Wat is je design?quote:Op donderdag 10 mei 2012 14:08 schreef Tink89 het volgende:
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...
Xx
Ja, goede vraag, ik ben ook in de warquote:Op donderdag 10 mei 2012 14:08 schreef Tink89 het volgende:
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...
Xx
Je kunt 'gewoon' contrasten specificeren in een ANOVAquote:Op donderdag 10 mei 2012 19:31 schreef crossover het volgende:
[..]
Ja, goede vraag, ik ben ook in de war
Oh ja! Maar eerst hercoderen. Eénmaal met select cases voor X1 =1 en éénmaal met select cases voor X1 = 2. Dan krijg je vier groepen en die kan je in de contrasten gebruiken.quote:Op donderdag 10 mei 2012 20:58 schreef Sandertje23 het volgende:
[..]
Je kunt 'gewoon' contrasten specificeren in een ANOVA
Ahquote:Op donderdag 10 mei 2012 22:56 schreef crossover het volgende:
[..]
Oh ja! Maar eerst hercoderen. Eénmaal met select cases voor X1 =1 en éénmaal met select cases voor X1 = 2. Dan krijg je vier groepen en die kan je in de contrasten gebruiken.
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):quote:Op maandag 14 mei 2012 16:09 schreef Oidipous het volgende:
Hallo allen, alvast super bedankt voor alle hulp!
Vorige week had ik gepost over het verwerken van data. Inmiddels ben ik een stap verder, ik heb alle data nu in SPSS staan en de volgende stap zou zijn univariate analysis, aldus mijn thesisbegeleider.. Niet wetende wat de precieze definitie is ga ik er van uit dat het descriptives zijn van variabelen. Klopt dit?
De descriptives heb ik tevoorschijn gekregen voor de hele sample en daarin zitten rare waarden. Wat blijkt, de outliers 'verpesten' het. Hoe moet ik deze outliers behandelen? Op internet wordt er ondermeer gepraat over z-values door variabelen bij descriptive te standaardiseren. Daarbij wordt gezegd dat je alles boven 3 en -3 moet verwijderen. Het betreft economisch/accounting onderzoek met ongeveer 12,000 firm years.
Zijn er verder nog zaken waar ik op moet letten voordat ik mijn regressie laat lopen? Heteroskedasticiteit-probleem heb ik niet omdat ik van elke variabele de logaritmische functie pak (maw, model ziet er zo uit log(y1)=b0+log(b1)+log(b2)+log(b3)). Moet ik hierdoor in plaats van lineaire regressie de binary logistic regression functie onder analyze pakken?
Ooh, dan zou ik alleen voor mijn descriptives de outliers eruit moeten halen. Dat zou wel fijn zijn.quote:Op maandag 14 mei 2012 16:44 schreef Z het volgende:
Schakel je met die logaritmische functie niet al de outliers uit?
Thx, ik ga er mee aan de slag.quote:Op maandag 14 mei 2012 16:53 schreef Sandertje23 het volgende:
[..]
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
Deze methode wordt ook in SPSS gebruikt wanneer je een boxplot maakt.quote:Op maandag 14 mei 2012 16:53 schreef Sandertje23 het volgende:
[..]
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
quote:Pallant:
SPSS defines points as outliers if they extend more than
1.5 box-lengths from the edge of the box. Extreme points (indicated with an
asterisk, * ) are those that extend more than 3 box-lengths from the edge of
the box.
Data-> Select cases -> Select cases if...quote:Op donderdag 17 mei 2012 14:20 schreef axz0l het volgende:
Misschien een hele stomme vraag. Van een aantal gegevens wil ik kijken hoevaak elke waarde voorkomt. Bijv: waarde A komt 3 keer voor, waarde B 4 keer en waarde C 8 keer.
Nu doe ik dat heel simpel via analyze frequencies, maar ik wil alles wat 0, 1 en 2 keer voorkomt NIET weergeven. Dus ik wil alleen alles wat 3x of vaker voorkomt weergeven met daarbij hoevaak dit voorkomt.
Kom er echt niet uit, ook de handleiding van SPSS en het internet niet, misschien dat iemand mij hier kan helpen?
Variabele kopiëren, ctrl + F, alle veel voorkomende antwoorden vervangen (door 'replace') door numerieke waarden en die waardes coderen bij variable labels. Vervolgens de overige verwijderen of system missing van maken. Als laatste nog zorgen dat het een numerieke varaibele is en dan kan je als het goed is frequentietabellen maken.quote:Op dinsdag 22 mei 2012 17:18 schreef axz0l het volgende:
Mensen, ik kom er niet uit dus ik hoop dat iemand mij toch nog verder kan helpen. Het gaat om een
kolom waar mensen zelf een 'automerk' intypen, neem peugeot als voorbeeld (het is dus een string).
Uiteindelijk kijk ik via frequencies en zie ik nu dat 55 mensen peugeot hebben ingevoerd, 38 mensen volkswagen en bijvoorbeeld maar 1 iemand die kiest voor Toyota, 1 iemand die kiest voor Honda.
Omdat het nu een gigantische lijst is, wil ik alle automerken die slechts 1x voorkomen (die dus door 1 iemand zijn ingevuld) weglaten, maar ik krijg het maar niet voor elkaar!!
Select if dat heeft geen zin, want de output van analyze, frequencies is geen variabele. Die kan ik dus niet selecteren.
Hoe kan ik nou mijn frequenties in de output window zo sorteren dat alles wat slechts 1x is genoemd, niet getoond wordt?!
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.nvm
[ Bericht 5% gewijzigd door Silverdigger2 op 28-05-2012 23:52:52 ]
Je kunt non-parametrisch toetsen, maar bij genoeg proefpersonen is een schending van levene's test niet zo rampzalig.quote:Op dinsdag 29 mei 2012 14:48 schreef KrentebolHooft het volgende:
Ik moet een ANOVA test uitvoeren, maar de Levene's test die homogeneity bepaald geeft een significante waarde aan. Dat betekend dus dat de varianties niet gelijk zijn in de groepen en een ANOVA (die gelijke varantie vereist) toets niet mag worden gebruikt.
Heb al met mijn stagebegeleider overlegd en hij raadde aan om de data te transformeren. Heb al verschillende log en Ln transformaties geprobeerd, maar het blijft altijd significant aangeven.
Heeft iemand nog ideeën om dit te verhelpen? Of wat ik kan overwegen als alternatief (wat dus wel mogelijk is met ongelijke varianties).
Kruskal-Wallis wordt het meest gebruikt, dus als je niet in de literatuur wilt duiken met betrekking tot de andere tests is het misschien een goed idee om die (als je dat kunt) te gebruiken.quote:Op dinsdag 29 mei 2012 15:08 schreef KrentebolHooft het volgende:
Ja inderdaad, dat was ook een optie
Zijn er nog nonparametrische toetsen buiten de Kruskal-Wallis en Wilcoxon-Rank sum toetsen? Ik ga sowieso die 2 denk ik even bekijken.
edit: ik zie er zo al een boel staan in SPSS, dat wordt lekker proberen
Ik word niet wijs uit jouw lap tekst. Wat is je afhankelijke variabele (en meetschaal) en wat zijn je onafhankelijke variabelen (en meetschaal) per hypothese? Dan kunnen we even wat gerichter kijken.quote:Op donderdag 7 juni 2012 14:55 schreef Kneivster het volgende:
Verder, wat voor verdere analyse zouden jullie uitvoeren hierop om uiteindelijk de hypotheses te testen? Ik lees overal verschillende dingen, de één voert een Mann-Whitney U Test uit (Niet parametrische test tussen 2 onafhankelijke samples), de ander een One-sample Kolmogorov Test (ook niet parametrisch, maar met 1 sample). Ik zie door de bomen het bos niet meer...
Alvast vele malen dank voor de hulp!
quote:Op donderdag 7 juni 2012 14:55 schreef Kneivster het volgende:
maar hoe kan ik van 2 (of meer) variabelen het gezamenlijke gemiddelde en standaarddeviatie laten berekenen zodat dit een samengevoegde variabele wordt en ik deze variabele later ook weer kan gebruiken in verdere statische analyses?
Volgens mij ben ik er, wat dit deel betreft, zelf uitgekomen. Klopt het als je dit doet: Transform -> compute new variable -> naam nieuwe variabele; MEAN(variabele 1, variabele 2, enz)?quote:[Nou kan het dus zijn dat 2 onafhankelijke variabelen samen genomen moeten worden omdat ze uitmaken van 'grotere' onafhankelijke variabele (bijvoorbeeld: onder dezelfde hypothese als bovenstaand zijn er ook twee vragen met betrekking tot de beoordeling van het huidige kostensysteem t.o.v. activity-based costing. Deze twee vragen hebben alletwee een aparte onafhankelijke variabele en worden ook alletwee apart getoetst, maar ik wil ze ook samenvoegen om, in dit geval, het geheel van de beoordeling van het huidige kostensysteem te toetsen aan de adoptie van activity-based costing.
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |