Oké, bedankt voor je antwoord!quote:Op dinsdag 8 mei 2012 11:34 schreef Sandertje23 het volgende:
[..]
Dat kan niet. Dan kun je geen CA meer berekenen, want die gaat over meer dan 1 item. Je kunt kijken naar de item-restcorrelatie.
Wat is je design?quote:Op donderdag 10 mei 2012 14:08 schreef Tink89 het volgende:
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...
Xx
Ja, goede vraag, ik ben ook in de warquote:Op donderdag 10 mei 2012 14:08 schreef Tink89 het volgende:
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...
Xx
Je kunt 'gewoon' contrasten specificeren in een ANOVAquote:Op donderdag 10 mei 2012 19:31 schreef crossover het volgende:
[..]
Ja, goede vraag, ik ben ook in de war
Oh ja! Maar eerst hercoderen. Eénmaal met select cases voor X1 =1 en éénmaal met select cases voor X1 = 2. Dan krijg je vier groepen en die kan je in de contrasten gebruiken.quote:Op donderdag 10 mei 2012 20:58 schreef Sandertje23 het volgende:
[..]
Je kunt 'gewoon' contrasten specificeren in een ANOVA
Ahquote:Op donderdag 10 mei 2012 22:56 schreef crossover het volgende:
[..]
Oh ja! Maar eerst hercoderen. Eénmaal met select cases voor X1 =1 en éénmaal met select cases voor X1 = 2. Dan krijg je vier groepen en die kan je in de contrasten gebruiken.
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):quote:Op maandag 14 mei 2012 16:09 schreef Oidipous het volgende:
Hallo allen, alvast super bedankt voor alle hulp!
Vorige week had ik gepost over het verwerken van data. Inmiddels ben ik een stap verder, ik heb alle data nu in SPSS staan en de volgende stap zou zijn univariate analysis, aldus mijn thesisbegeleider.. Niet wetende wat de precieze definitie is ga ik er van uit dat het descriptives zijn van variabelen. Klopt dit?
De descriptives heb ik tevoorschijn gekregen voor de hele sample en daarin zitten rare waarden. Wat blijkt, de outliers 'verpesten' het. Hoe moet ik deze outliers behandelen? Op internet wordt er ondermeer gepraat over z-values door variabelen bij descriptive te standaardiseren. Daarbij wordt gezegd dat je alles boven 3 en -3 moet verwijderen. Het betreft economisch/accounting onderzoek met ongeveer 12,000 firm years.
Zijn er verder nog zaken waar ik op moet letten voordat ik mijn regressie laat lopen? Heteroskedasticiteit-probleem heb ik niet omdat ik van elke variabele de logaritmische functie pak (maw, model ziet er zo uit log(y1)=b0+log(b1)+log(b2)+log(b3)). Moet ik hierdoor in plaats van lineaire regressie de binary logistic regression functie onder analyze pakken?
Ooh, dan zou ik alleen voor mijn descriptives de outliers eruit moeten halen. Dat zou wel fijn zijn.quote:Op maandag 14 mei 2012 16:44 schreef Z het volgende:
Schakel je met die logaritmische functie niet al de outliers uit?
Thx, ik ga er mee aan de slag.quote:Op maandag 14 mei 2012 16:53 schreef Sandertje23 het volgende:
[..]
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
Deze methode wordt ook in SPSS gebruikt wanneer je een boxplot maakt.quote:Op maandag 14 mei 2012 16:53 schreef Sandertje23 het volgende:
[..]
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
quote:Pallant:
SPSS defines points as outliers if they extend more than
1.5 box-lengths from the edge of the box. Extreme points (indicated with an
asterisk, * ) are those that extend more than 3 box-lengths from the edge of
the box.
Data-> Select cases -> Select cases if...quote:Op donderdag 17 mei 2012 14:20 schreef axz0l het volgende:
Misschien een hele stomme vraag. Van een aantal gegevens wil ik kijken hoevaak elke waarde voorkomt. Bijv: waarde A komt 3 keer voor, waarde B 4 keer en waarde C 8 keer.
Nu doe ik dat heel simpel via analyze frequencies, maar ik wil alles wat 0, 1 en 2 keer voorkomt NIET weergeven. Dus ik wil alleen alles wat 3x of vaker voorkomt weergeven met daarbij hoevaak dit voorkomt.
Kom er echt niet uit, ook de handleiding van SPSS en het internet niet, misschien dat iemand mij hier kan helpen?
Variabele kopiëren, ctrl + F, alle veel voorkomende antwoorden vervangen (door 'replace') door numerieke waarden en die waardes coderen bij variable labels. Vervolgens de overige verwijderen of system missing van maken. Als laatste nog zorgen dat het een numerieke varaibele is en dan kan je als het goed is frequentietabellen maken.quote:Op dinsdag 22 mei 2012 17:18 schreef axz0l het volgende:
Mensen, ik kom er niet uit dus ik hoop dat iemand mij toch nog verder kan helpen. Het gaat om een
kolom waar mensen zelf een 'automerk' intypen, neem peugeot als voorbeeld (het is dus een string).
Uiteindelijk kijk ik via frequencies en zie ik nu dat 55 mensen peugeot hebben ingevoerd, 38 mensen volkswagen en bijvoorbeeld maar 1 iemand die kiest voor Toyota, 1 iemand die kiest voor Honda.
Omdat het nu een gigantische lijst is, wil ik alle automerken die slechts 1x voorkomen (die dus door 1 iemand zijn ingevuld) weglaten, maar ik krijg het maar niet voor elkaar!!
Select if dat heeft geen zin, want de output van analyze, frequencies is geen variabele. Die kan ik dus niet selecteren.
Hoe kan ik nou mijn frequenties in de output window zo sorteren dat alles wat slechts 1x is genoemd, niet getoond wordt?!
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.nvm
[ Bericht 5% gewijzigd door Silverdigger2 op 28-05-2012 23:52:52 ]
Je kunt non-parametrisch toetsen, maar bij genoeg proefpersonen is een schending van levene's test niet zo rampzalig.quote:Op dinsdag 29 mei 2012 14:48 schreef KrentebolHooft het volgende:
Ik moet een ANOVA test uitvoeren, maar de Levene's test die homogeneity bepaald geeft een significante waarde aan. Dat betekend dus dat de varianties niet gelijk zijn in de groepen en een ANOVA (die gelijke varantie vereist) toets niet mag worden gebruikt.
Heb al met mijn stagebegeleider overlegd en hij raadde aan om de data te transformeren. Heb al verschillende log en Ln transformaties geprobeerd, maar het blijft altijd significant aangeven.
Heeft iemand nog ideeën om dit te verhelpen? Of wat ik kan overwegen als alternatief (wat dus wel mogelijk is met ongelijke varianties).
Kruskal-Wallis wordt het meest gebruikt, dus als je niet in de literatuur wilt duiken met betrekking tot de andere tests is het misschien een goed idee om die (als je dat kunt) te gebruiken.quote:Op dinsdag 29 mei 2012 15:08 schreef KrentebolHooft het volgende:
Ja inderdaad, dat was ook een optie
Zijn er nog nonparametrische toetsen buiten de Kruskal-Wallis en Wilcoxon-Rank sum toetsen? Ik ga sowieso die 2 denk ik even bekijken.
edit: ik zie er zo al een boel staan in SPSS, dat wordt lekker proberen
| Forum Opties | |
|---|---|
| Forumhop: | |
| Hop naar: | |