abonnement Unibet Coolblue Bitvavo
pi_143941111
quote:
0s.gif Op donderdag 28 augustus 2014 16:28 schreef wiedeweer het volgende:
Dag allemaal,

Ik heb een vraag over een multilevel analyse, waarvan ik hoop dat iemand me kan helpen.
Ik vergelijk twee groepen met elkaar tav van het verloop van scores over de tijd. Iedere drie maanden wordt er door de personen uit de twee groepen een vragenlijst ingevuld waar een score uit komt. De looptijd is max. een jaar, maar bij sommigen is dit korter. Niet iedereen heeft evenveel vragenlijsten ingevuld, soms is er maar 1, soms 2, soms 3 of soms 4. Mijn hypothese is dat de ene groep een vrij vlak verloop heeft (maw de score op de vragenlijsten neemt in de loop van de tijd niet af) en dat de andere groep een steiler verloop heeft (maw de score op de vragenlijsten loopt in de loop van de tijd af). Nu kwam ik op een multilevelanalyse, maar kreeg ik van mijn supervisor de vraag of de tijdsvariabele gecentreerd moet worden?! Kan iemand daar voor mij op basis van deze info iets zinnigs over zeggen? Alvast heel hartelijk dank!
Ik kan er iets zinnigs over zeggen maar niet op basis van de gegeven info ;)

Basically heb je twee opties:
niet centreren, waarbij t=0 dus t=0 blijft.
centreren waarbij de gemiddelde t 0 wordt.

afthankelijk van wat t voorstelt is het wel of niet aan te raden, aangezien het voor de statistiek niet uit maakt. (Ik ga er in deze reactie vanuit dat je tijd alleen als main-effect meeneemt, als je het als deel in een interactie gebruikt ligt het wat gecompliceerder.)

Stel je voor dat t de tijd is sinds het begin van een medicijnkuur, in dit geval is het veel logischer om tijd niet te centreren, omdat het effect van tijd ten opzichte van de gemiddelde tijd in jouw onderzoek superingewikkeld wordt om te interpreteren, het is veel logischer om het effect weer te geven in tijd sinds het begin van de kuur.

Nu wilde ik een voorbeeld geven waarin het wel logisch is om tijd te centreren maar het lukt me niet op binnen een minuut op iets te komen, nou ja punt lijkt me duidelijk toch?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_143986582
Bedankt voor je reactie oompaloompa, ik gebruik wel tijd als deel van de interactie namelijk tijd x groep
Welke info kan ik nog geven zodat je daar iets over zou kunnen zeggen? *)
pi_143992824
quote:
0s.gif Op zaterdag 30 augustus 2014 13:40 schreef wiedeweer het volgende:
Bedankt voor je reactie oompaloompa, ik gebruik wel tijd als deel van de interactie namelijk tijd x groep
Welke info kan ik nog geven zodat je daar iets over zou kunnen zeggen? *)
Gebruik je dummy-coderinig voor groep? (0-1)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_144004377
quote:
Gebruik je dummy-coderinig voor groep? (0-1)
ja
pi_144005188
quote:
0s.gif Op zaterdag 30 augustus 2014 22:53 schreef wiedeweer het volgende:

[..]

ja
Dan maakt het statistisch niks uit dus zou ik gaan wat het logischt is qua interpretatie :)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_144015157
ok dank je wel!
pi_144390868
Hallo allemaal,

Ik wil de missings in mijn dataset imputeren dus wil eerst een Little's MCAR test uitvoeren.
Ik heb begrepen dat dit alleen kan met continue variabelen. Nou vraag ik me een aantal dingen af:
• "leeftijd" of "aantal kinderen" is continu, maar dat is toch niet iets wat je laat schatten door spss?
• de meeste items (eigenlijk vrijwel alle items) bestaan uit antwoordschalen "1 = helemaal niet mee eens", etc., dus dan kan ik ze niet behandelen als continue variabelen, toch? (dan blijft er dus niks meer over om te imputeren. Ik heb een aantal 7-punts Likertschalen die ik als "scale" variabelen heb ingevoerd, dus dit is het enige wat ik zou kunnen imputeren)
• wat doe ik met de missings die ik niet kan imputeren (bijvoorbeeld omdat ze niet continu zijn)? Daar blijft dan "999" staan.. moet ik er daarna nog iets mee?
• ik heb al het één en ander geprobeerd, en uit de MCAR-test komt telkens het significantieniveau 1,000. Kan dit kloppen? (ik heb maar een kleine dataset.. 25 respondenten).

Ik hoop dat iemand mij meer duidelijkheid kan geven :)
pi_144392199
Of is het dan beter om het maar gewoon zo te laten en met de oorspronkelijke dataset aan de slag te gaan? (En zo ja, moet je dan alsnog iets met die "999" of kan ik hiermee gewoon aan de slag?).
pi_144393839
Als het niet nodig is, imputeer ik nooit data dus ik weet niet zo goed hoe het moet :P Maar als je de optie hebt het niet te doen, zou ik het niet doen (missings zijn volgens mij alleen een probleem bij multilevel analyses & repeated measures etc.)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_144398973
Oke! Dank!!
pi_144400629
zorg er dan trouwens wel voor dat 999 aangegeven staat als missing en niet meegenomen wordt als een score van 999! Heb ik een keer gedaan, snapte helemaal niks van m'n resultaten en duurde veel te lang voordat het kwartje viel :P
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_144426254
quote:
zorg er dan trouwens wel voor dat 999 aangegeven staat als missing en niet meegenomen wordt als een score van 999!
Haha! Yes! Heb ik! Dank!

Nog een vraagje.. welke opties heb ik als m'n cronbach's alpha te laag is?
- schaal eruit laten
- schaal erin laten maar terughoudend omgaan met de resultaten?
- nog andere opties?

Ik begrijp niet zo goed waarom mijn alpha zo laag is.. ik gebruik namelijk een betrouwbaar instrument (s-EMBU), waarbij vragen worden gesteld over de eigen opvoeding.. van zowel de vader als de moeder.
De alpha's bij de vader-items zijn allemaal hoog (gemiddeld .92) maar de alpha's bij de moeder-items zijn laag (.64, .65, .70). Terwijl het om dezelfde vragen gaat..

Iemand een idee?
pi_144430093
Oja.. ik begrijp dat ik ook losse items uit de schaal kan verwijderen. Maar ook alle alpha scores van "if item deleted" zijn nog te laag (< .70).
pi_144432063
Dat zijn toch best aardige alpha's (voor enquêtedata). Heb je missings op je schaalvragen en kan je beredeneren waarom ze missing zijn?
Aldus.
pi_144434404
oh, volgens mij moesten wij onze alpha's boven de .70 houden..
De respondenten met missings worden eruit gelaten dacht ik? (listwise deletion).
Ik heb echter ook alpha's van .45 en .47, maar weet dus niet goed wat ik ermee aan moet..
pi_144518569
Vraag! We mogen dit jaar ook R gebruiken in plaats van SPSS (wordt aangeraden als men de research master overweegt), dus daar ben ik nu eens mee aan het stoeien en het gaat aardig. Ik heb een achtergrond in python en C++, dus de command line is mij in ieder geval niet vreemd en het zelf schrijven van functies ook niet, dat scheelt. Desondanks is het toch weer best wel anders. :') Met veel ploeteren kom ik er wel doorheen, maar nu loop ik toch echt vast.

Ik heb drie groepen, elke groep bestaat uit een reeks getallen. Groep 1 & 2 hebben 12 getallen, groep 3 heeft er 9. Ik moet nu voor elke groep een boxplot maken en die samen laten zien in één grafiek. Ik heb elke groep als volgt ingevoerd:

> group1 <- c(27, 22, 29, 21, 19, 33, 16, 20, 24, 27, 28, 19)
> group2 <- c(12, 12, 15, 9, 20, 18, 17, 14, 14, 2, 17, 19)
> group3 <- c(18, 4, 22, 15, 18, 19, 22, 12, 12)

Een boxplot maken voor één groep is geen probleem:

> boxplot(group1, main="Boxplot", ylab="group1")

Groep 1 en 2 kan ik nog samenvoegen in één grafiek (hoewel het er wat lelijk uitziet en ik er nog wat dingen aan moet tweaken dan). Dat doe ik als volgt:

> groups12 <- data.frame(group1,group2)
> boxplot(group1,group2,data=groups12, main="Boxplot", xlab="Group", ylab="Trees")

Maar als ik probeer groep 1, 2 EN 3 samen te voegen, geeft R een error omdat de argumenten een verschillend aantal rijen hebben (12 en 9). Groep 3 aanvullen met nullen is natuurlijk geen optie.

Iemand een idee?
Your opinion of me is none of my business.
pi_144519729
quote:
0s.gif Op zondag 14 september 2014 17:00 schreef Sarasi het volgende:
Vraag! We mogen dit jaar ook R gebruiken in plaats van SPSS (wordt aangeraden als men de research master overweegt), dus daar ben ik nu eens mee aan het stoeien en het gaat aardig. Ik heb een achtergrond in python en C++, dus de command line is mij in ieder geval niet vreemd en het zelf schrijven van functies ook niet, dat scheelt. Desondanks is het toch weer best wel anders. :') Met veel ploeteren kom ik er wel doorheen, maar nu loop ik toch echt vast.

Ik heb drie groepen, elke groep bestaat uit een reeks getallen. Groep 1 & 2 hebben 12 getallen, groep 3 heeft er 9. Ik moet nu voor elke groep een boxplot maken en die samen laten zien in één grafiek. Ik heb elke groep als volgt ingevoerd:

> group1 <- c(27, 22, 29, 21, 19, 33, 16, 20, 24, 27, 28, 19)
> group2 <- c(12, 12, 15, 9, 20, 18, 17, 14, 14, 2, 17, 19)
> group3 <- c(18, 4, 22, 15, 18, 19, 22, 12, 12)

Een boxplot maken voor één groep is geen probleem:

> boxplot(group1, main="Boxplot", ylab="group1")

Groep 1 en 2 kan ik nog samenvoegen in één grafiek (hoewel het er wat lelijk uitziet en ik er nog wat dingen aan moet tweaken dan). Dat doe ik als volgt:

> groups12 <- data.frame(group1,group2)
> boxplot(group1,group2,data=groups12, main="Boxplot", xlab="Group", ylab="Trees")

Maar als ik probeer groep 1, 2 EN 3 samen te voegen, geeft R een error omdat de argumenten een verschillend aantal rijen hebben (12 en 9). Groep 3 aanvullen met nullen is natuurlijk geen optie.

Iemand een idee?
De reden dat je een foutmelding krijgt is dat een dataframe er vanuit gaat dat elke variabele die je eraan toevoegt even lang is. Als je terugdenkt aan SPSS zou je voor 3 cases een lege cel hebben in "group 3" variabele. Wat R doet is dat melden (Hallo, je mist data!) maar de boxplot werkt gewoon (toen ik het probeerde wel in ieder geval.) Als je echt heel graag van die foutmelding af wil kun je in dit geval de reeks van group3 aanvullen met NA, NA, NA op het einde. Dat geeft een missing variable aan. Mochten de getallen van de verschillende variabelen echt bij specifieke cases horen (27, 12, 18 als scores van 1 proefpersoon bijvoorbeeld) dan moet je de NA codering op de juiste, missende waarde, plek invullen. :)
pi_144519992
quote:
0s.gif Op donderdag 11 september 2014 19:26 schreef Natoo het volgende:
Oja.. ik begrijp dat ik ook losse items uit de schaal kan verwijderen. Maar ook alle alpha scores van "if item deleted" zijn nog te laag (< .70).
quote:
0s.gif Op donderdag 11 september 2014 20:54 schreef Natoo het volgende:
oh, volgens mij moesten wij onze alpha's boven de .70 houden..
De respondenten met missings worden eruit gelaten dacht ik? (listwise deletion).
Ik heb echter ook alpha's van .45 en .47, maar weet dus niet goed wat ik ermee aan moet..
Wat je kunt doen (Ik weet niet of je dit al geprobeerd hebt) is te werken met de "if item deleted" waar je het over had. Je draait die analyse en leest uit de tabel af welk item alpha het meeste zou verhogen als deze weg zou worden gelaten. Die vraag haal je eruit, en dan doe je deze analyse nog een keer. de "alpha if item deleted" zal veranderen doordat je de analyse opnieuw doet na het verwijderen van een vraag, je kunt dus niet uitgaan van de getallen van de eerste keer dat je deze analyse deed.

Dit lijkt onlogisch, omdat je leert dat het belangrijk is om een construct om meerdere manieren te meten voor een hogere betrouwbaarheid. Als echter uit je analyse blijkt dat een kleiner aantal vragen een hogere betrouwbaarheid geeft, dan is het onlogisch om vragen mee te nemen die eigenlijk niet meten wat je wil meten. :)
pi_144520031
quote:
0s.gif Op zondag 14 september 2014 17:39 schreef Operc het volgende:

[..]

De reden dat je een foutmelding krijgt is dat een dataframe er vanuit gaat dat elke variabele die je eraan toevoegt even lang is. Als je terugdenkt aan SPSS zou je voor 3 cases een lege cel hebben in "group 3" variabele. Wat R doet is dat melden (Hallo, je mist data!) maar de boxplot werkt gewoon (toen ik het probeerde wel in ieder geval.) Als je echt heel graag van die foutmelding af wil kun je in dit geval de reeks van group3 aanvullen met NA, NA, NA op het einde. Dat geeft een missing variable aan. Mochten de getallen van de verschillende variabelen echt bij specifieke cases horen (27, 12, 18 als scores van 1 proefpersoon bijvoorbeeld) dan moet je de NA codering op de juiste, missende waarde, plek invullen. :)
Welke boxplot werkt er dan? Het samenvoegen van drie groepen werkt niet, als ik dat probeer krijg ik de melding:
"Error in data.frame(group1, group2, group3) :
arguments imply differing number of rows: 12, 9"

Dus hoe maak je die boxplot als je niet een dataset hebt om uit te trekken?
Your opinion of me is none of my business.
pi_144520179
quote:
0s.gif Op zondag 14 september 2014 17:49 schreef Sarasi het volgende:

[..]

Welke boxplot werkt er dan? Het samenvoegen van drie groepen werkt niet, als ik dat probeer krijg ik de melding:
"Error in data.frame(group1, group2, group3) :
arguments imply differing number of rows: 12, 9"

Dus hoe maak je die boxplot als je niet een dataset hebt om uit te trekken?
Goede vraag. Ik zal fout hebben gekeken gok ik.
Onderstaande code werkt in ieder geval (dan werk je met NA)
1
2
3
4
5
6
group1 <- c(27, 22, 29, 21, 19, 33, 16, 20, 24, 27, 28, 19)
group2 <- c(12, 12, 15, 9, 20, 18, 17, 14, 14, 2, 17, 19)
group3 <- c(18, 4, 22, 15, 18, 19, 22, 12, 12, NA, NA, NA)
boxplot(group1, main="Boxplot", ylab="group1")
groups123 <- data.frame(group1, group2, group3)
boxplot(group1,group2, group3,data=groups123, main="Boxplot", xlab="Group", ylab="Trees")

EDIT: Je kunt ook zonder NAs boxplotten maken, alleen dan werk je zonder dataframe.
Als je group 1, 2 en 3 hebt gedfinieerd kun je deze code gebruiken:
1boxplot(group1,group2, group3,data="group1, group2, group3", main="Boxplot", xlab="Group", ylab="Trees")
pi_144520255
quote:
0s.gif Op zondag 14 september 2014 17:54 schreef Operc het volgende:

[..]

Goede vraag. Ik zal fout hebben gekeken gok ik.
Onderstaande code werkt in ieder geval (dan werk je met NA)
[ code verwijderd ]

Ik heb het net gevonden!

> boxplot(group1,group2,group3)

werkt gewoon. :') Niet meer als ik er specificaties achter plak, maar dat vogel ik dan straks wel weer uit...
Your opinion of me is none of my business.
pi_144520263
Python heeft toch ook een mooie statistiekmodule (Panda's)?
Aldus.
pi_144520307
quote:
0s.gif Op zondag 14 september 2014 17:56 schreef Sarasi het volgende:

[..]

Ik heb het net gevonden!

> boxplot(group1,group2,group3)

werkt gewoon. :') Niet meer als ik er specificaties achter plak, maar dat vogel ik dan straks wel weer uit...
Ah, mijn edit kwam te laat. :P De andere specificaties kun je er ook achter plakken (en het data=group1, 2 3 kun je weglaten inderdaad.)
pi_144520344
quote:
0s.gif Op zondag 14 september 2014 17:57 schreef Operc het volgende:

[..]

Ah, mijn edit kwam te laat. :P De andere specificaties kun je er ook achter plakken (en het data=group1, 2 3 kun je weglaten inderdaad.)
Dank voor de hulp in ieder geval! ^O^
Your opinion of me is none of my business.
pi_144520376
quote:
0s.gif Op zondag 14 september 2014 17:58 schreef Sarasi het volgende:

[..]

Dank voor de hulp in ieder geval! ^O^
Graag gedaan. :)
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')