quote:Ik haat spss op dit moment even heel erg. Ik kom er echt niet uit.
Oke, situatie: Ik wil weten of een hoge score op X veroorzaakt wordt door een betere score op Y. Y bestaat uit meerdere measures, bij sommige measures is een hoge score beter, bij andere is een lage beter. Daarnaast kijk ik ook naar een lineair verband tussen X en demografische gegevens.
Ik weet dat ik hiervoor een lineaire regressieanalyse moet uitvoeren. Volgens mijn afstudeerbegeleider moet ik dan een hiërarchische doen, omdat ik denk dat Y meer invloed heeft op X dan demografisch. Ik loop dus echt vast zodra ik daarmee bezig ga.
Mijn vraag dan ook: Hoe doe ik zo'n analyse en waar moet ik naar kijken in de eindeloze tabellen bij de uitkomsten? Moet ik dan ook nog rekening houden met de hoog/laag verschillen bij familie? En wat doe ik dan bij die blocks?
Hoop dat iemand kan helpen, dit is hopeloos
Pak het boek van pallant er even bij. Is ergens online te vinden. ('spss survival manual')quote:Op woensdag 5 juni 2013 09:13 schreef _Loki het volgende:
Ik haat spss op dit moment even heel erg. Ik kom er echt niet uit.
Oke, situatie: Ik wil weten of een hoge score op X veroorzaakt wordt door een betere score op Y. Y bestaat uit meerdere measures, bij sommige measures is een hoge score beter, bij andere is een lage beter. Daarnaast kijk ik ook naar een lineair verband tussen X en demografische gegevens.
Ik weet dat ik hiervoor een lineaire regressieanalyse moet uitvoeren. Volgens mijn afstudeerbegeleider moet ik dan een hiërarchische doen, omdat ik denk dat Y meer invloed heeft op X dan demografisch. Ik loop dus echt vast zodra ik daarmee bezig ga.
Mijn vraag dan ook: Hoe doe ik zo'n analyse en waar moet ik naar kijken in de eindeloze tabellen bij de uitkomsten? Moet ik dan ook nog rekening houden met de hoog/laag verschillen bij familie? En wat doe ik dan bij die blocks?
Hoop dat iemand kan helpen, dit is hopeloos
Iemand?quote:Op woensdag 5 juni 2013 14:22 schreef Droplollie het volgende:
Verder heb ik de volgende vraag: is het mogelijk om twee gemiddelden van twee groepen te vergelijken, terwijl het mogelijk is dat één iemand in beide groepen zit?
Voorbeeld: ik heb een populatie waarvan iemand in de populatie in groep 1 of 2 kan zitten. Groep 1 is vervolgens weer op gesplitst in groep 1a en groep 1b. Is het mogelijk het groepsgemiddelde van groep 1a te vergelijken met het groepsgemiddelde van groep 1? Zoja; hoe?
Dat zou rammelen aan alle kanten..quote:Op woensdag 5 juni 2013 14:22 schreef Droplollie het volgende:
Inmiddels heb ik gekozen voor multipele imputatie. Bij SPSS kan bij logistische regressie vervolgens de gepoolde Beta's weergegeven worden. Op die manier heb ik geen missings meer, weinig verschil in gemiddelden en effecten, maar eerder significante resultaten (door een hogere N).
Verder heb ik de volgende vraag: is het mogelijk om twee gemiddelden van twee groepen te vergelijken, terwijl het mogelijk is dat één iemand in beide groepen zit?
Voorbeeld: ik heb een populatie waarvan iemand in de populatie in groep 1 of 2 kan zitten. Groep 1 is vervolgens weer op gesplitst in groep 1a en groep 1b. Is het mogelijk het groepsgemiddelde van groep 1a te vergelijken met het groepsgemiddelde van groep 1? Zoja; hoe?
Omdat je veel proefpersonen in beide groepen hebt zitten.quote:Op dinsdag 11 juni 2013 18:15 schreef Droplollie het volgende:
[..]
Beide groepen hebben toch hun eigen gemiddelde, sd en n.
Waarom zou dat rammelen?
Ik heb het inderdaad maar niet gedaan.quote:Op woensdag 12 juni 2013 09:02 schreef crossover het volgende:
[..]
Omdat je veel proefpersonen in beide groepen hebt zitten.
Dat is op z'n minst een waard hè!quote:Op dinsdag 18 juni 2013 15:24 schreef Skv het volgende:
omfgwtfbbq, het lijkt er op dat mijn analyse van mn masterthesis ein-de-lijk is goedgekeurd.
Geen enkele hypothese met een significant resultaat. .
vertalen naar het Nederlands Omgekeerde wereld Ik kreeg commentaar dat ik geen NL termen in mijn grafiekjes en tabellen mocht hebben omdat mijn scriptie in het Engels is..quote:Op woensdag 19 juni 2013 22:34 schreef fh101 het volgende:
Ik heb de feedback op de conceptversie van mn scriptie terug gekregen. Nu wil mn begeleider ineens dat ik Nederlandse termen ga gebruiken voor SPSS toetsen ed. Maar die heb ik nog nooit eerder gebruikt Weten jullie wat de Nederlandse benaming is voor de volgende woorden?
- Analysis of Variance ANOVA (variantie analyse?)
- partial correlatie (gedeeltelijke correlatie?? hierover twijfel ik het meest..)
- one way ANOVA (eenweg ANOVA?)
- two way ANOVA (tweeweg ANOVA?)
Ja ik vind het ook een beetje vaag... Mijn scriptie is dan wel in het Nederlands dus enigszins logisch is het natuurlijk wel, maar als je tijdens je studie alleen maar de Engelse termen gebruikt en hoort van docenten.quote:Op woensdag 19 juni 2013 23:58 schreef Skv het volgende:
[..]
vertalen naar het Nederlands Omgekeerde wereld Ik kreeg commentaar dat ik geen NL termen in mijn grafiekjes en tabellen mocht hebben omdat mijn scriptie in het Engels is..
Kan je die ANOVA's niet gewoon F-test noemen en voor de ways 1-factor variantie-analyse en 2-factor variantie-analyse? Partial correlation is toch de relatie tussen twee variabelen gecontroleerd voor een derde? Leg het begrip even uit en noem het dan partiële correlatie.
Je theoretisch schema is ietwat onduidelijk (voor me). Hoe ziet je design eruit? Wil je de twee afbeeldingen vergelijken per proefpersoon (within-subjects) of wil je weten of er verschil is in bijvoorbeeld sekse in uitkomsten bij de twee afbeeldingen (between-subjects denk ik)?quote:Op vrijdag 21 juni 2013 18:48 schreef Lieselot-je het volgende:
Hoi!
Voor mijn masterscriptie ben ik bezig met het verwerken van de resultaten in SPSS (jippi, not).
Nu loop ik echt helemaal vast!
Ik heb een vragenlijst gehouden met likert-schaal vragen. Deze heb ik allemaal ingevoerd in SPSS, no problem. Nu heb ik de verschillende variabelen die samen één item vormen samengevoegd, eerst heb ik een Cronbach's Alpha uitgevoerd om te kijken of dit kon, no problem.
Mijn vragenlijst bestond uit 2 afbeeldingen. Nu wil ik de uitkomsten voor deze twee afbeeldingen met elkaar vergelijken. Hoe doe ik dit?
De data van de twee afbeeldingen staat wel in één SPSS bestand.
Ik dacht aan een ANOVA, maar welke gegevens moet ik dan waar invoeren?
Moet ik voor de afbeeldingen ook variabelen aanmaken? Hoe doe ik dan zonder dat SPSS er niet mee kan rekenen (had ik net namelijk).
Ik heb het idee dat ik een variabele mis ofzo, maar zou niet weten welke en hoe ik deze dan in moet voeren.
Wie kan mij helpen? Ik word er onderhand een beetje wanhopig van!
Je maakt dus geen onderscheid in verschillende groepen?quote:Op maandag 24 juni 2013 09:10 schreef Lieselot-je het volgende:
Bedankt voor je reactie DuTank. Ik heb 2 afbeeldingen voorgelegd aan één groep proefpersonen, nu wil ik zien welke afbeelding beter heeft gescoord onder de gehele groep proefpersonen.
Paired samples t-test inderdaad waarbij je de gemiddelde score per afbeelding vergelijkt. Maar dit zou onderhand toch 'simpel' moeten zijn, als je al bij je master bent? Of heb je geen statistiek 1 en 2 gehad?quote:Op maandag 24 juni 2013 09:10 schreef Lieselot-je het volgende:
Bedankt voor je reactie DuTank. Ik heb 2 afbeeldingen voorgelegd aan één groep proefpersonen, nu wil ik zien welke afbeelding beter heeft gescoord onder de gehele groep proefpersonen.
Ik ben ook masterstudent, heb statistiek 1 gehad, oooit... ergens in een ver verleden. Voor mijn eerder genoemde opdracht moest ik qua kennis from scratch beginnen, je weet wel wat je moet invullen, maar wat je output betekent... oh god. Nope. Dan ga je een taalstudie doen om de cijfers te ontlopen maar dan moet je alsnog met cijfers werken. Ik zie haar probleem hoor, ik ben blij dat ik die opdracht heb moeten doen, anders was ik straks ook afgestudeerd zonder enige kennis over statistiekquote:Op maandag 24 juni 2013 11:43 schreef Skv het volgende:
[..]
Paired samples t-test inderdaad waarbij je de gemiddelde score per afbeelding vergelijkt. Maar dit zou onderhand toch 'simpel' moeten zijn, als je al bij je master bent? Of heb je geen statistiek 1 en 2 gehad?
Volgens mij heb je bij elke wetenschappelijke studie wel cijfers en/of SPSS nodigquote:Op maandag 24 juni 2013 12:00 schreef eleganza het volgende:
[..]
Ik ben ook masterstudent, heb statistiek 1 gehad, oooit... ergens in een ver verleden. Voor mijn eerder genoemde opdracht moest ik qua kennis from scratch beginnen, je weet wel wat je moet invullen, maar wat je output betekent... oh god. Nope. Dan ga je een taalstudie doen om de cijfers te ontlopen maar dan moet je alsnog met cijfers werken. Ik zie haar probleem hoor, ik ben blij dat ik die opdracht heb moeten doen, anders was ik straks ook afgestudeerd zonder enige kennis over statistiek
Maar idd, een paired t-test lijkt me hier het handigst
Communicatiekunde. Als ik alleen kwalitatieve onderzoeksvakken had gekozen (daar heb ik er 3 van de vier van) en mijn scriptie ook volledig kwalitatief had gedaan had ik geen getal hoeven te gebruiken in spss Maar ben toch blij dat ik er iets van weet nu hahaha. Maar vraag me niet wat een chisquare ook alweer berekent, want dat weet ik dus nietquote:Op maandag 24 juni 2013 13:17 schreef DuTank het volgende:
[..]
Volgens mij heb je bij elke wetenschappelijke studie wel cijfers en/of SPSS nodig
Verschil bekijken tussen gemiddelden van twee populaties.quote:Op maandag 24 juni 2013 13:20 schreef eleganza het volgende:
[..]
Communicatiekunde. Als ik alleen kwalitatieve onderzoeksvakken had gekozen (daar heb ik er 3 van de vier van) en mijn scriptie ook volledig kwalitatief had gedaan had ik geen getal hoeven te gebruiken in spss Maar ben toch blij dat ik er iets van weet nu hahaha. Maar vraag me niet wat een chisquare ook alweer berekent, want dat weet ik dus niet
Is de analyse inmiddels gelukt?quote:Op maandag 24 juni 2013 20:15 schreef Lieselot-je het volgende:
Bedankt voor alle reacties!
Ik heb alleen statistiek 1 gedaan (een jaar of 2 geleden onderhand) en de daar werd alles voor je uitgekauwd
Nu heb ik normaliter wel enig verstand van SPSS, maar ik kwam er nu echt even niet meer uit. Laten we het op de stress houden. In ieder geval bedankt allemaal.
Ongeveer ja Maar ik zoek een duidelijkere manier om het op te schrijven, en ik weet niet meer precies hoe het statistisch zit. Er is nu een ongelijke verdeling qua groepsgrootte want er zijn erg weinig mensen die in de categorie 'laag' vallen. Ik wil aanbevelen dat in vervolgonderzoek meer mensen meedoen die in deze categorie vallen, want dat lijkt me beter voor het onderzoek. Maar hoe zat dat ook al weer...quote:Op maandag 24 juni 2013 22:43 schreef Skv het volgende:
Ja. Het is vreemd dat je verwacht dat de verschillen tussen de groepen 'duidelijker' zullen worden. Wat bedoel je daarmee? Dat wanneer de groepen gelijke grootte hebben, er grotere verschillen zichtbaar zullen zijn? Als je dat stelt, dan bedoel je dat je conclusie van nu (geen significante verschillen) verklaard kunnen worden door je steekproefgrootte. Is dat wat je wil zeggen?
Kun je niet kijken of iemand appels juist lekkerder dan peren vindt of andersom? Als je daar een dummy variable van maakt wordt het eenvoudiger volgens mij.quote:Op woensdag 26 juni 2013 13:19 schreef speknek het volgende:
Hmm ik probeer een collega te helpen maar ik kom er zelf niet uit.
Zeg dat hij het effect van appels en peren eten op gemoedstoestand wil meten.
Onafhankelijke variabele fruit, afhankelijke variabele gemoedstoestand.
Alleen, sommige mensen vinden appels veel lekkerder dan anderen, en sommige peer veel lekkerder dan anderen.
Dus van tevoren heeft ie een meting "hoe lekker vind je appels", en "hoe lekker vind je peren".
Dat lijken me covariabelen. Alleen; voor de mensen die uiteindelijk de peer eten, is het niet relevant om hoe lekker vind je appels als covariaat te hebben, en evenzo voor de mensen die uiteindelijk appel eten.
Hoe moet je dan die covariaten toevoegen. Als twee aparte covariaten, of een enkele variabele 'lekker' waarbij je de score van de appels voor de appelgroep invult, en de score van de peren voor de perengroep?
Ik bedoel zeg maar dat jequote:Op woensdag 26 juni 2013 14:51 schreef speknek het volgende:
Hmnee, het is meer appels en rotte peren zeg maar. En de gedachte is dan dat mensen die een appel eten blijer zijn dan mensen die een rotte peer eten. Alleen, ik (hij) vind dus dat sommige mensen rotte peren minder erg vinden dan anderen, en dit de resultaten beinvloedt.
Oh, zo. Dan kan ik je niet verder helpen.quote:Op woensdag 26 juni 2013 15:13 schreef speknek het volgende:
Ik snap wat je bedoelt, en dan heb je een 2x2 design, maar iedereen vindt appels lekkerder dan rotte peren . Het is meer een continue variabele en heb ik niet genoeg ppn (het zijn ook drie groepen, met een controle groep) om ze in die drie groepen door twee te delen.
Toch bedankt!quote:Op woensdag 26 juni 2013 15:21 schreef wimjongil het volgende:
[..]
Oh, zo. Dan kan ik je niet verder helpen.
Je kan construct validiteit voor elk onderzoek goed gebruiken. Wat wil je er ongeveer over weten?quote:Op woensdag 26 juni 2013 14:12 schreef Brembo het volgende:
Ik ben bezig met mijn masterscriptie, redelijk ervaren al met SPSS. Echter ik zoek een boek of iemand die wat meer achtergrondinformatie heeft geschreven over constructvaliditeit. Dit omdat ik constructvaliditeit zeer goed kan gebruiken voor mijn onderzoek .
Zou dit niet een normale verdeling kunnen zijn? Sommige mensen zullen het super erg vinden, de meeste mensen gewoon erg en weer sommige mensen die het helemaal niet zo erg vonden.quote:Op woensdag 26 juni 2013 14:51 schreef speknek het volgende:
Hmnee, het is meer appels en rotte peren zeg maar. En de gedachte is dan dat mensen die een appel eten blijer zijn dan mensen die een rotte peer eten. Alleen, ik (hij) vind dus dat sommige mensen rotte peren minder erg vinden dan anderen, en dit de resultaten beinvloedt.
Ik ben ook geen expert hoor, maar het lijkt mij dat als je gewoon die twee covariaten erin stopt, dat SPSS dan wel uitrekent in hoeverre ze van invloed zijn.quote:Op donderdag 27 juni 2013 08:28 schreef speknek het volgende:
Ja. En er komt dus ook iets significants uit als ik het als covariaat invoer. Alleen ik weet dus niet hoe ik het als covariaat in moet voeren. Want wat mensen van appels vinden is niet relevant voor de perenconditie, en wat mensen van peren vinden is niet relevant voor de appelsconditie.
Ik heb verder echt geen idee..quote:Op donderdag 27 juni 2013 10:50 schreef speknek het volgende:
Nou en dat is precies het punt.
Hij heeft gevraagd wat iemands attitude was t.o.v. appels EN t.o.v. peren (twee variabelen).
Mijn ingeving zou zijn om hier een variabele te maken, waar je de attitude t.o.v. appels in kopieert voor de mensen in de appelgroep, en de attitude t.o.v. peren erin kopieert voor de mensen in de perengroep.
Maar ik weet niet of dat mag, ik heb het zeker in ieder geval nog nooit gezien.
Ik snap zelf hoe het werkt alleen moet ik natuurlijk wel bronnen hebben die uitleggen hoe de wetenschappelijke toepassing is in plaats van dat ik het uit mijn duim zuig. Maar bij Drenth en Sijtsema (2007) met het boek testtheorie stond voldoende achtergrondinformatie in .quote:Op woensdag 26 juni 2013 15:29 schreef speknek het volgende:
[..]
Toch bedankt!
[..]
Je kan construct validiteit voor elk onderzoek goed gebruiken. Wat wil je er ongeveer over weten?
Julie Pallant.quote:Op maandag 1 juli 2013 22:55 schreef PizzaMizza het volgende:
Mede SPSS'ers,
Ik zou graag mijn eigen statistische vaardigheden willen 'upgraden' op SPSS. Ik heb zelf een beetje ervaring met SPSS, maar deze is te verwaarlozen.
Ik ben daarom op zoek naar een boek/online document om SPSS te 'leren'. Welke raden jullie mij aan? Ik zocht graag eentje die mij alles weer leert vanaf het begin. Dus echt eentje die begint bij 0. Engels of Nederlands maakt mij niet veel uit, maar de voorkeur gaat uit naar het Nederlands.
Mijn universiteit maakt gebruik van het boek van De Vocht. Daarnaast vind ik het boek van Andy Field erg handig.quote:Op maandag 1 juli 2013 22:55 schreef PizzaMizza het volgende:
Mede SPSS'ers,
Ik zou graag mijn eigen statistische vaardigheden willen 'upgraden' op SPSS. Ik heb zelf een beetje ervaring met SPSS, maar deze is te verwaarlozen.
Ik ben daarom op zoek naar een boek/online document om SPSS te 'leren'. Welke raden jullie mij aan? Ik zocht graag eentje die mij alles weer leert vanaf het begin. Dus echt eentje die begint bij 0. Engels of Nederlands maakt mij niet veel uit, maar de voorkeur gaat uit naar het Nederlands.
Die van Field is inderdaad erg prettig, zeker als je meer van de achterliggende statistiek wil weten. Maar als je alleen een 'kookboek' wil, zou ik toch die van Pallant (of inderdaad De Vocht) aanraden.quote:Op dinsdag 2 juli 2013 12:27 schreef Maraca het volgende:
[..]
Mijn universiteit maakt gebruik van het boek van De Vocht. Daarnaast vind ik het boek van Andy Field erg handig.
Ik heb het al opgelost. Je kunt gewoon MIN gebruiken, ik dat dat die het niet zou doen voor data.quote:Op donderdag 11 juli 2013 18:45 schreef Z het volgende:
De 'Date and Time Wizard' moet hier wel uitkomst kunnen bieden vermoed ik.
1 2 | IF (samengesteld_status=1) samengesteld_date=MIN(eventA_date,EventB_date,EventC_date,EventD_date). EXECUTE. |
1 2 3 4 5 | DO IF (ANY(Med1_use,1,2)). COMPUTE Med1_start_days=DATEDIFF(Med1_start,dateindex,'days'). COMPUTE Med1_end_days=DATEDIFF(Med1_end,dateindex,'days'). END IF. EXECUTE. |
1 2 3 4 5 6 7 8 9 10 11 12 | DO REPEAT med_use=Med1_use Med2_use /med_start=Med1_start Med2_start /med_end=Med1_end Med2_end /med_start_days=Med1_start_days Med2_start_days /med_end_days= Med1_end_days Med2_end_days. DO IF (ANY(med_use,1,2)). COMPUTE med_start_days=DATEDIFF(med_start,dateindex,'days'). COMPUTE med_end_days=DATEDIFF(med_end,dateindex,'days'). End IF. END REPEAT PRINT. EXECUTE. |
1 2 3 4 5 6 7 8 9 10 11 | DEFINE !ComputeDays (!POSITIONAL !CMDEND) !DO !I !IN (!1) DO IF !CONCAT("(ANY(",!I,"_use,1,2))"). compute !CONCAT(!I,"_start_days") = DATEDIFF(!CONCAT(!I,"_start"),dateindex,'days'). compute !CONCAT(!I,"_end_days") = DATEDIFF(!CONCAT(!I,"_end"),dateindex,'days'). END IF. !DOEND !ENDDEFINE. !ComputeDays Med1 Med2 Med3. Exe. |
Nee, maar staat wel op mijn lijstje om eens te leren...quote:Op zaterdag 13 juli 2013 13:26 schreef Z het volgende:
Puik werk. Ik vind de SPSS macro-taal gruwelijk. In tegenstelling tot bijvoorbeeld Excel VB.
Ik ben me aan het verdiepen in R, gebruikt iemand hier dat?
Begrijp ik je goed als ik zeg dat je een correlatie hebt berekend met een dichtome variabele?quote:Op dinsdag 23 juli 2013 13:30 schreef edh88 het volgende:
Hallo
Ik heb een (denk ik) simpele SPSS vraag. Uit SPSS komen een aantal correlaties en Pearsons R verbanden die significant zouden moeten zijn (P < 0,05). Maar wanneer is er sprake van een sterk verband; of te wel vanaf welke Pearsons R waarde is het verband redelijk sterk- sterk te noemen, zodat je echt kan spreken van een zeer waarschijnlijk duidelijk verband.
Als voorbeeld heb ik analyse gedaan met als achtergrondvariabel Gender (man/vrouw als antwoordmogelijkheden).
Bij een van de variabelen is de Pearsons R waarde 0.460 en de Sig 2-tailed P-waarde: 0.000
Bij een andere achtergrondvariabele krijg ik Pearsons R waarden als 0.686 en Sig 2-tailed P waarde: 0.000
Ook krijg ik regelmatig wel een P waarde kleiner dan 0,05, maar de Pearsons R waarde schommelt dan rond de 0.2/0.3.
Mijn eigen conclusie zou zijn dat de verbanden met een Pearsons R waarde rond de 0,2/0,3 er wel zijn, maar dat deze niet heel erg sterk is. En dus statistisch niet goed 'hard' te maken. En de eerste 2 voorbeelden redelijk sterke verbanden zijn. Maar ik twijfel erg over de eerste twee voorbeelden.
Ik hoop dat het beetje duidelijk is en iemand mij kan helpen!
Thanks a lot!
Ahh ik begrijp dat ik een grote fout heb gemaakt??quote:Op woensdag 24 juli 2013 11:24 schreef crossover het volgende:
[..]
Begrijp ik je goed als ik zeg dat je een correlatie hebt berekend met een dichtome variabele?
Regressies zijn waarvoor je ze wil gebruiken. Regressies hoeven in principe niets met voorspellingen te maken hebben. Alleen, mocht je het willen, kun je er wel voorspellingen mee maken.quote:Op woensdag 24 juli 2013 16:53 schreef edh88 het volgende:
ik lees hier dat regressie is voor voorspellingen? Maar dan hoeft dus niet
Ik gebruik R, nog niet als vervanging van SPSS, mar op dit moment alleen om dingen te doen die in SPSS minder gemakkelijk zijn, multilevels / mixed models en data simulaties.quote:Op zaterdag 13 juli 2013 13:26 schreef Z het volgende:
Puik werk. Ik vind de SPSS macro-taal gruwelijk. In tegenstelling tot bijvoorbeeld Excel VB.
Ik ben me aan het verdiepen in R, gebruikt iemand hier dat?
Hoezo kan dat niet?quote:Op woensdag 24 juli 2013 11:24 schreef crossover het volgende:
[..]
Begrijp ik je goed als ik zeg dat je een correlatie hebt berekend met een dichtome variabele?
Een regressie met dummies is in essentie een correlatie..quote:
Op wat voor manier? De uitkomsten of de vorm van de output?quote:Op zaterdag 3 augustus 2013 11:56 schreef oompaloompa het volgende:
Pas trouwens wel op dat er blijkbaar een verschil zit tussen de standaard anova resultaten van SPSS en R ben ik laatst achter gekomen.
Ik heb me er niet echt in v erdiept maar een collega van me wel, weet niet precies wat het verschil is. Er zijn blijkbaar 4 manieren om sums of squares te berekenen, spss gebruikt manier 3(4?) en R 4(3?).quote:Op zaterdag 3 augustus 2013 12:30 schreef Operc het volgende:
[..]
Op wat voor manier? De uitkomsten of de vorm van de output?
Bedankt! Interessante blogpost over een onderwerp waar ik echt nog nooit bij stil had gestaan.quote:Op zaterdag 3 augustus 2013 12:32 schreef oompaloompa het volgende:
[..]
Ik heb me er niet echt in v erdiept maar een collega van me wel, weet niet precies wat het verschil is. Er zijn blijkbaar 4 manieren om sums of squares te berekenen, spss gebruikt manier 3(4?) en R 4(3?).
edit; here we go http://myowelt.blogspot.n(...)ults-in-r-as-in.html
Ik zat er dus concreet helemaal naast maar globaal klopte wat ik zei
Voor mij was het ook echt toeval dat mijn collega het vertelde die er ook per toeval achter was gekomen. Hij had een power berekening uitgevoerd (en gepubliceerd) waarna iemand anders hem er op attendeerde dat zijn power berekening andere uitkomsten had dan die van hem en daarna door uit te zoeken hoe dat kwam, kwam hij op dit verschil terecht.quote:Op zaterdag 3 augustus 2013 13:13 schreef Operc het volgende:
[..]
Bedankt! Interessante blogpost over een onderwerp waar ik echt nog nooit bij stil had gestaan.
Zaten er grote verschillen in die powerberekening? (Als in: veranderde de conclusie?)quote:Op zaterdag 3 augustus 2013 13:17 schreef oompaloompa het volgende:
[..]
Voor mij was het ook echt toeval dat mijn collega het vertelde die er ook per toeval achter was gekomen. Hij had een power berekening uitgevoerd (en gepubliceerd) waarna iemand anders hem er op attendeerde dat zijn power berekening andere uitkomsten had dan die van hem en daarna door uit te zoeken hoe dat kwam, kwam hij op dit verschil terecht.
Ja in plaats van 62 mensen had je er 90+ nodig. Nogal relevant als het om een nulvinding in een replicatie gaat...quote:Op zaterdag 3 augustus 2013 13:21 schreef Operc het volgende:
[..]
Zaten er grote verschillen in die powerberekening? (Als in: veranderde de conclusie?)
Het stuk over dat A+B andere uitkomsten geeft dan B+A vond ik weleen beetje onlogisch, maar dat hoofdeffecten niet altijd zinvol zijn bij interacties is wel iets om rekening mee te houden.
Omdat je drie assumpties schendt. Je hebt namelijk geen normaal verdeelde variabelen, er is geen lineaire samenhang en de variabelen zijn niet (beide) op ratio/interval schaal.quote:
Ah, ja dat is zuur inderdaad.quote:Op zaterdag 3 augustus 2013 13:24 schreef oompaloompa het volgende:
[..]
Ja in plaats van 62 mensen had je er 90+ nodig. Nogal relevant als het om een nulvinding in een replicatie gaat...
Maar dat hoeft niet voor een correlatie, je kunt gewoon een correlatie tussen een dicho + continuous doen hoor, alleen geen pearsonsquote:Op zaterdag 3 augustus 2013 13:52 schreef crossover het volgende:
[..]
Omdat je drie assumpties schendt. Je hebt namelijk geen normaal verdeelde variabelen, er is geen lineaire samenhang en de variabelen zijn niet (beide) op ratio/interval schaal.
Ik ging er inderdaad even vanuit dat het over Pearsons r ging, maar ik zou ook geen spearman doen, eigenlijk. Is het niet logischer om een kruistabel te maken en dan met bijv chi2 op significantie te toetsen?quote:Op zaterdag 3 augustus 2013 14:10 schreef oompaloompa het volgende:
[..]
Maar dat hoeft niet voor een correlatie, je kunt gewoon een correlatie tussen een dicho + continuous doen hoor, alleen geen pearsons
Hmm ligt er aan wat je wilt doen denk ik. Ik reageerde omdat ik een paper heb waar ik dichotome correlaties gebruik en reviewers geen kritiek hadden op de correlatie, daarom ben ik het ook uit gaan zoeken. In mijn geval is het niet zo dat ik een echt theoretische of statistische vraag heb, maar meer iets dat theoretisch gecorreleerd zou moeten zijn, als een soort controle dus. Als je iets wilt zeggen over de sterkte van een effect op een ander effect kun je vrij weinig met een correlatie en dan zou een regressie / anova beter zijn. Weet eigenlijk niet of een correlatie twussen twee dichotome maten kan, dan zou ik eigenlijk altijd een chi-square doen denk ik...quote:Op zaterdag 3 augustus 2013 14:13 schreef crossover het volgende:
[..]
Ik ging er inderdaad even vanuit dat het over Pearsons r ging, maar ik zou ook geen spearman doen, eigenlijk. Is het niet logischer om een kruistabel te maken en dan met bijv chi2 op significantie te toetsen?
Je moet zoeken op listwise / pairwise deletion.quote:Op maandag 5 augustus 2013 14:08 schreef edh88 het volgende:
Thanks everyone Naar alle waarschijnlijkheid hoef ik toch geen analyses te doen *zucht haha*.
Nog 1 vraagje; 1 van de vragen telt ongeveer 30 missings. Nu zei een collega dat hij gehoord had dat je de data in spss kon veranderen. Dus dat het laagste aantal respons als 100% wordt genomen. (het gaat om 1 vraag bestaande uit veel onderdelen, en laagste respons bij 1 van de onderdelen is 52, terwijl er 81 respondenten meededen). Anyone?? Heb al wat gegoogled maar kom er zo 1,2,3 niet uit XD
Thanks! Ik ga t bekijken.. ziet er zo op t eerste oog ingewikkeld uit!quote:Op maandag 5 augustus 2013 21:02 schreef crossover het volgende:
[..]
Je moet zoeken op listwise / pairwise deletion.
Hoe doe ik dat dan?quote:Op maandag 5 augustus 2013 22:11 schreef oompaloompa het volgende:
Een andere optie is om gewoon al die observaties helemaal uit te zetten door alleen cases te selecteren die op die afhankelijke >= 1 hebben bv.
Top super bedankt!!!quote:Op dinsdag 6 augustus 2013 08:47 schreef oompaloompa het volgende:
data -> select cases, select if (variabele) = 1
Dat was wel uit mn hoofd dus de knopjes kunnen iets anders hetenquote:
Knopjes kloppen wel Maar wat moet ik nu selecteren?quote:Op dinsdag 6 augustus 2013 08:49 schreef oompaloompa het volgende:
[..]
Dat was wel uit mn hoofd dus de knopjes kunnen iets anders heten
Als het om 1 variabele gaat kies je: select cases if condition is satisfied en onder dat knopje geef je aan (variabelenaam) = 1quote:Op dinsdag 6 augustus 2013 08:53 schreef edh88 het volgende:
[..]
Knopjes kloppen wel Maar wat moet ik nu selecteren?
Ben er achter dat ik niet meer dan 1 variabel tegelijk kan wijzigen (helaas, want het zijn er stuk of 30 die ik een ander 100 procent ding moeten hebben ).
Maar ik kan kiezen uit:
- all cases
- if condition is statisfied
- random sample of cases
- based on time or case range
- use filter variable
Mijn niet-spss-hoofd zegt optie 1 en 3 sowieso niet.
En voor output staat er de keuze:
- filter out unselected cases
- copy selected cases to a new dataset
- delete unselected cases
Ik gok optie 1?
IK denk dat pairwise deletion een betere optie is. Het gaat om 1 vraag die een lage repons heeft, en niet zozeer een aantal respondenten.quote:Op maandag 5 augustus 2013 21:02 schreef crossover het volgende:
[..]
Je moet zoeken op listwise / pairwise deletion.
zijn de twee independents main effecten?quote:Op woensdag 7 augustus 2013 14:31 schreef murdock88 het volgende:
Hoi experts,
Ik heb een model waarin 2 independent variables invloed hebben op Mediator 1, die weer via Mediator 2 invloed heeft op mijn dependent variabele. Om het nog gecompliceerder te maken is er ook nog een moderator die effect heeft op de relatie tussen mediator 2 en de dependent variable.
Weet iemand of je dit model gewoon met lineaire regressie kan meten in SPSS? Is het een kwestie van gewoon alle onafhankelijke variabelen en interactievariabelen in een keer bij de Independents invoeren in het menu?
Thanks
Wat is het probleem dat je krijgt?quote:Op woensdag 7 augustus 2013 16:51 schreef Brembo het volgende:
Weet iemand toevallig wat je moet doen als je bij een multinominale regressie analyse problemen hebt met je hessian-matrix?
"Unexpected singularities in the Hessian matrix are encountered. This indicates that either some predictor variables should be excluded or some categories should be merged."quote:Op woensdag 7 augustus 2013 16:54 schreef oompaloompa het volgende:
[..]
Wat is het probleem dat je krijgt?
Er stond mij vaag iets bij dat het juist het tegenovergestelde was, een correlatie van 1 waardoor er geen variantie is en niets berekend kan worden, maar ik moet toegeven dat ik zoiets nog nooit in het echt mee heb gemaakt en dus alleen een keer ergens in een les wat over gehoord heb. Goed om te horen dat je in ieder geval een oplossing hebt gevonden!quote:Op woensdag 7 augustus 2013 17:08 schreef Brembo het volgende:
[..]
"Unexpected singularities in the Hessian matrix are encountered. This indicates that either some predictor variables should be excluded or some categories should be merged."
Volgens mij komt het omdat er tussen een variabele 0 correlerende items zijn dus kan het ook niks berekenen.
Als alternatief heb ik nu gekozen voor forward en zijn de resultaten wel goed . Hij gooit er wel een variabele uit, maar dat is niet erg.
Amos is je vriend. Of STATA. Of Lisrel. Of EQS. Maar niet SPSS.quote:Op woensdag 7 augustus 2013 14:31 schreef murdock88 het volgende:
Hoi experts,
Ik heb een model waarin 2 independent variables invloed hebben op Mediator 1, die weer via Mediator 2 invloed heeft op mijn dependent variabele. Om het nog gecompliceerder te maken is er ook nog een moderator die effect heeft op de relatie tussen mediator 2 en de dependent variable.
Weet iemand of je dit model gewoon met lineaire regressie kan meten in SPSS? Is het een kwestie van gewoon alle onafhankelijke variabelen en interactievariabelen in een keer bij de Independents invoeren in het menu?
Thanks
moderated mediationquote:Op woensdag 7 augustus 2013 18:19 schreef crossover het volgende:
[..]
Amos is je vriend. Of STATA. Of Lisrel. Of EQS. Maar niet SPSS.
Je hebt het hier over mediated moderation.
correleert die 4e variabele sterk met een van de variabelen waarin je geinteresseerd bent?quote:Op zaterdag 10 augustus 2013 14:33 schreef murdock88 het volgende:
Nog bedankt voor de antwoorden!!! Ga het niet in een model meten maar in kleine delen. Heb nog 1 vraag: Heb 4 control variables gemeten, maar was er tot nu toe 1 vergeten toe te voegen aan het model. Wat nu blijkt is dat het model met 3 control variabelen significant is, maar met de 4e erbij niet meer. Dit terwijl die 4e control variable in geen enkel model ook maar een beetje significant is (scores van .650 enzo).
Mag je die controle variabele dan weghalen met de reden dat ie niks toevoegt en je model onderuit haalt? Het gaat (uiteraard;)) om een scriptie btw.
Oh ja. ik haal ze wel vaker door elkaarquote:Op woensdag 7 augustus 2013 18:59 schreef oompaloompa het volgende:
[..]
moderated mediation
Als murdockhet goed uitgelegd heeft is het moderated mediation en dan kan het gewoon met SPSS.
Ik weet wat de beperkingen zijn, maar in SPSS kun je ze in het geheel niet berekenen, terwijl andere programma's dat wel kunnen (waarbij je het CI dat het dichtst bij 95% ligt krijgt).quote:Op woensdag 21 augustus 2013 11:27 schreef crossover het volgende:
https://normaldeviate.wor(...)-and-dr-strangelove/
Met een streepje + sterretje of de exacte p-waardes.quote:Op maandag 23 september 2013 11:02 schreef MaxC het volgende:
Hoe zet ik in de grafiek een * als een verschil significant is? Ik zie met ANOVA dat p <0.05 is alleen hoe zet ik dat vervolgens in de grafiek?
Daarom maak je ze ook niet met SPSSquote:Op dinsdag 24 september 2013 00:46 schreef MaxC het volgende:
Ja precies dat 2e
Lukt me sowieso niet echt om mooie grafieken te maken met SPSS
Geen oplossing, maar beter dan handmatig is je veranderingen via de syntax doen, Dan moet je nog steeds elke keer iets aanpassen, maar is het slechts 1 knop.quote:Op zondag 29 september 2013 15:06 schreef sjoneah het volgende:
Weet iemand een oplossing voor mijn probleem?
We zijn bezig met een experiment waarbij een aantal onderzoekssessies gepland staan. Voor elke sessie moeten we vooraf een analyse maken om de groepen te verdelen.
Daarbij hercoderen wij een aantal variabelen waarna we vervolgens een berekening hierop los gooien en het resultaat in een nieuwe variabele zetten. Op basis van die laatste variabel maken wij de groepsindeling.
De respondenten kiezen trouwens in de vragenlijst een sessie waarop ze willen komen en een dag van te voren gooien wij nu steeds een sessie dicht zodat die niet gekozen kan worden waarna we vervolgens de bovenstaande analyse maken.
Voor morgen moet er weer een analyse gemaakt worden maar omdat er weer nieuwe respons bij zit krijg ik een nieuw .sav bestand vanuit de vragenlijst/Qualtrics. Als ik deze kopieer en plak in SPSS dan wordt deze data niet automatisch opnieuw gehercodeerd en de nieuwe variabele wordt ook niet opgesteld voor de nieuwe later ingevoegde data.
Weet iemand een optie waarmee ik dit wel kan bereiken? Dus dat bij het invoegen van nieuwe data de hercodering/variabele opstellen wel gewoon wordt uitgevoerd?
Alvast bedank!
Geen probleem, blij dat ik heb kunnen helpenquote:Op zondag 29 september 2013 15:37 schreef sjoneah het volgende:
Bedankt voor dit snelle antwoord! Door jouw oplossing ben ik eens even gaan knutselen met die Syntax functie van SPSS, dat kende ik nog niet maar dat is ontzettend handig. Ik kopieer nu steeds een deel van de output naar de syntax functie en dat werkt goed.
Naast het oplossen van mijn probleem heb je dus ook een bijdrage geleverd aan mijn kennis over mogelijkheden van SPSS, waarvoor bedankt!
Regressieanalyse of anova kan allebei, ligt een beetje aan wat je precies wilt doen.quote:Op donderdag 3 oktober 2013 10:09 schreef Stienn het volgende:
Ik heb even jullie hulp nodig, ik ben bezig met het schrijven van mijn afstudeer scriptie. Mijn onderwerp is of Het Nieuwe Werken invloed gaat hebben op de corebusiness van een Schoonmaakbedrijf.
Nu heb ik een onderscheid gemaakt in ondernemingen die
1. Het Nieuwe Werken hebben toegepast
2. Het Nieuwe Werken gaan toepassen
3. Het Nieuwe Werken niet gaan toepassen
Vervolgens is er achterhaald wat er met het schoonmaak budget is gebeurt, is dit gedaald of gestegen. Hieruit kan ik een gemiddelde berekenen hoeveel er gemiddeld gestegen of gedaald is.
Nu gaf mijn begeleider aan dat ik het beste regressie analyse hier op los kon laten om te kijken of er een samenhang is? Gebruik ik dan het goede model?
Ik wil de samenhang van de groei of krimp van het schoonmaak budget koppelen aan of er gekozen is wel of niet voor HNW.
Eeuhm dat lit er weer aan, als je afhankelijke is wel verhoogd vs niet verhoogd, dan een kruistabel.quote:Op donderdag 3 oktober 2013 14:43 schreef Stienn het volgende:
Thnx, ik wil inzicht geven of er een verband is in de daling van het schoonmaak budget of het wel of niet is ingevoerd. Als ik simpel nadenk kan ik dat toch ook aangeven in een kruistabel?
wat wit je in je grafiek hebben? Het aantal maal dat anders is ingevuld? Lijntjes/staven per mogelijke string in D? In beide gevallen is Recode een optie.quote:Op vrijdag 4 oktober 2013 11:19 schreef Freire het volgende:
even een kort vraagje: in mijn enquête zit een vraag met 4 antwoordmogelijkheden, bijvoorbeeld:
A) ...............
B) ...............
C) ...............
D) Anders, namelijk
Hoe krijg ik de antwoorden die bij D zijn ingevuld nu in mijn grafieken?
Coderen in andere variabelen. Stel de vraag is wat voor huisdier je hebt en bij D vullen 5 mensen in Cavia, 3 Paard en 2 Koe, dan moet je D uitsplitsen in die 3 variabelen met de respectievelijke labels.quote:Op vrijdag 4 oktober 2013 11:19 schreef Freire het volgende:
even een kort vraagje: in mijn enquête zit een vraag met 4 antwoordmogelijkheden, bijvoorbeeld:
A) ...............
B) ...............
C) ...............
D) Anders, namelijk
Hoe krijg ik de antwoorden die bij D zijn ingevuld nu in mijn grafieken?
Sorry, het was misschien een beetje onduidelijk.quote:Op vrijdag 4 oktober 2013 11:23 schreef dotKoen het volgende:
ld? Lijntjes/staven per mogelijke string in D? In beide gevallen is Recode een optie.
Graag gedaan.quote:Op vrijdag 4 oktober 2013 11:26 schreef Freire het volgende:
[..]
Sorry, het was misschien een beetje onduidelijk.
De vraag in de enquête is bijvoorbeeld:
Wat is uw favoriete vakantieland?
A) Spanje
B) Frankrijk
C) Duitsland
D) België
E) Anders, namelijk...
Hiervan wil ik een 'Pie' maken, maar het lukt me niet om de ingevoerde antwoorden bij E) in die 'Pie' te krijgen.
Bedankt voor de snelle reactie trouwens
Edit: De post van Operc te laat gezien. Dank!
Doen wat alle wetenschappers tegenwoordig leuk vinden om te doen: Noem de interactie marginaal significant en zeg dat hier tekenen zijn van een effect maar dat vervolg onderzoek moet aantonen in welke maat het echt een sterk effect isquote:Op zondag 6 oktober 2013 18:03 schreef dramatiek het volgende:
Wie o wie kan me helpen met onderstaande probleem. Ik heb zelf behoorlijk wat tijd geïnvesteerd in het zoeken naar het juiste antwoord, maar het lijkt wel of alle studieboeken voorbeelden gebruiken waarbij de combinatie van onderstaande uitkomsten niet voorkomen. Of ik heb natuurlijk iets in de aanloop verkeerd gedaan.
Ik heb de scores van de afhankelijke en onafhankelijk variabele en moderator gemiddeld (compute mean a1,a2 etc) en daarna gesaved als zscore.
Vervolgens heb ik in een regressie analyse in block 1 de zscore onafhankelijk variabele en moderatie gezet gezet en in blok twee de interactieterm.
Als afhankelijke variabele heb ik zscore afhankelijke variabele ingevoerd.
In mijn eerste hypothese veronderstel ik een positief verband tussen onafhankelijke variabele en afhankelijke variabele en in mijn tweede hypothese stel ik dat de moderator een positieve invloed heeft op die samenhang.
Nu krijg ik als resultaat in "model summary" voor model 1 een p waarde van .042 en voor model 2 een p waarde van .067. De ANOVA geeft voor model 1 een p waarde idem als in model summary en een p waarde voor model 2 van 0.021.
Wanneer ik dan in de tabel kijk met coëfficiënten is de onafhankelijke variabele in model 1 significant (p .033, moderator is 0.223) maar in model 2 is niets meer significant (0.052, 0.122, en voor de interactieterm 0.067)
Ik zit totaal vast met het komen tot een conclusie wanneer ik naar deze resultaten kijk. Ik kom niet verder dan dat er een hoofdeffect is van onafhankelijk variabele + moderator op de afhankelijke variabele, maar dat de moderator zelf (interactie) geen invloed heeft op de samenhang tussen onafhankelijke variabele en afhankelijke variabele. Ook is de samenhang voor de afhankelijke variabele positief gezien de beta in coefficiententabel positief is en significant is. Heb de gegevens ook gevisualiseerd en daar zou je van zeggen dat de interactie wel significant is.
Wie kan me helpen om tot een conclusie te komen. Ik mis overduidelijk iets...........
wat is precies je vraag. Je omschrijft namelijk je resultaten maar zegt nergens waar je nu hulp bij nodig hebtquote:Op zondag 6 oktober 2013 18:03 schreef dramatiek het volgende:
Wie o wie kan me helpen met onderstaande probleem. Ik heb zelf behoorlijk wat tijd geïnvesteerd in het zoeken naar het juiste antwoord, maar het lijkt wel of alle studieboeken voorbeelden gebruiken waarbij de combinatie van onderstaande uitkomsten niet voorkomen. Of ik heb natuurlijk iets in de aanloop verkeerd gedaan.
Ik heb de scores van de afhankelijke en onafhankelijk variabele en moderator gemiddeld (compute mean a1,a2 etc) en daarna gesaved als zscore.
Vervolgens heb ik in een regressie analyse in block 1 de zscore onafhankelijk variabele en moderatie gezet gezet en in blok twee de interactieterm.
Als afhankelijke variabele heb ik zscore afhankelijke variabele ingevoerd.
In mijn eerste hypothese veronderstel ik een positief verband tussen onafhankelijke variabele en afhankelijke variabele en in mijn tweede hypothese stel ik dat de moderator een positieve invloed heeft op die samenhang.
Nu krijg ik als resultaat in "model summary" voor model 1 een p waarde van .042 en voor model 2 een p waarde van .067. De ANOVA geeft voor model 1 een p waarde idem als in model summary en een p waarde voor model 2 van 0.021.
Wanneer ik dan in de tabel kijk met coëfficiënten is de onafhankelijke variabele in model 1 significant (p .033, moderator is 0.223) maar in model 2 is niets meer significant (0.052, 0.122, en voor de interactieterm 0.067)
Ik zit totaal vast met het komen tot een conclusie wanneer ik naar deze resultaten kijk. Ik kom niet verder dan dat er een hoofdeffect is van onafhankelijk variabele + moderator op de afhankelijke variabele, maar dat de moderator zelf (interactie) geen invloed heeft op de samenhang tussen onafhankelijke variabele en afhankelijke variabele. Ook is de samenhang voor de afhankelijke variabele positief gezien de beta in coefficiententabel positief is en significant is. Heb de gegevens ook gevisualiseerd en daar zou je van zeggen dat de interactie wel significant is.
Wie kan me helpen om tot een conclusie te komen. Ik mis overduidelijk iets...........
Er zijn twee manieren hoe je dit kunt interpreteren.quote:Op maandag 7 oktober 2013 19:06 schreef dramatiek het volgende:
Bedankt voor de feedback. Mijn vraag was welke conclusies ik hier aan kan verbinden. Met name de resultaten van de anova kan ik niet rijmen met de rest van de resultaten. Weet niet precies hoe ik de conclusie moet omschrijven.
In hypothese 1 veronderstel ik een positieve samenhang tussen onafh en afhankelijke variabele. In hypothese twee veronderstel ik dat de moderator een positieve invloed heeft op de relatie tussen onafhankelijke en afhankelijke variabele.
Gokje is inderdaad goed. Erg weinig proefpersonen (41). Opdracht gaat meer om het doen dan relevant onderzoek.
[ afbeelding ]
Ok, dus de ANOVA an sich geeft wel aan dat het volledige model significant. Dus als daar een niet significante p waarde uit was gekomen voor model 1 en 2 had ik helemaal niet verder hoeven kijken?quote:Op dinsdag 8 oktober 2013 01:54 schreef oompaloompa het volgende:
[..]
Er zijn twee manieren hoe je dit kunt interpreteren.
De eerste is de soort van fascistische dichotome alles onder .05 is sig en dus belangrijk, alles erboven niet. Dan is interpretatie vrij straightforward.
De wat genuanceerdere interpretatie is dat je power erg laag is en je p-waardes daarom relatief hoog zijn. Dan zou ik gewoon naar de B's kijken in je tweede model. Er is dan dus een positief effect van de IV, en een interactie effect van e moderator, namelijk een positief effect voor de moderator an sich, maar de IV*moderator heeft een negatief effect dat dat opheft.
nb; in jouw stukje spreek je over een positief effect van de moderator, maar het lijkt een negatief effect te zijn.
Ligt er aan hoeveel gewicht je geeft aan p-waardesquote:Op dinsdag 8 oktober 2013 17:15 schreef dramatiek het volgende:
[..]
Ok, dus de ANOVA an sich geeft wel aan dat het volledige model significant. Dus als daar een niet significante p waarde uit was gekomen voor model 1 en 2 had ik helemaal niet verder hoeven kijken?
Ik ben niet helemaal duidelijk geweest hierin gisteren (ik geef mn jetlag de schuld)quote:Ik neem mee als conclusie dat de IV een positief effect heeft op de DV en dat de moderator een negatieve invloed heeft op die relatie.
Heb feedback van mijn begeleider die meldt dat ik moet spreken van "een trend". De gebruikte analyse zoals in de opgave was verder ok (betrouwbaarheidsanalyse,schalen berekenen (compute mean, dan gestandaardiseerde versie van schalen berekenen (zscore), interactieterm berekenen en multiple regressie uitvoeren)quote:Op dinsdag 8 oktober 2013 17:30 schreef oompaloompa het volgende:
[..]
Ligt er aan hoeveel gewicht je geeft aan p-waardes
[..]
Ik ben niet helemaal duidelijk geweest hierin gisteren (ik geef mn jetlag de schuld)
Daarnaast realiseer ik me nu ook pas dat je waarschijnlijk twee continue IV's hebt gemeten.
Wat je hebt gevonden is dat met 1 punt hoger op emoV, mensen ongeveer .3 hoger scoren op de DV
1 punt hoger op extraV leidt tot een .23 hoger op de DV
De interactie tussen emoC en extraV zorgt er voor dat 1 punt hoger op die interactie leidt tot .35 lager op de DV
Dus voor iemand met 0 op emoV, zorgt er voor dat 1 hoger scoren op emoC leidt tot een hogere uitkomst op de DV, maar voor iemand die 1 scoort op emoV, zorgt het 1 hoger scoren op emoC tot een iets lagere uitkomst op de DV (+ .23 - .35 --> -.12)
Het probleem alleen met allebei veranderen in z-scores, is dat je je interactie nogal beperkt, je nteractie term moet dan namelijk even groot zijn voor iemand met -2 en en -2 als voor iemand met +2 en +2.
Nu moet ik als disclaimer zeggen dat ik vrijwel nooit regressies met interacties doe op continue variabelen, maar volgens mij klopt wat ik hierboven zeg, ik vind het conceptueel heel erg vreemd om een regressie te doen op een interactie van twee gecentreerde variabelen. Daarnaast maak je volgens mij ook nog andere assumpties op die manier, namelijk een exponentieel verband, een score van 2&2 telt als 4 in je regressie, maar 3&3 telt als 9.
Nu ben ik wel heel nieuwsgierig wie je begeleider is want, no offense naar jou toe, het klinkt eerder alsof je begeleider je probeert trucjes aan te leren dan je te helpen te begrijpen hoe je zoiets moet doen.quote:Op dinsdag 8 oktober 2013 18:35 schreef dramatiek het volgende:
[..]
Heb feedback van mijn begeleider die meldt dat ik moet spreken van "een trend". De gebruikte analyse zoals in de opgave was verder ok (betrouwbaarheidsanalyse,schalen berekenen (compute mean, dan gestandaardiseerde versie van schalen berekenen (zscore), interactieterm berekenen en multiple regressie uitvoeren)
Ook krijg ik de feedback dat ik p-waarde eventueel door 2 mag delen wanneer ik in mijn hypothese een richting aangeef (in dit geval een positief verband)
Beide IV variabelen zijn extraversie en emotionele stabiliteit, gemeten met 9 puntsschaal (uit bigfive test).
Ik vind het allemaal nogal vrij vaag. Lijkt me dat het minder vaag zou worden met 4000 ipv 42 respondenten.
Je zou pas naderhand richting geven aan je hypothese, dat is niet de bedoeling kan ik je beloven;)quote:Op dinsdag 8 oktober 2013 18:35 schreef dramatiek het volgende:
[..]
Heb feedback van mijn begeleider die meldt dat ik moet spreken van "een trend". De gebruikte analyse zoals in de opgave was verder ok (betrouwbaarheidsanalyse,schalen berekenen (compute mean, dan gestandaardiseerde versie van schalen berekenen (zscore), interactieterm berekenen en multiple regressie uitvoeren)
Ook krijg ik de feedback dat ik p-waarde eventueel door 2 mag delen wanneer ik in mijn hypothese een richting aangeef (in dit geval een positief verband)
Beide IV variabelen zijn extraversie en emotionele stabiliteit, gemeten met 9 puntsschaal (uit bigfive test).
Ik vind het allemaal nogal vrij vaag. Lijkt me dat het minder vaag zou worden met 4000 ipv 42 respondenten.
Nee, die richting staat natuurlijk op voorhand vast. Die ga je er niet achteraf bij bedenken.quote:Op dinsdag 8 oktober 2013 20:36 schreef Noppie2000 het volgende:
[..]
Je zou pas naderhand richting geven aan je hypothese, dat is niet de bedoeling kan ik je beloven;)
Maar je zei dat je een positieve interactie verwachtte. Nu vind je een negatieve die je vanje begeleider nog eenzijdig moet toetsen ook. Als dat niet achteraf je hypothese bedenken is, dan weet ik het ook niet meerquote:Op dinsdag 8 oktober 2013 21:01 schreef dramatiek het volgende:
[..]
Nee, die richting staat natuurlijk op voorhand vast. Die ga je er niet achteraf bij bedenken.
quote:Op dinsdag 8 oktober 2013 21:43 schreef oompaloompa het volgende:
[..]
Maar je zei dat je een positieve interactie verwachtte. Nu vind je een negatieve die je vanje begeleider nog eenzijdig moet toetsen ook. Als dat niet achteraf je hypothese bedenken is, dan weet ik het ook niet meer
Wat hij zegt, tenminste zo interpreteer ik het, dat je soms de p waarde mag halveren wanneer je een richting veronderstelt in je hypothese. (negatief danwel positief). Op zich wordt de hypothese dan nog verworpen, ondanks het halveren van de p waarde omdat de invloed negatief is en niet positief zoals ik mijn hypothese gedacht had. Ik ga nu niet ineens de hypothese veranderen in dat ik een negatieve invloed van de moderator verwachtte.....quote:Op dinsdag 8 oktober 2013 21:43 schreef oompaloompa het volgende:
[..]
Maar je zei dat je een positieve interactie verwachtte. Nu vind je een negatieve die je vanje begeleider nog eenzijdig moet toetsen ook. Als dat niet achteraf je hypothese bedenken is, dan weet ik het ook niet meer
Ik geloof helemaal dat hij dat zegt want dat zijn dingen die je wel vaker hoort. Het is alleen niet correctquote:Op dinsdag 8 oktober 2013 22:17 schreef dramatiek het volgende:
[..]
[..]
Wat hij zegt, tenminste zo interpreteer ik het, dat je soms de p waarde mag halveren wanneer je een richting veronderstelt in je hypothese. (negatief danwel positief). Op zich wordt de hypothese dan nog verworpen, ondanks het halveren van de p waarde omdat de invloed negatief is en niet positief zoals ik mijn hypothese gedacht had. Ik ga nu niet ineens de hypothese veranderen in dat ik een negatieve invloed van de moderator verwachtte.....
Zijn de opties 0-6 ordinale of nominale variabelen? Of misschien nog handiger, wat betekent 0-6?quote:Op vrijdag 25 oktober 2013 17:03 schreef Keessie88 het volgende:
Hoi,
Hier ook een SPSS vraagje, hoop dat iemand me op weg kan helpen
Momenteel bezig met mijn scriptie. Korte uitleg van mijn afhankelijke variabele: ik wil onderzoeken hoe vaak bepaalde werkzaamheden worden uitgevoerd op een risico. De informatie die ik heb is:
1. De hoeveelheid risico's per case (met een maximum van 13 risico's);
2. Per risico een antwoord hoe dit risico is opgevolgd (mogelijke antwoorden zijn 0 t/m 6).
3. Ik wil in mijn afhankelijke variabele weergeven bij hoeveel risico's per case het antwoord 5 is gegeven. Ik wil namelijk onderzoeken of in de economische crisis vaker het antwoord 5 wordt gegeven dan voor de crisis.
4.Ik heb per case bepaalt hoe vaak het antwoord 5 is gegeven, dit heb ik gedeeld door het aantal risico's per case , hierdoor krijg ik een soort van verhoudingsgetal.
Het probleem waar ik tegenaan loop is dat bij veel cases het antwoord 5 helemaal niet is gegeven. Ik heb dus relatief vaak een score van 0,00 (immers 0 gedeeld door het aantal risico's). Het gemiddelde van de variabele ligt daarom rond de 0,11.
Omdat ik een regressie-analyse wil uitvoeren moet mijn afhankelijke variabele normaal verdeeld zijn. Dat is deze niet.Op het moment dat bijvoorbeeld voor 3 van de 4 variabelen het antwoord 5 is gegeven komt hier een score uit van 0,75, wat door SPSS als een outlier wordt gezien. In mijn histogram zie ik een grote piek bij de 0,00. Ik heb ook al een logaritme van de variabele gemaakt, maar dit veranderd niets aan de vorm van de histogram.
Ik zou alle outliers eruit kunnen gooien of ze normaliseren, dit leidt er echter naar mijn idee toe dat de uitkomsten straks totaal niet meer betrouwbaar/representatief zijn. Ik ben dus op zoek naar een andere oplossing waarbij ik wel een normaal verdeelde variabele heb, maar de kwaliteit van de dataset wel geborgd blijft. Hoop dat ik het een beetje duidelijk heb kunnen uitleggen, heeft iemand een idee hoe ik dit kan oplossen?
Als het alleen er om gaat of ze optie 5 wel of niet doen zou ik een logistische regressie gebruiken. Omdat het om een keuze gaat tussen 0 (niet doen) en 1 (wel doen) zal je data nooit normaal verdeeld zijn. Wat een logistische regressie doet is kijken naar de odds ratio van wel vs niet iets doen. Door daar de log van te nemen zouden de data approx normal moeten zijn en kun je dus een regressie erop uitvoeren.quote:Op zaterdag 26 oktober 2013 08:53 schreef Keessie88 het volgende:
Hey, thanks voor je reactie. Hier wat meer details:
- de opties 0-6 zijn nominale variabelen. Het is een scriptie voor de opleiding accountancy. Bij 0-6 heeft de respondent moeten aangeven wat voor soort werkzaamheden hij heeft gedaan om het risico te beperken (bv interview met het personeel, het doen van een cijferbeoordeling)
- De risico's zijn onafhankelijk.
Ik dacht een regressie-analyse uit te voeren om te onderzoeken of mijn mijn variabelen van invloed zijn op de afhankelijke variabele. Bv. zorgt een lagere auditfee ervoor dat de accountant zijn werk anders doet (tijdsdruk).
Ik heb daarnaast ook data van voor de crisis, om het effect te meten wil een Paired Samples T-test gebruiken. Ik heb namelijk van dezelfde firma's data van voor en tijdens de crisis. Ik kan hierbij dus het effect meten bij een specifieke firma zelf.
Dat zou niet uit moeten maken maar dan zit je wel met een moeilijkere analyse en gebruik je een mixed model:quote:Op maandag 28 oktober 2013 07:43 schreef Keessie88 het volgende:
Ik wil graag toetsen of ze optie 5 vaker gebruiken dan voorheen, door er een dummyvariabele van te maken (0 en 1) kan ik alleen nog zeggen of ze optie 5 hebben gekozen, maar niet of dat in verhouding vaker is dan voorheen. Nu heb ik het aantal keer optie 5 gedeeld door het totaal aantal risico's, waardoor je een verhoudingsgetal krijgt.
Als ik het zo lees bedoel je dat ik per risico moet aangeven of ze wel of niet optie 5 hebben gebruikt?Dus een 0 en een 1 scoren per risico? Praktisch probleem hierbij is alleen dat niet alle firma's alle risico's hebben.
Kom er dus helaas nog niet helemaal uit, dankje voor het meedenken iig!
volgens mij kan dit niet?quote:Op donderdag 31 oktober 2013 09:56 schreef elineee het volgende:
n B --> C is de homoscendasticiteit niet in orde (In de plot zijn bijna alle waarden tussen de -1 en 0 te vinden).
Kun je iets meer vertellen over de variabelen, voornamelijk variabele B?quote:Op donderdag 31 oktober 2013 09:56 schreef elineee het volgende:
Ik ben op het moment bezig met mijn masterscriptie en al een tijdje aan het worstelen met SPSS.
Ik wil graag gaan testen of er een medierende effect is: A ---> B ---> C
Hiervoor moet ik natuurlijk eerst gaan kijken of er aan de voorwaarden van mediatie voldaan wordt:
A --> C
A --> B
B --> C
Dit wil ik doen d.m.v. enkelvoudige regressie analyse, want ik denk dat alle verbanden hierboven asymmetrisch zijn en Scale x Scale zijn.
Nu voldoet het bij A --> C aan de vooronderstellingen van enkelvoudige regressie analyse (lineair en homoscendasticiteit), maar bij zowel A --> B en B --> C is de homoscendasticiteit niet in orde (In de plot zijn bijna alle waarden tussen de -1 en 0 te vinden).
Nu vraag ik me af of ik de variabele B moet transformeren (zoja, op welke manieren kan dat) of moet ik een andere test gaan gebruiken in plaats van de enkelvoudige regressieanalyse (zoja, hoe weet ik welke?)
Ik hoop dat het een duidelijke vraag is en jullie me kunnen helpen, want zelf ben ik erg in de war!
Alvast bedankt!
Eigenlijk hier hetzelde, hoe bedoel je frequentiemaat?quote:Op donderdag 31 oktober 2013 10:08 schreef elineee het volgende:
En ik kreeg van mijn begeleidster de feedback niet te middelen bij het maken van een frequentiemaat.
Weet iemand waarom niet? En wat ik dan wel moet doen? De SuM?
Variabele B is dus fysieke kindermishandeling. Dit is een frequentiemaat. Ik kijk naar het afgelopen half jaar en dan naar de frequentie daarvan.quote:Op donderdag 31 oktober 2013 18:06 schreef oompaloompa het volgende:
Kun je iets meer vertellen over de variabelen, voornamelijk variabele B?
Reagerend hierop: Het gaat bij mijn variabele A en C niet op frequentiematen en daarom gebruik ik daarbij een regressie analyse, maar variabele B is dit wel en nu weet ik niet welke analyse ik daarvoor moet gebruiken..quote:Op donderdag 31 oktober 2013 14:38 schreef Silverdigger2 het volgende:
hoezo gebruik je dan regressie analyses?
Het probleem van je frequentiemaat is dat dit een sort van logaritme is, het verschil tussen 6 en 7 is groter dan het verschil tussen 2 en 3, toch tel je allebei als "1". Waarom gebruik je niet gewoon de absolute aantallen?quote:Op dinsdag 5 november 2013 13:44 schreef elineee het volgende:
Om duidelijker te zijn:
Ik kijk in mijn studie naar het effect van Psychopathologie bij ouders (Depressie+Angst) op het Coping gedrag van kinderen (in conflicten met ouders/leeftijdsgenoten). Daarnaast kijk welk effect Fysieke Kindermishandeling heeft op dit effect. Ik verwacht dat dit een medierend effect heeft.
[..]
Variabele B is dus fysieke kindermishandeling. Dit is een frequentiemaat. Ik kijk naar het afgelopen half jaar en dan naar de frequentie daarvan.
Om deze variabele te maken heb ik de items omgescoord waarbij:
1=0x
2=1x
3=2x
4=4x
5=8x
6=15x
7=25x of meer
Nu wil ik van deze items de frequentiemaat/variabele fysieke kindermishandeling maken.
Ik had dit gedaan door te middelen : Mean.5(item1+item2+etc)*7.
Mijn begeleidster gaf echter aan dat het te simpel is om te middelen met een frequentiemaat.
Ik heb geen idee wat ik nu wel moet doen.
Ik heb van mijn begeleidster ze juist moeten omscoren omdat dit staat voor het getal. Dus degene die 6 invulde heeft daadwerkelijk 15x zijn/haar kind geslagen in het afgelopen jaar (sorry het is een beetje een naar onderwerp waardoor dit erg banaal klinkt, maar voor het analyseren moet het helaas zo besproken worden).quote:Op dinsdag 5 november 2013 15:22 schreef oompaloompa het volgende:
Het probleem van je frequentiemaat is dat dit een sort van logaritme is, het verschil tussen 6 en 7 is groter dan het verschil tussen 2 en 3, toch tel je allebei als "1". Waarom gebruik je niet gewoon de absolute aantallen?
Dit zegt dus iedereen die ik spreek, maar het is een variabele bestaand uit items die op wetenschappelijke basis is samengesteld. Ik weet dus zeker dat de items hetzelfde meten, namelijk fysieke kindermishandeling en dat ze even sterk/zwaar zijn.quote:Op dinsdag 5 november 2013 15:22 schreef oompaloompa het volgende:
Voor het combineren van de items tot 1 gemiddelde is het verder belangrijk dat al die items hetzelfde meten, ik ken je items niet, maar ik vermoedt dat dat niet het geval is. Wat dat betreft heeft je begeleider ook gelijk omdat als je dan het gemiddelde neemt, je impliciet er van uit gaat dat je schalen hetzelfde meten en dat iemand die 2 op item 1 antwoord en 4 op item 2, hetzelfde is als iemand die 4 op item 1 zegt en 2 op item 2.
De '25 of meer' categorie, is dat ook wat mensen hebben ingevuld, of heb je precieze scores (25, 32, 41) en die samengevat in 25 of meer? In het laatste geval: Losse scores pakken en niet omscoren naar 1-7 maar in absolute aantallen de waardes invoeren.quote:Op woensdag 6 november 2013 10:19 schreef elineee het volgende:
[..]
Ik heb van mijn begeleidster ze juist moeten omscoren omdat dit staat voor het getal. Dus degene die 6 invulde heeft daadwerkelijk 15x zijn/haar kind geslagen in het afgelopen jaar (sorry het is een beetje een naar onderwerp waardoor dit erg banaal klinkt, maar voor het analyseren moet het helaas zo besproken worden).
Nu snap ik dat het logaritmisch is, maar is er dan een andere manier waarop ik dit kan omzeilen?
Nou ja het enige dat je kunt doen is het ook op die manier interpreteren, maar dat maakt het hele verhaal een stuk moeilijker. Ik begrijp niet goed waarom je begeleider deze manier wil gebruiken omdat het je data minder inzichtelijk maakt. Uiteindelijk zul je een conclusie hebben waarop je zegt; een score van 1 hoger op "schaal" leidt tot "x", maar wat een score van 1 hoger op "schaal" betekent hangt af van waar je kijkt, 2-3 is anders dan 5-6. Het maakt dus alles veel ingewikkelder.quote:Op woensdag 6 november 2013 10:19 schreef elineee het volgende:
[..]
Ik heb van mijn begeleidster ze juist moeten omscoren omdat dit staat voor het getal. Dus degene die 6 invulde heeft daadwerkelijk 15x zijn/haar kind geslagen in het afgelopen jaar (sorry het is een beetje een naar onderwerp waardoor dit erg banaal klinkt, maar voor het analyseren moet het helaas zo besproken worden).
Nu snap ik dat het logaritmisch is, maar is er dan een andere manier waarop ik dit kan omzeilen?
[..]
Je kunt statstisch kijken of dat inderdaad zo is, door bv correlaties te bekijken, crohnbachs alfa en de items los te nemen en te laten zien dat ze allemaal een vergelijkbare b hebben. Daarnaast zul je voornamelijk een logisch argument moeten hebben waarom ze wel samen zouden kunnen, een soort uitgebreidere versie van wat je net zeiquote:Dit zegt dus iedereen die ik spreek, maar het is een variabele bestaand uit items die op wetenschappelijke basis is samengesteld. Ik weet dus zeker dat de items hetzelfde meten, namelijk fysieke kindermishandeling en dat ze even sterk/zwaar zijn.
Geen flauw idee. SPS afsluiten en opnieuw opstarten zou normaal gezien wel moeten werken. Wat voor macro wil je precies uitzetten? (Als het een macro is die een functie toevoegt is het niet erg dat deze geactiveerd blijft, als hij bestaande functies aanpast mogelijk wel.)quote:Op donderdag 7 november 2013 11:35 schreef Z het volgende:
Kan een actieve macro ook gedeactiveerd worden (via syntax)?
quote:Op vrijdag 8 november 2013 15:02 schreef Z het volgende:
R biedt daar allerlei mogelijkheden voor (lijnen met marges). Ik kan je niet precies vertellen hoe dat aan te pakken.
Thanks, Ik heb al het een en ander met ggplot gedaan in R maar heb R tot nu toe alleen gebruikt voor datasimulatie etc. Zo te zien is het tijd geworden ook dataanalyse in R te leren doenquote:Op vrijdag 8 november 2013 15:44 schreef Felagund het volgende:
ggplot2 (pakket van R) biedt o.a. de mogelijkheid om de transparantie van punten scatterplots aan te passen, wat patroonherkenning een stuk beter opmaakt. De syntax van dit pakket (plots opgebouwd uit lagen) maakt het ook makkelijk om er een lijn aan toe te voegen.
Ik kan kijken of ik een simpel voorbeeldje kan maken.
Hmm bij mij is het precies andersom, mijn t-toetsen durf ik wel in R te doen, het is mijn 6000N 300 variabelen dataset waar ik het toch wel heel erg fijn vind om mijn data te kunnen zien.quote:Op vrijdag 8 november 2013 19:11 schreef Z het volgende:
Maar SPSS blijft een fantastisch pakket. Vandaag dingen gedaan met data restructure en autorecode. Dat zou in andere pakketten uren geduurd hebben en in SPSS zo gepiept. Maar naar mate databestanden groter worden, verwacht ik steeds minder met SPSS te doen. En deste meer met R en Python (pandas).
Kan je ze niet simpelweg via compute bij elkaar optellen? Ervanuitgaande dat iedereen maar één conditie heeft doorlopen, krijg je dan dus of 0 +0+0+1 = conditie 1, 0+0+0+2 = conditie 2 enzovoorts. Dan zie je dus aan de hand van de uitkomst welke conditie dat is geweestquote:Op zaterdag 9 november 2013 17:06 schreef Bakkerd het volgende:
Poeh, ik zit muurvast met iets dat waarschijnlijk heel simpel is. Hoop dat iemand mij hier kan helpen!
Ik heb vier condities, elke proefpersoon heeft één hiervan doorlopen.
De condities zijn genummerd van 1 tm 4. Dat ziet er dus zo uit:
[ afbeelding ]
(klein stukje, want 300 proefpersonen)
Nu wil ik één variabele maken waarin ik kan zien wie welke conditie heeft doorlopen, ik wil dus eigenlijk die 4 variabelen van de afbeelding in één variabele proppen. Weet iemand hoe ik dit voor elkaar krijg?
Voor de zekerheid, je hebt niet het hele personeelsbestand gevraagd naar hun reistijd toch?quote:Op woensdag 13 november 2013 21:11 schreef ballenbak015 het volgende:
Ik bijt me hier nog steeds op stuk.
Toets of je mag concluderen dat meer dan 30% van het personeel langer dan 30 minuten reistijd heeft.
Hierbij heb ik de binomiale toets gebruikt.
[ afbeelding ]
Nu heb ik deze test uitgevoerd (binomiale.. volgens mij de goede) en zie ik dat de significantie zo ontzettend laag is, onder mijn onbetrouwbaarheid van 5%.. hieruit mag ik dan toch concluderen dat 30% van het personeel een reistijd langer dan 30 minuten heeft?
Alvast bedankt..
Nee, de dataset bestaat uit de gegevens van drie instituten dus niet het gehele personeelsbestand.quote:Op woensdag 13 november 2013 22:28 schreef Operc het volgende:
[..]
Voor de zekerheid, je hebt niet het hele personeelsbestand gevraagd naar hun reistijd toch?
Goed om te horen dat het gelukt is!quote:Op donderdag 14 november 2013 13:22 schreef elineee het volgende:
Kan je een enkelvoudige regressie analyse en/of een Chi Square analyse uitvoeren wanneer de N verschilt per schaal (Door missings)?
ps. Ik heb hier eerder een vraag gesteld over mijn masterscriptie en voor degenen mij hierbij hebben proberen te helpen: Het is gelukt. Allereerst kwam mijn begeleidster erachter dat ze een fout had gemaakt dus dat haar feedback niet klopte en we hebben er geen frequentiemaat, maar een prevalentiemaat van gemaakt uiteindelijk (en dus kan ik de Chi-Square doen :-) )
De grootte van de populatie maakt in principe niet uit.Wel is het zo dat je steekproef (24 per conditie of 24 in totaal?) extreem klein is, je power zal dus vrij laag zijn. Zo laag dat, als er echt een verschil is in de populatie, de kans dat je dit verschil statistisch aan kunt tonen vrij klein zal zijn door middel van t-toetsen.quote:Op maandag 9 december 2013 12:59 schreef ganzenherder het volgende:
Ben, na jaren geen SPSS en statistiek toegepast te hebben, nu op zeer pragmatistisch niveau bezig met het verwerken van data.Ik heb naast een 24 tal diepte interviews gehouden te hebben de respondenten ook vragenlijsten laten invullen.
Nu wil ik kijken, middels een T-toets, of groep A significant hoger scoort dan groep B in mijn onderzoek. Het antwoord is (voorlopig) dat dat niet het geval is.
Maar ik neem aan dat SPSS er van uit gaat dat die 24 respondenten een steekproef vormen uit een (zeer) grote populatie. Wat niet het geval is, ik schat de populatie op onder de 100 zelfs. Ik vrees dat dit een grote invloed heeft op de resultaten van de T-toets.
Enig idee hoe SPSS redeneert in deze kwestie en hoe ik dit anders kan aanpassen? Zoals ik al zei is het al een paar jaar geleden dat ik veel met SPSS en statistiek te maken had dus het kan zijn dat ik wat basiskennis mis in deze kwestie...
De eerste 11 cases (rijen dus) kun je gewoon deleten uit het SPSS bestand. Kijk ook even of er onder de laatste respondent niet nog een rij is waarin iets staat (totaal ofzo) en haal die dan ook weg.quote:Op woensdag 8 januari 2014 18:56 schreef Thrills het volgende:
Binnenkort dien ik mijn eindrapport voor mijn afstuderen in te leveren, met een aantal resultaten die ik tot nu toe van Thesistools binnen heb probeer ik al een beetje te oefenen met het uitlezen en verwerken van de statistieken zodat ik niet over een tijdje alles nog moet ontdekken in SPSS.
Nu loop ik tegen het volgende probleem aan, ik heb het .xls bestand geïmporteerd naar SPSS en dit geeft al een redelijk goede weergave, als ik nu wat crosstables of frequencies probeer te testen en te bekijken telt ie 135 respondenten, dit zijn er eigenlijk 123. Tevens deelt ie de legenda verkeerd in, misschien dat de onderstaande afbeeldingen het verhaal iets duidelijker maken.
Op afbeelding 1 kun je zien dat SPSS de antwoorden '1=man' voornamelijk allemaal onder gewoon '1' geschaard heeft. Afbeelding twee laat de eerste elf (lege) cellen zien welke SPSS ook als respondent meetelt (er zijn nog andere cellen aan het einde die het op 135 laten uitkomen). Mijn vraag is dus hoe ik beide problemen kan verhelpen om alles duidelijk en leesbaar eruit te laten komen, ben helaas niet zo'n ster met SPSS.
[ afbeelding ]
[ afbeelding ]
Super, bedankt! Dit heeft inderdaad de problemen opgelost.quote:Op woensdag 8 januari 2014 19:03 schreef Operc het volgende:
[..]
De eerste 11 cases (rijen dus) kun je gewoon deleten uit het SPSS bestand. Kijk ook even of er onder de laatste respondent niet nog een rij is waarin iets staat (totaal ofzo) en haal die dan ook weg.
Wat betreft 1 en 1=man: kijk in die kolom of er bij de respondenten 1 of 1=man staat. In principe is het het netste om alleen met de nummers te werken (1 en 2 in dit geval) en dan via Variable View de Labels aan te passen dat 1=man en 2= vrouw. Je kunt dan in het data venster bovenin nog klikken op of je de weergave wil in cijfers (1 en 2) of de labels (man en vrouw). Dit zou al redelijk wat moeten oplossen. Zo niet, laat even weten welk probleem je dan overhoudt (het liefste weer met screenshots.)
Mooiquote:Op woensdag 8 januari 2014 19:12 schreef Thrills het volgende:
[..]
Super, bedankt! Dit heeft inderdaad de problemen opgelost.
Nooit Thesistools gebruikt (wel vaak langs zien komen). Kan Qualtrics data opslaan als SPSS-bestand? Een programma wat ik ooit gebruikte kon dat wel, maar geen idee meer hoe dat heette.quote:Op woensdag 8 januari 2014 19:23 schreef eleganza het volgende:
^ Dit vond ik het grote probleem van Thesistools De datafile moet je eerst nog half slopen
+1 voor Qualtrics, vind ik echt stukken beter dan TT.
Jup, je kunt je data rechstreeks exporteren naar een .sav bestand dat je direct in spss kunt laden, en de variabelen ook al direct een naam geven in qualtrics als je de vragenlijst maakt zodat je je niet dood zoekt in een databestand met 130 variabelen (story of my life). De eerste 6-7 variabelen zijn niet echt relevant, maar data over start/eindtijd, ip adres, respondentid en zulk soort dingen als je iets wil zeggen over de vragenlijst zelfquote:Op woensdag 8 januari 2014 19:35 schreef Operc het volgende:
[..]
Nooit Thesistools gebruikt (wel vaak langs zien komen). Kan Qualtrics data opslaan als SPSS-bestand? Een programma wat ik ooit gebruikte kon dat wel, maar geen idee meer hoe dat heette.
Dat is praktisch inderdaad. Om het werken aan je scriptie (gok ik?) nog makkelijker te maken: gebruik Mendeley voor je literatuur/referenties. Scheelt veel geklooi.quote:Op woensdag 8 januari 2014 19:40 schreef eleganza het volgende:
[..]
Jup, je kunt je data rechstreeks exporteren naar een .sav bestand dat je direct in spss kunt laden, en de variabelen ook al direct een naam geven in qualtrics als je de vragenlijst maakt zodat je je niet dood zoekt in een databestand met 130 variabelen (story of my life). De eerste 6-7 variabelen zijn niet echt relevant, maar data over start/eindtijd, ip adres, respondentid en zulk soort dingen als je iets wil zeggen over de vragenlijst zelf
Echt, ik studeer nu 7 jaar, en had in mn eerste jaar willen weten van Qualtrics. Het is super gebruiksvriendelijk, en van ThesisTools heb ik nog moeten huilen toen ik mijn hbo scriptie ging schrijven. Veel universiteiten (vaak faculteiten) hebben een abonnement op qualtrics, waardoor je ongelimiteerd aantal respondenten hebt. Als je het als student zonder abo heb je max 250 respondenten, maar meestal is dat meer dan voldoende.
Laat ik nou net bijna klaar zijn met mn literatuur Ik ben mn scriptie een beetje verkeerd om aan het schrijven, eerst mn vragenlijst, dan methode/literatuur, dan analyse. (en dan de rest ) Maar ik kom hier nog wel even terug voor regressieanalyse. Heb ooit statistiek 1 gevolgd, maar ik ben om te huilen met cijfers. Sla mezelf nog steeds om 't feit dat ik een vragenlijst heb gekozen en niet kwalitatief ben gaan onderzoekenquote:Op woensdag 8 januari 2014 19:42 schreef Operc het volgende:
[..]
Dat is praktisch inderdaad. Om het werken aan je scriptie (gok ik?) nog makkelijker te maken: gebruik Mendeley voor je literatuur/referenties. Scheelt veel geklooi.
Binnenkort eens naar Qualtrics kijken dan (vooral voor de combinatie met SPSS.)
Heb je de cellen met de Limburger/Nederlander variabele gecodeerd in cijfers en deze cijfers labels gegeven? Of heb je in die cellen gewoon echt LM en NL getypt?quote:Op dinsdag 21 januari 2014 15:51 schreef sirdanilot het volgende:
Ik heb een hoop problemen met SPSS.
Even kort verhaaltje:
Twee groepen, Limburgers (LM) en Nederlanders (NL), hebben een bepaalde test gedaan. Hieruit kwam een bepaalde reactie tijd. Ik wil kijken of er een significant verschil is tussen de resultaten van de twee groepen; waren de Limburgers significant sneller, waren de NL significant sneller, of is er geen significant verschil.
Dus ik doe de Independent-Samples T-test.
[ link | afbeelding ]
Maar ik krijg deze foutmelding:
The GROUPS subcommand specifies an unknown variable or a long string variable. This subcommand must specify either a numeric variable or a short string variable. Text found: SubjLang
Wat doe ik fout? Ik ben echt ten einde raad met dit verschrikkelijke programma.
Even geprobeerd, maakt geen klap uit, doet het bij beide. Is er misschien 1 rij (of meerdere) waarin iets anders staat dan LM/NL of de reactietijd? (Zoals het woord 'reactietijd' bijvoorbeeld?)quote:Op dinsdag 21 januari 2014 16:29 schreef Operc het volgende:
[..]
Heb je de cellen met de Limburger/Nederlander variabele gecodeerd in cijfers en deze cijfers labels gegeven? Of heb je in die cellen gewoon echt LM en NL getypt?
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Had inderdaad gewoon getypt, stom ! Nu doet hij wel iets. Dankquote:Op dinsdag 21 januari 2014 16:29 schreef Operc het volgende:
[..]
Heb je de cellen met de Limburger/Nederlander variabele gecodeerd in cijfers en deze cijfers labels gegeven? Of heb je in die cellen gewoon echt LM en NL getypt?
Zelfs met die laatste variant zou het wel moeten werken, maar fijn dat je weer verder kunt.quote:Op dinsdag 21 januari 2014 17:11 schreef sirdanilot het volgende:
[..]
Had inderdaad gewoon getypt, stom ! Nu doet hij wel iets. Dank
Zou kunnen, of een iets andere variabele instelling ofzo.quote:Op dinsdag 21 januari 2014 17:34 schreef sirdanilot het volgende:
Misschien heb ik een oudere versie van spss?
Wat wil je nu precies weten? Hoe je een F-statistiek krijgt of welk percentage mannen er in je sample zit?quote:Op dinsdag 28 januari 2014 15:21 schreef Milchat het volgende:
Wat tof dat dit topic er is! Ook al ontdek je het pas als je het nodig hebt.. Ik heb een SPSS/statistiek vraagje. In de resultaten zie je vaak zo'n tabel met gegevens over de proefpersonen, meestal means en SD's. Daarachter staat dan ook een kolom met F-waarden en * voor significant of niet.
Mijn vraag is, hoe bereken je nou die F-waardes, voor bijvoorbeeld zoiets als het procent mannen in de sample? Het is vast héél simpel, maar ik kom er maar niet achter hoe ik dit bereken in SPSS
Heeft iemand een idee?
Nou, beide? Het percentage mannen en of dit een significant percentage is.quote:Op dinsdag 28 januari 2014 15:28 schreef Noppie2000 het volgende:
[..]
Wat wil je nu precies weten? Hoe je een F-statistiek krijgt of welk percentage mannen er in je sample zit?
SPSS is volgens mij vooral handig om bestaande datasets te analyseren, terwijl je in R de datasets uitgebreid kunt aanpassen. Daarnaast heb je in R veel meer controle over wat je doet (je kunt een grafiek precies zo maken als jij wilt), en je kunt ook real-time data verwerken. R is ook gratis natuurlijk.quote:Op donderdag 23 januari 2014 23:08 schreef _Dido_ het volgende:
Wat is eigenlijk het verschil tussen spss en R? kunnen ze precies dezelfde dingen? Ik wil mn statistiek- en spss-kennis weer afstoffen
Percentage mannen kan je simpelweg berekenen door (ik denk via desciptives) te vragen naar de hoeveelheden mannelijke en vrouwelijke proefpersonen. Dan aantal mannelijke proefpersonen delen door het totaal aantal proefpersonen vermenigvuldigen met 100quote:Op dinsdag 28 januari 2014 15:29 schreef Milchat het volgende:
[..]
Nou, beide? Het percentage mannen en of dit een significant percentage is.
Oké, dat zal ik eens proberen ja.quote:Op dinsdag 28 januari 2014 15:39 schreef Noppie2000 het volgende:
[..]
Percentage mannen kan je simpelweg berekenen door (ik denk via desciptives) te vragen naar de hoeveelheden mannelijke en vrouwelijke proefpersonen. Dan aantal mannelijke proefpersonen delen door het totaal aantal proefpersonen vermenigvuldigen met 100
Of het een significant percentage is, waar wil je dat voor weten? Denk sowieso niet dat je daar een F-statistiek aan moet koppelen.
Zou je output eens moeten zien, snap nog niet helemaal hoe of wat Wellicht dat iemand anders je hier beter kan helpen, of je moet hier willen posten wat je hebt staan in SPSS natuurlijk.quote:Op dinsdag 28 januari 2014 15:45 schreef Milchat het volgende:
[..]
Oké, dat zal ik eens proberen ja.
Het is een tabel met sample characteristics, en onder andere staan daar de F-waardes en significantie van het percentage man, en bijvoorbeeld ook het IQ. Ik wil het ook niet persé weten, maar het schijnt in zo'n overzichtstabel te horen en daarom moet het erbij van mijn begeleider Het is een vaag verhaal, I know..
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
quote:Op dinsdag 28 januari 2014 15:59 schreef Milchat het volgende:
Thanks voor het mee denken in elk geval Field heb ik al bekeken van kaft tot kaft. Het punt is niet dat ik mijn output niet snap, ik weet niet hoe ik het ín mijn output krijg. Ik wil iets weten, maar heb geen idee hoe ik dat uit SPSS laat rollen.
Hierbij een plaatje van hoe zo'n tabel eruit zou moeten zien (met gevoelige informatie weggewerkt).Mjah, voor zover ik zie is er geen output bij F. Dit zijn gewoon standaard gegevens zoals je zegt. Weet niet hoe je het er bij moet krijgen, maar lijkt me aardig triviaal. Moet het er echt bij?SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Nee, dit is geen output. En inderdaad, standaardgegevens, maar die F-waarde moet er echt bij.quote:Op dinsdag 28 januari 2014 16:12 schreef Noppie2000 het volgende:
[..]
Mjah, voor zover ik zie is er geen output bij F. Dit zijn gewoon standaard gegevens zoals je zegt. Weet niet hoe je het er bij moet krijgen, maar lijkt me aardig triviaal. Moet het er echt bij?
Om maar even een balletje op te gooien, bedoelt hij niet het percentage Female? Dus: 100 proefpersonen (F=60%) bijvoorbeeld?quote:Op dinsdag 28 januari 2014 16:18 schreef Milchat het volgende:
[..]
Nee, dit is geen output. En inderdaad, standaardgegevens, maar die F-waarde moet er echt bij.
Ik zou eigenlijk ook niet weten of je dan significant verschil berekent ten opzichte van de hele sample, of ten opzichte van de andere groepen ofzo. Geen flauw idee
Maar misschien dat iemand die hier wel bekend mee is dit leest?
Maar heb je daar dan ook een F-waarde van?quote:Op dinsdag 28 januari 2014 17:13 schreef Operc het volgende:
[..]
Om maar even een balletje op te gooien, bedoelt hij niet het percentage Female? Dus: 100 proefpersonen (F=60%) bijvoorbeeld?
Ik bedoelde meer: Zit er niet een communicatie fout tussen jullie dat hij met 'F' aantal vrouwen bedoelde maar het leek alsof hij het had over een F-waarde?quote:Op woensdag 29 januari 2014 10:28 schreef Milchat het volgende:
[..]
Maar heb je daar dan ook een F-waarde van?
Dan wil ik alleen het percentage mannen erin, ik voorzie een bias.quote:Op woensdag 29 januari 2014 10:49 schreef motorbloempje het volgende:
Ik denk alleen maar een fuckability-waarde. Maar dat klopt vast niet.
Je kan wel kijken of er een significant verschil zit tussen mannen in de verschillende groepen op je afhankelijke variabelen, als je dat dan misschien bedoelt. Anders zou ik even gaan naar je begeleider ja.quote:Op woensdag 29 januari 2014 11:38 schreef Milchat het volgende:
LOL, nee ik bedoel oprecht een F-waarde. Het zou ook tussen groepen kunnen zijn, want ik heb groepen in mijn analyse. Hoeveel procent er man is van elke groep en of dit significant is ofzo?
Ik ga mijn begeleider dan wel weer lastig vallen, blijkbaar is het toch niet zo'n domme vraag
Verstandig als je een lager cijfer wil hebbenquote:Op woensdag 29 januari 2014 11:38 schreef Milchat het volgende:
LOL, nee ik bedoel oprecht een F-waarde. Het zou ook tussen groepen kunnen zijn, want ik heb groepen in mijn analyse. Hoeveel procent er man is van elke groep en of dit significant is ofzo?
Ik ga mijn begeleider dan wel weer lastig vallen, blijkbaar is het toch niet zo'n domme vraag
Als je zo denkt ga je Andy Field briljant vinden. Volgens hem is SPSS een afkorting voor Satan's Personal Statistics Slave.quote:Op woensdag 29 januari 2014 10:49 schreef motorbloempje het volgende:
Ik denk alleen maar een fuckability-waarde. Maar dat klopt vast niet.
Even vragen waar hij precies de F-waarde van wil hebben kan geen kwaad nee.quote:Op woensdag 29 januari 2014 11:38 schreef Milchat het volgende:
LOL, nee ik bedoel oprecht een F-waarde. Het zou ook tussen groepen kunnen zijn, want ik heb groepen in mijn analyse. Hoeveel procent er man is van elke groep en of dit significant is ofzo?
Ik ga mijn begeleider dan wel weer lastig vallen, blijkbaar is het toch niet zo'n domme vraag
Ach, je moet wel zelf nadenken, maar vragen om verduidelijking als je feedback krijgt van je begeleider is echt niet desastreus voor je cijfer.quote:Op woensdag 29 januari 2014 13:29 schreef Syntix het volgende:
[..]
Verstandig als je een lager cijfer wil hebben
Overigens SPSS Ben toch maar geswitched naar wat anders, want hoe langer je met SPSS werkt hoe meer je merkt dat het een heel beperkt programma is.
Eens, tijdens je feedback kun je best zulke vragen stellen. Echter, als je elke week gaat mailen om vragen over SPSS dan kan dat zeker invloed hebben of je cijfer.quote:Op woensdag 29 januari 2014 13:35 schreef Operc het volgende:
[..]
Als je zo denkt ga je Andy Field briljant vinden. Volgens hem is SPSS een afkorting voor Satan's Personal Statistics Slave.
[..]
Even vragen waar hij precies de F-waarde van wil hebben kan geen kwaad nee.
[..]
Ach, je moet wel zelf nadenken, maar vragen om verduidelijking als je feedback krijgt van je begeleider is echt niet desastreus voor je cijfer.
Klopt, veel universiteiten hebben ook nog wel een SPSS/statistiek helpdesk waar je beter met die vragen terecht kunt (of hier natuurlijk). Al hebben wij meer informatie nodig over wat er nu precies bedoeld wordt.quote:Op woensdag 29 januari 2014 13:44 schreef Syntix het volgende:
[..]
Eens, tijdens je feedback kun je best zulke vragen stellen. Echter, als je elke week gaat mailen om vragen over SPSS dan kan dat zeker invloed hebben of je cijfer.
Hebben jullie wel mijn plaatje van de tabel bekeken? Als jullie ook allemaal niet begrijpen wat er bedoeld wordt dan vind ik het wel een steeds vreemdere tabel worden..quote:Op woensdag 29 januari 2014 13:45 schreef Operc het volgende:
[..]
Klopt, veel universiteiten hebben ook nog wel een SPSS/statistiek helpdesk waar je beter met die vragen terecht kunt (of hier natuurlijk). Al hebben wij meer informatie nodig over wat er nu precies bedoeld wordt.
Ah, dat verklaart. Ja dan kun je gewoon een ANOVA doen en dan komt de F waarde (en daarna de p-waarde) er vanzelf uitrollen.quote:Op woensdag 29 januari 2014 15:49 schreef Milchat het volgende:
[..]
Hebben jullie wel mijn plaatje van de tabel bekeken? Als jullie ook allemaal niet begrijpen wat er bedoeld wordt dan vind ik het wel een steeds vreemdere tabel worden..
Stel dat ik de F-waarde van IQ wil weten in die tabel in plaats van geslacht, en je hebt van de 4 verschillende groepen de means en standaard deviaties al in de tabel gezet. Zou het dan gaan om significant verschil in IQ tussen groepen? (Er komt maar 1 F-waarde kolom in de tabel voor verschillende variabelen, dus niet een F waarde per groep t.o.v. de sample).
Stel het gaat dan bij IQ om een significant verschil tussen groepen, hoe krijg je dat dan uit SPSS?
Ah! Ik wist dat het eenvoudig moest zijn, maar zo eenvoudig.. thanks!quote:Op woensdag 29 januari 2014 15:52 schreef Operc het volgende:
[..]
Ah, dat verklaart. Ja dan kun je gewoon een ANOVA doen en dan komt de F waarde (en daarna de p-waarde) er vanzelf uitrollen.
Dit inderdaad. Had dat meteen gezegd joh!quote:Op woensdag 29 januari 2014 15:52 schreef Operc het volgende:
[..]
Ah, dat verklaart. Ja dan kun je gewoon een ANOVA doen en dan komt de F waarde (en daarna de p-waarde) er vanzelf uitrollen.
Graag gedaan.quote:Op woensdag 29 januari 2014 15:56 schreef Milchat het volgende:
[..]
Ah! Ik wist dat het eenvoudig moest zijn, maar zo eenvoudig.. thanks!
Ik snap je tabel niet helemaal. Wat heb je precies gedaan qua groepen en vragen?quote:Op vrijdag 31 januari 2014 21:40 schreef stefanschippers het volgende:
Goedenavond,
Ik werk voor het eerst met SPSS en ik heb een aantal kruistabellen gemaakt voor verbanden die ik wil bekijken. Deze voldoen aan de voorwaarden voor de chi2-toets, maar ik snap niet hoe ik nou aan de hand van de observed count en de expected count een 'uitspraak' kan doen. Bij een 'ja' 'nee' vraag lukt me dat nog wel nu niet.
Zijn er hier wellicht mensen met een beetje SPSS-kennis die me kunnen helpen? als ik er eentje heb gedaan dan lukken die andere ook wel. Het gaat in het onderstaande voorbeeld-geval over het effect van gratis retour aanbieden op het percentage terugkerende klanten. Ik wil daar gewoon kortweg iets over kunnen zeggen.
http://postimg.org/image/qm35b3p65/
Zeer bedankt alvast
P.S. ja ik weet dat ik achteraf ook boven de 40 % verder had moeten tellen, maar de groep die 50 %, 60 % etc. zou antwoorden verwachte ik erg laag.
Bedankt voor je reactie Ik heb al gehercodeerd, eerst waren er namelijk nog meer antwoordopties. Maar volgens jou moeten er nog meer groepen samengevoegd worden?quote:Op vrijdag 31 januari 2014 23:06 schreef sirdanilot het volgende:
Je moet kijken bij Sig (van significance). Sig > 0,05, dus niet significant.
EDIT: Ik zal nog iets verduidelijken
Het gaat erom of de groepen die jij hebt ingedeeld, de waarden 'above chance level' beïnvloeden. Dat wil zeggen; er moet minder dan 5% kans zijn, dat de waarden door toeval gewoon zijn zoals ze zijn. De waarden moeten dus voldoende verschillen van de expected value. De expected value is meestal totaal van de rij * totaal van de kolom / totaal van rijen + kolommen bij elkaar.
Misschien als je je groepen anders indeelt, dat je wel een effect krijgt. Dat is meestal de crux bij dit soort dingen. Je deelt je groepen arbitrair in, en dan rolt er niks uit. Je moet idealiter ook een reden hebben om je groepen in te delen zoals je doet.
De statistiek hier is dus niet zo heel zinnig. Misschien kun je iets van een correlatie-test doen of zo, kijk maar in je handboek. Maar dan moet je eigenlijk eerst een significante chi square hebben? Hier eindigt mijn kennis zo'n beetje.
Jij ook bedankt voor de reactie! De hypothese die getoetst moet worden is eigenlijk dat aanbieden van gratis retour een positief effect heeft op het percentage bezoekers dat terugkeert na een aankoop. Eerst heb ik dus de winkels gevraagd in een enquête welk percentage van de bezoekers terugkeert en daarna heb ik een aantal vragen gesteld over o.a. wel of geen gratis retour (en nog 10 andere elementen die mogelijk van invloed zijn op een hoger 'terugkeer-percentage' klanten). Nu wil ik dus gaan kijken welke van deze dingen duidelijk invloed hebben.quote:Op zaterdag 1 februari 2014 01:13 schreef Operc het volgende:
[..]
Ik snap je tabel niet helemaal. Wat heb je precies gedaan qua groepen en vragen?
Ik neem aan dat 'opnieuw kopen' de afhankelijke variabele is? Maar wat is gratis_retourtoepassing dan? En waar staat de ja/nee voor?
Tot zover klopt het iddquote:Op zaterdag 1 februari 2014 14:54 schreef Operc het volgende:
Dus, als ik het goed begrijp zit het als volgt: Je hebt aan de winkeliers gevraagd wat het percentage van mensen is dat terugkomt, introduceert daarna het "gratis terugbrengen"
Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.quote:en vraagt vervolgens aan klanten hoe groot ze de kans inschatten dat ze nog een keer terugkomen en je wil die twee cijfers met elkaar vergelijken?
Ik heb dus de klanten niets gevraagd zoals ik zei het gaat ook er ook niet om dat ze in de toekomst nog van plan zijn terug te keren maar of de winkel op dit moment in het algemeen veel terugkerende klanten heeft of niet.quote:Achteraf kun je er weinig mee, dat begrijp ik, maar het was prettig geweest als je er een iets logischere schaal van had gemaakt, waarbij elke antwoordmogelijkheid een even grote groep procenten weergeeft.
Heb je toevallig de vraag ook gesteld in ja/nee? (dus: ga je nog eens kopen: ja/nee) want deze informatie is lastig te verwerken. Dit komt omdat er een optie 0-20 procent is, waarbij het nogal uitmaakt of iemand echt niet van plan is om nog eens te kopen (0 procent) of de kans niet heel groot is (20 procent).
Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?quote:Op zaterdag 1 februari 2014 15:15 schreef stefanschippers het volgende:
[..]
Tot zover klopt het idd
[..]
Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.
[..]
Ik heb dus de klanten niets gevraagd zoals ik zei het gaat ook er ook niet om dat ze in de toekomst nog van plan zijn terug te keren maar of de winkel op dit moment in het algemeen veel terugkerende klanten heeft of niet.
Het betreft alleen webwinkels, deze kunnen dus aan de hand van statistieken meten hoeveel procent van de klanten blijft (voor degene die dat niet meten, was er de optie 'ik weet het niet').
Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.quote:Op zaterdag 1 februari 2014 16:08 schreef Operc het volgende:
[..]
Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.quote:Op zaterdag 1 februari 2014 17:11 schreef stefanschippers het volgende:
[..]
Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.
Zit daar hét probleem dus, die schaal? Want als dat de oplossing is, dan is het daarvoor nog wel de moeite waard om even opnieuw de respondenten (met schaamte ) benaderen.
Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..quote:Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:
[..]
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.
Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?quote:Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.
Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.
Niemand die mij zou kunnen helpen?quote:Op vrijdag 31 januari 2014 19:36 schreef Crack_ het volgende:
Hallo!
Ik hoop dat julle mij kunnen helpen met kijken of de dingen die ik wil meten ook gemeten worden met de daarbij behorende toetsen. In oderstaand schema staan de te meten variabelen met de toets waarvan ik denk dat die daarbij hoort.
[ afbeelding ]
Hier onder nog een schema waar het zelfde wordt gezegd maar dan met de meetschalen
[ afbeelding ]
Bedankt !
Ja je gebruikt dan een t-toets of ANOVA, afhankelijk van uit hoeveel groepen je onafhankelijke variabele bestaat (in dit geval 2, ja/nee, dus dan kan een t-toets. Als het er meer worden, moet je richting de ANOVA waarschijnlijk, maar beide zijn geen hogere wiskunde en kunnen makkelijk via SPSS worden gedaan.)quote:Op zondag 2 februari 2014 11:58 schreef stefanschippers het volgende:
[..]
Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..
[..]
Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.quote:Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:
[..]
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.
Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.
Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.
De counts bij een correcte chi-square test moeten minimaal 5 zijn!quote:Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:
[..]
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.
http://s29.postimg.org/nr57jrntz/expected_count.jpg
Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is? Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?
Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.quote:Op donderdag 6 februari 2014 16:28 schreef eleganza het volgende:
Dacht dat ik hier niet meer terug hoefde te komen, helaas voor mijn laatste ... ALLERLAATSTE analyse nog wel.
Ik wil een crosstab maken met 2 variabelen, waar eentje al vast staat. De andere moet ik berekenen aan de hand van of cases boven/gelijk of onder het gemiddelde zitten. Het wordt dus een 0 (onder het gemiddelde) of 1(gelijk of hoger dan gemiddelde) waarde. Heb nu het volgende gedaan: Compute variable (nieuwe variabele) = oude variabele >= (gemiddelde oude variabele)
Krijg er dan wel uit wat ik wil? Ik heb .00 en 1.00's gekregen, en het lijkt te werken. Is mijn logica hier logisch? Ik volg mezelf namelijk ook niet altijd
Waarom codeer je naar 0-20% etc? Als je gewoon de absolute percentages hebt (bedrijf A 7%, bedrijf B 43% etc) dan hoef je niet met die chi-squares te klooien en kun je met gemiddeldes, standaarddeviaties en t-toetsen werken.quote:Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:
[..]
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.
http://s29.postimg.org/nr57jrntz/expected_count.jpg
Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is? Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?
Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:quote:Op donderdag 6 februari 2014 16:40 schreef Operc het volgende:
[..]
Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.
Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:quote:Op donderdag 6 februari 2014 17:44 schreef eleganza het volgende:
[..]
Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:
Nieuwe var= attitude variabele >= 5.25
Volgens mij is alles nu 1 wat boven of gelijk is aan die 5.25, en alles dat daar niet aan voldoet 0.
Toch?
Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoel )quote:Op donderdag 6 februari 2014 18:31 schreef Operc het volgende:
[..]
Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:
if attitude >=5.25 Nieuwe variabele = 1
if attitude <5.25 Nieuwe variabele = 0
Maar jouw methode werkt ook volgens mij.
EDIT: Aangezien ik gok dat je een helemaal niet mee eens - helemaal mee eens 7-puntsschaal hebt gebruikt is het effectief 1-5 en 6-7 natuurlijk.
Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?quote:Op donderdag 6 februari 2014 22:33 schreef eleganza het volgende:
[..]
Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoel )
EDIT: Ik zit dat ik niet duidelijk had gemaakt dat ik de kwartielen had berekend en daar t tweede kwartiel van gepakt had.
Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.quote:Op donderdag 6 februari 2014 23:31 schreef Operc het volgende:
[..]
Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?
In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)quote:Op vrijdag 7 februari 2014 12:41 schreef eleganza het volgende:
[..]
Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.
FB_NRFUNCT * BI_ATTITUDE Crosstabulation
Count
BI_ATTITUDE Total
funct | laag | hoog
1.00 1 0 1
2.00 2 5 7
3.00 8 7 15
4.00 30 31 61
Total 41 43 84
4 van de 8 cellen hebben een waarde lager dan vijf door die scheve verdeling.
Hij geeft mij nu dit bij chisquare
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 2.322a 3 .508
Likelihood Ratio 2.750 3 .432
Linear-by-Linear Association .038 1 .845
N of Valid Cases 84
a 4 cells (50.0%) have expected count less than 5. The minimum expected count is .49. (.45, .45, .15 en .13 voor andere variabelen)
Dat laatste betekent toch dat ik er niks mee kan?
Bij andere vier variabelen in dezelfde crosstab heb ik ook geen significante resultaten, maar ik mag daar ivm die expected count toch niks over zeggen?
Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede. (so much for inzicht in statistiek als masterstudent)quote:Op vrijdag 7 februari 2014 13:26 schreef Operc het volgende:
[..]
In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)
Als je kijkt naar de scores in de groepen, dan zie je dat er eigenlijk tussen laag en hoog weinig verschil zit (verschillen van -1, 3, -1, 1). Het is dus niet zo waarschijnlijk dat daar significante resultaten uit zullen komen, even afgezien van de minimale groepsgroottes. Dat kan deels komen door een plafondeffect. Je ziet dat het grootste deel van de deelnemers (61 van de 84) de maximale score heeft bereikt. Een mogelijke invloed van attitude om de score te verhogen in een van de twee groepen is daardoor dus vrijwel onmogelijk. Misschien had je een grotere spreiding gevonden als je maximale score 10 of hoger was geweest, maar dat weet je niet.
Wat je nog zou kunnen proberen, is score 1 en 2 eruit laten, wegens te weinig proefpersonen en in plaats van een mediaan als ijkpunt voor wat hoog en wat laag is, het eerste en derde kwartiel pakken. Je gooit dan een deel van je data weg, maar je kunt dat eventueel beredeneren door te stellen dat een score van 5.24 nu niet echt van 5.26 afwijkt, terwijl je volgens de eerste methode deze twee wel als totaal anders ziet (laag en hoog). Als je zoiets doet zou ik wel eerst een analyse met alle data draaien en in je scriptie opnemen, voordat je aan dergelijke subgroepen begint. Een heldere omschrijving van en redenatie waarom je bepaalde statistische keuzes maakt is heel belangrijk voor lezers van een artikel.
Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.quote:Op vrijdag 7 februari 2014 13:52 schreef eleganza het volgende:
[..]
Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede. (so much for inzicht in statistiek als masterstudent)
Wat ik hier eigenlijk van wil weten is gebruiken mensen met een hogere attitude (hoger dan de mediaan in mijn geval) nou meer functies dan mensen met een lagere attitude dan de mediaan? Dat heb ik als het goed is berekend met die eerste crosstabs (1,2,3,4 waren het aantal functies), maar is dan die chisquare 'valide' genoeg om te zeggen dat het niet significant is? Doet me verder niks dat het niet significant is, is ook een resultaat - maar het moet wel valide zijn als ik dat wil aanvoeren als argument!
Uiteraard, uiteraard Over het algemeen is er wel een positievere wending, dus hoe positiever men op een variabele scoort, des te meer functies respondenten gebruiken, maar het is dus niet significantquote:Op vrijdag 7 februari 2014 13:55 schreef Operc het volgende:
[..]
Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.
Gefeliciteerd!quote:Op vrijdag 7 februari 2014 14:20 schreef eleganza het volgende:
[..]
Uiteraard, uiteraard Over het algemeen is er wel een positievere wending, dus hoe positiever men op een variabele scoort, des te meer functies respondenten gebruiken, maar het is dus niet significant
* eleganza heeft net antwoord gegeven op haar onderzoeksvraag uit haar scriptie
Als het niet ingewikkelder wordt dan dit:quote:Op vrijdag 14 februari 2014 14:40 schreef Droplollie het volgende:
Ik ben momenteel een syntax aan het schrijven voor een reeks onderzoek die eraan gaan komen.
Nou wil ik een standaard syntax schrijven die een categorial variable omzet naar een dummy.
Voorbeeld:
Van variabele 'locatie' zijn duizend mogelijkheden van 1 t/m 1000.
In onderzoek A worden locaties 100, 200 en 300 aangevinkt.
Voor de variabele 'locatie' wil ik dan voor locatie 100, 200 en 300 een dummy gemaakt wordt.
Er komen dan dus drie nieuwe variabelen bij.
Is dit op één of andere manier mogelijk geautomatiseerd doen?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | Do IF locatie=100. compute locatie100 = 1. compute locatie200 = 0. compute locatie300 = 0. Else if locatie=200. compute locatie100 = 0. compute locatie200 = 1. compute locatie300 = 0. Else if locatie = 300. compute locatie100 = 0. compute locatie200 = 0. compute locatie300 = 1. Else. compute locatie100 = 0. compute locatie200 = 0. compute locatie300 = 0. End if. Execute. |
Die syntax ken ik, maar ik wil dan dus van alle mogelijke locaties (1 - 10.000) een dummy hebben.quote:Op vrijdag 14 februari 2014 15:04 schreef dotKoen het volgende:
[..]
Als het niet ingewikkelder wordt dan dit:
[ code verwijderd ]
Maar volgens mij zijn er ook wel mooiere macro's voor creëren van dummies te vinden.
Dat moet je dus met een macro doen. Zoiets als http://www.glennlthompson.com/?p=92.quote:Op vrijdag 14 februari 2014 16:32 schreef Droplollie het volgende:
[..]
Die syntax ken ik, maar ik wil dan dus van alle mogelijke locaties (1 - 10.000) een dummy hebben.
Dus mogelijk zit er locatie 101 tussen. Dan wordt het met jouw voorbeeld niet als dummy gepakt.
1 2 3 4 5 6 | naam1 geslacht score 1 naam1 geslacht score 2 naam1 geslacht score 3 naam2 geslacht score 1 naam2 geslacht score 2 naam2 geslacht score 3 |
1 2 | naam1 geslacht score 1 score 2 score 3 naam2 geslacht score 1 score 2 score 3 |
quote:Op woensdag 19 februari 2014 10:53 schreef Z het volgende:
Met 'restructure'. Is een SPSS functie (ergens in een menu te vinden).
Is dat uberhaupt nodig? een hardnekkig misverstand is dat data normaal verdeeld moeten zijn voor parametrische testen, maar dat is helemaal niet de assumptie, deze is slechts dat de means normaal verdeeld zijn.quote:Op donderdag 27 februari 2014 13:54 schreef Krizzyboy89 het volgende:
Vraagje: Ik ben nu bezig met multipele lineaire regressie en heb voor mijn analyses een aantal log transformaties gedaan, zodat ze wat normaler verdeeld zijn.
Het heeft te maken met het soort missing value dat je hebt. Niets invullen is een system missing en wel iets invullen maar het aanstippen als missing is een andere missing.quote:Op dinsdag 18 maart 2014 17:49 schreef oompaloompa het volgende:
Ik begrijp niet waarom mensen uberhaupt nummers invoeren bij missing values (alhoewel wij het ook aanleerden met "999") waarom zou je die cellen niet gewoon leeg laten?
Of heb ik al die jaren een superhandige functie gemist ergens?
http://www.ats.ucla.edu/stat/spss/modules/missing.htmquote:There is no way to get a system missing value to appear in a crosstabs table. The closest you will come is to change the system-missing value to a user-missing value. This can be accomplished with a recode command, as is shown below. The keyword sysmis can be used on the recode command, and it stands for the system-missing value.
dank!quote:Op dinsdag 18 maart 2014 17:59 schreef Operc het volgende:
[..]
Het heeft te maken met het soort missing value dat je hebt. Niets invullen is een system missing en wel iets invullen maar het aanstippen als missing is een andere missing.
De link hieronder legt er wat over uit, met het volgende voorbeeld over het verschil tussen die twee bij het analyseren:
[..]
http://www.ats.ucla.edu/stat/spss/modules/missing.htm
Graag gedaan.quote:
Geen oplossing, misschien wel omweg trucje maar waarom doe je een crosstab? Zolang je geen chi-squares oid nodig hebt is het misschien gemakkelijker split file en frequencies te gebruiken?quote:Op maandag 24 maart 2014 14:25 schreef Thrills het volgende:
Niet zozeer een inhoudelijke vraag, meer een technische maar wellicht dat iemand er ervaring mee heeft. Tijdens het analyseren van mijn data maak ik af en toe een crosstab, dit resulteert erin dat SPSS compleet de pan uit flipt met dit als resultaat:
[ afbeelding ]
Zoals je kan zien staat de crosstab werkelijk waar all over the place, eigenlijk volgt alles mijn muis een beetje, zo gauw ik naar data view of variable view ga verschuift daar alles ook met de muis mee :S
EDIT: hij doet het nu meteen na het openen van het programma zonder ook maar een actie te hebben ondernomen...
Neem aan dat je ook een afhankelijke variabele hebt, anders is het een beetje een flutdesignquote:Op woensdag 26 maart 2014 21:57 schreef Andyy het volgende:
Hoe heet een design met alleen drie condities (intern, extern en controle) zonder verdere variabele?
Als wel of geen hulp bij dezelfde proefpersoon gevarieerd is, is het idd een mixed design.quote:Op donderdag 27 maart 2014 00:14 schreef Andyy het volgende:
Reactietijd en wel of geen hulp.
1 blok geleden statistiek afgesloten, nu al deze shit vergeten
3x2 mixed design dus, thanks
Kut, ze staan allemaal los van elkaar, between subjects design dusquote:Op donderdag 27 maart 2014 06:54 schreef oompaloompa het volgende:
[..]
Als wel of geen hulp bij dezelfde proefpersoon gevarieerd is, is het idd een mixed design.
quote:Op donderdag 27 maart 2014 11:10 schreef Andyy het volgende:
[..]
Kut, ze staan allemaal los van elkaar, between subjects design dus
Je brengt het naar boven zonder het te zeggen
repeated measures / within participants / multilevelquote:Op zaterdag 5 april 2014 13:49 schreef puspuistje het volgende:
Stel een groep participanten vertonen bepaald gedrag. Vervolgens neem je een screeningsinstrument bij ze af om dit gedrag in beeld te brengen en deze patiënten hulp aan te bieden. Na een jaar ga je checken hoe het gaat en of de situatie verbeterd is. Wat soort onderzoek is dit? (dit vergelijk je eventueel met een controle groep) hoe kun je dit het beste meten, dus welke methode voor SPSS?
Thnx! is dit een cohort studie?quote:Op zaterdag 5 april 2014 14:25 schreef oompaloompa het volgende:
[..]
repeated measures / within participants / multilevel
het gemakkelijkste gebriuk je een mancova voor analyse.
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |