abonnement Unibet Coolblue Bitvavo
pi_84849081
Hoi,

Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.

Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.

Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?
pi_84857861
quote:
Op zondag 1 augustus 2010 17:01 schreef pdegroot het volgende:

[..]

Wellicht kun jij mij dan helpen als het niet lastig is ;)

Ik moet met de volgende data werken:
X= computeraankopen per maand van een bedrijf
Y= omzet per maand van het bedrijf

Eerst moet ik een aantal waardes berekenen die niet zo moeilijk zijn, namelijk:
- gemiddelde
- standaardafwijking
- tijdlijn van beide variabelen in 1 figuur
- spreidingsdiagram
- correlatiematrix
- lineaire regressie van Y op X

Hierna moet ik voor X een onderzoek doen naar stationariteit. Daarnaast moet ik een correlatiematrix maken van alle gebruikte variabelen en controleren of er sprake is van multicollineariteit. Vervolgens moet ik hetzelfde doen voor Y.

Hoe doe ik dit in SPSS?
Over multicollineariteit als je in het scherm van regressieanalyse zit kan je onder het kopje Stats nog meer testen aanvinken oa. die collinariteit. Als je met tijdreeksen werkt kan je ook Durbin-Watson aanvinken.
pi_84857924
En ik heb nog een vraagje over regressieanalyse; de standaardafwijking van mijn residuen is nogal groot. Is er een manier om deze te verkleinen?
pi_84858743
quote:
Op woensdag 4 augustus 2010 13:11 schreef de_nachtwacht het volgende:
Hoi,

Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.

Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.

Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?
Je interpreteert je getransformeerde data, daarna zou je een interpretatie van je normale data kunnen geven. Maar aangezien je de getransformeerde test doe je daar de uitspraken over.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_85142540
Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?
pi_85767596
Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!
  zaterdag 28 augustus 2010 @ 17:51:20 #157
301663 The_Eye
For his eyes are on the ways o
pi_85810693
quote:
Op vrijdag 27 augustus 2010 12:43 schreef gember het volgende:
Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!
Data reduceren doe je met een factor analyse. Volgens mij moeten de antwoordcategorien wel gelijk zijn voor deze procedure. Google anders factor analyse zodat je meer over deze techniek te weten komt.
  zaterdag 28 augustus 2010 @ 18:00:34 #158
301663 The_Eye
For his eyes are on the ways o
pi_85810928
quote:
Op woensdag 11 augustus 2010 15:24 schreef Hiya het volgende:
Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?
Met Kendall's Tau-B ben ik niet zo bekend. De toepassing van Pearson of Spearman Rho om een correlatie tussen variabelen te toetsen is afhankelijk van je data. Bij interval geschaalde data, dat normaal verdeeld is, gebruik je Pearson (product-momentcorrelatiecoëfficiënt). De Spearman Rho wordt ook wel Spearman rangcorrelatiecoeffiecient genoemd. Deze gebruik je als je interval data niet normaal verdeeld is, of als je te maken hebt met ordinaal geschaalde data.
pi_85833796
Bedankt voor de snelle reactie!
Een factoranalyse heb ik al uitgewerkt. Het is niet de bedoeling de data te reduceren, maar tot een soort van "gemiddelde" schaalscore te komen zodat ik deze in mijn regressievergelijking kan opnemen.
Als alle schalen gemeten worden op een vijfpuntschaal doe je bijvoorbeeld bij Compute
(VRAAG1 + VRAAG2 + VRAAG 3) / 3 voor het gemiddelde van het hele concept. Simpel uitgelegt zien mijn vragen er zo uit:
vraag 1: antwoordcategorieen van 1 t/m 5
vraag 2: antwoordcategoieen van 1 t/m 6
vraag 3: antwoordcategorieen van 1 t/m 10
Als je nu via compute (VRAAG1 + VRAAG2 + VRAAG 3) / 3 invoert bij compute, krijg je een gemiddelde dat aangetast is door het feit dat de ene vraag vijf antwoordcategorien heeft en de ander zes.
Er moet (lijkt me) een manier zijn om deze vragen toch vergelijkbaar te maken?

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
  FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 18:13:46 #160
149527 crew  ChipsZak.
That's hot.
pi_87681175
Hey! Ik heb morgen een SPSS toets en ik kom al niet uit de oefenopgave, :') .
Kan iemand helpen?

quote:
In een experiment worden mannen en vrouwen willekeurig ingedeeld in vier experimentele groepen. De proefpersonen moeten twee taken uitvoeren en de experimentele groep waarin ze zijn ingedeeld bepaalt onder welke condities de taken moeten worden uitgevoerd (groep 1 lichtste condities t/m groep 4 zwaarste condities). In de tabel op het uitgereikte formulier staan de gegevens van 20 personen.
Uitgereikt formulier:



Ik loop al direct vast bij het makkelijkste gedeelte, :') :') .
De vraag is namelijk.

quote:
Open SPSS en voer de data in. Zorg ervoor dat er in je dataset vier variabelen zijn. Kies, waar nodig, zelf een codering voor de variabelen.
Ik had zelf eerst als 4 variabelen de condities, maar merkte op dat anderen meer in de juiste richting zaten [waarschijnlijk] met 4 variabelen als 'Sekse, Conditie, Taak1, Taak2'. Maar eigenlijk snap ik er niks van, want ook met die variabelen kom ik niet echt verder met wat ik er precies bij moet invullen, :{ :') . Ook moet ik later in de opgave nog een nieuwe variabele maken die gelijk is aan de som van de beide variabelen.

Help? :+
[*] I kill a bitch with a potato peeler for the skrilla.
[*] You wanna mess with a motherfucker that skydives out of a plane to give the Statue of Liberty high fives, doing drive-by’s and miss you with five tries?
pi_87682331
Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)

Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).

Beetje duidelijker zo?
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
  FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 18:49:34 #162
149527 crew  ChipsZak.
That's hot.
pi_87682510
quote:
Op maandag 18 oktober 2010 18:45 schreef crossover het volgende:
Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)

Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).

Beetje duidelijker zo?
Het zijn de scores idd. Maar het moeten per se 4 variabelen worden, dus 5 gaat niet lukken.
Meetschaal zal wel lukken.

Alleen ik snap niet helemaal hoe en wat ik nu precies moet invullen.
Voorbeeld: Ik wilde eerst onder geslacht voor een man een 0 invullen en voor vrouwen een 1 maar dat liep ergens ineens niet goed omdat er in de groepen van taak1 al niet constant hetzelfde aantal mannen zitten.
[*] I kill a bitch with a potato peeler for the skrilla.
[*] You wanna mess with a motherfucker that skydives out of a plane to give the Statue of Liberty high fives, doing drive-by’s and miss you with five tries?
  maandag 18 oktober 2010 @ 19:01:44 #163
302800 Frith
fictief en almachtig
pi_87683025
Het enige wat een beetje onder de radar zit is dat je uiteraard "taak" ook maar een enkele variabele maakt.

Wat latere bewerkingen selecteer je gewoon op "1" of "2" onder de variabele 'taak'.

Uiteraard is iedere persoon een aparte case en zijn de twee taken (of meer) mutual exclusive, wat betekent dat iemand óf in 1 zit of in 2, maar nooit in beide.

taak: 1,2
sekse: 1,2
groep: 1,2,3,4
score: 0-99 (interval)

In SPSS levert je dat drie categorische variabelen op (weet de naam even niet) en een enkele scale-variabele, omdat SPSS geen interval meetniveau kent. Dacht ik dan toch.
  FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 19:04:48 #164
149527 crew  ChipsZak.
That's hot.
pi_87683158
Maar ze zitten toch juist in beide taken, :@ ? Want ze moeten ze beiden doen?
[*] I kill a bitch with a potato peeler for the skrilla.
[*] You wanna mess with a motherfucker that skydives out of a plane to give the Statue of Liberty high fives, doing drive-by’s and miss you with five tries?
  maandag 18 oktober 2010 @ 19:15:01 #165
302800 Frith
fictief en almachtig
pi_87683559
quote:
Op maandag 18 oktober 2010 19:04 schreef ChipsZak. het volgende:
Maar ze zitten toch juist in beide taken, :@ ? Want ze moeten ze beiden doen?
whoops. :P

Me smart! :')

In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.
  FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 19:40:11 #166
149527 crew  ChipsZak.
That's hot.
pi_87684701
quote:
Op maandag 18 oktober 2010 19:15 schreef Frith het volgende:

[..]

whoops. :P

Me smart! :')

In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.
Ik las ook nog ergens dat ik de cijfers moet opvatten als individuen en dus moest kijken naar hun score op zowel taak1 als taak2 en dan zou mijn spss ding op deze manier goed moeten zijn.



(man (=0) uit groep 1 heeft op taak1 een score van 65 maar bij taak2 een van 42.
[*] I kill a bitch with a potato peeler for the skrilla.
[*] You wanna mess with a motherfucker that skydives out of a plane to give the Statue of Liberty high fives, doing drive-by’s and miss you with five tries?
pi_88483953
Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R2 waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?
ウプピエ 八十三 << u-pu-pi-e hachi-ju-san, ik denk ik zeg het er maar ff bij :P
pi_88484359
TVP. Over een paar weken mag ik ook weer aan de slag met SPSS.
  dinsdag 9 november 2010 @ 19:47:07 #169
38651 yozd
FR1908 Vakkie R
pi_88528305
Even een kort vraagje; als ik een (lineair) regressie run met meerdere variabelen en bij ANOVA is mijn model significant en al die variabelen zijn ook significant, BEHALVE de 'constant'. Wat betekent dit dan concreet?
"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."
pi_88535389
quote:
1s.gif Op maandag 8 november 2010 19:23 schreef uppie83 het volgende:
Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R2 waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?
Moet je dit met eigen data of gegeven data zijn?

Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R2 waarden. Weet je zeker dat je alles goed hebt ingevoerd?

Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?
pi_88614153
quote:
1s.gif Op dinsdag 9 november 2010 22:15 schreef Hiya het volgende:

[..]



Moet je dit met eigen data of gegeven data zijn?

Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R2 waarden. Weet je zeker dat je alles goed hebt ingevoerd?

Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?
We hebben een deel van een data bestand gekregen van een oud onderzoek. Hiermee moesten we voor ons vak een paper schrijven met onder andere de eis dat er een multiple regressie in zou komen. Inmiddels ben ik er achter gekomen dat de eis voor multiple regressie niet zozeer is dat alle factoren een hoge lineaire regressie moeten hebben, maar ze moeten met elkaar correleren. Niet dat dat overal netjes gebeurd, maar dat is nu eenmaal 'the real deal'. Dit is zeg maar een voorbereidingsvak op de masterscriptie.
ウプピエ 八十三 << u-pu-pi-e hachi-ju-san, ik denk ik zeg het er maar ff bij :P
pi_88673277
Whoehoe, een spss-topic!

Mag ik meteen een vraag stellen?

Ik heb een database met onder andere als vraag: hoeveel geeft u uit aan a, b, c, d, e.
Ik wil de antwoorden op deze vragen indelen in drie categorieën, namelijk mensen die bij a iets (maakt niet uit wat) hebben ingevuld, mensen die bij b iets hebben ingevuld en mensen die bij c, d of e iets hebben.
Complicerende factor: ik wil dat alleen weten voor 2009 (of indien niet beschikbaar 2008) terwijl deze vraag voor 2005 tot en met 2009 is beantwoord.

Hoe krijg ik dit voor elkaar?! Ik hóóp dat jullie een antwoord weten, alvast heel erg bedankt!
pi_88673305
uppie, mag je zelf je variabelen kiezen? En als je daar nu in varieert?
pi_88674383
Hoe ziet de "jaarvariabele" er uit? En hoe blijkt uit de uitgave variabele of het een uitgave a, b, cde is
Aldus.
pi_88693085
Per deelnemer wordt per jaar al dan niet een waarde ingegeven in de kolommen a t/m e. Dus: ik heb onder elkaar steeds 5 dezelfde deelnemer (dus nr. 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, etc), tweede kolom is 2005,2006,2007,2008,2009,2005,2006,2007 etc. En dan volgen de kolommen a t/m e waar waardes ingegeven kunnen zijn (en ik ben dus niet geïnteresseerd in de waardes, maar of er al dan geen waarde in staat). Is dat hoe je de vraag bedoeld? Ik hoop dat ik zo duidelijk ben.
pi_88729493
Nog een suf vraagje trouwens: Ik heb met select cases een aantal bedrijven eruit geselecteerd, maar hoe kan ik deze filter bewaren? Als ik spss opnieuw open, is de selectie weer ongedaan gemaakt.
pi_88729643
Het is een [b]must[/b]!! om in SPSS met syntaxen te werken. In je syntax kan je al je commando's opslaan. Als je je selectie gemaakt hebt via de menu's, klik je niet op 'OK' maar op 'PASTE', de opdracht wordt geopend in een syntax die je vervolgens kan draaien. Verdiep je daar een beetje in zou ik zeggen, op een gegeven moment laat je de menu's voor wat ze zijn en schrijf je direct syntaxen. Als ik vandaag tijd heb kom ik nog terug op de andere vraag. Het is in ieder geval niet handig dat één respondent data op verschillende regels heeft staan.
Aldus.
pi_88729850
Oké, dat ga ik zeker uitproberen vandaag, met die syntax.

Wat betreft de vraag óf er een waarde is ingegeven (in plaats van wát die waarde is), volgens mij kom ik er als ik de variabele hercodeer. Er worden bedragen genoemd, dus als ik alles wat groter of gelijk is aan ¤ 1 klasse a noem en alles wat kleiner is dan ¤ 1 klasse b, dan heb ik dat alvast voor elkaar.

Blijft dat ik er dan achter moet komen wie er alleen a, alleen b, a en b, of a, b, c, e heeft ingevuld. Hmm, vind dat nog lastig, ben benieuwd of jij nog iets weet, ik denk er zelf ook nog over na.

Heel fijn dat je meedenkt!

Ik ben nu aan het uitzoeken hoe ik de waardes van twee variabelen kan mixen, zodat ik één gemiddelde variabele krijg (betreft twee vragen met een ordinale schaal, alleen loopt de ene van 1 tot 5 (positief-negatief) en de andere van 5 tot 1 (negatief-positief)...)
pi_88738917
Pfff, werd helemaal gek van die database (heb hem zelf niet in elkaar gezet, het is echt slordig gedaan). Heb nu gewoon de variabelen die ik wil middelen naar excel gekopieerd. Daar een nieuwe variabele van gemaakt en dat probeer ik dan weer in spss te krijgen. Je moet er wat voor overhebben ;)
pi_88807631
Update: ik ben inmiddels klaar. Er hoefde geen relaties verbeterd te worden. Moest mijn conclusies er enkel op aanpassen ;)
ウプピエ 八十三 << u-pu-pi-e hachi-ju-san, ik denk ik zeg het er maar ff bij :P
pi_88822691
quote:
1s.gif Op maandag 15 november 2010 10:09 schreef Susanna het volgende:
Ik ben nu aan het uitzoeken hoe ik de waardes van twee variabelen kan mixen, zodat ik één gemiddelde variabele krijg (betreft twee vragen met een ordinale schaal, alleen loopt de ene van 1 tot 5 (positief-negatief) en de andere van 5 tot 1 (negatief-positief)...)
Daar moet je Transform > Recode in to New Variables ( Als je dus een nieuwe column wil aan maken) of Recode in to Same Variables (als je het wil veranderen in dezelfde column). Ik raad je aan om het in een nieuwe column te doen, als je wat fout doet kan je gemakkelijk opnieuw doen.

Wat je dus in dat scherm moet doen is per variabele aangeven in wat hij moet veranderen.

Voorbeeldje: nu loopt je data gespiegeld dus een 5 moet een 1 worden.

Old Value 5
New Value 1
Klik op Add.

Doe dit voor 4 t/m 1 natuurlijk ook.
Elke keer moet je weer op Add drukken trouwens. Enter werkt niet.

Daarna OK aan klikken, en daarna weer ok om het uit te voeren.
pi_88822761
Mixen kan je trouwens doen door Transform > Compute new variabele. Daar kan je aangeven welk columns je wil delen, vermenigvuldigen et cetera.
pi_88967905
Ik heb ook een SPSS-vraagje. Ik moet morgen presentatie geven over de voortgang van ons onderzoek en daarom ben ik nu al (met de niet volledige data) wat analyses aan het uitvoeren.
Ik wil graag een ANOVA uitvoeren om te kijken of de antwoorden op enquetes op drie verschillende scholen van elkaar verschillen. Nu heb ik van school 1 23 enquetes terug, van school 2 15 en van school 3 9 enquetes. De n is dus niet helemaal gelijk. Iemand enig idee hoe ik dit recht kan trekken in SPSS, zonder dat er dus scheve verschillen ontstaan tussen deze scholen?
You may say I'm a dreamer / But I'm not the only one - John Lennon
pi_88970309
De toets houdt rekening met steekproefgrootte, de betrouwbaarheidsintervallen zullen erg groot zijn alleen met zo'n lage n.
Aldus.
pi_89139739
Ik was altijd goed in SPSS, maar ben het nu even helemaal kwijt.

Ik heb een enquete afgenomen onder een aantal respondenten met een likert scale.
Er werden tien elementen genoemd die allemaal verondersteld worden samen onderdeel te zijn van één concept. De respondenten hebben de tien elementen genummerd van 1 (zeer relevant) tot 5 (niet relevant).

Heb alles nu in SPSS staan, maar ik weet niet meer hoe ik nou kan kijken welke items wél het concept meten en welke niet. ;(
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89139952
Cronbach's alpha (> 0.7)?

RELIABILITY
/VARIABLES= A B C D etc.
/FORMAT=NOLABELS
/SCALE(ALPHA)=ALL/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE CORR
/SUMMARY=TOTAL MEANS .
Aldus.
pi_89140052
quote:
5s.gif Op donderdag 25 november 2010 16:23 schreef Z het volgende:
Cronbach's alpha (> 0.7)?

RELIABILITY
/VARIABLES= A B C D etc.
/FORMAT=NOLABELS
/SCALE(ALPHA)=ALL/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE CORR
/SUMMARY=TOTAL MEANS .
Dat dus.

quote:
Je kunt de betrouwbaarheid berekenen bij analyse scale reliability analysis. Daar moet je aangeven van welke variabelen je de betrouwbaarheid wilt berekenen. De Cronbachs alpha staat standaard aangevinkt. Bij Statistics moet je Scale nog aanvinken. Met de optie scale if item deleted kun je onderzoeken wat er gebeurt met de samenhang als je één variabele verwijdert.
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_89140226
Die had ik al gedaan, maar daar krijg ik dit uit:

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89140275
Heb je al je variabelen wel goed gecodeerd (werken ze allemaal dezelfde richting op)?
pi_89140367
Yes. Het gaat om tien aspecten die 'maatschappelijk verantwoord ondernemen' moeten meten.
De tien zijn op een rijtje gezet en de respondenten hebben deze genummerd van 1(relevant) tot 5(irrelevant).

Moet ik nu net zo lang variabelen met een lage score verwijderen tot cronbach's alpha >0.7? Of mag dat niet zomaar?
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89140478
quote:
1s.gif Op donderdag 25 november 2010 16:33 schreef Skv het volgende:
Yes. Het gaat om tien aspecten die 'maatschappelijk verantwoord ondernemen' moeten meten.
De tien zijn op een rijtje gezet en de respondenten hebben deze genummerd van 1(relevant) tot 5(irrelevant).

Moet ik nu net zo lang variabelen met een lage score verwijderen tot cronbach's alpha >0.7? Of mag dat niet zomaar?
Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_89140603
quote:
1s.gif Op donderdag 25 november 2010 16:35 schreef crossover het volgende:

[..]

Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.
Het heeft sowieso in de meeste gevallen niet de voorkeur om veel elementen te verwijderen.

Wellicht meten deze 10 elementen dan ook meer dan 1 concept. Ik weet niet of je dat eenvoudig middels een factor-analyse zou kunnen achterhalen. Als je vervolgens op een tweetal aan relevante factoren uitkomt dan zijn de scores waarschijnlijk een stuk beter.

De benamingen van elementen die je meeneemt lopen in mijn ogen ook vrij ver uiteen. Het lijkt me dan ook aannemelijk dat je niet dezelfde scores krijgt.

Wat voor soort analyse wil je gaan doen?

[ Bericht 6% gewijzigd door Citizen.Erased op 25-11-2010 16:47:34 ]
pi_89141360
quote:
1s.gif Op donderdag 25 november 2010 16:35 schreef crossover het volgende:

[..]

Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.
Ik meet de toepasbaarheid van een tiental richtlijnen die door Nederland zijn opgesteld voor internationale toepassing op het Zuid-Afrikaanse bedrijfsleven. Het is dus de bedoeling dat er een selectie overblijft van een paar items die dus toepasbaar zijn.. :) Het is niet de bedoeling dat er een bepaald aantal overeenkomt.
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89141650
Ik kan overigens aan het laatste plaatje dat ik heb gepost al opmaken dat de items 'forced labor' en 'child labor' niet relevant zijn vanwege de hoge scores en dat bijvoorbeeld health care, corruption en working conditions het meest relevant zijn vanwege de lage scores. Echter, om nou in mijn thesis mijn conclusie te bevestigen op deze losse scores.. Dat gaat niet. Maar items verwijderen bij Cronbach's alpha zou dan dus de oplossing zijn?
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89141733
Ik weet niet precies wat voor soort analyse je doet. Wil je weten of ze een significant effect hebben op een andere variabele?
pi_89142012
Nou nee, het enige doel is het destilleren van de items die het begrip 'maatschappelijk verantwoord ondernemen' meten en dat resultaat statistisch kunnen verantwoorden. Verder geen effectanalyse of wat dan ook.

Met die samenhang van Cronbach's alpha gaat dat dus niet, omdat de extreme waarden van de items die als 'zeer relevant' worden geschat worden gezien als afwijkend in plaats van als toonaangevend. (de hoge scores die dus extra relevant worden geacht door respondenten correleren niet goed met het gemiddelde).

Of zou ik gewoon op basis van de gemiddelden en standaarddviaties er naast kunnen zeggen dat er een paar items sowieso te hoog scoren?

[ Bericht 21% gewijzigd door Skv op 25-11-2010 17:41:40 ]
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89143050
-

[ Bericht 50% gewijzigd door Skv op 25-11-2010 17:38:50 ]
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89144079
Met Cronbach bekijk je of de verschillende schaaltjes (stellingen) hetzelfde meten, dat is dus duidelijk niet het geval. Volgens mij gaat dat dan ook problemen opleveren bij een factoranalyse.
Aldus.
pi_89144786
quote:
2s.gif Op donderdag 25 november 2010 18:01 schreef Z het volgende:
Met Cronbach bekijk je of de verschillende schaaltjes (stellingen) hetzelfde meten, dat is dus duidelijk niet het geval. Volgens mij gaat dat dan ook problemen opleveren bij een factoranalyse.
Goed, Cronbach gaat hem dus niet worden. Is er een andere manier om een statistische analyse te trekken over deze gegevens?

Het gaat er dus alleen maar om dat ik in mijn rapport kan zeggen: 'aan de hand van deze gegevens trek ik de conclusie dat begrip 'a', 'b' en 'c' het begrip niet meten en 'd', 'e' en 'f'' wel.
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89145955
Een ander idee: een T-toets op het gemiddelde (3, gezien de verwachting is dat elk element gemiddeld scoort).

Dat geeft dit resultaat:
Alles verschilt dus significant van het gemiddelde (sig 2-tailed = P <0.05). Ik denk echter dat dit veroorzaakt wordt door de lage N(=14). Zou ik deze tabel neer kunnen zetten als indicator welke begrippen belangrijker worden geacht dan andere begrippen? Ik zou hierbij kunnen refereren aan mean difference: hoe lager het mean difference, hoe relevanter het item is.. Iemand? :)
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89146911
Er zijn andere analysemethoden voor zulke lage n-en (daar kan ik je niet mee helpen). Alles wat hierboven door je beschreven is komt door de lage n-en.
Aldus.
pi_89158458
"aan de hand van deze gegevens trek ik de conclusie dat begrip 'a', 'b' en 'c' het begrip niet meten en 'd', 'e' en 'f'' wel"

Dit soort uitspraken kun je nooit doen aan de hand van statistiek. Je kan hooguit zeggen dat je twee (of meer) factoren hebt gevonden. Welke factoren dit zijn moet je zelf (aan de hand van theorie) invullen.

Als je Cronbach's alpha negatief is, moet je je items en dataset nog eens goed bekijken en niet gewoon maar een andere analysetechniek gaan gebruiken die minder of niet geschikt is maar wel resultaten geeft die in je verhaal passen. (ook nogal kort door de bocht om te zeggen dat het allemaal gewoon komt door een kleine n trouwens)

Ik begrijp ook niet hoe je erbij komt t-testen te gaan doen. Waarom ga je ervan uit dat je respondenten op elk element gemiddeld moeten scoren? En dat gemiddelde is dan het 'neutrale' antwoord? Zegt dat niet eerder iets over je respondenten dan over de kwaliteit van je vragenlijst? Wat is het bestaansrecht van je vragenlijst als je de kwaliteit van je vragenlijst afleidt uit het al dan niet gemiddeld scoren van je respondenten? Dan kun je de vragenlijst dus evengoed niet afnemen, mensen scoren toch gemiddeld en als dat niet zo is, is de vragenlijst ineens niet goed.

Probeer eens een factoranalyse (al is dat eigenlijk PCA in SPSS geloof ik?) en kijk of daar iets zinvols uitkomt. Al is je n voor al dit soort dingen wel érg laag. Met tien vragen zou je toch best een 200-tal respondenten bevragen.
pi_89158904
CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.

Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.
Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.
pi_89166426
quote:
1s.gif Op donderdag 25 november 2010 22:55 schreef Skv het volgende:
CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.

Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.
Hier haal je toch wat dingen door elkaar. Nagaan of hoog-scoorders op alle elementen hoog scoren en laag-scoorders op alle elementen laag scoren (wat er volgens jouw beschrijving is gedaan), is heel iets anders dan nagaan of alle personen op alle elementen gemiddeld 'neutraal' scoren.
Je hebt dus wel degelijk Cronbach's alpha nodig hier.

Als je wilt nagaan welke items in de praktijk niet goed passen, gaat het dus wél om de kwaliteit van je vragenlijst.
Aan je gemiddeldes en standaardafwijkingen kan je al duidelijk zien dat de verschillende elementen heel verschillend worden gewaardeerd en dat er veel verschillen zitten tussen de mensen onderling.
Het lijkt me met deze data verstandig de inferentiële statistiek even te laten voor wat het is en eens goed naar je data te kijken. Maak bijvoorbeeld een lijngrafiekje per participant met de scores per element. Zo kan je zien of het bij elke participant dezelfde items zijn die veel lager/hoger scoren. Als dat het geval is, kun je gaan bekijken waarom deze items anders scoren. Waarschijnlijk kun je daar de data uit je interview wel voor gebruiken en er is vast ook wat theorie over. Welke groep items dan 'het concept' meet en welke groep een 'ander concept' moet je toch echt hieruit halen en niet uit statistiek en p-waardes.
pi_89236063
Wat leuk, een SPSS topic :)
Ik ga het allemaal eens doorlezen...

Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).
Eindoordeel: je gaat boven de gestelde eisen uit.
pi_89430570
Ik zit met een klein dilemma en weet niet of ik nu verder kan gaan in mijn analyse.

Ik ben bezig met een multiple regressie en niet alle data lijkt normaal verdeeld.
Mijn Dependent Variable (Switchintentie) lijkt bijvoorbeeld niet normaal.
De wijze waarom de scores verdeeld zijn is wel de verdeling die ik vooraf verwacht heb. Het overgrote deel van de mensen in de markt die ik onderzoek heeft niet de intentie om over te schakelen naar een andere aanbieder.




Ik heb geprobeerd om enkele transformaties toe te passen, maar op de een of andere manier wordt de verdeling daardoor niet beter.

Mijn vraag is:

1. Hoe moet ik de scores van Kurtosis en Skewness interpreteren?
2. Kan ik met deze data een multiple regressie uitvoeren (en de resultaten hiervan interpreteren)?
3. Zijn er nog 'n aantal transformaties die ik kan gebruiken?
pi_89437545
1.: Kurtosus is de mate van scheefheid. Google even op afbeeldingen dan krijg je er een beeld bij. Skewness houdt in naar welke kant je verdeling neigt.


Houd ook rekening met je meetschaal. Als je in je vragenlijst de alle keuzemogelijkheden van 1 t/m 5 hebt gedefinieerd, is het een ordinale meetschaal en mag je strict genomen geen regressie uitvoeren. Als je alleen de 1 en 5 hebt benoemd 'mag' het wel.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_89437875
Wat is/zijn je onafhankelijke variabele(n)?
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_89439617
quote:
1s.gif Op donderdag 2 december 2010 17:25 schreef crossover het volgende:
Wat is/zijn je onafhankelijke variabele(n)?
Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.

Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is :')
{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.

De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.
pi_89736568
Welke analyses kun je dan uitvoeren als je gebruik maakt van een ordinale meetschaal met (zoals je in het voorbeeld schetst) antwoord 1-5? Een regressieanalyse lijkt me dan bij voorbaat onzinnig, wat kun je dan over de data zeggen?
pi_89736736
quote:
2s.gif Op donderdag 2 december 2010 18:14 schreef Citizen.Erased het volgende:

[..]

Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.

Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is :')
{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.

De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.
Geen normale verdeling = geen regressieanalyse

Ben echt benieuwd wat je er dan wel nog mee kan. Heb zelf namelijk ook steekproeven met in elke cel >30 waarnemingen en (gezien de vraagstelling logisch) niet normaal verdeeld...
pi_89737642
quote:
1s.gif Op zaterdag 27 november 2010 20:55 schreef schaal_9 het volgende:
Wat leuk, een SPSS topic :)
Ik ga het allemaal eens doorlezen...

Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).
Niet gewoon Select Cases en dan kiezen voor opslaan in nieuw venster?
pi_89741576
Oké, hier ook nog maar even mijn vraag droppen dan. Nouja, ik heb er eigenlijk twee.
Als eerste een vraag over Chi-square. 2 groepen: mannen en vrouwen, hebben aangegeven of ze wel of niet voorkeur geven aan vroeg college. De output van spss is reeds gegeven, maar er wordt gevraagd deze te interpreteren. Hoe kan ik weten wat de uitkomst nou eigenlijk is? Het resultaat is significant, maar dat kan in principe zowel betekenen dat mannen liever vroeg college hebben, dan dat het kan betekenen dat vrouwen vroeg college hebben, toch? Hoe moet ik dit terugzien?

Verder een vraag over MSG en MSE. Bij een andere opgave werden de standaarddeviaties en standaardfouten gegeven, de df's werden gegeven, en de n's werden gegeven. Vervolgens moest je dan op basis daarvan eerst de sum of square groups en square errors berekenen en daarna dus MSG en MSE. Het leek mij dat je voor sum gewoon zowel de sd als de sf allemaal in het kwadraat doet en optelt. Dan heb je je sum, toch? Nou, als ik dat doe kom ik al niet op de juiste waarde. Vervolgens dus naar de mean, en dat zou dan het delen door de df moeten zijn? Indien nodig kan ik de opgave wel even hier neer zetten.
pi_89742566
Overigens, @ Citizen.Erased, volgens mij is het normaal dat bij het meten van een categorische nominale variabele - zoals jij die meet - de verdeling niet normaal is. Als ik een enquete houd onder de bevolking met de vraag of ze altijd al eens iemand hebben willen vermoorden zal 90% ook 'nee' zeggen. of 1 / 2 wanneer we het hebben over een 5-puntsschaal. Is het probleem niet meer het feit dat de uitkomst evident is, en geen analyse behoeft?
pi_89742718
Volgens mij kan je bij een chi square gewoon een kruistabel maken en vanaf daar interpreteren.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_89743524
Hoe bedoel je dat...? Ik moet immers wel bepalen of het resultaat significant is. Bij 2*2 zou dat nog enigszins kunnen i guess, maar stel het is 2*3, of 3*3, wat dan? Hoe bepaal je dan welke nou significant is?
pi_89750819
Als ik me niet vergis kan je ook bij de wat grotere kruistabellen de gegevens aflezen. Ik denk dat de significantie verwijst naar de gehele tabel. Maar kan iemand anders dit bevestigen of ontkrachten? Is voor mij ook weer een tijdje geleden..
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_89755172
een chi square tabel geeft aan of iets afhankelijk van elkaar is, als je dus een significante chi square krijgt (de observed value wijkt af van expected value) dan betekent het dat de groepen wat met elkaar te maken.
maak hier een crosstabel/grafiek van en je kan interpreteren!
je ziet dan bv met die lijnen zien wat je verband is.

voor MSE, moet je eerst SS berekenen. De SSE is kwadratensom, die deel je door de Df, en dan krijg je de MSE. en dit kan je met elke SS doen ( groeps of individu niveau)

[ Bericht 1% gewijzigd door Rick.Gulmans op 10-12-2010 11:06:33 (typfouten) ]
pi_90061967
Wat te doen als een somers'd test nagenoeg géén relatie laat zien tussen twee variabelen. Dan ben je lijkt me uitgeanalyseerd? Ik wilde namelijk met de somers'd test laten zien dat er wél een (positief danwel negatief) verband is en aan de hand daarvan met regressieanalyse aan de slag gaan.
pi_90257971
Niemand??
pi_90258197
Volgende vraag ;)

Ik heb een logistische regressie uitgevoerd. De afhankelijke variabele is een dummy, de predictorvariabele is categorisch.

Uitkomst:

Model Summary:
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 ,000a ,692 1,000
a. Estimation terminated at iteration number 19 because a perfect fit is detected. This solution is not unique.

Het gaat me om de opmerking bij a (kan niet zo goed een tabel hierin plakken, sorry). Because a perfect fit is detected. Betekend dit dat ik niets aan deze analyse heb? En komt dat dan doordat ik het model verkeerd heb gebouwd, of omdat de data gewoon niet meewerkt (het liefst dat laatste natuurlijk ;) )
pi_92736211
Ik heb het volgende gelezen: Tevens kan de variabele getransformeerd worden door het natuurlijk logaritme (LN) te nemen van de variabele.
Hoe kun je in spss dan een logaritme berekenen? Is dat een bewerking (en zo ja, welke) waarna je een 'nieuwe' variabele krijgt waarmee je dan weer de normale dingen kunt doen, zoals descriptives draaien en nagaan of er een normale verdeling is en een skewness van tussen -2 en +2 bijvoorbeeld?
pi_92738685
Al bij compute variable gekeken?
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  maandag 14 februari 2011 @ 15:03:50 #224
38651 yozd
FR1908 Vakkie R
pi_92769417
Ik wil graag weten hoe ik kan bepalen of gevonden coëfficiënten bij regressies voor 2 verschillende groepen significant verschillen.

Stel je hebt dit model:

y = c + X1 + X2 + X3

waarbij X3 een dummy variabele is (man/vrouw, 0/1). Als ik nu wil weten of de coëfficiënten van X1 en X2 voor mannen en vrouwen verschillen, moet ik interactievariabelen toevoegen voor elk van die predictors:

y = c + X1 + X2 + X3 + (X1 * X3) + (X2 * X3)

Nu kan ik in de output zien of de coëfficiënten van die interactietermen significant zijn en dus bepalen of geslacht de invloed van X1 en X2 op y beïnvloedt.

Maar nu hoorde ik laatst van iemand dat je dit ook op een andere manier kon checken. Je hebt dan 2 samples (mannen en vrouwen) en je runt dan 2x (1x voor mannen en 1x voor de vrouwensample):

y = c + X1 + X2

Vervolgens doe je een T-test op de 4 (2x2) gevonden coëfficiënten. Maar hoe doe je dat precies?
"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."
pi_94136201
Al een tijdje rustig hier, maar toch nog even proberen...

Ik ben een vragenlijst aan het coderen en ben op een type vraag gestuit waar ik niet zo goed van weet wat ik ermee aan moet.

Het gaat erom dat de respondenten vijf mogelijkheden krijgen aangeboden en deze naar voorkeur in een volgorde moeten zetten. Oftewel vijf antwoorden moeten worden ingevoerd waarvan het ook belangrijk is welke ze als eerste, welke ze als tweede etc hebben ingevoerd.

Weet iemand hoe dit moet? Ik ben eeuwig dankbaar!
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')