abonnement Unibet Coolblue
  Moderator / Redactie Sport maandag 21 november 2011 @ 15:35:20 #1
92686 crew  borisz
Keurmeester
pi_104631584


Hier verder met Deel 4.

Links:
http://www.spsslog.com/
http://www.spss.com/nl/

Laatste berichten:
[
quote:
0s.gif Op maandag 21 november 2011 15:29 schreef borisz het volgende:
Ik heb een lijstje kosten en een lijstje contact-uren. Iemand hoe ik daar via spss een % functie van kan maken? Dus bij het toenemen van 10% contact uren hoeveel stijgen de kosten dan? Dat laatste gaat natuurlijk via een regressie, maar hoe moet ik die data veranderen?
quote:
0s.gif Op maandag 21 november 2011 15:31 schreef oompaloompa het volgende:

[..]

Dat is een hele vreemde vraag.

Stel een contactuur kost 50 euro

bij 20 contacturen is een stijging van 10% dus 100 euro
bij 50 contacturen is een stijging van 10% dan 250 euro
Dus kun je wel spreken van een bedrag per 10%?

Of begrijp ik je bedoeling niet helemaal?
De vraag is
quote:
is it possible to come up with a model that predicts percentual changes in costs as a result in changes in volume?
Daarbij bestaat mijn data uit 48 punten van Costs & Contract uren
winnaar wielerprono 2007 :) Last.FM
pi_104633007
quote:
0s.gif Op maandag 21 november 2011 15:34 schreef borisz het volgende:
De vraag is

[..]

Daarbij bestaat mijn data uit 48 punten van Costs & Contract uren
pfoe, ik ben niet helemaal helder vandaag dus ik kan het fout hebben, maar het lijkt mij onmogelijk zo'n model te maken als het verband lineair is, ik denk dat dat alleen mogelijk is als je een kwadratisch verband hebt.

(ik ga er van uit dat de waardes in costs absoluut zijn en dat hetzelfde geldt voor contract).

Kun je anders even een plotje maken om het verband (linear / kwadratisch) te zien?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 21 november 2011 @ 16:10:47 #3
8369 speknek
Another day another slay
pi_104633147
Denk je niet te moeilijk en vraagt ie niet gewoon om een correlatie?
They told me all of my cages were mental, so I got wasted like all my potential.
pi_104633183
quote:
0s.gif Op maandag 21 november 2011 16:10 schreef speknek het volgende:
Denk je niet te moeilijk en vraagt ie niet gewoon om een correlatie?
Dat is wat ik eerst dacht maar dan is het echt de meest ingewikkelde slechte vraagstelling ooit :D
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 21 november 2011 @ 16:14:36 #5
8369 speknek
Another day another slay
pi_104633323
Ik lees het als dat je van je ruwe kostendata (voorheen en nu) een percentage moet maken (nu gedeeld door voorheen), en dan een regressiemodel moet laten berekenen.
They told me all of my cages were mental, so I got wasted like all my potential.
pi_104633501
quote:
0s.gif Op maandag 21 november 2011 16:14 schreef speknek het volgende:
Ik lees het als dat je van je ruwe kostendata (voorheen en nu) een percentage moet maken (nu gedeeld door voorheen), en dan een regressiemodel moet laten berekenen.
Ik raak alleen maar verwarder :P
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  Moderator / Redactie Sport maandag 21 november 2011 @ 16:22:29 #7
92686 crew  borisz
Keurmeester
pi_104633644
Komt omdat de docent op BB een opmerking plaatste als van
quote:
c) (againn a regression, but now with %change variables of costs and hours).
Vandaar mijn opmerking. Of ik denk te lastig :+. Maar goed de opdracht.

Assignment 5: Consulting Services plc
Consulting Services is an advisory firm for small and medium sized companies in Ireland. It
is a small company itself, employing around 12 consultants. The market is volatile and oscilates between a low 1,026 and a high 1,663 monthly consulting hours sold. A monthly overview of consulting hours sold and corresponding Consulting Services’ operational costs is iven in the following table.

Datatabel met
Maand, kosten, uren

en dan zijn dit de vragen

Required:
a. Analyse Consulting Services’ direct cost function. Please pay special attention to the error
terms. What do the different error term displays suggest?
b. Try to improve Consulting Services’ cost function.
c. Is it possible to come up with a model that predicts percentual changes in costs as a result
of changes in volume? (this is the cost-elasticity of contract hours).
d. What would you recommend Consulting Services management to do, based on your regression analyses found under b and c?

A. is een standaard regressie.. B geneuzel en dan vraag C... Ik kom er niet uit.
winnaar wielerprono 2007 :) Last.FM
pi_104633870
Dat klinkt alsof het best een kwadratische functie zou kunnen zijn vooral vanwege die vraag over de error-terms

Als je wilt kun je me de data sturen en dan kijk ik ff
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  Moderator / Redactie Sport maandag 21 november 2011 @ 16:34:08 #9
92686 crew  borisz
Keurmeester
pi_104634158
Data zit in je PM

Studiegenoten komen er ook niet uit _O-. Maar dat zit hem er wrs in dat die vraag niet helder gesteld is, want we hebben allemaal uitgebreid statistiek + Methoden & technieken gehad.
winnaar wielerprono 2007 :) Last.FM
pi_104634598
quote:
0s.gif Op maandag 21 november 2011 16:34 schreef borisz het volgende:
Data zit in je PM

Studiegenoten komen er ook niet uit _O-. Maar dat zit hem er wrs in dat die vraag niet helder gesteld is, want we hebben allemaal uitgebreid statistiek + Methoden & technieken gehad.
denk het ook kijkend naar onze verschillende interpretaties hier :P
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104634975
quote:
0s.gif Op maandag 21 november 2011 16:14 schreef speknek het volgende:
Ik lees het als dat je van je ruwe kostendata (voorheen en nu) een percentage moet maken (nu gedeeld door voorheen), en dan een regressiemodel moet laten berekenen.
Zoiets ja, dat je tussen iedere twee maanden de toename in kosten en uren moet bereken en daarvan een regressie moet maken. Zo intrepreteer ik de vraag ook als ik hem helemaal lees.
You don't need a weatherman to know which way the wind blows.
---------------------------------------------------------------------------------------------------------------------------------------------
last.fm Album top 100
pi_104635357
zo op het eerste gezicht lijkt het idd een deels kwadratische functie te zijn. Hoe meer de uren omhoog gaan, hoe meer de prijs per uur is, dus de prijs per uur is afhankelijk van het totaal aantal uren. Dan zou het mogelijk moeten zijn...

dit is de prijs per uur gesorteerd op oplopende totaal-uren

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104635647
Dus bij a doe je een standaard ineaire regressie, daar zouje moeten vinden dat de error hoger wordt naarmatede uren hoger worden.

bij b maak je een nieuwe functie die deels kwadratisch is:
intercept + b*kosten1 + b^2kosten2

dit kun je dan herformuleren bij c

en bij d raad je aan of de uren laag te houden of op een andere manier die extra toename in kosten tegen te gaan o.i.d.

maar dat is mijn interpretatie van de opdracht....
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  Moderator / Redactie Sport maandag 21 november 2011 @ 17:13:12 #14
92686 crew  borisz
Keurmeester
pi_104636139
Morgen weten we de juiste interpretatie is :+.
Vanavond even weer even verder :s)
winnaar wielerprono 2007 :) Last.FM
  maandag 21 november 2011 @ 23:56:38 #15
124676 RobertoCarlos
Zit je nou naar me te loeruh?
pi_104660676
Ik heb 2 vragen over de T-toets (SPSS 19):

- hoe doe je het nou met de Grouping variable van 2 onafhankelijke samples van 2 variabelen die allebei meer dan 2 groepen hebben? Hoe definieer ik dit dan in Define groups?

- hoe maak ik een grafiek van een betrouwbaarheidsinterval (CI)?

Ik heb beide vragen al tevergeefs opgezocht. Weet iemand dit?
!!! Go 49-ers !!!
pi_104661848
quote:
2s.gif Op maandag 21 november 2011 23:56 schreef RobertoCarlos het volgende:
Ik heb 2 vragen over de T-toets (SPSS 19):

- hoe doe je het nou met de Grouping variable van 2 onafhankelijke samples van 2 variabelen die allebei meer dan 2 groepen hebben? Hoe definieer ik dit dan in Define groups?

- hoe maak ik een grafiek van een betrouwbaarheidsinterval (CI)?

Ik heb beide vragen al tevergeefs opgezocht. Weet iemand dit?
Ik begrijp niet goed wat je bij vraag 1 bedoelt

vraag 2 is volgens mij het volgende. Stel je vind een mean van 20 met een CI van 18-22 (kun je opvragen in spss of gewoon 1.96*std) volgens mij kun je dan gewoon een normaalkromme tekenen met 20 in het midden en 18 en 22 bij de twee uiteindes van 2.5%
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  dinsdag 22 november 2011 @ 08:26:25 #17
124676 RobertoCarlos
Zit je nou naar me te loeruh?
pi_104664783
quote:
0s.gif Op dinsdag 22 november 2011 00:25 schreef oompaloompa het volgende:

[..]

Ik begrijp niet goed wat je bij vraag 1 bedoelt

vraag 2 is volgens mij het volgende. Stel je vind een mean van 20 met een CI van 18-22 (kun je opvragen in spss of gewoon 1.96*std) volgens mij kun je dan gewoon een normaalkromme tekenen met 20 in het midden en 18 en 22 bij de twee uiteindes van 2.5%
ad vraag 2: Misschien is het wel zo simpel idd om een normaalverdeling te tekenen, ik dacht dat er misschien een apart functie voor het tekenen van een betrouwbaarheidsinterval was.

En met vraag 1 bedoel ik: stel dat ik voor 2 variabelen een Independent Samples T-test wil doen. Dan moet ik van SPSS verplicht een Grouping variable invoeren. Alleen kan dat niet omdat mijn 2 (interval) variabelen beide uit heel veel values of groups bestaan (dus 'heel erg', 'erg', 'enigzins', etc) Dat kan ik dus niet allemaal definieren via Define Groups in die Grouping Variable.
Hoe los ik dit op of heb ik de verkeerde test te pakken?
!!! Go 49-ers !!!
pi_104665536
quote:
2s.gif Op dinsdag 22 november 2011 08:26 schreef RobertoCarlos het volgende:

[..]

ad vraag 2: Misschien is het wel zo simpel idd om een normaalverdeling te tekenen, ik dacht dat er misschien een apart functie voor het tekenen van een betrouwbaarheidsinterval was.

En met vraag 1 bedoel ik: stel dat ik voor 2 variabelen een Independent Samples T-test wil doen. Dan moet ik van SPSS verplicht een Grouping variable invoeren. Alleen kan dat niet omdat mijn 2 (interval) variabelen beide uit heel veel values of groups bestaan (dus 'heel erg', 'erg', 'enigzins', etc) Dat kan ik dus niet allemaal definieren via Define Groups in die Grouping Variable.
Hoe los ik dit op of heb ik de verkeerde test te pakken?
De grouping variable is wat je condities zijn :) Het klinkt alsof je daar een afhankelijke in hebt gevuld.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104670362
Hoi allemaal,
Ik gebruik SPSS
Ik heb een dataset met 3 vragen over directory updating, 3 vragen over motivatie om informatie te zoeken.
Dus ik heb een construct van beide variabelen gemaakt, cronbach alpha was 0,895 dus dat is "goed".
Toen lineaire regressie gedaan, daarna de residuen geanalyseerd met behulp van een scatterplot en of het normaal verdeeld was.

Normaal verdeeld - klopt
homogene variantie - klopt ook. Spreiding wordt niet kleiner of groter.
Lineair verband - Klopt niet?
Volgens mij is het een kwadratisch verband, aangezien negatieve residuen voorkomen bij lagere waarden van de afhankelijke variabel en positieve residuen bij hogere waarde.
Klopt dit wat ik nu zeg?
Moet ik dus een kwadratische regressie doen? (hoe?).



[ Bericht 2% gewijzigd door JohnSpek op 22-11-2011 12:19:36 ]
pi_104670953
quote:
0s.gif Op dinsdag 22 november 2011 12:10 schreef JohnSpek het volgende:
Hoi allemaal,
Ik gebruik SPSS
Ik heb een dataset met 3 vragen over directory updating, 3 vragen over motivatie om informatie te zoeken.
Dus ik heb een construct van beide variabelen gemaakt, cronbach alpha was 0,895 dus dat is "goed".
Toen lineaire regressie gedaan, daarna de residuen geanalyseerd met behulp van een scatterplot en of het normaal verdeeld was.

Normaal verdeeld - klopt
homogene variantie - klopt ook. Spreiding wordt niet kleiner of groter.
Lineair verband - Klopt niet?
Volgens mij is het een kwadratisch verband, aangezien negatieve residuen voorkomen bij lagere waarden van de afhankelijke variabel en positieve residuen bij hogere waarde.
Klopt dit wat ik nu zeg?
Moet ik dus een kwadratische regressie doen? (hoe?).

[ afbeelding ]
Volgens mij klopt alles wat je zegt.

Een manier om een kwadratische te doen is door zelf een nieuwe variabele aan te maken die het kwadraat is van de oude en deze dan in je regressie te gebruiken
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104673081
quote:
0s.gif Op dinsdag 22 november 2011 12:29 schreef oompaloompa het volgende:

[..]

Volgens mij klopt alles wat je zegt.

Een manier om een kwadratische te doen is door zelf een nieuwe variabele aan te maken die het kwadraat is van de oude en deze dan in je regressie te gebruiken
Top, dan ga ik aan de slag :P
  dinsdag 22 november 2011 @ 15:13:38 #22
34299 davako
-GATGCTGTTGAA-
pi_104676609
Ik moet voor een opdracht een statistische test uitvoeren op verkregen data of van een eigen onderzoek. Zelf heb ik gekozen om de data te gebruiken van een eigen onderzoek, alleen ik loop een beetje vast welke toets ik moet gebruiken.

Mijn research vraag is:
In a sub-arctic peat land soil, what are the consequences of increased temperature and substrate addition on the microbial community structure, and how does this change through time?

Dus ik heb grond samples waarbij ik 3 verschillende substraten heb toegevoegd(Cellen, planten en de controle) en ik heb de grond verwarmd bij 9 en 14 graden.

Ik heb voor het gekozen om vier microbiële groepen te testen in percentage ten opzichte van de totale aanwezige bacteriën.
Mijn vraag is dus welke statistische toets zou ik uitvoeren? Ik zat zelf te denken aan een repeated measure ANOVA?
Of iemand anders een beter idee :) ?
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_104681324
Nog een vraagje dan maar :)

Ik heb drie hypotheses
A heeft positieve invloed op Y..etc

H1: A -> Y
H2: B -> Y
H3: C -> Y

Is het nu dus aan te raden om dit in één model te doen bij regressie? (dus onafhankelijke variabelen: A, B, C en afhankelijke: Y )

Als ik A -> Y en B -> Y en C -> Y apart regressie test dan zijn ze allemaal significant.
Als ik A, B , C - > Y in 1 model doe, dan zijn B en C niet meer significant (en ook echt totaal niet significant meer, p = 0.67 bij B -> Y )

Wanneer wel, wanneer niet?
pi_104683759
quote:
0s.gif Op dinsdag 22 november 2011 17:15 schreef JohnSpek het volgende:
Nog een vraagje dan maar :)

Ik heb drie hypotheses
A heeft positieve invloed op Y..etc

H1: A -> Y
H2: B -> Y
H3: C -> Y

Is het nu dus aan te raden om dit in één model te doen bij regressie? (dus onafhankelijke variabelen: A, B, C en afhankelijke: Y )

Als ik A -> Y en B -> Y en C -> Y apart regressie test dan zijn ze allemaal significant.
Als ik A, B , C - > Y in 1 model doe, dan zijn B en C niet meer significant (en ook echt totaal niet significant meer, p = 0.67 bij B -> Y )

Wanneer wel, wanneer niet?

Waarschijnlijk hangen je variabelen samen.

Stel b.v. dat je het effect wilt testen van:

in de buurt bij water zijn
warm weer
weinig kleren

op het aantal muggenbulten.

Los zijn ze allemaal significant maar wanneer je ze samen neemt opeens niet meer. Dit komt doordat mensen bij warm weer vaker bij water zijn en minder kleren aan hebben. Het probleem is dat je door die samenhang niet meer goed kunt bepalen welk van de drie variabelen nou uiteindelijk echt de oorzaak is.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104683824
quote:
0s.gif Op dinsdag 22 november 2011 15:13 schreef davako het volgende:
Ik moet voor een opdracht een statistische test uitvoeren op verkregen data of van een eigen onderzoek. Zelf heb ik gekozen om de data te gebruiken van een eigen onderzoek, alleen ik loop een beetje vast welke toets ik moet gebruiken.

Mijn research vraag is:
In a sub-arctic peat land soil, what are the consequences of increased temperature and substrate addition on the microbial community structure, and how does this change through time?

Dus ik heb grond samples waarbij ik 3 verschillende substraten heb toegevoegd(Cellen, planten en de controle) en ik heb de grond verwarmd bij 9 en 14 graden.

Ik heb voor het gekozen om vier microbiële groepen te testen in percentage ten opzichte van de totale aanwezige bacteriën.
Mijn vraag is dus welke statistische toets zou ik uitvoeren? Ik zat zelf te denken aan een repeated measure ANOVA?
Of iemand anders een beter idee :) ?
dus je hebt een 2(temp)x3(subtraat) between en 4 within (bacterien)?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104688048
Crosspost wie o wie kan mijn vrouw helpen.

SPSS hulp nodig

Ik ben bezig met mijn afstudeeronderzoek en ben in de analyse fase belandt.
Ik heb een variabele: aantal werkzame personen bij een organisatie en die heb ik gecategoriseerd in:
2-5
5-10
10-15
15-20 werkzame personen

Ik heb een representativiteitstoets uitgevoerd mbv de chi-kwadraat en daaruit blijkt dat de eerste twee categorieën (2-5 en 5-10) gewaardeerd moeten worden met respectievelijk 0,87 en 1,32.
Nu moet ik dit in gaan voeren in SPSS gaan invoeren, zodat deze waardering helemaal wordt doorgevoerd.
Nu snap ik niet hoe ik dit moet doen. Ik heb boeken voor me liggen waar het wellicht in uitgelegd staat, maar dan nog lukt het mij niet. Ik heb SPSS voor Mac.

Kan iemand mij hier door heen helpen, aangezien ik nu echt helemaal vast zit.

Ik hoop het!
Al vast bedankt voor de moeite.
pi_104688773
quote:
0s.gif Op dinsdag 22 november 2011 18:20 schreef oompaloompa het volgende:

[..]

Waarschijnlijk hangen je variabelen samen.

Stel b.v. dat je het effect wilt testen van:

in de buurt bij water zijn
warm weer
weinig kleren

op het aantal muggenbulten.

Los zijn ze allemaal significant maar wanneer je ze samen neemt opeens niet meer. Dit komt doordat mensen bij warm weer vaker bij water zijn en minder kleren aan hebben. Het probleem is dat je door die samenhang niet meer goed kunt bepalen welk van de drie variabelen nou uiteindelijk echt de oorzaak is.
Ja het is eigenlijk zo

Ik heb een systeem(Q) die bestaat uit drie de processen(A, B en C).
Nu zei de docent van "Dit is leuk om te onderzoeken, maar spits het uit per proces, want dat is wat specifieker".

Eerst had ik dus Q -> Y

Nu heb ik dus:
A -> Y
B -> Y
C -> Y

Maar hoe kan ik hieruit dan toch nog conclusies trekken? Waarom is A -> Y bijvoorbeeld wel significant en B en C niet in het "totaal model" ? Hoe moet ik de uitkomst interpreteren is eigenlijk mijn vraag dus :)
pi_104688929
quote:
0s.gif Op dinsdag 22 november 2011 20:07 schreef JohnSpek het volgende:

[..]

Ja het is eigenlijk zo

Ik heb drie processen(A, B, C) die samen één systeem(Q) vormen.
Nu zei de docent van "Dit is leuk om te onderzoeken, maar spits het uit per proces, want dat is wat specifieker".

Eerst had ik dus Q -> Y

Nu heb ik dus:
A -> Y
B -> Y
C -> Y

Maar hoe kan ik hieruit dan toch nog conclusies trekken? Waarom is A -> Y bijvoorbeeld wel significant en B en C niet in het "totaal model" ? Hoe moet ik de uitkomst interpreteren is eigenlijk mijn vraag dus :)
nou ja, mijn antwoord is dus eigenlijk dat dat niet echt kan omdat je onafhankelijken gecorreleerd zijn.

Je kunt een aantal zaken doen die het een beetje fixen, dus een 3staps model toetsen en elke variabele los toevoegen maar dan nog kun je geen duidelijke conclusies trekken...

(voor zover ik weet dan heh, maar ben hier redelijk zeker over)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104689214
quote:
0s.gif Op dinsdag 22 november 2011 20:10 schreef oompaloompa het volgende:

[..]

nou ja, mijn antwoord is dus eigenlijk dat dat niet echt kan omdat je onafhankelijken gecorreleerd zijn.

Je kunt een aantal zaken doen die het een beetje fixen, dus een 3staps model toetsen en elke variabele los toevoegen maar dan nog kun je geen duidelijke conclusies trekken...

(voor zover ik weet dan heh, maar ben hier redelijk zeker over)
Is er een website met meer uitleg over het drie staps model? Ik ben een methoden en technieken leek in principe :)

De correlatie is inderdaad 0.6x tussen de variabelen, aardig hoog dus.
De VIF(maatstaf van multicollearity) is echter rond de 1.5, ik dacht dat dat juist zegt dat het wel goed zit met de onafhankelijkheid tussen de variabelen?

[ Bericht 5% gewijzigd door JohnSpek op 22-11-2011 20:25:12 ]
  dinsdag 22 november 2011 @ 20:30:01 #30
124676 RobertoCarlos
Zit je nou naar me te loeruh?
pi_104690234
quote:
0s.gif Op dinsdag 22 november 2011 09:14 schreef oompaloompa het volgende:

[..]

De grouping variable is wat je condities zijn :) Het klinkt alsof je daar een afhankelijke in hebt gevuld.
Dat snap ik, alleen heb ik dus geen condities...
!!! Go 49-ers !!!
  dinsdag 22 november 2011 @ 20:43:08 #31
34299 davako
-GATGCTGTTGAA-
pi_104690978
quote:
0s.gif Op dinsdag 22 november 2011 18:21 schreef oompaloompa het volgende:

[..]

dus je hebt een 2(temp)x3(subtraat) between en 4 within (bacterien)?
Ja. Dat is dan toch een repeated measure ANOVA. Of zou je een andere adviseren?
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_104697027
quote:
0s.gif Op dinsdag 22 november 2011 20:15 schreef JohnSpek het volgende:

[..]

Is er een website met meer uitleg over het drie staps model? Ik ben een methoden en technieken leek in principe :)

De correlatie is inderdaad 0.6x tussen de variabelen, aardig hoog dus.
De VIF(maatstaf van multicollearity) is echter rond de 1.5, ik dacht dat dat juist zegt dat het wel goed zit met de onafhankelijkheid tussen de variabelen?
Je kunt bij een regressie dingen per analyse toevoegen, dan kijkt spss bij elke toevoeging of dit significant meer variantie verklaart, maar in princiepe als je geen theoretisch kader hebt waarom de ene beter zou moeten werken / vooraf gaan aan de andere kun je er geen uitspraak over doen.

Ik weet niet wat 1.5 betekent maar met een correlatie van 0.6 kan ik me niet voorstellen dat er geen problemen zijn dat is echt een hele hoge correlatie.

quote:
2s.gif Op dinsdag 22 november 2011 20:30 schreef RobertoCarlos het volgende:

[..]

Dat snap ik, alleen heb ik dus geen condities...
Maar een t-test is een test tussen condities...

quote:
0s.gif Op dinsdag 22 november 2011 20:43 schreef davako het volgende:

[..]

Ja. Dat is dan toch een repeated measure ANOVA. Of zou je een andere adviseren?
yeap :)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104707619
quote:
0s.gif Op dinsdag 22 november 2011 12:29 schreef oompaloompa het volgende:

[..]

Volgens mij klopt alles wat je zegt.

Een manier om een kwadratische te doen is door zelf een nieuwe variabele aan te maken die het kwadraat is van de oude en deze dan in je regressie te gebruiken
Ik heb van mijn variabel Y de variabel S gemaakt (Door compute variable en dan S = Y*Y)

Nu heb ik S als afhankelijke variabel en A, B en C als onafhankelijke variabelen in de lineaire regressie gedaan.
Nu heb ik nog steeds hetzelfde patroon (iets anders dat wel, maar nog steeds een y = x lijn) in mijn scatterplot S vs residuen.
Weet jij hoe dat komt?
Het is wel zo dat de significanties ook anders zijn. Nu is variabel A opeens niet meer significant en variabel B wel!
pi_104708117
quote:
0s.gif Op woensdag 23 november 2011 07:21 schreef JohnSpek het volgende:

[..]

Ik heb van mijn variabel Y de variabel S gemaakt (Door compute variable en dan S = Y*Y)

Nu heb ik S als afhankelijke variabel en A, B en C als onafhankelijke variabelen in de lineaire regressie gedaan.
Nu heb ik nog steeds hetzelfde patroon (iets anders dat wel, maar nog steeds een y = x lijn) in mijn scatterplot S vs residuen.
Weet jij hoe dat komt?
Het is wel zo dat de significanties ook anders zijn. Nu is variabel A opeens niet meer significant en variabel B wel!
Ik bedoelde eigenlijk de onafhankelijke.

Even dit los zien van het andere probleem. Stel je hebt alleen maar A --> Y en het verband is kwadratisch. Wat je dan doet is een nieuwe term aanmaken a^2. Vervolgens doe je een regressie van zowel A als A^2 op Y. Dan kun je het lineaire en het kwadratische effect van A op Y testen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104714789
quote:
0s.gif Op woensdag 23 november 2011 08:15 schreef oompaloompa het volgende:

[..]

Ik bedoelde eigenlijk de onafhankelijke.

Even dit los zien van het andere probleem. Stel je hebt alleen maar A --> Y en het verband is kwadratisch. Wat je dan doet is een nieuwe term aanmaken a^2. Vervolgens doe je een regressie van zowel A als A^2 op Y. Dan kun je het lineaire en het kwadratische effect van A op Y testen.
Waarom zou je eigenlijk ook de lineaire term nemen? Aangezien de lineaire term alleen al zorgt voor een te hoge schattingslijn bij lage waarde van y (Aangezien de residuen negatief zijn bij lage waardes van y) zou een toevoeging van zowel het lineaire als (een positieve) kwadratische coefficient alleen maar zorgen voor nog een hogere schattingslijn?
(en als er een negatieve kwadratisch term zou zijn zou het begin beter kloppen maar gaat het einde helemaal raar omdat je dan een soort berg parabool krijgt terwijl de residuen bij een lineaire schattingslijn er al boven liggen!).

edit:
Als ik enkel de kwadratische"termen" toevoeg dan zit er geen patroon meer in mijn residuen (gewoon een mooi wolkje).
Als ik de kwadratische en de lineaire termen toevoeg, dan zit er weer een patroon in mijn residuen.
Betekent dit dat ik dus inderdaad enkel de kwadratische term moet toevoegen?

[ Bericht 3% gewijzigd door JohnSpek op 23-11-2011 13:03:39 ]
pi_104732210
Ik bleek te vroeg te hebben gejuigd ;( bij beide kwadratische regressies (met en zonder lineaire termen) zit er nog steeds een y = x lijn in de scatterplot.
pi_104733519
quote:
0s.gif Op woensdag 23 november 2011 12:48 schreef JohnSpek het volgende:

[..]

Waarom zou je eigenlijk ook de lineaire term nemen? Aangezien de lineaire term alleen al zorgt voor een te hoge schattingslijn bij lage waarde van y (Aangezien de residuen negatief zijn bij lage waardes van y) zou een toevoeging van zowel het lineaire als (een positieve) kwadratische coefficient alleen maar zorgen voor nog een hogere schattingslijn?
(en als er een negatieve kwadratisch term zou zijn zou het begin beter kloppen maar gaat het einde helemaal raar omdat je dan een soort berg parabool krijgt terwijl de residuen bij een lineaire schattingslijn er al boven liggen!).

edit:
Als ik enkel de kwadratische"termen" toevoeg dan zit er geen patroon meer in mijn residuen (gewoon een mooi wolkje).
Als ik de kwadratische en de lineaire termen toevoeg, dan zit er weer een patroon in mijn residuen.
Betekent dit dat ik dus inderdaad enkel de kwadratische term moet toevoegen?
Je voegt ze beiden toe omdat het een combinatie van beide kan zijn, bv: a + bx + cx^2
Een regressie analyse kijkt wat het beste "past" dus als het puur alleen kwadratisch zou zijn zou je een niet significante b-waarde er uit krijgen.

quote:
0s.gif Op woensdag 23 november 2011 20:11 schreef JohnSpek het volgende:
Ik bleek te vroeg te hebben gejuigd ;( bij beide kwadratische regressies (met en zonder lineaire termen) zit er nog steeds een y = x lijn in de scatterplot.
vreemd. Stuur anders eens je spss-file en je precieze bedoeling dan kijk ik er naar wanneer ik tijd over heb.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_104734203
quote:
0s.gif Op woensdag 23 november 2011 20:34 schreef oompaloompa het volgende:

[..]

Je voegt ze beiden toe omdat het een combinatie van beide kan zijn, bv: a + bx + cx^2
Een regressie analyse kijkt wat het beste "past" dus als het puur alleen kwadratisch zou zijn zou je een niet significante b-waarde er uit krijgen.

[..]

vreemd. Stuur anders eens je spss-file en je precieze bedoeling dan kijk ik er naar wanneer ik tijd over heb.
Dat zou echt super zijn! Ik pm je de data set.
  donderdag 24 november 2011 @ 19:12:09 #39
34299 davako
-GATGCTGTTGAA-
pi_104770267
Ik heb vier keer een repeated measure toets welke ik moet uitvoeren. Data is als volgt opgedeeld:

Eerste waarde in mijn dataset:
Temperatuur; dit is een nominale waarde welke temp 1 of 2 kan hebben

Tweede waarde in mijn dataset
Toevoeging
Dit is wederom een nominale waarde welke 3 keuzes kunnen hebben.

derde waarde in dataset
Waarde op tijdstip 1

vierde waarde in dataset
Waarde op tijdstip 2

Ik gebruik dus een repeated measure ANOVA om een verschil te meten tussen de twee tijdstippen. Per test meet ik hoeveel een bepaalde bacterie voorkomt(staan in de derde en vierde column).
Bij twee van mijn bacterien gaat dit goed, alleen bij andere twee soorten gaat dit niet goed. Bij de twee laatste soorten zegt mijn Levene's test dat de data niet homogenous verdeelt is.

Ook mag ik niet sphericity aannemen.

Ik heb de data al proberen te transformeren maar dit zorgt er niet voor dat de data homogeen wordt.

De data punten zijn waarden van ongeveer 0.100 tot 1.999

Misschien kan iemand mij helpen of wat adviseren.
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
  donderdag 24 november 2011 @ 21:30:47 #40
302800 Frith
fictief en almachtig
pi_104779137
quote:
0s.gif Op dinsdag 22 november 2011 19:56 schreef nelisb het volgende:
Crosspost wie o wie kan mijn vrouw helpen.

SPSS hulp nodig

Ik ben bezig met mijn afstudeeronderzoek en ben in de analyse fase belandt.
Ik heb een variabele: aantal werkzame personen bij een organisatie en die heb ik gecategoriseerd in:
2-5
5-10
10-15
15-20 werkzame personen

Ik heb een representativiteitstoets uitgevoerd mbv de chi-kwadraat en daaruit blijkt dat de eerste twee categorieën (2-5 en 5-10) gewaardeerd moeten worden met respectievelijk 0,87 en 1,32.
Nu moet ik dit in gaan voeren in SPSS gaan invoeren, zodat deze waardering helemaal wordt doorgevoerd.
Nu snap ik niet hoe ik dit moet doen. Ik heb boeken voor me liggen waar het wellicht in uitgelegd staat, maar dan nog lukt het mij niet. Ik heb SPSS voor Mac.

Kan iemand mij hier door heen helpen, aangezien ik nu echt helemaal vast zit.

Ik hoop het!
Al vast bedankt voor de moeite.
Het eerste wat bij mij binnen schiet is 'weeggewichten', maar ik heb al een tijd niets met statistiek gedaan en het is puur een associatie.

Hoe dan ook zul je de vier categoriën en alle cases daar in vallen op zo'n manier moeten bewerken (hercoderen zal wel niet hoeven, maar dat zou anders wel zo zijn) dat ze daadwerkelijk met elkaar vergeleken kunnen worden. Voor zover ik me zo uit de losse pols kan bedenken, is dat bij gelijkwaardige categorieën (dus geen verschillen tussen gebruikte variabelen) een weeggewicht, om zodoende de steekproef gelijk te stellen aan de verdeling in de populatie.

Pin me daar niet op vast, maar dit kun je heel snel opzoeken in je literatuur in ieder geval.
Volgens mij is het ook zo dat je dit alleen bij bepaalde toetsen hoeft te doen en niet per se bij alle soort toetsen.
pi_104781522
quote:
0s.gif Op donderdag 24 november 2011 19:12 schreef davako het volgende:
Ik heb vier keer een repeated measure toets welke ik moet uitvoeren. Data is als volgt opgedeeld:

Eerste waarde in mijn dataset:
Temperatuur; dit is een nominale waarde welke temp 1 of 2 kan hebben

Tweede waarde in mijn dataset
Toevoeging
Dit is wederom een nominale waarde welke 3 keuzes kunnen hebben.

derde waarde in dataset
Waarde op tijdstip 1

vierde waarde in dataset
Waarde op tijdstip 2

Ik gebruik dus een repeated measure ANOVA om een verschil te meten tussen de twee tijdstippen. Per test meet ik hoeveel een bepaalde bacterie voorkomt(staan in de derde en vierde column).
Bij twee van mijn bacterien gaat dit goed, alleen bij andere twee soorten gaat dit niet goed. Bij de twee laatste soorten zegt mijn Levene's test dat de data niet homogenous verdeelt is.

Ook mag ik niet sphericity aannemen.

Ik heb de data al proberen te transformeren maar dit zorgt er niet voor dat de data homogeen wordt.

De data punten zijn waarden van ongeveer 0.100 tot 1.999

Misschien kan iemand mij helpen of wat adviseren.
Een non-parametrische toets biedt oplossing, die heeft minder sterke assumpties. Voordat je dat doet zou ik eerst de anova gewoon doen. Als daar niks uit blijkt te komen komt de non-parametrische toets ook niet uit.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  Moderator / Redactie Sport zaterdag 26 november 2011 @ 13:16:12 #42
92686 crew  borisz
Keurmeester
pi_104840658
quote:
0s.gif Op maandag 21 november 2011 17:13 schreef borisz het volgende:
Morgen weten we de juiste interpretatie is :+.
Vanavond even weer even verder :s)
Goede antwoord was dus Eerst de data omgooien naar % en een dummy aanmaken voor de negatieve getallen. Waardoor je ziet dat de kosten er sneller bij gaan, maar minder snel af te halen zijn.
winnaar wielerprono 2007 :) Last.FM
pi_104932879
Ik heb een A, B, C -> Y kwadratische regressie gedaan (alle beta's zijn positief) en de docent zei drie dingen wat ik nogal vaag vond:

- Het moet een parabool zijn de schattingslijn.

Dat vond ik raar aangezien de schaal van 1-7 is dus het zou gewoon een lijn moeten zijn die opwaarts sloped (tjah hoe leg je dat uit...).

- De beta's zijn erg laag terwijl de significantie heel hoog is.
De standaard deviatie is relatief aardig hoog in de afhankelijke variabel.
Nu is de beta van proces A behoorlijk laag maar is de p waarde 0,000 dus het is heel erg significant.
Hoe kan het een relatief lage beta zijn terwijl de p waarde toch heel laag is?

- De variabelen correleren heel erg met elkaar, dus mijn conclusie was dat ik er weinig over kon zeggen over de resultaten. Zij vond dat anders en zei dat ik toch per proces (A, B, C) moest zeggen waarom het wel of niet significant was. Wat is jullie mening?

[ Bericht 9% gewijzigd door JohnSpek op 28-11-2011 19:29:05 ]
pi_105097384
Ik denk dat het een erg simpele vraag voor jullie is, maar ik zit in dubio. Ik heb het gevoel dat ik ergens iets fout doe.

Ik heb een enquete gehouden onder 75 personen. Ik wil nu een gaan kijken of 'oudere' personen meer voor optie a kiezen dan voor optie b of c. Bij jongeren net andersom. De mensen konden kiezen bij punt a, b en c uit vijf opties op een ordinale schaal. (Strongly disagree tot Strongly agree).
De leeftijden zijn ook onderverdeeld in vijf delen, namelijk met leeftijdsklassen. (Let's say: 18-32)

Nu wil ik beide zaken met elkaar vergelijken. Dus de leeftijden met optie a, leeftijden met b en als laatste met c. Ik wil gebruik maken van de Chi-squared test, maar daar ga ik volgens mij de mist in?
pi_105099808
Je kunt een 5-puntslikertschaal ook zien als continue variabele, al is het dat strikt genomen niet helemaal. Er is wat discussie over, sommigen zeggen van wel, anderen van niet. Als je het als continue schaal ziet, kun je er een 1-factor ANOVA op loslaten per letter (a, b, c)
pi_105099860
Is dat dan niet een two-way ANOVA?
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_105100199
quote:
0s.gif Op vrijdag 2 december 2011 16:09 schreef crossover het volgende:
Is dat dan niet een two-way ANOVA?
Je gebruikt 1 factor (leeftijd, met 5 niveaus) voor 1 afhankelijke variabele: a/b of c. Het kan ook met andere modellen, waarin je in een keer a, b en c bekijkt, maar ik weet niet hoe groot iemands statistiek kennis is. (en ik durf er zelf ook even geen eenduidige uitspraken over te doen hoe dat ook weer moet.)
pi_105100758
Je kan gewoon een chi squared doen. Theoretisch het meest correct:-)
pi_105130444
Okee bedankt. Want ik had na onderzoek in de leerboeken gevonden dat je de Chi-Square test alleen met categorische variabelen mocht doen
pi_105130893
quote:
0s.gif Op vrijdag 2 december 2011 16:08 schreef Operc het volgende:
Je kunt een 5-puntslikertschaal ook zien als continue variabele, al is het dat strikt genomen niet helemaal. Er is wat discussie over, sommigen zeggen van wel, anderen van niet. Als je het als continue schaal ziet, kun je er een 1-factor ANOVA op loslaten per letter (a, b, c)
Ik ben even hiermee aan de slag gegaan en dit lijkt ook wel een goede oplossing. Vooral icm de Post-Hoc test die je kunt uitvoeren lijkt mij dit de beste methode. Allen bedankt! :)
pi_105477042
Hai,

Even de kluts kwijt met statistiek...

Mijn DV is een count variabele (aantal patenten), dus ik heb gekozen voor een negative binomial regression.

De regression output laat ook negatieve coëfficiënten zien, maar die kan je niet 1 op 1 overnemen. Die moet je eerst EXP(B) (eventueel + constant). Dus er kan nooit een negatief effect zijn.

Maar dat snap ik even niet meer. Ik snap wel dat ik geen negatieve waarden kan hebben, omdat ik zit met de count variabele, die niet negatief kan zijn. Maar een IV kan toch wel een negatieve impact hebben op mijn DV? Hoe moet ik dat zien?

bedankt...
pi_105578484
Ik heb een aantal variabelen welke parametrisch en niet-parametrisch verdeelt zijn. Nu wil ik de correlatie tussen de variabelen toetsen, dit doe ik door middel van Correlate -> Bivariate. Maar nu heb ik de vraag wat moet ik doen bij een niet-parametrisch * parametrisch wil toetsen. Is dit dan niet parametrisch of moet ik als uitgangspunt iets anders nemen?
pi_106481728
Ik heb hulp nodig bij de t-test betreffende 'comparing two populations'.
Het is niet zozeer een SPSS vraag maar een statistische kwestie in het algemeen.

quote:
The results of the Student Satisfaction Survey 2009 are published.
The researchers sent out 300.000 invitations to the survey:

35.000 to students of University of Sussex and 265.000 to students not studying at
University of Sussex. There were 80.000 responses, 10.000 of them from students of Sussex.

Can you conclude from these data that the response rate of Sussex students is statistically significant higher than the response rate of other students? Use α = 1%
Het gaat dus om independent samples / unequal variances (correct me if i'm wrong)

Het eerste probleem waar ik op stuit bij deze opdracht is dat er geen population/sample standard deviation of sample variances zijn gegeven. En dat is juist een cruciale component bij het bepalen van de t-waarde.

Mean (x-bar) Sussex students (1): 10.000
Mean (x-bar) other students (2): 70.000

Dit zijn de stappen die ik heb gevolgd:

Stap 1:
Null hypothesis: Response Rate (Uni of Sussex) is not equal to Response Rate (Other Unis)
Alternate hypothesis: Response Rate (Uni of Sussex) > (is higher than) Response Rate (Other unis)

Stap 2: De equality van de population variances bepalen (d.m.v. F-test) met σ onbekend

Test statistic: F = Pooled variance (Sussex) / Pooled variance (Other)
Null hypothesis: Population variance (Sussex) / Population variance (Other) = 1
Alternate hypothesis: Population variance (Sussex) / Population variance (Other) NOT EQUAL TO 1

Stap 3: Als null hypothesis wordt bewezen, equal variances t-test uitvoeren, als alternate hypothesis wordt bewezen, unequal variances t-test uitvoeren.

Maar hier loop ik dus stuk omdat er geen sample variance/standard deviation staat gegeven, iemand die me kan helpen?
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106484247
Beschik je over de dataset?
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_106484530
quote:
0s.gif Op vrijdag 6 januari 2012 15:08 schreef crossover het volgende:
Beschik je over de dataset?
Die is er niet, dat is juist het probleem, anders was het een stuk makkelijker geweest en had ik de variances via de descriptives kunnen verkrijgen en dan via compare means de t-test uit kunnen voeren.
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106484603
quote:
0s.gif Op vrijdag 6 januari 2012 15:14 schreef Asskicker14 het volgende:

[..]

Die is er niet, dat is juist het probleem, anders was het een stuk makkelijker geweest en had ik de variances via de descriptives kunnen verkrijgen en dan via compare means de t-test uit kunnen voeren.
quote:
Can you conclude from these data that the response rate of Sussex students is statistically significant higher than the response rate of other students?
Dan is het antwoord op de vraag 'nee'.
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_106484671
Dit is van het oefen-tentamen waar ik momenteel mee bezig ben, 3 opgaves die ik handmatig moet berekenen en 3 opgaves met SPSS datasets.
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106484720
quote:
0s.gif Op vrijdag 6 januari 2012 15:15 schreef crossover het volgende:

[..]

[..]

Dan is het antwoord op de vraag 'nee'.
Ik heb het niet onderbouwd waarom dat zo is omdat ik de sample variance niet heb, dus als ik slechts nee zou beantwoorden zonder een berekening van de t-test te kunnen weerleggen, krijg ik 0 punten.
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106485041
quote:
0s.gif Op vrijdag 6 januari 2012 15:17 schreef Asskicker14 het volgende:

[..]

Ik heb het niet onderbouwd waarom dat zo is omdat ik de sample variance niet heb, dus als ik slechts nee zou beantwoorden zonder een berekening van de t-test te kunnen weerleggen, krijg ik 0 punten.
Tja, volgens mij heb je gelijk en is hier de oplossing niet te berekenen zonder die informatie. Heb je andere studenten hierover gesproken?
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_106500351
Dit kan je helemaal niet testen met een t-test, je moet het verschil tussen response rates testen en response rates zijn proporties, geen gemiddeldes.
Enige wat je daarvoor nodig hebt is je proportie en je n.
pi_106501889
quote:
0s.gif Op vrijdag 6 januari 2012 21:04 schreef gewooneenuser het volgende:
Dit kan je helemaal niet testen met een t-test, je moet het verschil tussen response rates testen en response rates zijn proporties, geen gemiddeldes.
Enige wat je daarvoor nodig hebt is je proportie en je n.
Valt dit dan onder 'samping distributions'?

Merci!
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106502224
Ik heb geleerd dat je met proporties niet de statistical significance van two populaties kunt weergeven. Ik dacht dat dat alleen kan door middel van een soort test waarbij je een hypothese onderzoekt.

Maar moet het dan gewoon zo?

P (Sussex): 10.000 / 35.000 = 0.2857
P (Others): 70.000 / 265.000 = 0.2642
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106502963
Is gewoon een z-test. Vele voorbeelden te vinden op internet, bijvoorbeeld http://www.acastat.com/Statbook/ztest2.htm

Je nul-hypothese is gewoon dat beide proporties aan elkaar gelijk zijn :s)
pi_106503224
Dank je, je bent een levensredder!
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106504829
Dus gewoon:

Null: Response Rate (Sussex) is the same as Response Rate (Others)
Alternate: Response Rate (Sussex) is higher than the Response Rate (Others)

C.V. : z = 2.33

p = 35.000 * (0.2857) + 265.000 * (0.2642) / 300.000 = 0.2667
q = 1 - 0.2667 = 0.7333

S = 0.4422 * 0.1798 = 0.0795

T.S. : z = (0.2857 - 0.2642) / 0.0795 = 0.27044

Conclusie: 0.27 is niet groter dan CV van 2.33, daarom is er geen statistically significant difference in de response rate
Is God willing to prevent evil, but not able? Then he is not omnipotent.
Is he able, but not willing? Then he is malevolent.
Is he both able and willing? Then whence cometh evil?
Is he neither able nor willing? Then why call him God?
pi_106719210
Vraagje over een onderzoeksopzet. Als je een longitudinaal onderzoek hebt waarbij je binnen twee groepen kijkt of de scores op drie factoren verschilt in de verschillende meetmomenten, welke analyse gebruik je dan>?
Ik dacht zelf aan repeated measures ANOVA, maar dit moet dan zes keer. Is daar niets anders voor te verzinnen?
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_106719658
Voor de duidelijkheid; er is dus sprake van afhankelijke waarnemingen.
'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_106720641
Ik heb een kanshebber gevonden: Mixed Between-Within-Subjects ANOVA.

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>
pi_106876029
Ik moet voor school aan de hand van een discriminant analysis in SPSS de volgende vragen beantwoorden:

1. What is the conceptual difference with the direct method?
2. How well are we performing with this method in our classification efforts? Would you call this
an improvement?

Kan iemand mij op weg helpen hoe ik tot een antwoord kan komen op deze twee vragen?
pi_106889848
Wie heeft een formule voor mij om een sample size berekening te maken voor een standard multiple regression?

Mijn effect size is 0.437
aantal onafhankelijke variabelen is 16
power is 88% en α is 0.05

Ik kan nergens een goede formule vinden voor regressie analyse...

Thnx

Kim

[ Bericht 1% gewijzigd door kiertje1941 op 16-01-2012 21:58:46 ]
pi_106897857
.

[ Bericht 60% gewijzigd door kiertje1941 op 17-01-2012 00:37:16 ]
pi_107409693
Ik heb ook even een vraagje:
Ik heb een vragenlijst van 20 items, waarbij ik per item wil weten of er een significant verschil is tussen twee groepen mensen die de vragenlijst hebben ingevuld.
Omdat dit eigenlijk 20 testen zijn, is het niet meer zinvol om met een significantie grens van p<.05 te werken. Nu is de vraag: als ik een totale analyse doe in SPSS, waarin deze 20 items worden geanalyseerd, corrigeert SPSS dan automatisch voor de hoeveelheid variabelen?
pi_107413343
Ik wil verklaren dat X een effect heeft op Y.

Nu heb ik ook Q, T, en Z gemeten (omdat uit andere onderzoeken is gebleken dat deze variabelen een significant effect hebben op Y).

Bij mijn regressie zou ik dan Q, T en Z er ook bij betrekken?
pi_107419431
quote:
0s.gif Op maandag 30 januari 2012 18:35 schreef Operc het volgende:
Ik heb ook even een vraagje:
Ik heb een vragenlijst van 20 items, waarbij ik per item wil weten of er een significant verschil is tussen twee groepen mensen die de vragenlijst hebben ingevuld.
Omdat dit eigenlijk 20 testen zijn, is het niet meer zinvol om met een significantie grens van p<.05 te werken. Nu is de vraag: als ik een totale analyse doe in SPSS, waarin deze 20 items worden geanalyseerd, corrigeert SPSS dan automatisch voor de hoeveelheid variabelen?
ANOVA?
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_107419474
quote:
0s.gif Op maandag 30 januari 2012 20:02 schreef JohnSpek het volgende:
Ik wil verklaren dat X een effect heeft op Y.

Nu heb ik ook Q, T, en Z gemeten (omdat uit andere onderzoeken is gebleken dat deze variabelen een significant effect hebben op Y).

Bij mijn regressie zou ik dan Q, T en Z er ook bij betrekken?
Ja. Je kijkt dan of er effect is van X op Y, corrigerend voor Q, T en Z.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_107419626
quote:
0s.gif Op maandag 30 januari 2012 21:59 schreef crossover het volgende:

[..]

ANOVA?
Bijvoorbeeld :) Maar corrigeert die voor het aantal testen wat je uitvoert?
pi_107420119
quote:
0s.gif Op maandag 30 januari 2012 22:02 schreef Operc het volgende:

[..]

Bijvoorbeeld :) Maar corrigeert die voor het aantal testen wat je uitvoert?
Is dat nodig dan?
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_107421257
In principe verwacht je bij 20 samenhangende testen dat er 1 significant zal uitvallen, terwijl dit strikt genomen niet het geval is. (Wegens de significatiegrens van 5%) Daar moet je voor corrigeren naar mijn mening. Maar als je het anders ziet, hoor ik graag argumenten, daar kan ik weer van leren. :)
pi_107429862
Ik ben geen expert, maar bij ANOVA hoefde dat ook als een eenweg opzet hebt met twee groepen en drie variabelen. Het is dan namelijk één toets, terwijl als je 20 keer een t-toets uitvoert, je inderdaad die type-1 fout hebt. Of was het type-II... :P
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_107638450
Ik heb een regressie met 7 onafhankelijke variabelen.

Mijn residuen zijn niet normaal verdeeld blijkt, en dat is wel nodig.

Wat nu?
pi_107828822
Hoe kan ik van mijn multiple response chart een staafdiagram maken?

In de Chart builder zie ik de set niet staan bij de variabelen..
pi_108929744
Hoi!

Alvast bedankt met het helpen van mijn SPSS vraag. Het is dus de bedoeling dat ik voor Research Seminar data verwerk. Leuk, want ik snap er de ballen van. Mijn vraag is als volgt:

Ik heb meerdere keren verschillende items waar ik een construct/variabele van maak. Dat gaat goed. Echter, die items meten de antwoorden van een vraag met een likert-schaal van 1 tot en met 5. En zo nu en dan zit er een 0 tussen. Dat lijkt mij een missing variable. Als ik dat in de variable view aanmerk als missing (Missing > discrete =0), 'ziet' spss wel de missing data wanneer ik Analyze>Descripte>Frequencies doe. Echter, (en hier komt het probleem) verschijnen er dan gaten in mijn construct, precies daar waar in de items een 0 voorkomt. Dus een nul in mijn item betekent een . in mijn construct. Staan er enkel items met correcte antwoorden dan staat er wel netjes een cijfer.

Wat doe ik fout en hoe dit op te lossen?

Bedankt!
pi_108932255
quote:
0s.gif Op zaterdag 10 maart 2012 01:20 schreef Meneerik2 het volgende:
Hoi!

Alvast bedankt met het helpen van mijn SPSS vraag. Het is dus de bedoeling dat ik voor Research Seminar data verwerk. Leuk, want ik snap er de ballen van. Mijn vraag is als volgt:

Ik heb meerdere keren verschillende items waar ik een construct/variabele van maak. Dat gaat goed. Echter, die items meten de antwoorden van een vraag met een likert-schaal van 1 tot en met 5. En zo nu en dan zit er een 0 tussen. Dat lijkt mij een missing variable. Als ik dat in de variable view aanmerk als missing (Missing > discrete =0), 'ziet' spss wel de missing data wanneer ik Analyze>Descripte>Frequencies doe. Echter, (en hier komt het probleem) verschijnen er dan gaten in mijn construct, precies daar waar in de items een 0 voorkomt. Dus een nul in mijn item betekent een . in mijn construct. Staan er enkel items met correcte antwoorden dan staat er wel netjes een cijfer.

Wat doe ik fout en hoe dit op te lossen?

Bedankt!
Klopt

Er zijn een aantal manieren om dit op te lossen.
1. Laat de cases die 1+ missing value hebben er uit.
2. Laat de cases die n+ missing values hebben er uit (zelf besluiten wat n is) en generer vervangende missing values.
3. Genereer vervangen values voor iedereen.

Dan heb je eigenlijk nog 2a, b, c, d, namelijk hoe vervang je de missing values.
Er zijn een aantal opties, celgemiddelde, groepsgemiddelde, etc. Dat is eigenlijk ook eigen keuze.

Elke keuze heeft voordelen en nadelen, je zult dus goed moeten beargumenteren waarom je voor welke oplossing hebt gekozen.

Als je bv iedereen met missing values er uit haalt bias je je sample. Maar door zelf data te genereren bias je weer je data, etc.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109240051
Wie kan mij alsjeblieft helpen.. Ik word zo'n beetje radeloos. Ik moet voor school 3 hypothesen toetsen namelijk een moderende, een medierende en meerder oorzaken. Er is een hypothese gemaakt dat de invloed van het aantal vrienden op depressie verschillend is voor een ander geslacht (moderend)
De tweede hypothese is dat levensgebeurtenissen invloed heeft op blijheid wat invloed heeft op depressie (medierend). De derde hypothese veronderstelt dat wel of niet piekeren en wel of niet sporten invloed hebben op depressie (meerdere oorzaken)

hoe moet ik dit toetsen en welke moet ik gebruiken..

wie mij kan helpen maakt me super blij!!!!
  maandag 19 maart 2012 @ 19:00:49 #85
34299 davako
-GATGCTGTTGAA-
pi_109282573
Wie o wie kan mij helpen. Ik heb een vraag betreffende een Repeated Measures ANOVA. Wanneer ik een repeated measure ANOVA uitvoer krijg ik vervolgens F-values en P-Values enz. enz.
Vervolgens blijken er 1 factor of combinaties van factoren significant te verschillen.
Dit is leuk en is goed, alleen hoe kan ik uit SPSS halen welke van de waarden significant verschillen.

Stel mijn waarden reageren significant op een bepaalde treatment.(Stel treatment 3 (Dit weet ik echter nog niet)) Maar hoe weet ik nou met welke treatment hij significant verschillend is.
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_109282999
quote:
0s.gif Op zondag 18 maart 2012 17:26 schreef x.steph het volgende:
Wie kan mij alsjeblieft helpen.. Ik word zo'n beetje radeloos. Ik moet voor school 3 hypothesen toetsen namelijk een moderende, een medierende en meerder oorzaken. Er is een hypothese gemaakt dat de invloed van het aantal vrienden op depressie verschillend is voor een ander geslacht (moderend)
De tweede hypothese is dat levensgebeurtenissen invloed heeft op blijheid wat invloed heeft op depressie (medierend). De derde hypothese veronderstelt dat wel of niet piekeren en wel of niet sporten invloed hebben op depressie (meerdere oorzaken)

hoe moet ik dit toetsen en welke moet ik gebruiken..

wie mij kan helpen maakt me super blij!!!!
1, multi(uni)variate of lineaire regressie met dummie + interacties voor geslacht.
2.linear regressie & sobel (of bootstrap) moet je even googlen voor de syntax
3. zelfde multi(uni)variate maar nu hopelijk zonder uitkomst dat er een interactie effect is.

quote:
0s.gif Op maandag 19 maart 2012 19:00 schreef davako het volgende:
Wie o wie kan mij helpen. Ik heb een vraag betreffende een Repeated Measures ANOVA. Wanneer ik een repeated measure ANOVA uitvoer krijg ik vervolgens F-values en P-Values enz. enz.
Vervolgens blijken er 1 factor of combinaties van factoren significant te verschillen.
Dit is leuk en is goed, alleen hoe kan ik uit SPSS halen welke van de waarden significant verschillen.

Stel mijn waarden reageren significant op een bepaalde treatment.(Stel treatment 3 (Dit weet ik echter nog niet)) Maar hoe weet ik nou met welke treatment hij significant verschillend is.
Contrasten gebruiken, anovas zeggen nooit waar het verschil zit, is altijd een toets over de hele dataset.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 19 maart 2012 @ 19:14:32 #87
34299 davako
-GATGCTGTTGAA-
pi_109283184
quote:
0s.gif Op maandag 19 maart 2012 19:10 schreef oompaloompa het volgende:

[..]

1, multi(uni)variate of lineaire regressie met dummie + interacties voor geslacht.
2.linear regressie & sobel (of bootstrap) moet je even googlen voor de syntax
3. zelfde multi(uni)variate maar nu hopelijk zonder uitkomst dat er een interactie effect is.

[..]

Contrasten gebruiken, anovas zeggen nooit waar het verschil zit, is altijd een toets over de hele dataset.
Wat houden contrasten precies is?
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_109283335
quote:
0s.gif Op maandag 19 maart 2012 19:14 schreef davako het volgende:

[..]

Wat houden contrasten precies is?
pfoe dat is niet heel erg gemakkelijk zo 1,2,3 uit te leggen. Waarom krijg je dit niet bij het vak waar je spss nodig voor hebt? Is een vrij basaal onderdeel van anovas?

Dt zou moeten helpen: http://www.psychology.not(...)C82MST/contrasts.pdf
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 19 maart 2012 @ 19:32:45 #89
34299 davako
-GATGCTGTTGAA-
pi_109284040
quote:
0s.gif Op maandag 19 maart 2012 19:18 schreef oompaloompa het volgende:

[..]

pfoe dat is niet heel erg gemakkelijk zo 1,2,3 uit te leggen. Waarom krijg je dit niet bij het vak waar je spss nodig voor hebt? Is een vrij basaal onderdeel van anovas?

Dt zou moeten helpen: http://www.psychology.not(...)C82MST/contrasts.pdf
Ze werken in die opdracht puur en alleen met een One-Way ANOVA. Met gewone ANOVA's weet ik ook wel hoe je de verschillen kan vinden. Dit lijkt echter niet op te gaan voor een RM ANOVA.
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_109290840
[quote]0s.gif Op maandag 19 maart 2012 19:10 schreef oompaloompa het volgende:

[..]

1, multi(uni)variate of lineaire regressie met dummie + interacties voor geslacht.
2.linear regressie & sobel (of bootstrap) moet je even googlen voor de syntax
3. zelfde multi(uni)variate maar nu hopelijk zonder uitkomst dat er een interactie effect is.

Zou je me please ook kunnen uitleggen hoe ik de eerste dan met dummy's moet doen? Ik heb het tijdens werkcollege gevraagd maar hij zegt doodleuk dat we daar zelf achter moeten komen..
pi_109292911
Is er toevallig iemand die mij kan 'ondersteunen' bij hoe ik een stapsgewijze lineaire regressie analyse moet aanpakken? Heb totaal geen idee maar moet het deze week wel gaan doen :D :'(
  maandag 19 maart 2012 @ 22:23:39 #92
124676 RobertoCarlos
Zit je nou naar me te loeruh?
pi_109294069
quote:
0s.gif Op maandag 19 maart 2012 19:32 schreef davako het volgende:

[..]

Ze werken in die opdracht puur en alleen met een One-Way ANOVA. Met gewone ANOVA's weet ik ook wel hoe je de verschillen kan vinden. Dit lijkt echter niet op te gaan voor een RM ANOVA.
Uh, met een one-way ANOVA heb je toch helemaal geen contrasts?
!!! Go 49-ers !!!
pi_109294640
quote:
0s.gif Op maandag 19 maart 2012 21:30 schreef x.steph het volgende:
[quote][ afbeelding ] Op maandag 19 maart 2012 19:10 schreef oompaloompa het volgende:

[..]

1, multi(uni)variate of lineaire regressie met dummie + interacties voor geslacht.
2.linear regressie & sobel (of bootstrap) moet je even googlen voor de syntax
3. zelfde multi(uni)variate maar nu hopelijk zonder uitkomst dat er een interactie effect is.

Zou je me please ook kunnen uitleggen hoe ik de eerste dan met dummy's moet doen? Ik heb het tijdens werkcollege gevraagd maar hij zegt doodleuk dat we daar zelf achter moeten komen..
Ik zou gewoon een variate test doen, is een stuk simpeler.

Met dummies doe je het volgende.
Stel je hebt geslacht gemeten en neuroticisme en regresseert deze op impulsief koopgedrag (noem ook maar wat) je verwacht dat het effect van neuroticisme voor mannen anders is dan voor vrouwen.

Gebruik voor geslacht 0 & 1, voeg deze toe in je regressie
Voeg neuroticisme toe
Voeg een interactieterm van de twee toe, compute een nieuwe variabele geslacht * neuroticisme

Als die interactie dan significant (pos of neg) blijkt te zijn, betekent dit dat het effect voor mannen anders is dan voor vrouwen.

quote:
0s.gif Op maandag 19 maart 2012 22:03 schreef Trusten het volgende:
Is er toevallig iemand die mij kan 'ondersteunen' bij hoe ik een stapsgewijze lineaire regressie analyse moet aanpakken? Heb totaal geen idee maar moet het deze week wel gaan doen :D :'(
Waar loop je vast? In principe gooi je gewoon steeds een nieuwe variabele in je regressie totdat deze niet significant meer verklaart.

quote:
2s.gif Op maandag 19 maart 2012 22:23 schreef RobertoCarlos het volgende:

[..]

Uh, met een one-way ANOVA heb je toch helemaal geen contrasts?
Zolang je meer dan twee groepen hebt wel. (en meestal doe je bij twee een t-test dus is een anova juist gebruikelijk wanneer je wel contrasten moet doen)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 19 maart 2012 @ 23:01:44 #94
34299 davako
-GATGCTGTTGAA-
pi_109295884
Oompaloompa wat studeer jij of wat voor werk doe jij? Jij bent in ieder geval aardig gedreven in statistiek.
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_109306642
quote:
0s.gif Op maandag 19 maart 2012 23:01 schreef davako het volgende:
Oompaloompa wat studeer jij of wat voor werk doe jij? Jij bent in ieder geval aardig gedreven in statistiek.
Ik ben net begonnen met promoveren in econ. psy / decision making. Daarvoor research master soc. psy gedaan in Tilburg. Daar hebben ze nogal wat statistiek, in totaal heb ik 8 volle statistiek vakken moeten doen en daarnaast nog wat lichtere cursussen. Was toen erg saai maar achteraf gezien ben ik wel blij dat we zoveel verplichte statistiek hebben gehad. Merk dat het fijn is goed te begrijpen wat je aan het doen bent en zou uit mezelf nooit zoveel energie er in stoppen. Ben het zelfs stiekem best wel leuk gaan vinden :D
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109306831
quote:
0s.gif Op zondag 18 maart 2012 17:26 schreef x.steph het volgende:
Wie kan mij alsjeblieft helpen.. Ik word zo'n beetje radeloos. Ik moet voor school 3 hypothesen toetsen namelijk een moderende, een medierende en meerder oorzaken. Er is een hypothese gemaakt dat de invloed van het aantal vrienden op depressie verschillend is voor een ander geslacht (moderend)
De tweede hypothese is dat levensgebeurtenissen invloed heeft op blijheid wat invloed heeft op depressie (medierend). De derde hypothese veronderstelt dat wel of niet piekeren en wel of niet sporten invloed hebben op depressie (meerdere oorzaken)

hoe moet ik dit toetsen en welke moet ik gebruiken..

wie mij kan helpen maakt me super blij!!!!
Klinkt als tweedejaars Psychologie aan de VU. Wat een drama is het dit jaar..

[ Bericht 4% gewijzigd door Sandertje23 op 20-03-2012 11:35:24 ]
pi_109307315
quote:
0s.gif Op maandag 19 maart 2012 19:10 schreef oompaloompa het volgende:
Contrasten gebruiken, anovas zeggen nooit waar het verschil zit, is altijd een toets over de hele dataset.
Wat is het verschil dan met post-hoc toetsen?

grumble, wrong button 2 posts..
  dinsdag 20 maart 2012 @ 11:47:55 #98
8369 speknek
Another day another slay
pi_109307689
Ik zou ook post-hoc tests doen (heb je gelijk effect sizes) en pas rommelen met contrasts als spss vervelend gaat doen en ze niet toestaat. Maar ik ben dan ook een auto-didacte statistiek-rommelaar en heb geen acht vakken erover gehad.
They told me all of my cages were mental, so I got wasted like all my potential.
pi_109309250
quote:
0s.gif Op dinsdag 20 maart 2012 11:36 schreef Sandertje23 het volgende:

[..]

Wat is het verschil dan met post-hoc toetsen?

grumble, wrong button 2 posts..
quote:
0s.gif Op dinsdag 20 maart 2012 11:47 schreef speknek het volgende:
Ik zou ook post-hoc tests doen (heb je gelijk effect sizes) en pas rommelen met contrasts als spss vervelend gaat doen en ze niet toestaat. Maar ik ben dan ook een auto-didacte statistiek-rommelaar en heb geen acht vakken erover gehad.
Een post-hoc is een contrast.
Je hebt planned contrasts die je van te voren hebt bepaald en waar je geen type-1 correctie op toe hoeft te passen, pf post-hoc contrasten waarbij je dit wel moet doen.

SPSS heeft gewoon verwarrende naampjes voor de opties. En ik denk daar weer niet bij na en geef dus onhandig advies ;)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  dinsdag 20 maart 2012 @ 12:39:33 #100
8369 speknek
Another day another slay
pi_109309453
Ik krijg bij dat soort van te voren bepaalde contrasts altijd een beetje een one-tailed t-test smaakje (in principe mogelijk, maar meestal misbruikt om iets toch significant te krijgen). Aan de andere kant is veel type-I correctie ook onzinnig.
They told me all of my cages were mental, so I got wasted like all my potential.
pi_109309473
quote:
0s.gif Op dinsdag 20 maart 2012 12:32 schreef oompaloompa het volgende:

[..]

[..]

Een post-hoc is een contrast.
Je hebt planned contrasts die je van te voren hebt bepaald en waar je geen type-1 correctie op toe hoeft te passen, pf post-hoc contrasten waarbij je dit wel moet doen.

SPSS heeft gewoon verwarrende naampjes voor de opties. En ik denk daar weer niet bij na en geef dus onhandig advies ;)
Duidelijk ;)
pi_109310446
quote:
0s.gif Op zaterdag 10 maart 2012 09:10 schreef oompaloompa het volgende:

[..]

Klopt

Er zijn een aantal manieren om dit op te lossen.
1. Laat de cases die 1+ missing value hebben er uit.
2. Laat de cases die n+ missing values hebben er uit (zelf besluiten wat n is) en generer vervangende missing values.
3. Genereer vervangen values voor iedereen.

Dan heb je eigenlijk nog 2a, b, c, d, namelijk hoe vervang je de missing values.
Er zijn een aantal opties, celgemiddelde, groepsgemiddelde, etc. Dat is eigenlijk ook eigen keuze.

Elke keuze heeft voordelen en nadelen, je zult dus goed moeten beargumenteren waarom je voor welke oplossing hebt gekozen.

Als je bv iedereen met missing values er uit haalt bias je je sample. Maar door zelf data te genereren bias je weer je data, etc.
Bedankt :)
  dinsdag 20 maart 2012 @ 13:45:15 #103
219590 oompaloompa
doompadeedee
pi_109311680
quote:
0s.gif Op dinsdag 20 maart 2012 12:39 schreef speknek het volgende:
Ik krijg bij dat soort van te voren bepaalde contrasts altijd een beetje een one-tailed t-test smaakje (in principe mogelijk, maar meestal misbruikt om iets toch significant te krijgen). Aan de andere kant is veel type-I correctie ook onzinnig.
Ja het ligt echt aan hoe duidelijk een hypothese volgt in mijn ervaring. Soms lees ik papers waar ik er echt mijn vraagtekens bij zet, in andere papers is het zo ontzettend duidelijk uit de theorie dat je echt een specifiek contrast verwacht en heb ik er 0.0 problemen mee.

Sowieso heb ik snel vraagtekens als alles rond de .05 hangt en als dingen een p van .001 hebben maakt het bijna niet meer uit of je controleert of niet :)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109329080
quote:
0s.gif [b]Op [Waar loop je vast? In principe gooi je gewoon steeds een nieuwe variabele in je regressie totdat deze niet significant meer verklaart.
Ik loop vast bij het openen van het databestand :P Alles is heel diep weggezakt, zou neit eens weten of ik moet standaardiseren of niet enz
pi_109338046
quote:
0s.gif Op maandag 19 maart 2012 22:03 schreef Trusten het volgende:
Is er toevallig iemand die mij kan 'ondersteunen' bij hoe ik een stapsgewijze lineaire regressie analyse moet aanpakken? Heb totaal geen idee maar moet het deze week wel gaan doen :D :'(
Zoek ff Pallant, SPSS survival manual op. Is hier en daar wel op internet te vinden in pdf.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_109357487
Vraagje, we willen een verband tussen opvoedgedrag en probleemgedrag meten en kijken of dit verschillend is tussen twee landen. Hoe dan ook moeten we een multiple regressie analyse doen. We twijfelen over een hiërarchische of stapsgewijze. We hebben al dummyvariabelen aangemaakt voor land en geslacht en weten de volgorde waarin we het moeten invoeren. Nu lopen we alleen vast op toevoegen van de interactie-effecten. Waar kun je dit ook alweer doen? Alvast bedankt ^O^
pi_109357668
quote:
0s.gif Op dinsdag 20 maart 2012 23:07 schreef crossover het volgende:

[..]

Zoek ff Pallant, SPSS survival manual op. Is hier en daar wel op internet te vinden in pdf.
Dit zou een standaard macroreply moeten zijn op elke post in dit topic. Wat een handig boek is dat!
quote:
0s.gif Op woensdag 21 maart 2012 18:15 schreef Trusten het volgende:
Vraagje, we willen een verband tussen opvoedgedrag en probleemgedrag meten en kijken of dit verschillend is tussen twee landen. Hoe dan ook moeten we een multiple regressie analyse doen. We twijfelen over een hiërarchische of stapsgewijze. We hebben al dummyvariabelen aangemaakt voor land en geslacht en weten de volgorde waarin we het moeten invoeren. Nu lopen we alleen vast op toevoegen van de interactie-effecten. Waar kun je dit ook alweer doen? Alvast bedankt ^O^
Of in een custom model, of zelf aanmaken door compute te gebruiken en voor elke dummie ook een interactiedummie te maken.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109357722
quote:
Of in een custom model, of zelf aanmaken door compute te gebruiken en voor elke dummie ook een interactiedummie te maken.
Thnx voor je reactie maar begrijp het nog niet helemaal. Hoe doe ik dat precies :@
pi_109357766
quote:
0s.gif Op woensdag 21 maart 2012 18:25 schreef Trusten het volgende:

[..]

Thnx voor je reactie maar begrijp het nog niet helemaal. Hoe doe ik dat precies :@
Ongeveer zoals hieronder uitgelegd :)

quote:
0s.gif Op maandag 19 maart 2012 22:35 schreef oompaloompa het volgende:

[..]

Ik zou gewoon een variate test doen, is een stuk simpeler.

Met dummies doe je het volgende.
Stel je hebt geslacht gemeten en neuroticisme en regresseert deze op impulsief koopgedrag (noem ook maar wat) je verwacht dat het effect van neuroticisme voor mannen anders is dan voor vrouwen.

Gebruik voor geslacht 0 & 1, voeg deze toe in je regressie
Voeg neuroticisme toe
Voeg een interactieterm van de twee toe, compute een nieuwe variabele geslacht * neuroticisme

Als die interactie dan significant (pos of neg) blijkt te zijn, betekent dit dat het effect voor mannen anders is dan voor vrouwen.

[..]

Waar loop je vast? In principe gooi je gewoon steeds een nieuwe variabele in je regressie totdat deze niet significant meer verklaart.

[..]

Zolang je meer dan twee groepen hebt wel. (en meestal doe je bij twee een t-test dus is een anova juist gebruikelijk wanneer je wel contrasten moet doen)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109357833
quote:
Ongeveer zoals hieronder uitgelegd :)

Eerste gedeelte begrijpen we maar lopen vast bij "compute een nieuwe variabele geslacht * neuroticisme". Hoe doe ik dat precies...
pi_109357938
quote:
0s.gif Op woensdag 21 maart 2012 18:29 schreef Trusten het volgende:

[..]

Eerste gedeelte begrijpen we maar lopen vast bij "compute een nieuwe variabele geslacht * neuroticisme". Hoe doe ik dat precies...
compute
interactieab(of een andere naam) = a keer b
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109358280
quote:
0s.gif Op woensdag 21 maart 2012 18:33 schreef oompaloompa het volgende:
compute
interactieab(of een andere naam) = a keer b
Hmm..wil nog niet echt lukken. Mag ik je misschien een PM sturen met wat meer info over ons onderzoek zodat je beter begrijp waar we tegen aan lopen?
pi_109358442
quote:
0s.gif Op woensdag 21 maart 2012 18:42 schreef Trusten het volgende:

[..]

Hmm..wil nog niet echt lukken. Mag ik je misschien een PM sturen met wat meer info over ons onderzoek zodat je beter begrijp waar we tegen aan lopen?
Nou het is echt heel erg simpel, weet niet wat ik er nog aan toe kan voegen. Je maakt een variabele aan die het ene keer het andere is (dat is namelijk wat een interactie is, effect van het ene hangt af van de grootte van het andere). Kan er echt niets meer over zeggen dan dat je de twee originele variabelen met elkaar vermenigvuldigt en toevoegt aan je model...

(behalve dan een echo van crossover ;) )

Je mag me zeker pm-en alhoewel ik eerlijk moet zeggen dat ik nogal aan het soggen ben en dus misshcien geen tijd heb er naar te kijken) maar ik weet niet in hoeverre ik nog iets toe kan voegen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109358520
quote:
0s.gif Op woensdag 21 maart 2012 18:47 schreef oompaloompa het volgende:

[..]

Nou het is echt heel erg simpel, weet niet wat ik er nog aan toe kan voegen. Je maakt een variabele aan die het ene keer het andere is (dat is namelijk wat een interactie is, effect van het ene hangt af van de grootte van het andere). Kan er echt niets meer over zeggen dan dat je de twee originele variabelen met elkaar vermenigvuldigd en toevoegt aan je model...

(behalve dan een echo van crossover ;) )
Hmm ja toch gaat het ergens mis. Toch even wat meer uitleg dan. We willen kijken of er een verband is tussen opvoedgedrag A en B en probleemgedrag X. Daarnaast willen we kijken of er verschil is tussen twee landen en of dit verschillend is voor jongens en meisjes.
We moeten sowieso een multiple regressie doen. De afhankelijke variabele is probleemgedrag X.

We hebben het nu als volgt bedacht:
Block 1: dummy land x dummy sekse
Block 2: Opvoedgedrag A en opvoedgedrag B
Block 3: interactie-effect dummy land x opvoeding (2x)

We zijn nu begonnen met een stapsgewijze regressie, klopt dit of moet het hiërarchisch zijn?

Indien het inderdaad een stapsgewijze regressie moet zijn lopen we vast bij blok 3. We zijn schijnbaar ergens vergeten de interactie-effecten aan te maken/toe te voegen want in onze Output kunnen we de interactie-effecten niet terugvinden. Ook als we ze wel toegevoegd denken te hebben volgens jou eerder beschreven manier. Dus er gaat toch ergens iets niet goed, enig idee?
pi_109358890
quote:
0s.gif Op woensdag 21 maart 2012 18:49 schreef Trusten het volgende:

[..]

Hmm ja toch gaat het ergens mis. Toch even wat meer uitleg dan. We willen kijken of er een verband is tussen opvoedgedrag A en B en probleemgedrag X. Daarnaast willen we kijken of er verschil is tussen twee landen en of dit verschillend is voor jongens en meisjes.
We moeten sowieso een multiple regressie doen. De afhankelijke variabele is probleemgedrag X.

We hebben het nu als volgt bedacht:
Block 1: dummy land x dummy sekse
Block 2: Opvoedgedrag A en opvoedgedrag B
Block 3: interactie-effect dummy land x opvoeding (2x)

We zijn nu begonnen met een stapsgewijze regressie, klopt dit of moet het hiërarchisch zijn?

Indien het inderdaad een stapsgewijze regressie moet zijn lopen we vast bij blok 3. We zijn schijnbaar ergens vergeten de interactie-effecten aan te maken/toe te voegen want in onze Output kunnen we de interactie-effecten niet terugvinden. Ook als we ze wel toegevoegd denken te hebben volgens jou eerder beschreven manier. Dus er gaat toch ergens iets niet goed, enig idee?
Laten we even je IV's a, b & c noemen, je afhankelijke is x

Als eerste maak je de volgende interactietermen aan:
a*b
a*c
b*c
a*b*c

Dan heb je in totaal 7 variabelen om toe te voegen:
a
b
c
ab
ac
bc
abc

De volgorde waarop je die toevoegt hangt van je theorie af (hierarchical regression)
Of je gooit het er gewoon in (stepwise)

Welke van die twee geschikt is hangt af van je methode & je onderzoek.

Hier staat daar meer uitleg over:
http://www.nd.edu/~rwilliam/stats1/x95.pdf
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109361557
quote:
0s.gif Op maandag 19 maart 2012 19:10 schreef oompaloompa het volgende:

[..]

1, multi(uni)variate of lineaire regressie met dummie + interacties voor geslacht.
2.linear regressie & sobel (of bootstrap) moet je even googlen voor de syntax
3. zelfde multi(uni)variate maar nu hopelijk zonder uitkomst dat er een interactie effect is.

[..]

Contrasten gebruiken, anovas zeggen nooit waar het verschil zit, is altijd een toets over de hele dataset.
Ik snap de eerste en tweede nu super bedankt!!! nu hopen dat het lukt.. Ik behoor ook tot de VU studenten die hier hopeloos stuntelen met hypotheses.. moet ik bij de laatste een GLM gebruiken? Zo ja wat moet dan bij fixed factors bij mijn hypothese en wat bij covariate?
pi_109361726
quote:
0s.gif Op woensdag 21 maart 2012 20:01 schreef x.steph het volgende:

[..]

Ik snap de eerste en tweede nu super bedankt!!! nu hopen dat het lukt.. Ik behoor ook tot de VU studenten die hier hopeloos stuntelen met hypotheses.. moet ik bij de laatste een GLM gebruiken? Zo ja wat moet dan bij fixed factors bij mijn hypothese en wat bij covariate?
Is het zo'n onduidelijk vak dan? Klinkt een beetje alsof jullie enorm in het diepe gegooid worden ^_^

Het verschil tussen fixed factors en covariaten is dat je er van uit gaat dat covariaten een random verdeling hebben. Meestal zul je dus je condities in fixed factors zetten en dingen als leeftijd of de score op een bepaald psychologisch schaaltje / trait measure in covariates. Voor je resultaten maakt het eigenlijk vrijwel nooit iets uit.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109363863
ooohhh ik denk dat het kwartje begint te vallen.. ja het is echt verschrikkelijk.. tenminste bij mijn werkgroep. Ik ben heel blij met jou :P Je maakt veel dingen een stuk duidelijker dus echt 10000x bedankt. die dummy dingen zijn gelukkig gelukt en een deel van mijn mediatie bleek niet significant dus dat is gelukt.

nu alleen met mijn laatste hypothese. Die veronderstelt dat wel of niet piekeren en wel of niet sporten invloed hebben op depressie. Kan ik daar dan het beste zo'n General Lineair Model voor gebruiken en dan univariate of multivariate? Dan moet ik zeker alleen nog een interactie door compute maken voor sporten*piekeren en die dan ook als een fixed factor zetten?
pi_109367628
quote:
0s.gif Op woensdag 21 maart 2012 20:05 schreef oompaloompa het volgende:

[..]

Is het zo'n onduidelijk vak dan? Klinkt een beetje alsof jullie enorm in het diepe gegooid worden ^_^

Het verschil tussen fixed factors en covariaten is dat je er van uit gaat dat covariaten een random verdeling hebben. Meestal zul je dus je condities in fixed factors zetten en dingen als leeftijd of de score op een bepaald psychologisch schaaltje / trait measure in covariates. Voor je resultaten maakt het eigenlijk vrijwel nooit iets uit.
kan het trouwens kloppen dat als je een dummy hebt gemaakt voor geslacht dat je geslacht zelf niet in de lineaire regressie moet gooien? Sorry voor alle vragen..
pi_109381175
quote:
0s.gif Op woensdag 21 maart 2012 22:00 schreef x.steph het volgende:

[..]

kan het trouwens kloppen dat als je een dummy hebt gemaakt voor geslacht dat je geslacht zelf niet in de lineaire regressie moet gooien? Sorry voor alle vragen..
Dat klopt, wat je daar zegt. Je maakt immers niet voor niets dummyvariabelen aan. Maar, in principe is geslacht een dummyvariabele (je moet 'm dan wel met 0 en 1 coderen, als dat zo is, hoef je de dummyvariabele van geslacht niet te gebruiken).
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_109386272
quote:
0s.gif Op woensdag 21 maart 2012 20:46 schreef x.steph het volgende:
ooohhh ik denk dat het kwartje begint te vallen.. ja het is echt verschrikkelijk.. tenminste bij mijn werkgroep. Ik ben heel blij met jou :P Je maakt veel dingen een stuk duidelijker dus echt 10000x bedankt. die dummy dingen zijn gelukkig gelukt en een deel van mijn mediatie bleek niet significant dus dat is gelukt.

nu alleen met mijn laatste hypothese. Die veronderstelt dat wel of niet piekeren en wel of niet sporten invloed hebben op depressie. Kan ik daar dan het beste zo'n General Lineair Model voor gebruiken en dan univariate of multivariate? Dan moet ik zeker alleen nog een interactie door compute maken voor sporten*piekeren en die dan ook als een fixed factor zetten?
Dank je wel O+

Je kunt of een univariate test doen, die test uit zichzelf de interactie (multivariate is met meerdere afhankelijke variabelen)

Voor de rest heeft crossover het al beantwoord :)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109390394
Hallo :D.

Ik heb een SPSS vraag.. ik hoop hem zo goed mogelijk uit te kunnen leggen :P.

Ik moest op school een paarsgewijze vergelijking doen. Dit houdt in dat mensen steeds 2 drankjes voor zich kregen, moesten zeggen welke de lekkerste was op 4 vlakken, hiervan waren 6 rondes. Voorbeeld: cola werd vergeleken met seven up op de vlakken geur, kleur, smaak en consistentie.

De uitkomsten hiervan wil ik vergelijken in SPSS, alleen heb ikecht geen idee hoe. Ik heb ze wel ingevoerd en geprobeerd er een grafiek van te maken maar het lukt niet echt. Misschien heb ik het verkeerd ingevoerd of doe ik het gewoon verkeerd.

Even printscreen van invoeren:

Etc etc, hierbij staat "cola sevenup kleur" voor de vergelijking van cola met sevenup op het gebied van kleur. Value is dan 1 = cola en 2 = sevenup.

Ik hoop dat jullie me kunnen helpen en als er nog vragen zijn etc hoor ik het ook wel!

Bedankt!
Baby darling doll face honey
pi_109392774
quote:
0s.gif Op donderdag 22 maart 2012 13:50 schreef oompaloompa het volgende:

[..]

Dank je wel O+

Je kunt of een univariate test doen, die test uit zichzelf de interactie (multivariate is met meerdere afhankelijke variabelen)

Voor de rest heeft crossover het al beantwoord :)
Aaahhh you just made my day!!!!!! :* En dat geldt ook voor Crossover!!! Ik heb nu alle hypotheses kunnen testen en ik snap het ook gewoon allemaal!!! Nu nog een mooi verslagje maken :9
pi_109395644
quote:
0s.gif Op donderdag 22 maart 2012 15:47 schreef Crack_ het volgende:
Hallo :D.

Ik heb een SPSS vraag.. ik hoop hem zo goed mogelijk uit te kunnen leggen :P.

Ik moest op school een paarsgewijze vergelijking doen. Dit houdt in dat mensen steeds 2 drankjes voor zich kregen, moesten zeggen welke de lekkerste was op 4 vlakken, hiervan waren 6 rondes. Voorbeeld: cola werd vergeleken met seven up op de vlakken geur, kleur, smaak en consistentie.

De uitkomsten hiervan wil ik vergelijken in SPSS, alleen heb ikecht geen idee hoe. Ik heb ze wel ingevoerd en geprobeerd er een grafiek van te maken maar het lukt niet echt. Misschien heb ik het verkeerd ingevoerd of doe ik het gewoon verkeerd.

Even printscreen van invoeren:
[ afbeelding ]
Etc etc, hierbij staat "cola sevenup kleur" voor de vergelijking van cola met sevenup op het gebied van kleur. Value is dan 1 = cola en 2 = sevenup.

Ik hoop dat jullie me kunnen helpen en als er nog vragen zijn etc hoor ik het ook wel!

Bedankt!
Simpelweg beschrijven welke alternatieven het meest zijn gekozen mag niet? Je kan sowieso via Graphs, Bar, simple een grafiek maken.
quote:
0s.gif Op donderdag 22 maart 2012 16:58 schreef x.steph het volgende:

[..]

Aaahhh you just made my day!!!!!! :* En dat geldt ook voor Crossover!!! Ik heb nu alle hypotheses kunnen testen en ik snap het ook gewoon allemaal!!! Nu nog een mooi verslagje maken :9
You're welcome :)
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_109396959
quote:
0s.gif Op donderdag 22 maart 2012 15:47 schreef Crack_ het volgende:
Hallo :D.

Ik heb een SPSS vraag.. ik hoop hem zo goed mogelijk uit te kunnen leggen :P.

Ik moest op school een paarsgewijze vergelijking doen. Dit houdt in dat mensen steeds 2 drankjes voor zich kregen, moesten zeggen welke de lekkerste was op 4 vlakken, hiervan waren 6 rondes. Voorbeeld: cola werd vergeleken met seven up op de vlakken geur, kleur, smaak en consistentie.

De uitkomsten hiervan wil ik vergelijken in SPSS, alleen heb ikecht geen idee hoe. Ik heb ze wel ingevoerd en geprobeerd er een grafiek van te maken maar het lukt niet echt. Misschien heb ik het verkeerd ingevoerd of doe ik het gewoon verkeerd.

Even printscreen van invoeren:
[ afbeelding ]
Etc etc, hierbij staat "cola sevenup kleur" voor de vergelijking van cola met sevenup op het gebied van kleur. Value is dan 1 = cola en 2 = sevenup.

Ik hoop dat jullie me kunnen helpen en als er nog vragen zijn etc hoor ik het ook wel!

Bedankt!
Kun je proberen uit te leggen wat je precies wilt weten, wat voor een soort conclusie wil je trekken?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_109403491
quote:
[..]

You're welcome :)
nu val ik jullie nog 1x lastig O-) ik moet mijn meerdere oorzaken hypothese interpreteren, maar ik vond geen hoofdeffect voor beide variabelen (piekeren en sport), maar ook geen interactie effect.. hoe moet ik dit dan interpreteren?
pi_109408816
quote:
0s.gif Op donderdag 22 maart 2012 21:02 schreef x.steph het volgende:

[..]

nu val ik jullie nog 1x lastig O-) ik moet mijn meerdere oorzaken hypothese interpreteren, maar ik vond geen hoofdeffect voor beide variabelen (piekeren en sport), maar ook geen interactie effect.. hoe moet ik dit dan interpreteren?
Niet. Als er geen hoofdeffecten en interactie is dan geef je dat aan (begin met interactie en dan hoofdeffecten) en daarbij geef je aan dat ze niet significant verschillen.
pi_109438271
wanneer er gevraagd wordt naar de totale variantie van een y-variabele bij een ANOVA
dan moet je toch bij je een ANOVA output tabel kijken bij de MSbetween?
* de SSeffect / df1?
pi_109438628
quote:
9s.gif Op vrijdag 23 maart 2012 19:29 schreef Silverdigger2 het volgende:
wanneer er gevraagd wordt naar de totale variantie van een y-variabele bij een ANOVA
dan moet je toch bij je een ANOVA output tabel kijken bij de MSbetween?
* de SSeffect / df1?
Dat is de variantie die een factor verklaart, niet de afhankelijke variabele (Y). (SSeffect / g-1)

De totale variantie van Y is R2 (dus de proportie verklaarde variantie van dat model)
pi_109439346
quote:
0s.gif Op vrijdag 23 maart 2012 19:38 schreef Sandertje23 het volgende:

[..]

Dat is de variantie die een factor verklaart, niet de afhankelijke variabele (Y). (SSeffect / g-1)

De totale variantie van Y is R2 (dus de proportie verklaarde variantie van dat model)
SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
dit is de vraag:
http://img19.imageshack.us/img19/6766/vraag12december.gif (copy/paste deze link)

en het correcte antwoord moet b zijn?
pi_109440394
quote:
0s.gif Op vrijdag 23 maart 2012 19:56 schreef Silverdigger2 het volgende:

[..]

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
dit is de vraag:
http://img19.imageshack.us/img19/6766/vraag12december.gif (copy/paste deze link)

en het correcte antwoord moet b zijn?
Ja, die is heel leuk. (je had hem ook op de FB pagina statistiek 2 kunnen posten). Je pakt hier (vraag me niet waarom) het SScorrected total / N-1.
pi_109455941
SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
pi_109542539
quote:
0s.gif Op donderdag 22 maart 2012 18:26 schreef crossover het volgende:

[..]

Simpelweg beschrijven welke alternatieven het meest zijn gekozen mag niet? Je kan sowieso via Graphs, Bar, simple een grafiek maken.

[..]

You're welcome :)
Nee dat mag niet.. stom he :')! Je moet laten zien hoe je aan die resultaten komt en dat moet ook nog eens echt in SPSS
quote:
0s.gif Op donderdag 22 maart 2012 19:04 schreef oompaloompa het volgende:

[..]

Kun je proberen uit te leggen wat je precies wilt weten, wat voor een soort conclusie wil je trekken?
Ehm nou de drankjes worden vergeleken op laten we nu zeggen kleur, hiervan moeten ze van twee drankjes kiezen welke kleur ze 't beste vinden van deze twee. Dit gebeurt 3x. We hebben 3 drankjes dus ieder drankje komt tegen over een ander drankje te staan. Hiervan willen we weten hoevaak die mensen op welk drankje hebben gestemd.



Kijk hierboven is te zien dat 7-up qua kleur meer in de smaak viel dan cola. Ik heb al bedacht dat ik niet 3 van dit soort grafiekjes in één grafiek kan dus dat moest naast elkaar.. maar kan zoiets niet in een schema/tabel ofzo?
Baby darling doll face honey
pi_109556910
Jawel...Analyse, Descriptives, Frequencies
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_109684966
Hier nog een beetje hulp nodig met mijn interactie-effecten. De correlatie van interactie XY is wel hoog en significant maar de voorspellende waarde is niet significant. Wat betekent dat dan? Vooral de correlatie...

Verder heb ik nog een vraag over m'n regressieanalyse. Ik ben op zoek naar hoe je kunt weten of het verband sterker is in land A dan in Land B. Ik heb wel gevonden dat een positief getal betekent dat land A hoger scoort maar dat zegt dan nog niks over de sterkte van het verband toch? of denk ik nu gewoon te moeilijk..

[ Bericht 21% gewijzigd door Trusten op 30-03-2012 10:08:18 ]
pi_109687371
quote:
0s.gif Op vrijdag 30 maart 2012 09:33 schreef Trusten het volgende:
Hier nog een beetje hulp nodig met mijn interactie-effecten. De correlatie van interactie XY is wel hoog en significant maar de voorspellende waarde is niet significant. Wat betekent dat dan? Vooral de correlatie...
Plaats je output eens.
quote:
Verder heb ik nog een vraag over m'n regressieanalyse. Ik ben op zoek naar hoe je kunt weten of het verband sterker is in land A dan in Land B. Ik heb wel gevonden dat een positief getal betekent dat land A hoger scoort maar dat zegt dan nog niks over de sterkte van het verband toch? of denk ik nu gewoon te moeilijk..
Dummyvariabele maken waarbij 0=land A en 1=land B en die vervolgens opnemen in je model. Daarnaast ook de interactievariabele met die dummy en de predictor opnemen in je model. Je ziet dan of het effect van X1 op Y afhankelijk is van Dummy2p.

Je krijgt dan de betacoefficienten en door het regressiemodel op te stellen zie je aan de hand van de interactievariabele voor welk land het effect van x op y sterker is. Bijvoorbeeld:

Y = Constante + BX1 + BDummy + BX1*Dummy

Stel je BX1*Dummy = -0.523. Bij een waarde van 0(=land A) telt dit effect niet mee. Bij een waarde van 1 (=land B) tel je -0.523 op bij BX1 en dan zie je voor welk land het effect van BX1 groter is :s)

[ Bericht 9% gewijzigd door crossover op 30-03-2012 11:07:58 ]
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_109688751
quote:
Plaats je output eens.
http://i44.tinypic.com/140dmw5.jpg
pi_109690024
quote:
Dummyvariabele maken waarbij 0=land A en 1=land B etc
Ik snap dit niet helemaal geloof ik. Landdummy hebben we wel opgenomen in het model maar hoe ik het moet aflezen begrijp ik dan niet echt...

http://i44.tinypic.com/1fxzzr.jpg
pi_109693331
Als iemand me verder kan helpen heel graag, het moet eigenlijk vanmiddag af maar ben echt vastgelopen -O-
pi_109700874
Hmmm zojuist van docent begrepen dat we sowieso fout zitten. Kan de hele analyse overnieuw gaan doen...

quote:
die correlaties met dummy- en interactievariabele kun je niks mee, moet echt in regressie.

Uit jullie output kan ik niet halen met welke dummy de interactievariabelen gemaakt zijn. Het is een beetje gek om 2 dummy-variabelen (sekse en land) op te nemen en maar van 1 van die variabelen de interactie-effecten. Of alles in 1 analyse, of echt 2 analyses: apart voor sekse (+ interactie) en apart voor land (+interactie).

Om te zien hoe het interactie-effect voor land eruit ziet moet je een grafiekje maken met apart voor NL en IN een weergave van de samenhang tussen je variabelen. Dat kun je ook door vergelijking van de correlaties tussen NL en IN al een beetje zien.
Daarom toch nog een keer mijn vraag....

De vraagstelling van deze studie is of er een verband bestaat tussen opvoedgedrag A en B en Gedrag X en of dit verband hetzelfde is bij kinderen uit land 1 en land 2. Deze vraagstelling is opgesplitst in de volgende onderzoeksvragen:
1. Bestaat er een verschil tussen kinderen uit land 1 en land 2 w.b. de mate van opvoedgedrag A en B?
2. Bestaat er een verschil tussen kinderen uit land 1 en land 2 w.b. de mate van gedrag X ?
3. Bestaat er een verband tussen opvoedgedrag A en gedrag X en is dit hetzelfde bij kinderen uit land 1 en land 2?
4. Bestaat er een verband tussen Opvoedgedrag B en gedrag X en is dit hetzelfde bij kinderen uit land 1 en land 2?

De eerste twee vragen hebben we inmiddels kunnen beantwoorden en we zijn toegekomen aan onze hiërarchische regressie-analyse voor vraag 3 en 4. We dachten dat we bijna klaar waren maar kregen helaas te horen dat we het niet goed hebben gedaan. We komen er niet meer uit o.a. wat betreft interactie-effecten, dummyvariabelen etc.. Is er iemand die in Jip en Janneke taal kort voor ons de stappen kan beschrijven om tot een antwoord van onze vragen te komen?

[ Bericht 46% gewijzigd door Trusten op 30-03-2012 20:51:28 ]
pi_109803380
Het is voor mij alweer een hele tijd geleden dat ik statistiek heb gedaan. Werken met SPSS gaat me nog wel goed af, maar welke testen ik waarvoor moet gebruiken ben ik helemaal kwijt. Welke test moet ik gebruiken voor de volgende situatie:

Ik heb een groep atheneum-leerlingen en een groep gymnasium-leerlingen. Van alle leerlingen heb ik de gemiddelde cijfers op 5 vakken. Op welke manier (met welke test?) test ik of de gemiddelde cijfers van gymnasiumleerlingen significant hoger zijn dan die van de atheneumleerlingen?
pi_109804937
quote:
0s.gif Op maandag 2 april 2012 14:12 schreef CG het volgende:
Het is voor mij alweer een hele tijd geleden dat ik statistiek heb gedaan. Werken met SPSS gaat me nog wel goed af, maar welke testen ik waarvoor moet gebruiken ben ik helemaal kwijt. Welke test moet ik gebruiken voor de volgende situatie:

Ik heb een groep atheneum-leerlingen en een groep gymnasium-leerlingen. Van alle leerlingen heb ik de gemiddelde cijfers op 5 vakken. Op welke manier (met welke test?) test ik of de gemiddelde cijfers van gymnasiumleerlingen significant hoger zijn dan die van de atheneumleerlingen?
Vijf verschillende onafhankelijke t-toetsen (analyse, compare means, independant t-test).

@Trusten: ik zal kijken of ik vanavond nog wat voor je kan betekenen (maar weet niet of ik tijd heb)
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  maandag 2 april 2012 @ 14:57:33 #143
8369 speknek
Another day another slay
pi_109805112
MANOVA
They told me all of my cages were mental, so I got wasted like all my potential.
  dinsdag 3 april 2012 @ 15:47:51 #144
256829 Sokz
Livin' the life
pi_109853268
Is SPSS ook te downloaden ergens?
pi_109853695
Torrents.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  dinsdag 3 april 2012 @ 23:00:24 #146
124676 RobertoCarlos
Zit je nou naar me te loeruh?
pi_109875534
usenet
!!! Go 49-ers !!!
  woensdag 4 april 2012 @ 17:38:19 #147
256829 Sokz
Livin' the life
pi_109902802
Stel ik heb een bestandje met bedrijven gerangschikt op volgorde van 'founding-year'. Hoe kan hier over verschillende delen de variabelen berekenen?

Erg versimpeld voorbeeldje anders zo onduidelijk:

Jan b.v. 1950
Joop b.v. 1971
Karel b.v. 1989
Piet b.v. 1942

Wat is de mean van de bedrijven voor 1970, en de mean van de bedrijven na 1970?
pi_109903018
quote:
99s.gif Op woensdag 4 april 2012 17:38 schreef Sokz het volgende:
Stel ik heb een bestandje met bedrijven gerangschikt op volgorde van 'founding-year'. Hoe kan hier over verschillende delen de variabelen berekenen?

Erg versimpeld voorbeeldje anders zo onduidelijk:

Jan b.v. 1950
Joop b.v. 1971
Karel b.v. 1989
Piet b.v. 1942

Wat is de mean van de bedrijven voor 1970, en de mean van de bedrijven na 1970?

Twee verschillende groepen aanmaken?
  woensdag 4 april 2012 @ 17:50:10 #149
256829 Sokz
Livin' the life
pi_109903159
Ja en hoe doe ik dat?:P Wil dus zeg maar een deel van voor 1970 en een deel van na 1970
pi_109904742
quote:
99s.gif Op woensdag 4 april 2012 17:50 schreef Sokz het volgende:
Ja en hoe doe ik dat?:P Wil dus zeg maar een deel van voor 1970 en een deel van na 1970
Je kunt bij visual binning twee groepen maken door de founding year var te splitsen bij 1970.
pi_109912700
Wat doet die visual binning optie precies?
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_109914478
quote:
0s.gif Op woensdag 4 april 2012 21:07 schreef crossover het volgende:
Wat doet die visual binning optie precies?
In principe hetzelfde als recode, maar de recode optie is hier wat ingewikkelder. Het verdeelt je variabele in x groepen en geeft ze een dummy mee. Als je dan de data van alleen één bepaalde groep wil hebben gebruik je de gebinde dummy voor die groep.
  woensdag 4 april 2012 @ 21:39:03 #153
256829 Sokz
Livin' the life
pi_109914527
Dat recode zat ik hele tijd mee te kloten daarmee lukte het me niet. :P
pi_109944966
ik heb een mediatie getoetst, en nu blijkt alleen x2 significant. De interactie en x1 niet. Hoe moet ik dit nu interpreteren??
pi_109960135
als x1 lost eerst significant is,
x2 los significant is,
en bij x1 én x2 in het model: de interactie en de x1 niet meer significant is, en x2 nog wel
dan is er sprake van volledige mediatie
pi_109974492
er moeten van te voren analyses significant zijn maar X1->X2 is niet significant. X1->Y, X2->Y wel. volgens die regels kan er dan al geen mediatie meer optreden.. Na de logistische regressie krijg ik als output dat X2 significant is, X1 niet en de interactie niet. Hoe moet ik dit dan interpreteren?
pi_110087798
Mensen, ik ben helemaal in de war geraakt. Ik heb mijn uitwerkingen teruggekregen waarin feedback is genoteerd en ik heb helaas geen mogelijkheid om hier nog vragen over te stellen.

Onderaan dit bericht vind je het stukje uit mijn uitwerkingen. Het feedback wat erbij stond wat dat mijn hypothese niet juist is voor een t-test, omdat je twee groepen met elkaar vergelijkt.
Ik snap helemaal niet waarom dit onjuist is en wat ik dan wel moet doen.. wie kan me dit vertellen?

(Klantloyaliteit (afhankelijke variabele) is op interval niveau gemeten. )

De volgende hypothesen zijn getoetst:

H0: Geslacht heeft geen invloed op klantloyaliteit .
H1: Geslacht heeft invloed op klantloyaliteit.

Om te analyseren of de mate van klantloyaliteit van mannen verschilt met die van vrouwen is de Independent samples t-test uitgevoerd. Deze test was niet significant, t(123)= 0,74 p= 0,460. De gemiddelde mate van klantloyaliteit van mannen (M = 3,2, SD = 1,27) verschilt niet van de gemiddelde mate van klantloyaliteit van vrouwen (M = 3,0, SD = 1,04).
Why is a mathbook so sad? Because it has too many problems...
pi_110089057
H0: klantloyaliteitman = klantloyaliteitvrouw
H1: klantloyaliteitman /= klantloyaliteitvrouw
pi_110089192
Oooh bedoelde hij dat :D Dankjewel!!

Weet je ook hoe ik dit moet toetsen? Gewoon met descriptives de gemiddelden vergelijken? Of is hier een geschikte toets voor?
Why is a mathbook so sad? Because it has too many problems...
pi_110089416
Gewoon met de t-test die je al hebt gedaan ;)
pi_110089529
Awesome :D
Why is a mathbook so sad? Because it has too many problems...
pi_110183365
Een vraag over missing values!

Heb een bestand met 850 cases. Bijna alle data is dichotoom (0 of 1). Ik wil graag een (binaire) logistische regressie met18 variabelen uitvoeren, maar dan worden in totaal 90 cases weggelaten, omdat er dus meerdere system missing values zijn.

Het probleem is dat zodra één variabele die in de regressie gestopt wordt een missing value bevat, gelijk de hele case wordt weggelaten en gezien als 'missing case'. Wie weet nu wat te doen?
Andrei Arlovski is a Belarusian heavyweight who has been in the MMA game for quite some time. His first professional fight dates back to 540 B.C. where Leonidas won as the underdog in Sparta
pi_110185816
Niets. Die moet je als verloren beschouwen, tenzij je terug kan kijken in de oorspronkelijke vragenlijsten wat er is ingevuld.

Je kan natuurlijk ook een Stapeltje1 doen.

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_110186157
Overigens mag je niet klagen met 760 cases.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_110767242
Ik vul zo hier en daar ook gewoon wat dingetjes in als respondenten 3 vragen niet invullen...
Desnoods een 4tje van de Likert schaal :p

Maar hoe voeg je ook alweer meerdere antwoordmogelijkheden samen?
Ik heb namelijk 1 open vraag gehanteerd waar respondenten handmatig hun eigen beweegredenen konden opgeven.
Nu heb ik deze allemaal geindexeerd (700 respondenten, 7 categorïen), maar er zijn natuurlijk ook respondenten die 2 of 3 verschillende argumenten aangeven.
Hoe kan ik dit het beste verwerken in SPSS?

Of kan ik lekker 7 nieuwe variabelen aanmaken en die vervolgens invullen met 1 (ja) of 2 (nee)....
Zeg me alsjeblieft dat er een snellere manier is.
"Ik heb nog met hem gekoerst"
  woensdag 25 april 2012 @ 14:51:59 #166
8369 speknek
Another day another slay
pi_110768277
quote:
0s.gif Op woensdag 25 april 2012 14:24 schreef ThePlaneteer het volgende:
Ik vul zo hier en daar ook gewoon wat dingetjes in als respondenten 3 vragen niet invullen...
Desnoods een 4tje van de Likert schaal :p
Ik hoop dat je begeleider er niet achter komt.
They told me all of my cages were mental, so I got wasted like all my potential.
pi_110772876
quote:
0s.gif Op woensdag 25 april 2012 14:24 schreef ThePlaneteer het volgende:
Ik vul zo hier en daar ook gewoon wat dingetjes in als respondenten 3 vragen niet invullen...
Desnoods een 4tje van de Likert schaal :p


Maar hoe voeg je ook alweer meerdere antwoordmogelijkheden samen?
Ik heb namelijk 1 open vraag gehanteerd waar respondenten handmatig hun eigen beweegredenen konden opgeven.
Nu heb ik deze allemaal geindexeerd (700 respondenten, 7 categorïen), maar er zijn natuurlijk ook respondenten die 2 of 3 verschillende argumenten aangeven.
Hoe kan ik dit het beste verwerken in SPSS?

Of kan ik lekker 7 nieuwe variabelen aanmaken en die vervolgens invullen met 1 (ja) of 2 (nee)....
Zeg me alsjeblieft dat er een snellere manier is.
En je verwacht nadat je dit gezegd hebt dat we je nu serieus antwoord gaan geven?
pi_110773988
Heb al de laatste optie gekozen.
"Ik heb nog met hem gekoerst"
pi_110776710
700 respondenten hebben en dan nog zelf iets verzinnen ipv missing invullen :')
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  woensdag 25 april 2012 @ 22:52:36 #170
231574 automatic_
muppetinnetje.
pi_110794239
quote:
0s.gif Op woensdag 25 april 2012 18:09 schreef crossover het volgende:
700 respondenten hebben en dan nog zelf iets verzinnen ipv missing invullen :')
Misschien een Stapel fan...?
Ik ga volgende week aan mijn analyses beginnen.... Gelukkig heb ik Sandertje al kunnen strikken voor hulp! ;)
"It's good to be open-minded, but not so open that your brains fall out."
pi_110794888
quote:
1s.gif Op woensdag 25 april 2012 22:52 schreef automatic_ het volgende:

[..]

Misschien een Stapel fan...?
Ik ga volgende week aan mijn analyses beginnen.... Gelukkig heb ik Sandertje al kunnen strikken voor hulp! ;)
Wie?
  woensdag 25 april 2012 @ 23:02:29 #172
231574 automatic_
muppetinnetje.
pi_110794920
quote:
0s.gif Op woensdag 25 april 2012 23:02 schreef Sandertje23 het volgende:

[..]

Wie?
U.
"It's good to be open-minded, but not so open that your brains fall out."
pi_110823420
Kan iemand mij met het volgende helpen.

Mijn data (van een groep middelbare scholieren) ziet er nu als volgt uit:

(achtereenvolgens: schoolvak, naam leerling, cijfer op dat vak)

vakA Jan Jansen 6,4
vakB Jan Jansen 6,9
vakC Jan Jansen 6,0
vakD Jan Jansen 7,0
vakA Mien Mienstra 7,1
vakB Mien Mienstra 7,2
vakC Mien Mienstra 7,3
vakD Mien Mienstra 7,4
etc.

Is het mogelijk om een nieuwe variabele te berekenen die van alle leerlingen afzonderlijk het gemiddelde over de 4 vakken berekend? En hoe doe ik dat?
pi_110824526
Dan kan je op naam de data aggregeren.
Aldus.
pi_110824561
Of het bestand flippen.
Aldus.
pi_110826118
quote:
99s.gif Op donderdag 26 april 2012 18:23 schreef Z het volgende:
Of het bestand flippen.
Dat doe je met Transpose, inderdaad.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_110827182
Op met het commando flip (in je syntax). Of bestaat dat niet meer? Levensgevaarlijk commando.
Aldus.
pi_110828537
Dat is dan wat anders, wat doet het?
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_110841395
Zet het databestand op z'n kant.
Aldus.
  dinsdag 1 mei 2012 @ 15:15:56 #180
231574 automatic_
muppetinnetje.
pi_110997469
Ik heb even een vraag en ik hoop dat ik hem duidelijk kan formulieren. Ik heb vier verschillende groepen (2-4, 5-7, 8-12,13-18). Er zijn drie groepen waarbij de kinderen zelf een vragenlijst hebben ingevuld (5-7, 8-12, 13-18). Daarnaast hebben bij alle groepen ook de ouders een lijst ingevuld. Voor de groep 2-4 jaar gebruik ik dus de vragenlijsten van de ouders.
Mijn idee was dus om de totale score van vader en de totale score van moeder bij elkaar te doen, maar dan alleen van de kinderen die 2-4 jaar zijn. Kan dit? En zo ja, hoe?
Ik dacht eerst zelf m.b.t. select cases, maar kan dat eigenlijk...?

Hopelijk is het een beetje duidelijk :)
"It's good to be open-minded, but not so open that your brains fall out."
pi_110997607
Vaders en moeders zijn aparte cases (regel in databestand)?
Aldus.
  dinsdag 1 mei 2012 @ 15:21:29 #182
231574 automatic_
muppetinnetje.
pi_110997707
quote:
2s.gif Op dinsdag 1 mei 2012 15:19 schreef Z het volgende:
Vaders en moeders zijn aparte cases (regel in databestand)?
Ja, ik heb daar nu al "totaal-schalen" bij gemaakt.
"It's good to be open-minded, but not so open that your brains fall out."
pi_110997814
Dat gaat niet werken. Ik zou de data aggregeren, met het kind als 'break variable' (data --> aggragate). Is dat een optie?
Aldus.
  dinsdag 1 mei 2012 @ 15:24:53 #184
231574 automatic_
muppetinnetje.
pi_110997847
quote:
2s.gif Op dinsdag 1 mei 2012 15:24 schreef Z het volgende:
Dat gaat niet werken. Ik zou de data aggregeren, met het kind als 'break variable' (data --> aggragate). Is dat een optie?
Ik ga even opzoeken wat dat is :@
"It's good to be open-minded, but not so open that your brains fall out."
pi_111034758
Kijk ook weer even naar de optie Transpose; je kan hiermee de rijen op de kolommen zetten en andersom. Je kan dan berekeningen maken die je normaal niet kan doen.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111076187


Bovenstaand gegevens die ik uit een database heb gehaald en de regressie die ik voor mijn onderzoek ga gebruiken. Belangrijk bij de regressie is dat ik per Company ID + jaar de dummies bepaal en tegelijkertijd t/t-1 kan uitrekenen. Hoe moet ik de data indelen om mijn regressie te runnen?

Ik zat te denken aan kollommen sales t1, sales t2, sales t3, sales t4, etc voor andere variabelen en toch de rijen aan te houden die er nu instaan zodat ik per firm year dummies kan bepalen. Zouden jullie het anders aanpakken? En welke functie moet ik hiervoor gebruiken in SPSS?


Laat maar, ik denk dat ik de oplossing al heb.

[ Bericht 15% gewijzigd door Oidipous op 03-05-2012 16:07:18 ]
  donderdag 3 mei 2012 @ 11:26:18 #187
231574 automatic_
muppetinnetje.
pi_111077539
Het probleem begint al dat niet alle schalen betrouwbaar zijn :')
"It's good to be open-minded, but not so open that your brains fall out."
pi_111080681
Hallo,

We hebben een vraag m.b.t. onze masterthesis. De volgende verbanden willen we onderzoeken:

invloed van I (ordinaal; goed/fout) op VW (continue)
invloed van A (continue) op VW
invloed van sekse (dummy) op VW
eventuele mediatieeffect van sekse op de invloed van I en A op VW

De steekproef is vrij klein; bevat 44 respondenten.

We zijn al een hele tijd aan het worstelen welke analyse we het beste kunnen gebruiken. Nu hebben we alle variabelen ingevoerd in een hierarchische regressie analyse (regression - lineair - ..next).

Nu hebben we in 1 model de hoofdeffecten en interactieeffecten (dmv compute variable) ingevoerd.

Is deze manier van toetsen een juiste om alle verbanden te onderzoeken? En moeten de hoofd- en interactie effecten in het model toegevoegd worden of moet dat op een of andere manier apart gemeten worden?

Heel graag wat tips omdat we niet kunnen checken of het goed is wat we nu doen...!
pi_111096018
Dit lijkt me de juiste methode, ja. Vink ergens (uit m'n hoofd bij options) Sig F change aan en je kan zien of het toevoegen van de betreffende variabele een toegevoegde variantie verklaart. Hoofdeffecten heb je toch automatisch al toegevoegd? Dat zijn namelijk I, A en sekse.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111097574
Beste forumleden,

Ik heb op 22 variabelen zoals prijs, gastvrijheid etc.. gegevens verzamelt van respondenten die onderling van elkaar verschillen bijvoorbeeld op basis van opleiding of vanwege provincie waar zij wonen. Aan de hand van (bijvoorbeeld) deze laatste twee nominale waarden wil ik kijken of er significante verschillen zijn te analyseren voor de 22 variabelen waar men als respondent kon kiezen uit een antwoord op basis van een vijf punts likert schaal.

Ik heb met T testen en alles een poging gewaagd maar een fatsoenlijke tabel waarmee ik dit in een oogopslag kan zien krijg ik er niet uit.

Alvast hartelijk dank voor jullie hulp.

Met vriendelijke groet,

Erik
pi_111097773
quote:
0s.gif Op donderdag 3 mei 2012 19:26 schreef Dilijan het volgende:
Beste forumleden,

Ik heb op 22 variabelen zoals prijs, gastvrijheid etc.. gegevens verzamelt van respondenten die onderling van elkaar verschillen bijvoorbeeld op basis van opleiding of vanwege provincie waar zij wonen. Aan de hand van (bijvoorbeeld) deze laatste twee nominale waarden wil ik kijken of er significante verschillen zijn te analyseren voor de 22 variabelen waar men als respondent kon kiezen uit een antwoord op basis van een vijf punts likert schaal.

Ik heb met T testen en alles een poging gewaagd maar een fatsoenlijke tabel waarmee ik dit in een oogopslag kan zien krijg ik er niet uit.

Alvast hartelijk dank voor jullie hulp.

Met vriendelijke groet,

Erik
En je vraag is?
  donderdag 3 mei 2012 @ 19:54:40 #192
242274 Granaatappel
Explosief fruit
pi_111099123
@Dilijan Crosstabs chi-square test misschien?
pi_111099140
Op welke wijze ik een tabel kan produceren die de verschillen voor de twintig variabelen weergeeft voor (nominaal) verschillende respondenten?
pi_111099357
Beste granaatappel,

Volgens mij niet, even geprobeerd maar kan in één vak maar variabelen invoeren en er blijft dan geen invoervak over voor nominale waarden..
  donderdag 3 mei 2012 @ 20:01:31 #195
242274 Granaatappel
Explosief fruit
pi_111099532
quote:
0s.gif Op donderdag 3 mei 2012 19:58 schreef Dilijan het volgende:
Beste granaatappel,

Volgens mij niet, even geprobeerd maar kan in één vak maar variabelen invoeren en er blijft dan geen invoervak over voor nominale waarden..
Kun je die nominale waarden als provincie en opleiding niet gewoon omzetten in een schaal bijvoorbeeld Noord-Holland = 1, Zuid-Holland = 2 etc. Hetzelfde voor opleiding?
pi_111100360
Ow sorry, dat heb ik denk ik verkeerd vermeld. Die nominale waarden heb ik inderdaad wel omgezet in schaal.

Dus hoe kan ik kijken of de provincie waar men woont van invloed is op de waarde die men hecht aan de 22 attributen als accommodatie etc?

Hoop dat het duidelijk is.

Groet,

Erik
  donderdag 3 mei 2012 @ 20:43:00 #197
242274 Granaatappel
Explosief fruit
pi_111101904
Ben zelf ook pas thuis in de SPSS wereld dus wellicht kunnen de experts hier melden of ik het juist doe, maar zoals ik je vraag begrijp wil je aan de hand van bijvoorbeeld provincie zien hoe de verschillende provincies accommodatie hebben beoordeeld (of hier een bepaalde waarde aan toekennen)?
D.m.v. crosstabs krijg je hier een overzicht van, wil je vervolgens testen of provincie en accommodatie afhankelijk van elkaar zijn, dan vink je bij Statistics binnen crosstabs de chi-square aan. Is de p-waarde kleiner dan het significantieniveau, dan is er sprake van afhankelijkheid (vice versa).

Ik vind het lastig om je vraag goed te begrijpen, invloed is namelijk weer wat anders dan de verschillen tussen de provincies en de bijbehorende waarden van de variabelen.
pi_111123478
Sorry Granaatappel,

Ik wil kijken of personen die Polen als vakantiebestemming reeds hebben bezocht of niet wezenlijke verschillen in de beoordeling van de accommodatie kwaliteit of de veiligheid (zijn er slechts twee) laten zien. Naast het feit of men er geweest is ja of nee wil ik voor alle 22 variabelen kijken of ouder mensen bijvoorbeeld meer belang hechten aan cultuur dan dat jongere mensen dit doen.

Helaas zijn niet alle groepen vergelijkbaar qua omvang maar indien 70% van de ouderen aangeeft cultuur van belang te vinden en van de jongeren slechts 20% dan kan ik hier uiteraard wat mee.

Mocht ik het wederom gepresteerd te hebben het onduidelijk te hebben geformuleerd schroom dan niet om opheldering te vragen.

Alvast hartelijk dank voor het meedenken!

Groet,

Erik
  dinsdag 8 mei 2012 @ 09:56:12 #199
283085 TWP
kassalade
pi_111279625
Bij het berekenen van mijn Cronbach's Alpha stuitte ik op een probleem. Mijn variabele wordt gemeten met twee items, maar de CA valt erg laag uit. Dat houdt dan in dat één van de items verwijderd moet worden, toch? Maar op welke manier bepaal ik welke van de twee items uit de set verwijderd moet worden?

Hopelijk weet iemand mij weer op weg te helpen. Alvast bedankt. :*
:)
pi_111282669
quote:
0s.gif Op dinsdag 8 mei 2012 09:56 schreef TWP het volgende:
Bij het berekenen van mijn Cronbach's Alpha stuitte ik op een probleem. Mijn variabele wordt gemeten met twee items, maar de CA valt erg laag uit. Dat houdt dan in dat één van de items verwijderd moet worden, toch? Maar op welke manier bepaal ik welke van de twee items uit de set verwijderd moet worden?

Hopelijk weet iemand mij weer op weg te helpen. Alvast bedankt. :*
Dat kan niet. Dan kun je geen CA meer berekenen, want die gaat over meer dan 1 item. Je kunt kijken naar de item-restcorrelatie.
pi_111283371
Hoi

Ik ben bezig met het analyseren van mijn data voor mijn thesis en ik raak in de war. Mijn hypothese voorspelt een lineaire lijn, dus (enkelvoudige) regressieanalyse moet ik uitvoeren. Nu bestaat 1 variabelen uit 1 vraag waar vijf antwoordmogelijkheden waren. De vraag was hoeveel minuten/uren mensen ergens gebruik van maakten. Scores zijn als volgt toegekend: 1 voor minder dan 10 minuten, 2 voor 10 tot 29 minuten, 3 voor 30 tot 59 minuten, 4 voor 1 tot 3 uur en 5 voor meer dan 3 uur. Mijn andere variabele is gebaseerd op een serie stellingen waar ook de scores 1 tot en met 5 zijn toegekend (1 = helemaal oneens tot 5 helemaal eens). Van deze serie stellingen is het gemiddelde genomen. Kan ik nu gewoon een enkelvoudige regressieanalyse uitvoeren? Of is dat niet mogelijk, doordat de scores van de eerste variabele niet 'gelijk' verdeeld zijn, daar bedoel ik mee dat 10 tot 29 minuten niet even lang is als bijvoorbeeld 1 tot 3 uur. Of zit ik nu gewoon onzin te praten en kan ik gewoon de analyse uitvoeren?

Alvast bedankt!
  dinsdag 8 mei 2012 @ 12:04:12 #202
283085 TWP
kassalade
pi_111283900
quote:
0s.gif Op dinsdag 8 mei 2012 11:34 schreef Sandertje23 het volgende:

[..]

Dat kan niet. Dan kun je geen CA meer berekenen, want die gaat over meer dan 1 item. Je kunt kijken naar de item-restcorrelatie.
Oké, bedankt voor je antwoord!
:)
  dinsdag 8 mei 2012 @ 15:34:53 #203
231574 automatic_
muppetinnetje.
pi_111291491
Even een snelle vraag:
Ik heb een databestand met kinderen van 2-18 jaar. Ik wil alleen de kinderen gebruiken van 5-18 jaar. Ik doe het vast omslachtig, maar ik heb nu dit gedaan:
SORT CASES BY LFTKIND(A).

Daarna pak ik de kinderen vanaf 5 jaar en dat begint bij 36
USE 36 thru 160.
EXECUTE.

Maar... Daarna wil ik weten hoe men het per geslacht doet. Ik wil dan eigenlijk dit doen, maar dat gaat natuurlijk niet (want dan vervalt de eerste "filter"):

SORT CASES BY GESL.
SPLIT FILE LAYERED BY GESL.

Hoe krijg ik dit toch voor elkaar?
Of moet ik een "nieuw" databestand maken waarin ik alleen de kinderen van 5 - 18 jaar opneem? En zo ja, hoe doe ik dit...? :@
"It's good to be open-minded, but not so open that your brains fall out."
pi_111291690
Met 'selection'. Kijk maar eens bij 'Data --> select cases --> If condition is satisfied'.
Aldus.
  dinsdag 8 mei 2012 @ 15:42:44 #205
231574 automatic_
muppetinnetje.
pi_111291823
Ik heb het nu in een andere volgorde gezet:

SORT CASES BY GESL.
SPLIT FILE LAYERED BY GESL.
USE 36 thru 160.
EXECUTE.

En dan werkt het ook. Ik zal zo nog eens naar jouw optie kijken :Y Bedankt!!
Onee, nu gooit hij alles weer om :')

Edit 3; het is volgens mij gelukt.

[ Bericht 10% gewijzigd door automatic_ op 08-05-2012 15:56:26 ]
"It's good to be open-minded, but not so open that your brains fall out."
pi_111335224
Hallo allemaal!

Ik heb een korte spss vraag;
Ik heb in mijn enquête een vraag waarbij respondenten op een schaal van 1 tot 5 aan kunnen klikken welk woordpaar het meest met hun mening overeen stemt, bijv:

saai (1) (2) (3) (4) (5) gezellig

Ik weet alleen niet hoe ik deze vraag moet verwerken, ik wil er graag een grafische weergave van maken. Kan iemand mij hiermee helpen?
pi_111335404
Ik zou de grafiek in Excel maken.
Aldus.
  donderdag 10 mei 2012 @ 13:45:05 #208
319308 Tink89
To live is to dance
pi_111375638
Aargh, ik heb issues met een interactie-effect.

Ik doe onderzoek naar attitudes en heb bij mijn Anova een significant interactie-effect gevonden tussen twee variabelen (articletype x findingtype). Nu zegt m'n begeleidster dat ik t-testen moet doen om te kijken waar de verschillen zitten, maar ik snap even niet hoe.

Allebei de variabelen hebben 1 of 2 als waarde en ik wil dus 4 t-testen doen. 1 vs 1, 1 vs 2, 2 vs 1 en 2 vs 2. Hoe prop ik dat in Spss?

Xx
K&W / Tink's droomhuis deel 3: Vur goan beginne! Ofzoiets....
maandag 30 september 2013 07:58 schreef Brighteyes het volgende:
En over de chocola... Tink is van een andere planeet. ;) Die heeft dat niet nodig. ;)
pi_111376279
Dat klinkt als paired t-test. Je wil dus per respondent kijken of bij diegene de waarde op Y verschilt bij

• article type = 1 en finding type = 1
• article type = 1 en finding type = 2
• article type = 2 en finding type = 1
• article type = 2 en finding type = 2
?

Je hoeft er dan overigens maar drie te doen. De middelste twee zijn hetzelfde namelijk.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  donderdag 10 mei 2012 @ 14:08:11 #210
319308 Tink89
To live is to dance
pi_111376442
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...

Xx
K&W / Tink's droomhuis deel 3: Vur goan beginne! Ofzoiets....
maandag 30 september 2013 07:58 schreef Brighteyes het volgende:
En over de chocola... Tink is van een andere planeet. ;) Die heeft dat niet nodig. ;)
pi_111381185
quote:
0s.gif Op donderdag 10 mei 2012 14:08 schreef Tink89 het volgende:
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...

Xx
Wat is je design?
pi_111389172
quote:
0s.gif Op donderdag 10 mei 2012 14:08 schreef Tink89 het volgende:
Hoe definieer ik dan dattie 1 of 2 moet nemen? Want ik heb maar 1 Y-waarde. Ik wil weten of die 4 condities verschillende gemiddelde y-waardes hebben...

Xx
Ja, goede vraag, ik ben ook in de war :')
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111393977
quote:
0s.gif Op donderdag 10 mei 2012 19:31 schreef crossover het volgende:

[..]

Ja, goede vraag, ik ben ook in de war :')
Je kunt 'gewoon' contrasten specificeren in een ANOVA :)
pi_111400129
quote:
0s.gif Op donderdag 10 mei 2012 20:58 schreef Sandertje23 het volgende:

[..]

Je kunt 'gewoon' contrasten specificeren in een ANOVA :)
Oh ja! Maar eerst hercoderen. Eénmaal met select cases voor X1 =1 en éénmaal met select cases voor X1 = 2. Dan krijg je vier groepen en die kan je in de contrasten gebruiken.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  zaterdag 12 mei 2012 @ 11:50:00 #215
319308 Tink89
To live is to dance
pi_111454576
quote:
0s.gif Op donderdag 10 mei 2012 22:56 schreef crossover het volgende:

[..]

Oh ja! Maar eerst hercoderen. Eénmaal met select cases voor X1 =1 en éénmaal met select cases voor X1 = 2. Dan krijg je vier groepen en die kan je in de contrasten gebruiken.
Ah :) Hier kan ik iets mee! Als het lukt, laat ik het jullie weten :D Txs!
K&W / Tink's droomhuis deel 3: Vur goan beginne! Ofzoiets....
maandag 30 september 2013 07:58 schreef Brighteyes het volgende:
En over de chocola... Tink is van een andere planeet. ;) Die heeft dat niet nodig. ;)
pi_111536288
Hallo allen, alvast super bedankt voor alle hulp!

Vorige week had ik gepost over het verwerken van data. Inmiddels ben ik een stap verder, ik heb alle data nu in SPSS staan en de volgende stap zou zijn univariate analysis, aldus mijn thesisbegeleider.. Niet wetende wat de precieze definitie is ga ik er van uit dat het descriptives zijn van variabelen. Klopt dit?

De descriptives heb ik tevoorschijn gekregen voor de hele sample en daarin zitten rare waarden. Wat blijkt, de outliers 'verpesten' het. Hoe moet ik deze outliers behandelen? Op internet wordt er ondermeer gepraat over z-values door variabelen bij descriptive te standaardiseren. Daarbij wordt gezegd dat je alles boven 3 en -3 moet verwijderen. Het betreft economisch/accounting onderzoek met ongeveer 12,000 firm years.

Zijn er verder nog zaken waar ik op moet letten voordat ik mijn regressie laat lopen? Heteroskedasticiteit-probleem heb ik niet omdat ik van elke variabele de logaritmische functie pak (maw, model ziet er zo uit log(y1)=b0+log(b1)+log(b2)+log(b3)). Moet ik hierdoor in plaats van lineaire regressie de binary logistic regression functie onder analyze pakken?
pi_111537818
Schakel je met die logaritmische functie niet al de outliers uit?
Aldus.
pi_111538174
quote:
0s.gif Op maandag 14 mei 2012 16:09 schreef Oidipous het volgende:
Hallo allen, alvast super bedankt voor alle hulp!

Vorige week had ik gepost over het verwerken van data. Inmiddels ben ik een stap verder, ik heb alle data nu in SPSS staan en de volgende stap zou zijn univariate analysis, aldus mijn thesisbegeleider.. Niet wetende wat de precieze definitie is ga ik er van uit dat het descriptives zijn van variabelen. Klopt dit?

De descriptives heb ik tevoorschijn gekregen voor de hele sample en daarin zitten rare waarden. Wat blijkt, de outliers 'verpesten' het. Hoe moet ik deze outliers behandelen? Op internet wordt er ondermeer gepraat over z-values door variabelen bij descriptive te standaardiseren. Daarbij wordt gezegd dat je alles boven 3 en -3 moet verwijderen. Het betreft economisch/accounting onderzoek met ongeveer 12,000 firm years.

Zijn er verder nog zaken waar ik op moet letten voordat ik mijn regressie laat lopen? Heteroskedasticiteit-probleem heb ik niet omdat ik van elke variabele de logaritmische functie pak (maw, model ziet er zo uit log(y1)=b0+log(b1)+log(b2)+log(b3)). Moet ik hierdoor in plaats van lineaire regressie de binary logistic regression functie onder analyze pakken?
Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
pi_111543385
quote:
2s.gif Op maandag 14 mei 2012 16:44 schreef Z het volgende:
Schakel je met die logaritmische functie niet al de outliers uit?
Ooh, dan zou ik alleen voor mijn descriptives de outliers eruit moeten halen. Dat zou wel fijn zijn.

quote:
0s.gif Op maandag 14 mei 2012 16:53 schreef Sandertje23 het volgende:

[..]

Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
Thx, ik ga er mee aan de slag.
pi_111568509
quote:
0s.gif Op maandag 14 mei 2012 16:53 schreef Sandertje23 het volgende:

[..]

Beste manier om outliers te bepalen is met de outlier labeling rule (g van 2,2):
Deze methode wordt ook in SPSS gebruikt wanneer je een boxplot maakt.

quote:
Pallant:
SPSS defines points as outliers if they extend more than
1.5 box-lengths from the edge of the box. Extreme points (indicated with an
asterisk, * ) are those that extend more than 3 box-lengths from the edge of
the box.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  dinsdag 15 mei 2012 @ 09:19:13 #221
319308 Tink89
To live is to dance
pi_111568774
Nou jongens, het is gelukt!

Uiteindelijk was het met select-cases en simpele t-testen helemaal niet zo moeilijk, maar ik dacht te ingewikkeld.
K&W / Tink's droomhuis deel 3: Vur goan beginne! Ofzoiets....
maandag 30 september 2013 07:58 schreef Brighteyes het volgende:
En over de chocola... Tink is van een andere planeet. ;) Die heeft dat niet nodig. ;)
pi_111578137
Bestaat de mogelijkheid om in de syntax een pause of break in te voegen, waardoor eerst het eerste deel wordt uitgevoerd tot dat klaar is, en vervolgens het tweede deel?

Ik heb een syntax waarin ik een .csv bestand laad en daarna ga ik de variabele labels etc aanpassen. Dit werkt niet achter elkaar...
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111578428
Misschien als je er bijvoorbeeld een loze frequency tussen zet plus een exe?

Laad bestand

fre V1.
exe.

var lab
V1 ''
V2 ''
...
.
Aldus.
pi_111580535
Dat werkt inderdaad, bedankt. :-)
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111583706
Oké, gekke vraag, maar misschien weet één van jullie het. Ik heb een histogram in SPSS gemaakt, maar moet het in APA-formaat in Word zien te krijgen. Hoe maak ik in een SPSS een APA-proof histogram of hoe pas ik het histogram aan om het APA-proof te krijgen? Databestand is niet beschikbaar in Excel, dus dat werkt niet.
pi_111584565
Via een PrintScrn en dan photoshop of paint oid? Kan ook rechtstreeks in Word maar dan moet je nog wat bijsnijden, weet niet af dat in Word kan.
Aldus.
pi_111585514
Ja, dat heb ik geprobeerd, maar dan krijg je hem niet volledig APA. Het gaat ook om lettertype van de assen, achtergrondkleur van de grafiek, etc.?

Edit: Met dank aan een studiegenootje. Als je dubbelklikt op de grafiek (of het histogram in dit geval) kun je vanalles aanpassen. Dom dat ik daar zelf niet op gekomen ben....

Edit2: Wel een andere vraag over iets "heel" anders. Wanneer concludeer je op basis van een histogram (in combinatie met zo'n mooie normaalcurve) dat het een normale verdeling is? Ik heb wel eens een histogram gezien dat totaal niet op die normaalcurve leek, maar dat wel normaalverdeeld genoemd werd en nu heb ik histogrammen, die ik wel redelijk normaalverdeeld vind lijken, maar die het toch niet schijnen te zijn. Kennelijk zijn mijn criteria dus niet oké.

[ Bericht 69% gewijzigd door Pinklady89 op 15-05-2012 19:16:03 ]
pi_111622137
Vraag: in mijn regressie van 18 variabelen worden er 2 uitgelaten door SPSS bij het uitvoeren van een lineaire regressie. De eerste variabel is bijna hetzelfde als variabel 2, enkel bij de eerste wordt er gecorreleerd met een dummyvariabele. Namelijk:
Variabel 1: Dummy*omzetT/omzetT-1*economische groei
Variabel 2: economische groei

De tweede variabel kan enkel 4 waardes aannemen waardoor er weinig variatie in zit (veroorzaakt dit bijvoorbeeld multicollineariteit?). Is dat dan ook de reden dat de twee variabelen niet worden meegenomen?

[ Bericht 0% gewijzigd door Oidipous op 16-05-2012 13:52:15 ]
pi_111622854
Hoe kan ik de resultaten van een 7 punts schaal omvormen naar een 3 punts schaal (i.e. van antwoordcategoriën bundelen)?
"Ik heb nog met hem gekoerst"
pi_111625740
Met een recode.
Aldus.
pi_111664446
Misschien een hele stomme vraag. Van een aantal gegevens wil ik kijken hoevaak elke waarde voorkomt. Bijv: waarde A komt 3 keer voor, waarde B 4 keer en waarde C 8 keer.

Nu doe ik dat heel simpel via analyze frequencies, maar ik wil alles wat 0, 1 en 2 keer voorkomt NIET weergeven. Dus ik wil alleen alles wat 3x of vaker voorkomt weergeven met daarbij hoevaak dit voorkomt.
Kom er echt niet uit, ook de handleiding van SPSS en het internet niet, misschien dat iemand mij hier kan helpen?
Hello! I am a signature virus. Please copy me into your own signature to help me spread.
pi_111665204
quote:
0s.gif Op donderdag 17 mei 2012 14:20 schreef axz0l het volgende:
Misschien een hele stomme vraag. Van een aantal gegevens wil ik kijken hoevaak elke waarde voorkomt. Bijv: waarde A komt 3 keer voor, waarde B 4 keer en waarde C 8 keer.

Nu doe ik dat heel simpel via analyze frequencies, maar ik wil alles wat 0, 1 en 2 keer voorkomt NIET weergeven. Dus ik wil alleen alles wat 3x of vaker voorkomt weergeven met daarbij hoevaak dit voorkomt.
Kom er echt niet uit, ook de handleiding van SPSS en het internet niet, misschien dat iemand mij hier kan helpen?
Data-> Select cases -> Select cases if...
En daar [variabele naam] >2 invullen :)
pi_111665592
Data-> Select cases -> Select if condition is satisfied -> MERK >= 2

En dan een foutmelding. Het gaat hier overigens om automerken, ik wil tellen hoevaak een automerk genoemd wordt. Dus bijv. Peugeot 10x, VW 8x etc. En daarbij wil ik dus alleen alles wat 3x of vaker genoemd wordt tonen
Hello! I am a signature virus. Please copy me into your own signature to help me spread.
pi_111843764
Hoi,

Kan iemand mij uitleggen waarom de keuze van referentiegroepen bij logistische regressie van invloed is op de p-waarden van mijn predictoren?

Ik heb een model met 2 categoriale predictoren met beide 2 groepen, 1 continue predictor, en een binaire afhankelijke variabele.
Ik kijk naar de hoofdeffecten, de 2 tweeweginteracties tussen de categoriale predictoren en de continue predictor en de drieweginteractie tussen de twee categoriale predictoren en de continue predictor.

dus
Cat1
Cat2
Con
Cat1*con
Cat2*con
Cat1*Cat2*con

Als ik voor beide categoriale predictoren de eerste groep als referentiegroep neem, is de tweede tweeweg interactie wel significant. Als ik voor beide categoriale predictoren de tweede groep als referentiegroep neem, is de tweede tweeweg interactie niet significant.
De drieweginteractie blijft in alle gevallen altijd significant.

Kan iemand mij vertellen waarom dit verschil uitmaakt bij variabelen met maar 2 groepen? Er is dan toch niet eens sprake van een echt "contrast"?
pi_111883515
Mensen, ik kom er niet uit dus ik hoop dat iemand mij toch nog verder kan helpen. Het gaat om een
kolom waar mensen zelf een 'automerk' intypen, neem peugeot als voorbeeld (het is dus een string).

Uiteindelijk kijk ik via frequencies en zie ik nu dat 55 mensen peugeot hebben ingevoerd, 38 mensen volkswagen en bijvoorbeeld maar 1 iemand die kiest voor Toyota, 1 iemand die kiest voor Honda.

Omdat het nu een gigantische lijst is, wil ik alle automerken die slechts 1x voorkomen (die dus door 1 iemand zijn ingevuld) weglaten, maar ik krijg het maar niet voor elkaar!!
Select if dat heeft geen zin, want de output van analyze, frequencies is geen variabele. Die kan ik dus niet selecteren.

Hoe kan ik nou mijn frequenties in de output window zo sorteren dat alles wat slechts 1x is genoemd, niet getoond wordt?!
Hello! I am a signature virus. Please copy me into your own signature to help me spread.
pi_111888834
quote:
0s.gif Op dinsdag 22 mei 2012 17:18 schreef axz0l het volgende:
Mensen, ik kom er niet uit dus ik hoop dat iemand mij toch nog verder kan helpen. Het gaat om een
kolom waar mensen zelf een 'automerk' intypen, neem peugeot als voorbeeld (het is dus een string).

Uiteindelijk kijk ik via frequencies en zie ik nu dat 55 mensen peugeot hebben ingevoerd, 38 mensen volkswagen en bijvoorbeeld maar 1 iemand die kiest voor Toyota, 1 iemand die kiest voor Honda.

Omdat het nu een gigantische lijst is, wil ik alle automerken die slechts 1x voorkomen (die dus door 1 iemand zijn ingevuld) weglaten, maar ik krijg het maar niet voor elkaar!!
Select if dat heeft geen zin, want de output van analyze, frequencies is geen variabele. Die kan ik dus niet selecteren.

Hoe kan ik nou mijn frequenties in de output window zo sorteren dat alles wat slechts 1x is genoemd, niet getoond wordt?!
Variabele kopiëren, ctrl + F, alle veel voorkomende antwoorden vervangen (door 'replace') door numerieke waarden en die waardes coderen bij variable labels. Vervolgens de overige verwijderen of system missing van maken. Als laatste nog zorgen dat het een numerieke varaibele is en dan kan je als het goed is frequentietabellen maken.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111968573
Hallo, ik heb een probleem (SPSS 17.0):
Ik heb een hoop data gecopy paste vanuit excel naar een spss sheet. Maar als ik ze wil analyzeren (general linear model -> univariate) dan mag ik mijn data niet naar fixed factor verplaatsen want 'string variables are not allowed in the list'.
Dus ik poog het probleem te verhelpen door mijn data van type: string naar type: numeric te veranderen. En hier loop ik vast: als ik dit doe veranderen al mijn data van die kolom in punten. Als ik het weer terug naar string verander zijn mijn kolommen leeg!
Ik kan ook niet eerst de kolom op numeric zetten en dan pas mijn data er in plakken want dan krijg ik nog steeds punten.

Wie biedt de oplossing?
pi_111968834
Probeer deze syntax:

alter type variabele (f8.2).

In SPSS 20 werkt jouw methode wel. Je moet dan wel alleen maar getallen in je data hebben dus check eens of je letters of symbolen er in hebt staan en probeer het dan nog eens (als bovenstaande syntax niet werkt).
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111969038
Waar moet ik die syntax invoeren dan? o.O

En een voorbeeld van mijn waarde is: 1470.935
De punt functioneert hier als decimal seperator. Worden deze punten wellicht als symbolen geteld waardoor ik dus die error krijg?
pi_111970315
Die syntax voer je in in het syntax scherm. (file, new, syntax).
Je kan proberen om de punten te vervangen door komma's mbv ctrl+F.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_111970621
Ok, die syntax zet die string waarde dus om in numeric. Maar nog altijd punten :(
Ik kan nog dat van punten/komma's proberen maar in de opties staat gewoon dat ie punten als decimal seperator herkend.

edit: yeah als ik punten in komma's verander werkt het. Snap niet waarom hij het niet met punten wil doen, want zo hij stond zo ingesteld dat ie punten zou moeten herkennen D:
Bedankt voor de hulp!
pi_111970969
Die optie gaat waarschijnlijk alleen op bij numerieke variabelen,vandaar. Maar SPSS zit vol met zulke eigenaardigheden ;)
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_112094457
Oké, dit is waarschijnlijk echt een ernstige vraag, maar ik stel hem toch. Het gaat om een 2-weg ANOVA. De resultaten hiervan wil ik noteren in een verslag en daarbij moet ik de vrijheidsgraden uitdrukken: F(df_between, df_within). Tot zover geen probleem.

Maar, nu heb ik getest voor een hoofdeffect (2 condities). Df_between wordt dan 1. Df_within zou (aantal ppn - aantal condities) moeten zijn. Alleen, waarom gebruik je voor dit aantal condities dan het aantal condities van het gehele experiment (in dit geval 4) in plaats van het aantal condities van deze toets (het hoofdeffect; 2 condities dus)?
pi_112138605
SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
nvm

[ Bericht 5% gewijzigd door Silverdigger2 op 28-05-2012 23:52:52 ]
pi_112168183
Ik moet een ANOVA test uitvoeren, maar de Levene's test die homogeneity bepaald geeft een significante waarde aan. Dat betekend dus dat de varianties niet gelijk zijn in de groepen en een ANOVA (die gelijke varantie vereist) toets niet mag worden gebruikt.
Heb al met mijn stagebegeleider overlegd en hij raadde aan om de data te transformeren. Heb al verschillende log en Ln transformaties geprobeerd, maar het blijft altijd significant aangeven.

Heeft iemand nog ideeën om dit te verhelpen? Of wat ik kan overwegen als alternatief (wat dus wel mogelijk is met ongelijke varianties).
pi_112168416
quote:
0s.gif Op dinsdag 29 mei 2012 14:48 schreef KrentebolHooft het volgende:
Ik moet een ANOVA test uitvoeren, maar de Levene's test die homogeneity bepaald geeft een significante waarde aan. Dat betekend dus dat de varianties niet gelijk zijn in de groepen en een ANOVA (die gelijke varantie vereist) toets niet mag worden gebruikt.
Heb al met mijn stagebegeleider overlegd en hij raadde aan om de data te transformeren. Heb al verschillende log en Ln transformaties geprobeerd, maar het blijft altijd significant aangeven.

Heeft iemand nog ideeën om dit te verhelpen? Of wat ik kan overwegen als alternatief (wat dus wel mogelijk is met ongelijke varianties).
Je kunt non-parametrisch toetsen, maar bij genoeg proefpersonen is een schending van levene's test niet zo rampzalig.

En anders doe je hem gewoon en is dit een discussiepunt :)
pi_112168945
Ja inderdaad, dat was ook een optie :P

Zijn er nog nonparametrische toetsen buiten de Kruskal-Wallis en Wilcoxon-Rank sum toetsen? Ik ga sowieso die 2 denk ik even bekijken.
edit: ik zie er zo al een boel staan in SPSS, dat wordt lekker proberen :')

[ Bericht 23% gewijzigd door KrentebolHooft op 29-05-2012 15:13:49 ]
pi_112169272
quote:
0s.gif Op dinsdag 29 mei 2012 15:08 schreef KrentebolHooft het volgende:
Ja inderdaad, dat was ook een optie :P

Zijn er nog nonparametrische toetsen buiten de Kruskal-Wallis en Wilcoxon-Rank sum toetsen? Ik ga sowieso die 2 denk ik even bekijken.
edit: ik zie er zo al een boel staan in SPSS, dat wordt lekker proberen :')
Kruskal-Wallis wordt het meest gebruikt, dus als je niet in de literatuur wilt duiken met betrekking tot de andere tests is het misschien een goed idee om die (als je dat kunt) te gebruiken.
pi_112170757
Ik heb een vraagje.. voor mijn thesis ben ik een analyse aan het doen waar ik niet uitkom:

ik heb 2 participant groepen (patientgroep en controlegroep)
drie condities (baseline, -100 ms cue en -200 ms cue)
in deze condities heb ik scores voor de reactiestijd gemiddeld van beide ogen, voor linker visueel veld en rechter visueel veld.

Mijn variabelen zijn dus:
v1 (overall baseline)
v2 (overall -100)
v3 (overall -200)
v4 (links, baseline)
v5 (links, -100)
... tm v9

Nu wil ik de resultaten dus voor de visuele velden apart bekijken.

Volgens mijn docent moet ik hiervoor een repeated measures glm (anova) op draaien, maar ik heb geen idee hoe!
Ik heb geprobeerd om 2 within subject factoren aan te maken (links en rechts) met 3 niveaus, maar dan moet ik 9 variabelen ingeven!

Wie weet hoe dit werkt?

Ik zou zelf geneigd zijn een independent sample t-test te draaien op links baseline en rechts baseline en paired sample op links baseline en -100 etc..
  maandag 4 juni 2012 @ 17:49:36 #250
34299 davako
-GATGCTGTTGAA-
pi_112433221
Ik heb een klein vraagje over welke test ik precies moet doen.

Ik heb van vier verschillende locaties blaadjes geteld en gewogen. Per locatie heb ik van gemiddeld 8 planten de blaadjes geteld en gewogen.
Dus mijn data ziet er basaal gezien zo uit:

Locatie Hoeveelheid blaadjes Gewicht
1 10 5,7
1 2 1,2
1 12 8,5
2 23 16,2
2 8 10,6
3
4 etc.
Jullie begrijpen vast het idee. Nu is dit gewicht het totale gewicht van de bv de 10 blaadjes.
Met welke test kan ik nu het beste het verschil bepalen tussen de verschillende locaties.

Ik heb het idee dat ik mijn data anders moet neerzetten, maar ben de afgelopen paar dagen alleen maar bezig geweest met tellen dus kan niet meer al te helder denken. Dus iemand een idee?
All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.
pi_112442198
Bekijk de optie Weight cases eens, staat bij Data dacht ik (of iig onderaan vlakbij split file). Voer daar de variabele van de hoeveelheid in. Vervolgens kan je met one way anova verschillen bepalen tussen de locaties. Hangt wel een beetje van je precieze codering af, maar je moet in die richting denken.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
  donderdag 7 juni 2012 @ 14:55:01 #252
232909 Kneivster
Let's hug it out, bitch!
pi_112568174
Ik hoop dat iemand mij hier kan helpen...
Ik ben bezig met het afronden van mijn masterthesis economie over de verspreiding van activity-based costing in Nederland. Nu moet er bij een masterthesis ook een empirisch gedeelte bijgevoegd worden zodat de opgestelde hypotheses in het theoretisch frame getest kunnen worden. Hiervoor heb ik een survey uitgevoerd, waarbij respondenten gevraagd werden te reageren op stellingen op basis van een 5 punts Likert-schaal (1= totaal niet mee eens, 2= niet mee eens, 3 = neutraal, enz). Ik heb alle data inmiddels binnen en ingevoerd in SPSS, maar de analyse ervan wil nog niet echt lukken, en aangezien mijn begeleider er ook de ballen verstand van heeft :') hoop ik dat jullie me willen helpen...
De afhankelijke variabele in het onderzoek ik de adoptie van activity-based costing (0=niet 1=wel). Op basis van de verschillende hypotheses zijn hier een aantal afhankelijke variabelen opgesteld die dus zijn getest in de survey (en hebben dus een waarde van 1 t/m 5).
Nou kan ik zelf wel de gemiddeldes en de standaardafwijkingen enzo van elke aparte variabele laten berekenen in SPSS, maar hoe kan ik van 2 (of meer) variabelen het gezamenlijke gemiddelde en standaarddeviatie laten berekenen zodat dit een samengevoegde variabele wordt en ik deze variabele later ook weer kan gebruiken in verdere statische analyses?

Verder, wat voor verdere analyse zouden jullie uitvoeren hierop om uiteindelijk de hypotheses te testen? Ik lees overal verschillende dingen, de één voert een Mann-Whitney U Test uit (Niet parametrische test tussen 2 onafhankelijke samples), de ander een One-sample Kolmogorov Test (ook niet parametrisch, maar met 1 sample). Ik zie door de bomen het bos niet meer...
Alvast vele malen dank voor de hulp! ^O^
King is much more than the weight of a crown
Natural patent of nobility
pi_112569486
quote:
4s.gif Op donderdag 7 juni 2012 14:55 schreef Kneivster het volgende:
Verder, wat voor verdere analyse zouden jullie uitvoeren hierop om uiteindelijk de hypotheses te testen? Ik lees overal verschillende dingen, de één voert een Mann-Whitney U Test uit (Niet parametrische test tussen 2 onafhankelijke samples), de ander een One-sample Kolmogorov Test (ook niet parametrisch, maar met 1 sample). Ik zie door de bomen het bos niet meer...
Alvast vele malen dank voor de hulp! ^O^
Ik word niet wijs uit jouw lap tekst. Wat is je afhankelijke variabele (en meetschaal) en wat zijn je onafhankelijke variabelen (en meetschaal) per hypothese? Dan kunnen we even wat gerichter kijken.
  donderdag 7 juni 2012 @ 16:21:08 #254
232909 Kneivster
Let's hug it out, bitch!
pi_112571546
Sorry voor de onduidelijkheid, hopelijk maakt dit het wat overzichtelijker:
De afhankelijke variabele in de survey is: de adoptie van activity based costing. De meetschaal hiervoor is: wel geadopteerd (gecodeerd met 1) en niet geadopteerd (gecodeerd met 0).
De afhankelijke variabelen zijn dus opgedeeld onder de verschillende hypotheses. Voorbeeld:
Hypothese: De keuze voor adoptie van activity-based costing is gemaakt op basis van efficiente keuze motieven
Onafhankelijke variabele: De technische efficiency van activity-based costing
Vraag in survey: Kunt u aangeven in hoeverre u het eens bent met de volgende stelling: Het was voorafgaand aan de implementatie van ABC te bepalen wat de input, output, kosten en opbrengsten zouden zijn.
Meetschaal: Volledig mee oneens (gecodeerd met 1), Mee oneens (gecodeerd met 2), Neutraal (gecodeerd met 3), Mee eens (gecodeerd met 4), Volledig mee eens (gecodeerd met 5).

Nou kan het dus zijn dat 2 onafhankelijke variabelen samen genomen moeten worden omdat ze uitmaken van 'grotere' onafhankelijke variabele (bijvoorbeeld: onder dezelfde hypothese als bovenstaand zijn er ook twee vragen met betrekking tot de beoordeling van het huidige kostensysteem t.o.v. activity-based costing. Deze twee vragen hebben alletwee een aparte onafhankelijke variabele en worden ook alletwee apart getoetst, maar ik wil ze ook samenvoegen om, in dit geval, het geheel van de beoordeling van het huidige kostensysteem te toetsen aan de adoptie van activity-based costing.
King is much more than the weight of a crown
Natural patent of nobility
  vrijdag 8 juni 2012 @ 13:45:33 #255
232909 Kneivster
Let's hug it out, bitch!
pi_112611433
quote:
4s.gif Op donderdag 7 juni 2012 14:55 schreef Kneivster het volgende:
maar hoe kan ik van 2 (of meer) variabelen het gezamenlijke gemiddelde en standaarddeviatie laten berekenen zodat dit een samengevoegde variabele wordt en ik deze variabele later ook weer kan gebruiken in verdere statische analyses?
quote:
[Nou kan het dus zijn dat 2 onafhankelijke variabelen samen genomen moeten worden omdat ze uitmaken van 'grotere' onafhankelijke variabele (bijvoorbeeld: onder dezelfde hypothese als bovenstaand zijn er ook twee vragen met betrekking tot de beoordeling van het huidige kostensysteem t.o.v. activity-based costing. Deze twee vragen hebben alletwee een aparte onafhankelijke variabele en worden ook alletwee apart getoetst, maar ik wil ze ook samenvoegen om, in dit geval, het geheel van de beoordeling van het huidige kostensysteem te toetsen aan de adoptie van activity-based costing.
Volgens mij ben ik er, wat dit deel betreft, zelf uitgekomen. Klopt het als je dit doet: Transform -> compute new variable -> naam nieuwe variabele; MEAN(variabele 1, variabele 2, enz)?
King is much more than the weight of a crown
Natural patent of nobility
  dinsdag 19 juni 2012 @ 18:44:19 #256
101634 NiekieW.
Zuipen tot we kruipen
pi_113108038
Werd hier naar doorverwezen heb even mijn openings post gekopieerd:

Hey,
Ik ben bezig met mijn scriptie, en wil een event study uitvoeren. Wat ik wil onderzoeken is wanneer een hedge fund een aandeel van meer dan 1% in een bedrijf krijgt wat dit met de aandelen prijs van het bedrijf doet. Ik heb nu van alle 125 events die ik heb de Abnormal returns in excel staan (heb deze berekend door de percentuele return van een index van de percentuele return van het bedrijf af te halen). Ook heb op een ander blad cumulatieve returns per bedrijf staan. Heb net al beetje met spss zitten kloten, maar heb er al heel lang niet meer mee gewerkt. Wat ik dus wil weten is hoe kan nu berekenen of er significante resultaten zijn bijvoorbeeld van event window van -20 naar +20. Volgens mij denk ik veel moeilijker dan dat het is. Of is een simpele T-test met de AR(-20,+20) al voldoende voor significantie? Hoop dat iemand me beetje verder kan helpen, of ergens een tutorial of iets dergelijks heeft. Kan op internet namelijk niks duidelijks vinden. Alvast bedankt.
Gr, Niek
Siofok 2007!
Lloret 2006!
Wintersport 2003-2007!
pi_113178382
Dag,

Ik heb een sample van 40.000 bedrijfsjaren waarover ik een regressie laat uitvoeren door SPSS.

Nu staat het volgende in vergelijkbaar onderzoek:

To control for error dependence of firm observations, we use Rogers (1993) standard errors clustered at the firm level in all regressions (Petersen 2009).

Hoe doe ik dit in SPSS? Is daar een functie voor? Ik maak gebruik van PASW statistics 18.

[ Bericht 0% gewijzigd door Oidipous op 21-06-2012 10:07:59 ]
  donderdag 21 juni 2012 @ 10:26:52 #258
38651 yozd
FR1908 Vakkie R
pi_113179111
Kan iemand mij uitleggen wat in SPSS het verschil is tussen een "fixed factor" en een "covariate" bij bijvoorbeeld univariate variantie analyse?
"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."
pi_113211606
quote:
0s.gif Op donderdag 21 juni 2012 09:57 schreef Oidipous het volgende:
Dag,

Ik heb een sample van 40.000 bedrijfsjaren waarover ik een regressie laat uitvoeren door SPSS.

Nu staat het volgende in vergelijkbaar onderzoek:

To control for error dependence of firm observations, we use Rogers (1993) standard errors clustered at the firm level in all regressions (Petersen 2009).

Hoe doe ik dit in SPSS? Is daar een functie voor? Ik maak gebruik van PASW statistics 18.
Zoek de originele bron eens op en kijk wat daar in staat beschreven.
quote:
0s.gif Op donderdag 21 juni 2012 10:26 schreef yozd het volgende:
Kan iemand mij uitleggen wat in SPSS het verschil is tussen een "fixed factor" en een "covariate" bij bijvoorbeeld univariate variantie analyse?
Ik kan je daar geen antwoord op geven, maar misschien heb je hier wat aan: http://www.theanalysisfac(...)tors-and-covariates/
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113284276
Ik weet hoe je een mediatiemodel moet testen middels de stappen en regressieanalyses van Baron & Kenny. Maar in mijn onderzoek zijn de onafhankelijke variabelen dichtoom. Kunnen jullie mij vertellen hoe ik in spss een mediatie model kan testen dmv regressieanalyses waarbij de onafhankelijke variabelen dichotoom zijn?

Het onderzoek gaat over klachtafhandeling en de variabelen zijn:

Onafhankelijk: empathie (Ja/Nee) & verklaring (Ja/Nee)
Mediator: interactionele rechtvaardigheidsperceptie
Afhankelijk: perceptie en intenties

Alvast bedankt!
pi_113307522
Gebruik het "Indirect" script van Preacher & Hayes; http://www.afhayes.com/spss-sas-and-mplus-macros-and-code.html.

Via file, open, script in spss 17. Werkt volgens mij niet in 20. Althans, bij mij niet.
Dat script detecteert automatisch of een Y dichotoom is en gebruikt dan logitische regressie ipv ordinary least squares (OLS).

[ Bericht 0% gewijzigd door crossover op 25-06-2012 10:29:56 ]
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113348922
Bedankt voor je antwoord! Ik vind het eerlijk gezegd nogal vaag. Want op een andere site vind ik nu dat in lineaire regressie de onafhankelijke variabele wel dichotoom kan zijn? Alleen de afhankelijke variabele zou dan continu moeten zijn?
pi_113353978
De onafhankelijke variabele mag best dichotoom zijn, de afhankelijke alleen niet, inderdaad. Dan gebruik je namelijk logistische regressie. Het valt me nu alleen op dat je twee predictor variabelen hebt. Dat past niet in dat script (misschien is er een ander script op zijn site?). Anders wordt het AMOS.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113354070
Oh trouwens, ik had Y moeten schrijven waar hierboven X stond. Vandaar ook je verwarring denk ik.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113355161
Bij mij zijn alleen de onafhankelijke variabelen (verklaring en empathie) dichotoom. De afhankelijke en medierende variabelen zijn gewoon dichotoom. Een aantal controle variabelen zijn daarentegen weer nominaal.

Maar je geeft aan dat de X toch gewoon dichotoom kan zijn bij lineaire regressie. Waarom zou ik dan logistische regressie moeten gebruiken? En waarom zou dat script dan moeten detecteren of de X dichotoom is om zo logistische regressie te gebruiken?
pi_113358599
quote:
0s.gif Op maandag 25 juni 2012 11:11 schreef koenvanveen het volgende:
Bij mij zijn alleen de onafhankelijke variabelen (verklaring en empathie) dichotoom. De afhankelijke en medierende variabelen zijn gewoon dichotoom. Een aantal controle variabelen zijn daarentegen weer nominaal.

Maar je geeft aan dat de X toch gewoon dichotoom kan zijn bij lineaire regressie. Waarom zou ik dan logistische regressie moeten gebruiken? En waarom zou dat script dan moeten detecteren of de X dichotoom is om zo logistische regressie te gebruiken?
Omdat je bij de afhankelijke variabele alleen de uitkomsten 1 of 0 hebt en waardes daartussen geen interpretatie hebben, terwijl die uitkomsten wel mogelijk zijn met een normale lineaire regressie. Een logistische regressie model modelleert de uitkomst in kansen op 1 en 0 die je kunt omzetten naar uitkomsten 1 en 0.
Beneath the gold, bitter steel
pi_113362015
Pff wat dom van mijzelf, wil ik vertellen dat mijn afhankelijke en medierende variabelen ordinaal zijn, schrijf ik dichotoom. Dus ik bedoel:

Bij mij zijn alleen de onafhankelijke variabelen (verklaring en empathie) dichotoom. De afhankelijke en medierende variabelen zijn gewoon ordinaal. Een aantal controle variabelen zijn daarentegen weer nominaal.

Dan is een lineaire regressie gewoon mogelijk begrijp ik. Is dat juist?
pi_113368584
Juist. Zoek ook even de spss survival manual op van Pallant, is via google te vinden. Daar staat precies in wat je nodig hebt voor lineaire regressie.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113372142
Korte vraag:

Ik heb data van ongeveer 100 mensen.
Deze mensen hebben 9 keer een vragenlijst ingevuld, maar niet iedereen heeft deze lijst 9 keer ingevuld.
Ik heb nu een SPSS bestand met Totaalscores op de vragenlijst als variabele. Ik heb per vragenlijst 1 case en iedere proefpersoon heeft dus maximaal 9 cases. Is er een makkelijke manier om de gemiddelde totaalscore te berekenen per proefpersoon? (En dat dit dus een variabele wordt waar ik verder mee kan rekenen tussen groepen etc.)
pi_113372293
Data aggregeren op proefpersoon?
Aldus.
pi_113386190
Hoi please help me!



Stel:
pad a is significant
pad b is significant
pad c is significant
pad c' is significant

Dan is er geen sprake van mediatie toch? Moet je dan alsnog de Sobel test uitvoeren?

Alvast bedankt!
pi_113390599
Ik zou gewoon het Indirect script gebruiken van Hayes. Is superieur aan de Sobel test, aldus de auteurs. Effe googlen en je hebt 'm.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113391441
quote:
2s.gif Op maandag 25 juni 2012 17:12 schreef Z het volgende:
Data aggregeren op proefpersoon?
Ik zit op die functie te zoeken, maar het wordt me nog niet helemaal duidelijk wat je er mee kan. Zou je in een (paar) simpele zin(nen) uit kunnen leggen wat je er mee kan? Heb er geen ervaring mee.
'Expand my brain, learning juice!'
&lt;a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank"&gt;Last.fm&lt;/a&gt;
pi_113394718
quote:
2s.gif Op maandag 25 juni 2012 17:12 schreef Z het volgende:
Data aggregeren op proefpersoon?
Ik lees je reactie nu pas, had deze functie zelf al gevonden ja. Bedankt!
@ Crossover: kort gezegd: met aggregate kun je van meerdere datapunten 1 datapunt maken. Je kunt dan nog kiezen hoe hij dit datapunt maakt. Ik heb bijvoorbeeld gekozen voor het gemiddelde van de verschillende datapunten, maar dat hangt natuurlijk af van je onderzoeksvraag.
pi_113747584
Ben de SPSS Survival Manual aan het lezen. Ben nu bij Part 4 'Statistical techniques to explore relationships among variables'

Waaronder dus Correlation, Partial correlation, Multiple regression, Logistic regression en Factor analysis.

Dan staat er een stukje:

quote:
Assumptions
There are a number of assumptions common to all the techniques covered in part Four. These are discussed below. You will need to refer back to these assumptions when performing any of the analyses covered in Chapters 11, 12, 13, 14 and 15.

[...]

Normality

Scores on each variable should be normally distributed. This can be checked by inspecting the histograms of scores on each variable (see Chapter 6) for instructions).
Nu heb ik voor variabele 1 de volgende normal line:


En voor variabele 2 deze:



En deze 2 variabelen afgezet tegen over elkaar zorgt voor de volgende scatter:



Dus noob-vraag: voldoen deze variabelen aan de eisen voor een Pearson r of moet ik gaan voor Spearman rho?

Bonus noob vraag: op de website van het boek kan je bestanden downloaden die als voorbeeld gebruikt worden. Nu zie ik dat ze vragen met een likert scale gecodeerd als 'Scale' hebben als measurement type.Moet likert scale niet als Ordinal behandeld worden?

Zie http://www.allenandunwin.com/spss/Files/survye_codebook.pdf de vragen over optimisme e.d. met 1 t/m 5 als antwoordmogelijkheid is hebben in de .sav file een Scale measurement.

[ Bericht 1% gewijzigd door VacaLoca op 04-07-2012 03:04:21 ]
pi_113748472
Hm toch maar gewoon verder gegaan met output uitdraaien.

Spearman rho correlation coefficient is .165 (Sig. 064)

Pearson correlation is .239 (Sig .007)

Ik kan denk ik dus wel stellen dat er een kleine, positieve correlatie is tussen de twee variabelen en dat er slechts een zwakke relatie bestaat.

Vraag ik me alleen nog af hoe jullie bovenstaande afbeeldingen zouden omschrijven. Wanneer is een afwijking van de lijn groot genoeg om te stellen dat het niet lineair genoeg is voor bv de Pearson analyse?
pi_113802273
Iemand duwtje in de juiste richting?
  donderdag 5 juli 2012 @ 21:55:06 #278
64479 Omnifacer
Alles geven!11
pi_113825188
Mensen, ik heb iets waar ik niet uitkom en ik vroeg me af of jullie me kunnen helpen. Het is volgens mij niet heel moeilijk, maar ik kom er niet uit. Ik wil een schaal maken van drie variabelen. Het zijn variabelen met een likert-schaal van 1-7. Alpha is .977, dus moet kunnen.

Echter: als ik via compute gewoon var1 + var 2 + var 3 doe, dan verschijnt de nieuwe variabele wel, maar zonder scores. Ik doe dus iets fout, maar kan niet vinden wat. Jullie een idee?
  donderdag 5 juli 2012 @ 22:29:21 #279
64479 Omnifacer
Alles geven!11
pi_113826804
Gelukt, moet (var1 + var2 + var3)/3 zijn :7
pi_113950106
hallo allemaal,

Ik probeer van een interactie in een logistische regressieanalyse een plot te maken. De verkregen grafiek lijkt me echter niet correct, gezien de constante lijn (ipv twee lijnen: een voor kerkelijk en een voor niet-kerkelijk ). De syntax die ik hiervoor heb gebruikt is:

quote:
compute logit=105.59640982551976 + 0.006987722743432774 * hbowo + 15.309299729723998 * kerklidmaatschap + -0.004312743957170497 * hbowo * kerklidmaatschap .
compute voorspeld= (exp (logit)) /
(1 + (exp (logit))).
exe.

GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=hbowo MEAN(voorspeld)[name="MEAN_voorspeld"]
kerklidmaatschap MISSING=LISTWISE REPORTMISSING=YES
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: hbowo=col(source(s), name("hbowo"))
DATA: MEAN_voorspeld=col(source(s), name("MEAN_voorspeld"))
DATA: kerklidmaatschap=col(source(s), name("kerklidmaatschap"), unit.category())
GUIDE: axis(dim(1), label("aantal_hbowo_studenten_keer_1000"))
GUIDE: axis(dim(2), label("Mean voorspeld"))
GUIDE: legend(aesthetic(aesthetic.color.interior), label("wel_of_niet_kerkelijk"))
SCALE: cat(aesthetic(aesthetic.color.interior), include(".0", "1.00"))
ELEMENT: line(position(hbowo*MEAN_voorspeld), color.interior(kerklidmaatschap), missing.interpolate())
END GPL.
De verkregen grafiek:



Ik heb gewoon het intercept en de verschillende B's ingevoerd en zie verder echt niet wat t probleem kan zijn. Ziet iemand wel een fout in de syntax welke ik over het hoofd heb gezien?
  zondag 8 juli 2012 @ 23:22:17 #281
219590 oompaloompa
doompadeedee
pi_113950621
ik maak nooit grafieken in spss, maar als niemand je verder helpt, kun je hem altijd gemakkelijk in excel maken..
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_113951209
quote:
0s.gif Op zondag 8 juli 2012 23:22 schreef oompaloompa het volgende:
ik maak nooit grafieken in spss, maar als niemand je verder helpt, kun je hem altijd gemakkelijk in excel maken..
Hmm, gemakkelijk?
  zondag 8 juli 2012 @ 23:42:14 #283
219590 oompaloompa
doompadeedee
pi_113951680
Ja in principe wel, is gewoon een kwestie van formule in typen en plotten.
Als je een interactie hebt is het iets ingewikkelder maar voor de rest redelijk straightforward.

stel formule is voor lijn 1: .4 + .03x
dan maak je een kolom met nummers 1 2 3 4 5 etc.
kolom er naast typ je "= .4 + (klik vakje links)*.03
Dan sleep je dat vakje over de hele kolom er naast.

Daarna maak je er een lijngrafiek van

dat is het, hoogstens 10 minuutjes werk als het goed is.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_113954927
Oompaloompa, ook suggesties voor het maken van een histogram in excel? In spss lukt dat prima, maar voor een verslag heb ik liever niet de spss lay-out.
  maandag 9 juli 2012 @ 09:58:21 #285
219590 oompaloompa
doompadeedee
pi_113959451
Het kan vast op een hele ingenieuze manier maar ik maak ze altijd (nou ja altijd heb er maar 1 keer 1 hoeven maken) met de hand, dus gewoon normaal staafdiagram en zelf de frequenties en verdeling maken, maar ik ben er van overtuigd dat dat gemakkelijker moet kunnen!
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 9 juli 2012 @ 22:18:10 #286
231574 automatic_
muppetinnetje.
pi_113989491
Ik snap even iets niet.
Ik heb drie leeftijdsgroepen en vier verschillende subgebieden van kwaliteit van leven. Ik wil nu kijken of er significante verschillen zijn tussen de drie leeftijdsgroepen en de subgebieden.
Dus bijvoorbeeld of groep 8-12 jaar significant verschilt met emotioneel functioneren of lichamelijke functioneren.

Hoe doe ik dit?
Ik heb al een ANOVA gedaan om te kijken naar de drie verschillende groepen op het gebied van "totaal functioneren". Of moet ik nu gewoon 5 losse ANOVA's doen? Ik dacht zelf aan een MANOVA maar daar kom ik niet uit :@
"It's good to be open-minded, but not so open that your brains fall out."
  maandag 9 juli 2012 @ 22:36:15 #287
219590 oompaloompa
doompadeedee
pi_113990505
quote:
0s.gif Op maandag 9 juli 2012 22:18 schreef automatic_ het volgende:
Ik snap even iets niet.
Ik heb drie leeftijdsgroepen en vier verschillende subgebieden van kwaliteit van leven. Ik wil nu kijken of er significante verschillen zijn tussen de drie leeftijdsgroepen en de subgebieden.
Dus bijvoorbeeld of groep 8-12 jaar significant verschilt met emotioneel functioneren of lichamelijke functioneren.

Hoe doe ik dit?
Ik heb al een ANOVA gedaan om te kijken naar de drie verschillende groepen op het gebied van "totaal functioneren". Of moet ik nu gewoon 5 losse ANOVA's doen? Ik dacht zelf aan een MANOVA maar daar kom ik niet uit :@
Als ik je goed begrijp doe je gewoon contrasten..

Eerst een multivariate of er verschillen zijn in totaal, daarna bij de univariate resultaten kijken of er per subgebied verschillen zijn, daarna contrasten om te kijken welke groepen precies verschillen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 9 juli 2012 @ 22:40:33 #288
231574 automatic_
muppetinnetje.
pi_113990822
quote:
0s.gif Op maandag 9 juli 2012 22:36 schreef oompaloompa het volgende:

[..]

Als ik je goed begrijp doe je gewoon contrasten..

Eerst een multivariate of er verschillen zijn in totaal, daarna bij de univariate resultaten kijken of er per subgebied verschillen zijn, daarna contrasten om te kijken welke groepen precies verschillen.
Oke... Ik ga dat nog eens even uitzoeken.
wat ben ik blij als dit erop zit, stom gedoe, haha
"It's good to be open-minded, but not so open that your brains fall out."
pi_113991011
quote:
0s.gif Op maandag 9 juli 2012 22:36 schreef oompaloompa het volgende:

[..]

Als ik je goed begrijp doe je gewoon contrasten..

Eerst een multivariate of er verschillen zijn in totaal, daarna bij de univariate resultaten kijken of er per subgebied verschillen zijn, daarna contrasten om te kijken welke groepen precies verschillen.
Je kunt dan beter een MANOVA met een posthoc test doen.
pi_113991826
Iemand nog die mij kan vertellen (zie eerdere posts) hoe je best kan beoordelen wanneer een normal plot te afwijkend? Kan je het bijvoorbeeld ook in waardes uitdrukken en dat er ergens theorieën bestaan over vanaf welke waarden het ene geld en wanneer het ander?
  maandag 9 juli 2012 @ 23:09:51 #291
231574 automatic_
muppetinnetje.
pi_113992593
Sandertje23 heeft net even met mij meegekeken, maar SPSS loopt te zeuren dat er minder dan drie groepen zijn, terwijl die er wel zijn.
"It's good to be open-minded, but not so open that your brains fall out."
  maandag 9 juli 2012 @ 23:11:28 #292
219590 oompaloompa
doompadeedee
pi_113992689
quote:
0s.gif Op maandag 9 juli 2012 22:43 schreef Sandertje23 het volgende:

[..]

Je kunt dan beter een MANOVA met een posthoc test doen.
manova = multivariate
post-hoc is een contrast ;)

Maar wel fijn dat we het met elkaar eens zijn :D
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 9 juli 2012 @ 23:12:19 #293
219590 oompaloompa
doompadeedee
pi_113992740
quote:
0s.gif Op maandag 9 juli 2012 23:09 schreef automatic_ het volgende:
Sandertje23 heeft net even met mij meegekeken, maar SPSS loopt te zeuren dat er minder dan drie groepen zijn, terwijl die er wel zijn.
Als je toevallig op de uni komt wil ik je wel even helpen...
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  maandag 9 juli 2012 @ 23:13:21 #294
231574 automatic_
muppetinnetje.
pi_113992808
quote:
0s.gif Op maandag 9 juli 2012 23:12 schreef oompaloompa het volgende:

[..]

Als je toevallig op de uni komt wil ik je wel even helpen...
Ik ga morgen misschien wat inleveren, maar dat weet ik nog niet zeker. Bedankt in ieder geval! Ik ga het even onthouden :)
"It's good to be open-minded, but not so open that your brains fall out."
pi_113992818
quote:
0s.gif Op maandag 9 juli 2012 23:09 schreef automatic_ het volgende:
Sandertje23 heeft net even met mij meegekeken, maar SPSS loopt te zeuren dat er minder dan drie groepen zijn, terwijl die er wel zijn.
Alle soorten groepen goed ingesteld? (scale etc.)
  maandag 9 juli 2012 @ 23:14:01 #296
219590 oompaloompa
doompadeedee
pi_113992864
quote:
0s.gif Op maandag 9 juli 2012 22:56 schreef VacaLoca het volgende:
Iemand nog die mij kan vertellen (zie eerdere posts) hoe je best kan beoordelen wanneer een normal plot te afwijkend? Kan je het bijvoorbeeld ook in waardes uitdrukken en dat er ergens theorieën bestaan over vanaf welke waarden het ene geld en wanneer het ander?
Er zijn standaardafwijkingen voor skewness & kurtosis (kun je in descriptives vinden). Over het algemeen zolang de skewness / kurtosis niet sig afwijkt (meand +/- 1.96*sd omvat 0) is het goed.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_113992986
quote:
0s.gif Op maandag 9 juli 2012 23:11 schreef oompaloompa het volgende:

[..]

manova = multivariate
post-hoc is een contrast ;)

Maar wel fijn dat we het met elkaar eens zijn :D
Posthoc gebruik je meestal achteraf (als je geen richting hebt voor je hypothese). Een contrast gebruik je meestal vooraf (= gepland) als je wel een richting hebt voor je hypothese.

Uiteraard ;)
  maandag 9 juli 2012 @ 23:16:55 #298
231574 automatic_
muppetinnetje.
pi_113993061
quote:
1s.gif Op maandag 9 juli 2012 23:13 schreef Operc het volgende:

[..]

Alle soorten groepen goed ingesteld? (scale etc.)
Ja, volgens mij wel.

Ik draai nu dit:

GLM LICHnw EMOnw SOCnw SCHnw BY LFTGROEP
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/PRINT=DESCRIPTIVE ETASQ HOMOGENEITY
/CRITERIA=ALPHA(.05)
/DESIGN= LFTGROEP.

En dan pakt hij allen 5-7 jaar & die andere twee niet.
"It's good to be open-minded, but not so open that your brains fall out."
  maandag 9 juli 2012 @ 23:17:22 #299
219590 oompaloompa
doompadeedee
pi_113993092
quote:
0s.gif Op maandag 9 juli 2012 23:15 schreef Sandertje23 het volgende:

[..]

Posthoc gebruik je meestal achteraf (als je geen richting hebt voor je hypothese). Een contrast gebruik je meestal vooraf (= gepland) als je wel een richting hebt voor je hypothese.

Uiteraard ;)
SPSS gebruikt rare namen. Zowel van te voren (zonder correctie) als achteraf (post-hoc) zijn het allemaal contrasten. Waarom spss het ene afkort tot post-hoc en het andere de koepelterm "contrast" geeft is mij ook totaal onduidelijk :P
(maar spss doet wel meerdere vreemde dingen)

@autom, je kunt me als je wilt even de data sturen..
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_113994621
quote:
0s.gif Op maandag 9 juli 2012 23:14 schreef oompaloompa het volgende:

[..]

Er zijn standaardafwijkingen voor skewness & kurtosis (kun je in descriptives vinden). Over het algemeen zolang de skewness / kurtosis niet sig afwijkt (meand +/- 1.96*sd omvat 0) is het goed.
Thanks, stukje 'meand +/- 1.96*sd omvat 0' is helaas nog even onbekende taal voor mij. Ik heb met studie geen statistiek gehad, en probeer nu zelf snel te leren zo goed en zo kwaad als het kan. Heb even uitdraai gemaakt.



Nu had ik daarover al wel gelezen in SPSS Survival Guide:

While there are tests that you can use to evaluate skewness and kurtosis values, these are too sensitive with large samples. Tabachnick and Fidell (2007, p. 81) recommend inspecting the shape of the distribution (e.g. using a histogram).

Nu zien zij 200+ als een large sample las ik elders in het boek... terwijl ik n=126 heb

Verderop in het boek adviseren ze iig een Normal Q-Q plot als alternatief.

quote:
he actual shape of the distribution for each group can be seen in the Histograms. In this example, scores appear to be reasonably normally distributed. This is also supported by an inspection of the normal probability plots (labelled Normal Q-Q Plot). In this plot, the observed value for each score is plotted against the expected value from the normal distribution. A reasonably straight line suggests a normal distribution.
Maar wanneer zouden mensen ervaren met statistiek het nog 'reasonable' noemen is dan mijn vraag betreffende bv de Q-Q plot die ik liet zien.

Iemand anders een goede website voor basis tot gemiddeld niveau analyses voor surveys? Werken met likert schalen, multiple choise etc. Ik heb alle data-invoer goed zover ik weet, maar niet overzichtelijk wélke analyses het meest relevant zijn voor een dergelijke enquete. Heb helaas zeer beperkt de tijd me goed in te lezen.
  maandag 9 juli 2012 @ 23:44:41 #301
219590 oompaloompa
doompadeedee
pi_113994631
Probleem ontdekt en omdat andere mensen hier misschien ook tegenaan kunnen lopen post ik het hier maar.

Als je een multivariate / manova doet, vallen in principe cases met 1 of meer missing values gewoon af. Omdat je dataset zo veel missings heeft, houdt je uiteindelijk minder dan de helft over. Wat nog cru-er is, is dat van 1 conditie je helemaal niemand meer overhoudt. Daarom kun je geen contrasten meer doen.

Nu zijn er 2 opties:
1 je imputeert de missings.
2 je doet allemaal losse univariates
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
abonnement Unibet Coolblue
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')