Het SPSS topic #4 - Syntaxen verder. | School, Studie en Onderwijs (SES)

Moderator / Redactie Sport maandag 21 november 2011 @ 15:35:20 #1

borisz

Keurmeester

Hier verder met Deel 4.

Links:
http://www.spsslog.com/
http://www.spss.com/nl/

Laatste berichten:
[

quote:
Op maandag 21 november 2011 15:29 schreef borisz het volgende:
Ik heb een lijstje kosten en een lijstje contact-uren. Iemand hoe ik daar via spss een % functie van kan maken? Dus bij het toenemen van 10% contact uren hoeveel stijgen de kosten dan? Dat laatste gaat natuurlijk via een regressie, maar hoe moet ik die data veranderen?

quote:
Op maandag 21 november 2011 15:31 schreef oompaloompa het volgende:

[..]

Dat is een hele vreemde vraag.

Stel een contactuur kost 50 euro

bij 20 contacturen is een stijging van 10% dus 100 euro
bij 50 contacturen is een stijging van 10% dan 250 euro
Dus kun je wel spreken van een bedrag per 10%?

Of begrijp ik je bedoeling niet helemaal?

De vraag is

quote:
is it possible to come up with a model that predicts percentual changes in costs as a result in changes in volume?

Daarbij bestaat mijn data uit 48 punten van Costs & Contract uren

winnaar wielerprono 2007 :) Last.FM

maandag 21 november 2011 @ 16:08:07 #2

oompaloompa

doompadeedee

quote:
Op maandag 21 november 2011 15:34 schreef borisz het volgende:
De vraag is

[..]

Daarbij bestaat mijn data uit 48 punten van Costs & Contract uren

pfoe, ik ben niet helemaal helder vandaag dus ik kan het fout hebben, maar het lijkt mij onmogelijk zo'n model te maken als het verband lineair is, ik denk dat dat alleen mogelijk is als je een kwadratisch verband hebt.

(ik ga er van uit dat de waardes in costs absoluut zijn en dat hetzelfde geldt voor contract).

Kun je anders even een plotje maken om het verband (linear / kwadratisch) te zien?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 21 november 2011 @ 16:10:47 #3

speknek

Another day another slay

Denk je niet te moeilijk en vraagt ie niet gewoon om een correlatie?

They told me all of my cages were mental, so I got wasted like all my potential.

maandag 21 november 2011 @ 16:11:32 #4

oompaloompa

doompadeedee

quote:
Op maandag 21 november 2011 16:10 schreef speknek het volgende:
Denk je niet te moeilijk en vraagt ie niet gewoon om een correlatie?

Dat is wat ik eerst dacht maar dan is het echt de meest ingewikkelde slechte vraagstelling ooit

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 21 november 2011 @ 16:14:36 #5

speknek

Another day another slay

Ik lees het als dat je van je ruwe kostendata (voorheen en nu) een percentage moet maken (nu gedeeld door voorheen), en dan een regressiemodel moet laten berekenen.

They told me all of my cages were mental, so I got wasted like all my potential.

maandag 21 november 2011 @ 16:18:50 #6

oompaloompa

doompadeedee

quote:
Op maandag 21 november 2011 16:14 schreef speknek het volgende:
Ik lees het als dat je van je ruwe kostendata (voorheen en nu) een percentage moet maken (nu gedeeld door voorheen), en dan een regressiemodel moet laten berekenen.

Ik raak alleen maar verwarder

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator / Redactie Sport maandag 21 november 2011 @ 16:22:29 #7

borisz

Keurmeester

Komt omdat de docent op BB een opmerking plaatste als van

quote:
c) (againn a regression, but now with %change variables of costs and hours).

Vandaar mijn opmerking. Of ik denk te lastig

. Maar goed de opdracht.

Assignment 5: Consulting Services plc
Consulting Services is an advisory firm for small and medium sized companies in Ireland. It
is a small company itself, employing around 12 consultants. The market is volatile and oscilates between a low 1,026 and a high 1,663 monthly consulting hours sold. A monthly overview of consulting hours sold and corresponding Consulting Services’ operational costs is iven in the following table.

Datatabel met
Maand, kosten, uren

en dan zijn dit de vragen

Required:
a. Analyse Consulting Services’ direct cost function. Please pay special attention to the error
terms. What do the different error term displays suggest?
b. Try to improve Consulting Services’ cost function.
c. Is it possible to come up with a model that predicts percentual changes in costs as a result
of changes in volume? (this is the cost-elasticity of contract hours).
d. What would you recommend Consulting Services management to do, based on your regression analyses found under b and c?

A. is een standaard regressie.. B geneuzel en dan vraag C... Ik kom er niet uit.

winnaar wielerprono 2007 :) Last.FM

maandag 21 november 2011 @ 16:28:02 #8

oompaloompa

doompadeedee

Dat klinkt alsof het best een kwadratische functie zou kunnen zijn vooral vanwege die vraag over de error-terms

Als je wilt kun je me de data sturen en dan kijk ik ff

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator / Redactie Sport maandag 21 november 2011 @ 16:34:08 #9

borisz

Keurmeester

Data zit in je PM

Studiegenoten komen er ook niet uit

. Maar dat zit hem er wrs in dat die vraag niet helder gesteld is, want we hebben allemaal uitgebreid statistiek + Methoden & technieken gehad.

winnaar wielerprono 2007 :) Last.FM

maandag 21 november 2011 @ 16:42:53 #10

oompaloompa

doompadeedee

quote:
Op maandag 21 november 2011 16:34 schreef borisz het volgende:
Data zit in je PM

Studiegenoten komen er ook niet uit . Maar dat zit hem er wrs in dat die vraag niet helder gesteld is, want we hebben allemaal uitgebreid statistiek + Methoden & technieken gehad.

denk het ook kijkend naar onze verschillende interpretaties hier

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 21 november 2011 @ 16:51:06 #11

Felagund

quote:
Op maandag 21 november 2011 16:14 schreef speknek het volgende:
Ik lees het als dat je van je ruwe kostendata (voorheen en nu) een percentage moet maken (nu gedeeld door voorheen), en dan een regressiemodel moet laten berekenen.

Zoiets ja, dat je tussen iedere twee maanden de toename in kosten en uren moet bereken en daarvan een regressie moet maken. Zo intrepreteer ik de vraag ook als ik hem helemaal lees.

You don't need a weatherman to know which way the wind blows.
---------------------------------------------------------------------------------------------------------------------------------------------
Album top 100 2024

maandag 21 november 2011 @ 16:57:44 #12

oompaloompa

doompadeedee

zo op het eerste gezicht lijkt het idd een deels kwadratische functie te zijn. Hoe meer de uren omhoog gaan, hoe meer de prijs per uur is, dus de prijs per uur is afhankelijk van het totaal aantal uren. Dan zou het mogelijk moeten zijn...

dit is de prijs per uur gesorteerd op oplopende totaal-uren

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 21 november 2011 @ 17:02:54 #13

oompaloompa

doompadeedee

Dus bij a doe je een standaard ineaire regressie, daar zouje moeten vinden dat de error hoger wordt naarmatede uren hoger worden.

bij b maak je een nieuwe functie die deels kwadratisch is:
intercept + b*kosten1 + b^2kosten2

dit kun je dan herformuleren bij c

en bij d raad je aan of de uren laag te houden of op een andere manier die extra toename in kosten tegen te gaan o.i.d.

maar dat is mijn interpretatie van de opdracht....

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator / Redactie Sport maandag 21 november 2011 @ 17:13:12 #14

borisz

Keurmeester

Morgen weten we de juiste interpretatie is

.
Vanavond even weer even verder

winnaar wielerprono 2007 :) Last.FM

maandag 21 november 2011 @ 23:56:38 #15

RobertoCarlos

Zit je nou naar me te loeruh?

Ik heb 2 vragen over de T-toets (SPSS 19):

- hoe doe je het nou met de Grouping variable van 2 onafhankelijke samples van 2 variabelen die allebei meer dan 2 groepen hebben? Hoe definieer ik dit dan in Define groups?

- hoe maak ik een grafiek van een betrouwbaarheidsinterval (CI)?

Ik heb beide vragen al tevergeefs opgezocht. Weet iemand dit?

Cookin’ like a chef I’m a 5 star Michelin

dinsdag 22 november 2011 @ 00:25:13 #16

oompaloompa

doompadeedee

quote:
Op maandag 21 november 2011 23:56 schreef RobertoCarlos het volgende:
Ik heb 2 vragen over de T-toets (SPSS 19):

- hoe doe je het nou met de Grouping variable van 2 onafhankelijke samples van 2 variabelen die allebei meer dan 2 groepen hebben? Hoe definieer ik dit dan in Define groups?

- hoe maak ik een grafiek van een betrouwbaarheidsinterval (CI)?

Ik heb beide vragen al tevergeefs opgezocht. Weet iemand dit?

Ik begrijp niet goed wat je bij vraag 1 bedoelt

vraag 2 is volgens mij het volgende. Stel je vind een mean van 20 met een CI van 18-22 (kun je opvragen in spss of gewoon 1.96*std) volgens mij kun je dan gewoon een normaalkromme tekenen met 20 in het midden en 18 en 22 bij de twee uiteindes van 2.5%

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 22 november 2011 @ 08:26:25 #17

RobertoCarlos

Zit je nou naar me te loeruh?

quote:
Op dinsdag 22 november 2011 00:25 schreef oompaloompa het volgende:

[..]

Ik begrijp niet goed wat je bij vraag 1 bedoelt

vraag 2 is volgens mij het volgende. Stel je vind een mean van 20 met een CI van 18-22 (kun je opvragen in spss of gewoon 1.96*std) volgens mij kun je dan gewoon een normaalkromme tekenen met 20 in het midden en 18 en 22 bij de twee uiteindes van 2.5%

ad vraag 2: Misschien is het wel zo simpel idd om een normaalverdeling te tekenen, ik dacht dat er misschien een apart functie voor het tekenen van een betrouwbaarheidsinterval was.

En met vraag 1 bedoel ik: stel dat ik voor 2 variabelen een Independent Samples T-test wil doen. Dan moet ik van SPSS verplicht een Grouping variable invoeren. Alleen kan dat niet omdat mijn 2 (interval) variabelen beide uit heel veel values of groups bestaan (dus 'heel erg', 'erg', 'enigzins', etc) Dat kan ik dus niet allemaal definieren via Define Groups in die Grouping Variable.
Hoe los ik dit op of heb ik de verkeerde test te pakken?

Cookin’ like a chef I’m a 5 star Michelin

dinsdag 22 november 2011 @ 09:14:23 #18

oompaloompa

doompadeedee

quote:
Op dinsdag 22 november 2011 08:26 schreef RobertoCarlos het volgende:

[..]

ad vraag 2: Misschien is het wel zo simpel idd om een normaalverdeling te tekenen, ik dacht dat er misschien een apart functie voor het tekenen van een betrouwbaarheidsinterval was.

En met vraag 1 bedoel ik: stel dat ik voor 2 variabelen een Independent Samples T-test wil doen. Dan moet ik van SPSS verplicht een Grouping variable invoeren. Alleen kan dat niet omdat mijn 2 (interval) variabelen beide uit heel veel values of groups bestaan (dus 'heel erg', 'erg', 'enigzins', etc) Dat kan ik dus niet allemaal definieren via Define Groups in die Grouping Variable.
Hoe los ik dit op of heb ik de verkeerde test te pakken?

De grouping variable is wat je condities zijn

Het klinkt alsof je daar een afhankelijke in hebt gevuld.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 22 november 2011 @ 12:10:43 #19

JohnSpek

Hoi allemaal,
Ik gebruik SPSS
Ik heb een dataset met 3 vragen over directory updating, 3 vragen over motivatie om informatie te zoeken.
Dus ik heb een construct van beide variabelen gemaakt, cronbach alpha was 0,895 dus dat is "goed".
Toen lineaire regressie gedaan, daarna de residuen geanalyseerd met behulp van een scatterplot en of het normaal verdeeld was.

Normaal verdeeld - klopt
homogene variantie - klopt ook. Spreiding wordt niet kleiner of groter.
Lineair verband - Klopt niet?
Volgens mij is het een kwadratisch verband, aangezien negatieve residuen voorkomen bij lagere waarden van de afhankelijke variabel en positieve residuen bij hogere waarde.
Klopt dit wat ik nu zeg?
Moet ik dus een kwadratische regressie doen? (hoe?).

[ Bericht 2% gewijzigd door JohnSpek op 22-11-2011 12:19:36 ]

dinsdag 22 november 2011 @ 12:29:59 #20

oompaloompa

doompadeedee

quote:
Op dinsdag 22 november 2011 12:10 schreef JohnSpek het volgende:
Hoi allemaal,
Ik gebruik SPSS
Ik heb een dataset met 3 vragen over directory updating, 3 vragen over motivatie om informatie te zoeken.
Dus ik heb een construct van beide variabelen gemaakt, cronbach alpha was 0,895 dus dat is "goed".
Toen lineaire regressie gedaan, daarna de residuen geanalyseerd met behulp van een scatterplot en of het normaal verdeeld was.

Normaal verdeeld - klopt
homogene variantie - klopt ook. Spreiding wordt niet kleiner of groter.
Lineair verband - Klopt niet?
Volgens mij is het een kwadratisch verband, aangezien negatieve residuen voorkomen bij lagere waarden van de afhankelijke variabel en positieve residuen bij hogere waarde.
Klopt dit wat ik nu zeg?
Moet ik dus een kwadratische regressie doen? (hoe?).

[ afbeelding ]

Volgens mij klopt alles wat je zegt.

Een manier om een kwadratische te doen is door zelf een nieuwe variabele aan te maken die het kwadraat is van de oude en deze dan in je regressie te gebruiken

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 22 november 2011 @ 13:39:49 #21

JohnSpek

quote:
Op dinsdag 22 november 2011 12:29 schreef oompaloompa het volgende:

[..]

Volgens mij klopt alles wat je zegt.

Een manier om een kwadratische te doen is door zelf een nieuwe variabele aan te maken die het kwadraat is van de oude en deze dan in je regressie te gebruiken

Top, dan ga ik aan de slag

dinsdag 22 november 2011 @ 15:13:38 #22

davako

-GATGCTGTTGAA-

Ik moet voor een opdracht een statistische test uitvoeren op verkregen data of van een eigen onderzoek. Zelf heb ik gekozen om de data te gebruiken van een eigen onderzoek, alleen ik loop een beetje vast welke toets ik moet gebruiken.

Mijn research vraag is:
In a sub-arctic peat land soil, what are the consequences of increased temperature and substrate addition on the microbial community structure, and how does this change through time?

Dus ik heb grond samples waarbij ik 3 verschillende substraten heb toegevoegd(Cellen, planten en de controle) en ik heb de grond verwarmd bij 9 en 14 graden.

Ik heb voor het gekozen om vier microbiële groepen te testen in percentage ten opzichte van de totale aanwezige bacteriën.
Mijn vraag is dus welke statistische toets zou ik uitvoeren? Ik zat zelf te denken aan een repeated measure ANOVA?
Of iemand anders een beter idee

?

All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.

dinsdag 22 november 2011 @ 17:15:09 #23

JohnSpek

Nog een vraagje dan maar

Ik heb drie hypotheses
A heeft positieve invloed op Y..etc

H1: A -> Y
H2: B -> Y
H3: C -> Y

Is het nu dus aan te raden om dit in één model te doen bij regressie? (dus onafhankelijke variabelen: A, B, C en afhankelijke: Y )

Als ik A -> Y en B -> Y en C -> Y apart regressie test dan zijn ze allemaal significant.
Als ik A, B , C - > Y in 1 model doe, dan zijn B en C niet meer significant (en ook echt totaal niet significant meer, p = 0.67 bij B -> Y )

Wanneer wel, wanneer niet?

dinsdag 22 november 2011 @ 18:20:26 #24

oompaloompa

doompadeedee

quote:
Op dinsdag 22 november 2011 17:15 schreef JohnSpek het volgende:
Nog een vraagje dan maar

Ik heb drie hypotheses
A heeft positieve invloed op Y..etc

H1: A -> Y
H2: B -> Y
H3: C -> Y

Is het nu dus aan te raden om dit in één model te doen bij regressie? (dus onafhankelijke variabelen: A, B, C en afhankelijke: Y )

Als ik A -> Y en B -> Y en C -> Y apart regressie test dan zijn ze allemaal significant.
Als ik A, B , C - > Y in 1 model doe, dan zijn B en C niet meer significant (en ook echt totaal niet significant meer, p = 0.67 bij B -> Y )

Wanneer wel, wanneer niet?

Waarschijnlijk hangen je variabelen samen.

Stel b.v. dat je het effect wilt testen van:

in de buurt bij water zijn
warm weer
weinig kleren

op het aantal muggenbulten.

Los zijn ze allemaal significant maar wanneer je ze samen neemt opeens niet meer. Dit komt doordat mensen bij warm weer vaker bij water zijn en minder kleren aan hebben. Het probleem is dat je door die samenhang niet meer goed kunt bepalen welk van de drie variabelen nou uiteindelijk echt de oorzaak is.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 22 november 2011 @ 18:21:49 #25

oompaloompa

doompadeedee

quote:
Op dinsdag 22 november 2011 15:13 schreef davako het volgende:
Ik moet voor een opdracht een statistische test uitvoeren op verkregen data of van een eigen onderzoek. Zelf heb ik gekozen om de data te gebruiken van een eigen onderzoek, alleen ik loop een beetje vast welke toets ik moet gebruiken.

Mijn research vraag is:
In a sub-arctic peat land soil, what are the consequences of increased temperature and substrate addition on the microbial community structure, and how does this change through time?

Dus ik heb grond samples waarbij ik 3 verschillende substraten heb toegevoegd(Cellen, planten en de controle) en ik heb de grond verwarmd bij 9 en 14 graden.

Ik heb voor het gekozen om vier microbiële groepen te testen in percentage ten opzichte van de totale aanwezige bacteriën.
Mijn vraag is dus welke statistische toets zou ik uitvoeren? Ik zat zelf te denken aan een repeated measure ANOVA?
Of iemand anders een beter idee ?

dus je hebt een 2(temp)x3(subtraat) between en 4 within (bacterien)?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 22 november 2011 @ 19:56:46 #26

nelisb

Crosspost wie o wie kan mijn vrouw helpen.

SPSS hulp nodig

Ik ben bezig met mijn afstudeeronderzoek en ben in de analyse fase belandt.
Ik heb een variabele: aantal werkzame personen bij een organisatie en die heb ik gecategoriseerd in:
2-5
5-10
10-15
15-20 werkzame personen

Ik heb een representativiteitstoets uitgevoerd mbv de chi-kwadraat en daaruit blijkt dat de eerste twee categorieën (2-5 en 5-10) gewaardeerd moeten worden met respectievelijk 0,87 en 1,32.
Nu moet ik dit in gaan voeren in SPSS gaan invoeren, zodat deze waardering helemaal wordt doorgevoerd.
Nu snap ik niet hoe ik dit moet doen. Ik heb boeken voor me liggen waar het wellicht in uitgelegd staat, maar dan nog lukt het mij niet. Ik heb SPSS voor Mac.

Kan iemand mij hier door heen helpen, aangezien ik nu echt helemaal vast zit.

Ik hoop het!
Al vast bedankt voor de moeite.

dinsdag 22 november 2011 @ 20:07:37 #27

JohnSpek

quote:
Op dinsdag 22 november 2011 18:20 schreef oompaloompa het volgende:

[..]

Waarschijnlijk hangen je variabelen samen.

Stel b.v. dat je het effect wilt testen van:

in de buurt bij water zijn
warm weer
weinig kleren

op het aantal muggenbulten.

Los zijn ze allemaal significant maar wanneer je ze samen neemt opeens niet meer. Dit komt doordat mensen bij warm weer vaker bij water zijn en minder kleren aan hebben. Het probleem is dat je door die samenhang niet meer goed kunt bepalen welk van de drie variabelen nou uiteindelijk echt de oorzaak is.

Ja het is eigenlijk zo

Ik heb een systeem(Q) die bestaat uit drie de processen(A, B en C).
Nu zei de docent van "Dit is leuk om te onderzoeken, maar spits het uit per proces, want dat is wat specifieker".

Eerst had ik dus Q -> Y

Nu heb ik dus:
A -> Y
B -> Y
C -> Y

Maar hoe kan ik hieruit dan toch nog conclusies trekken? Waarom is A -> Y bijvoorbeeld wel significant en B en C niet in het "totaal model" ? Hoe moet ik de uitkomst interpreteren is eigenlijk mijn vraag dus

dinsdag 22 november 2011 @ 20:10:06 #28

oompaloompa

doompadeedee

quote:
Op dinsdag 22 november 2011 20:07 schreef JohnSpek het volgende:

[..]

Ja het is eigenlijk zo

Ik heb drie processen(A, B, C) die samen één systeem(Q) vormen.
Nu zei de docent van "Dit is leuk om te onderzoeken, maar spits het uit per proces, want dat is wat specifieker".

Eerst had ik dus Q -> Y

Nu heb ik dus:
A -> Y
B -> Y
C -> Y

Maar hoe kan ik hieruit dan toch nog conclusies trekken? Waarom is A -> Y bijvoorbeeld wel significant en B en C niet in het "totaal model" ? Hoe moet ik de uitkomst interpreteren is eigenlijk mijn vraag dus

nou ja, mijn antwoord is dus eigenlijk dat dat niet echt kan omdat je onafhankelijken gecorreleerd zijn.

Je kunt een aantal zaken doen die het een beetje fixen, dus een 3staps model toetsen en elke variabele los toevoegen maar dan nog kun je geen duidelijke conclusies trekken...

(voor zover ik weet dan heh, maar ben hier redelijk zeker over)

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 22 november 2011 @ 20:15:26 #29

JohnSpek

quote:
Op dinsdag 22 november 2011 20:10 schreef oompaloompa het volgende:

[..]

nou ja, mijn antwoord is dus eigenlijk dat dat niet echt kan omdat je onafhankelijken gecorreleerd zijn.

Je kunt een aantal zaken doen die het een beetje fixen, dus een 3staps model toetsen en elke variabele los toevoegen maar dan nog kun je geen duidelijke conclusies trekken...

(voor zover ik weet dan heh, maar ben hier redelijk zeker over)

Is er een website met meer uitleg over het drie staps model? Ik ben een methoden en technieken leek in principe

De correlatie is inderdaad 0.6x tussen de variabelen, aardig hoog dus.
De VIF(maatstaf van multicollearity) is echter rond de 1.5, ik dacht dat dat juist zegt dat het wel goed zit met de onafhankelijkheid tussen de variabelen?

[ Bericht 5% gewijzigd door JohnSpek op 22-11-2011 20:25:12 ]

dinsdag 22 november 2011 @ 20:30:01 #30

RobertoCarlos

Zit je nou naar me te loeruh?

quote:
Op dinsdag 22 november 2011 09:14 schreef oompaloompa het volgende:

[..]

De grouping variable is wat je condities zijn Het klinkt alsof je daar een afhankelijke in hebt gevuld.

Dat snap ik, alleen heb ik dus geen condities...

Cookin’ like a chef I’m a 5 star Michelin

dinsdag 22 november 2011 @ 20:43:08 #31

davako

-GATGCTGTTGAA-

quote:
Op dinsdag 22 november 2011 18:21 schreef oompaloompa het volgende:

[..]

dus je hebt een 2(temp)x3(subtraat) between en 4 within (bacterien)?

Ja. Dat is dan toch een repeated measure ANOVA. Of zou je een andere adviseren?

All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.

dinsdag 22 november 2011 @ 22:05:37 #32

oompaloompa

doompadeedee

quote:
Op dinsdag 22 november 2011 20:15 schreef JohnSpek het volgende:

[..]

Is er een website met meer uitleg over het drie staps model? Ik ben een methoden en technieken leek in principe

De correlatie is inderdaad 0.6x tussen de variabelen, aardig hoog dus.
De VIF(maatstaf van multicollearity) is echter rond de 1.5, ik dacht dat dat juist zegt dat het wel goed zit met de onafhankelijkheid tussen de variabelen?

Je kunt bij een regressie dingen per analyse toevoegen, dan kijkt spss bij elke toevoeging of dit significant meer variantie verklaart, maar in princiepe als je geen theoretisch kader hebt waarom de ene beter zou moeten werken / vooraf gaan aan de andere kun je er geen uitspraak over doen.

Ik weet niet wat 1.5 betekent maar met een correlatie van 0.6 kan ik me niet voorstellen dat er geen problemen zijn dat is echt een hele hoge correlatie.

quote:
Op dinsdag 22 november 2011 20:30 schreef RobertoCarlos het volgende:

[..]

Dat snap ik, alleen heb ik dus geen condities...

Maar een t-test is een test tussen condities...

quote:
Op dinsdag 22 november 2011 20:43 schreef davako het volgende:

[..]

Ja. Dat is dan toch een repeated measure ANOVA. Of zou je een andere adviseren?

yeap

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 23 november 2011 @ 07:21:27 #33

JohnSpek

quote:
Op dinsdag 22 november 2011 12:29 schreef oompaloompa het volgende:

[..]

Volgens mij klopt alles wat je zegt.

Een manier om een kwadratische te doen is door zelf een nieuwe variabele aan te maken die het kwadraat is van de oude en deze dan in je regressie te gebruiken

Ik heb van mijn variabel Y de variabel S gemaakt (Door compute variable en dan S = Y*Y)

Nu heb ik S als afhankelijke variabel en A, B en C als onafhankelijke variabelen in de lineaire regressie gedaan.
Nu heb ik nog steeds hetzelfde patroon (iets anders dat wel, maar nog steeds een y = x lijn) in mijn scatterplot S vs residuen.
Weet jij hoe dat komt?
Het is wel zo dat de significanties ook anders zijn. Nu is variabel A opeens niet meer significant en variabel B wel!

woensdag 23 november 2011 @ 08:15:13 #34

oompaloompa

doompadeedee

quote:
Op woensdag 23 november 2011 07:21 schreef JohnSpek het volgende:

[..]

Ik heb van mijn variabel Y de variabel S gemaakt (Door compute variable en dan S = Y*Y)

Nu heb ik S als afhankelijke variabel en A, B en C als onafhankelijke variabelen in de lineaire regressie gedaan.
Nu heb ik nog steeds hetzelfde patroon (iets anders dat wel, maar nog steeds een y = x lijn) in mijn scatterplot S vs residuen.
Weet jij hoe dat komt?
Het is wel zo dat de significanties ook anders zijn. Nu is variabel A opeens niet meer significant en variabel B wel!

Ik bedoelde eigenlijk de onafhankelijke.

Even dit los zien van het andere probleem. Stel je hebt alleen maar A --> Y en het verband is kwadratisch. Wat je dan doet is een nieuwe term aanmaken a^2. Vervolgens doe je een regressie van zowel A als A^2 op Y. Dan kun je het lineaire en het kwadratische effect van A op Y testen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 23 november 2011 @ 12:48:36 #35

JohnSpek

quote:
Op woensdag 23 november 2011 08:15 schreef oompaloompa het volgende:

[..]

Ik bedoelde eigenlijk de onafhankelijke.

Even dit los zien van het andere probleem. Stel je hebt alleen maar A --> Y en het verband is kwadratisch. Wat je dan doet is een nieuwe term aanmaken a^2. Vervolgens doe je een regressie van zowel A als A^2 op Y. Dan kun je het lineaire en het kwadratische effect van A op Y testen.

Waarom zou je eigenlijk ook de lineaire term nemen? Aangezien de lineaire term alleen al zorgt voor een te hoge schattingslijn bij lage waarde van y (Aangezien de residuen negatief zijn bij lage waardes van y) zou een toevoeging van zowel het lineaire als (een positieve) kwadratische coefficient alleen maar zorgen voor nog een hogere schattingslijn?
(en als er een negatieve kwadratisch term zou zijn zou het begin beter kloppen maar gaat het einde helemaal raar omdat je dan een soort berg parabool krijgt terwijl de residuen bij een lineaire schattingslijn er al boven liggen!).

edit:
Als ik enkel de kwadratische"termen" toevoeg dan zit er geen patroon meer in mijn residuen (gewoon een mooi wolkje).
Als ik de kwadratische en de lineaire termen toevoeg, dan zit er weer een patroon in mijn residuen.
Betekent dit dat ik dus inderdaad enkel de kwadratische term moet toevoegen?

[ Bericht 3% gewijzigd door JohnSpek op 23-11-2011 13:03:39 ]

woensdag 23 november 2011 @ 20:11:33 #36

JohnSpek

Ik bleek te vroeg te hebben gejuigd

bij beide kwadratische regressies (met en zonder lineaire termen) zit er nog steeds een y = x lijn in de scatterplot.

woensdag 23 november 2011 @ 20:34:30 #37

oompaloompa

doompadeedee

quote:
Op woensdag 23 november 2011 12:48 schreef JohnSpek het volgende:

[..]

Waarom zou je eigenlijk ook de lineaire term nemen? Aangezien de lineaire term alleen al zorgt voor een te hoge schattingslijn bij lage waarde van y (Aangezien de residuen negatief zijn bij lage waardes van y) zou een toevoeging van zowel het lineaire als (een positieve) kwadratische coefficient alleen maar zorgen voor nog een hogere schattingslijn?
(en als er een negatieve kwadratisch term zou zijn zou het begin beter kloppen maar gaat het einde helemaal raar omdat je dan een soort berg parabool krijgt terwijl de residuen bij een lineaire schattingslijn er al boven liggen!).

edit:
Als ik enkel de kwadratische"termen" toevoeg dan zit er geen patroon meer in mijn residuen (gewoon een mooi wolkje).
Als ik de kwadratische en de lineaire termen toevoeg, dan zit er weer een patroon in mijn residuen.
Betekent dit dat ik dus inderdaad enkel de kwadratische term moet toevoegen?

Je voegt ze beiden toe omdat het een combinatie van beide kan zijn, bv: a + bx + cx^2
Een regressie analyse kijkt wat het beste "past" dus als het puur alleen kwadratisch zou zijn zou je een niet significante b-waarde er uit krijgen.

quote:
Op woensdag 23 november 2011 20:11 schreef JohnSpek het volgende:
Ik bleek te vroeg te hebben gejuigd bij beide kwadratische regressies (met en zonder lineaire termen) zit er nog steeds een y = x lijn in de scatterplot.

vreemd. Stuur anders eens je spss-file en je precieze bedoeling dan kijk ik er naar wanneer ik tijd over heb.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 23 november 2011 @ 20:45:01 #38

JohnSpek

quote:
Op woensdag 23 november 2011 20:34 schreef oompaloompa het volgende:

[..]

Je voegt ze beiden toe omdat het een combinatie van beide kan zijn, bv: a + bx + cx^2
Een regressie analyse kijkt wat het beste "past" dus als het puur alleen kwadratisch zou zijn zou je een niet significante b-waarde er uit krijgen.

[..]

vreemd. Stuur anders eens je spss-file en je precieze bedoeling dan kijk ik er naar wanneer ik tijd over heb.

Dat zou echt super zijn! Ik pm je de data set.

donderdag 24 november 2011 @ 19:12:09 #39

davako

-GATGCTGTTGAA-

Ik heb vier keer een repeated measure toets welke ik moet uitvoeren. Data is als volgt opgedeeld:

Eerste waarde in mijn dataset:
Temperatuur; dit is een nominale waarde welke temp 1 of 2 kan hebben

Tweede waarde in mijn dataset
Toevoeging
Dit is wederom een nominale waarde welke 3 keuzes kunnen hebben.

derde waarde in dataset
Waarde op tijdstip 1

vierde waarde in dataset
Waarde op tijdstip 2

Ik gebruik dus een repeated measure ANOVA om een verschil te meten tussen de twee tijdstippen. Per test meet ik hoeveel een bepaalde bacterie voorkomt(staan in de derde en vierde column).
Bij twee van mijn bacterien gaat dit goed, alleen bij andere twee soorten gaat dit niet goed. Bij de twee laatste soorten zegt mijn Levene's test dat de data niet homogenous verdeelt is.

Ook mag ik niet sphericity aannemen.

Ik heb de data al proberen te transformeren maar dit zorgt er niet voor dat de data homogeen wordt.

De data punten zijn waarden van ongeveer 0.100 tot 1.999

Misschien kan iemand mij helpen of wat adviseren.

All I do, is sit down at the typewriter, and start hittin' the keys. Getting them in the right order, that's the trick. That's the trick.

donderdag 24 november 2011 @ 21:30:47 #40

Frith

fictief en almachtig

quote:
Op dinsdag 22 november 2011 19:56 schreef nelisb het volgende:
Crosspost wie o wie kan mijn vrouw helpen.

SPSS hulp nodig

Ik ben bezig met mijn afstudeeronderzoek en ben in de analyse fase belandt.
Ik heb een variabele: aantal werkzame personen bij een organisatie en die heb ik gecategoriseerd in:
2-5
5-10
10-15
15-20 werkzame personen

Ik heb een representativiteitstoets uitgevoerd mbv de chi-kwadraat en daaruit blijkt dat de eerste twee categorieën (2-5 en 5-10) gewaardeerd moeten worden met respectievelijk 0,87 en 1,32.
Nu moet ik dit in gaan voeren in SPSS gaan invoeren, zodat deze waardering helemaal wordt doorgevoerd.
Nu snap ik niet hoe ik dit moet doen. Ik heb boeken voor me liggen waar het wellicht in uitgelegd staat, maar dan nog lukt het mij niet. Ik heb SPSS voor Mac.

Kan iemand mij hier door heen helpen, aangezien ik nu echt helemaal vast zit.

Ik hoop het!
Al vast bedankt voor de moeite.

Het eerste wat bij mij binnen schiet is 'weeggewichten', maar ik heb al een tijd niets met statistiek gedaan en het is puur een associatie.

Hoe dan ook zul je de vier categoriën en alle cases daar in vallen op zo'n manier moeten bewerken (hercoderen zal wel niet hoeven, maar dat zou anders wel zo zijn) dat ze daadwerkelijk met elkaar vergeleken kunnen worden. Voor zover ik me zo uit de losse pols kan bedenken, is dat bij gelijkwaardige categorieën (dus geen verschillen tussen gebruikte variabelen) een weeggewicht, om zodoende de steekproef gelijk te stellen aan de verdeling in de populatie.

Pin me daar niet op vast, maar dit kun je heel snel opzoeken in je literatuur in ieder geval.
Volgens mij is het ook zo dat je dit alleen bij bepaalde toetsen hoeft te doen en niet per se bij alle soort toetsen.

donderdag 24 november 2011 @ 22:00:02 #41

oompaloompa

doompadeedee

quote:
Op donderdag 24 november 2011 19:12 schreef davako het volgende:
Ik heb vier keer een repeated measure toets welke ik moet uitvoeren. Data is als volgt opgedeeld:

Eerste waarde in mijn dataset:
Temperatuur; dit is een nominale waarde welke temp 1 of 2 kan hebben

Tweede waarde in mijn dataset
Toevoeging
Dit is wederom een nominale waarde welke 3 keuzes kunnen hebben.

derde waarde in dataset
Waarde op tijdstip 1

vierde waarde in dataset
Waarde op tijdstip 2

Ik gebruik dus een repeated measure ANOVA om een verschil te meten tussen de twee tijdstippen. Per test meet ik hoeveel een bepaalde bacterie voorkomt(staan in de derde en vierde column).
Bij twee van mijn bacterien gaat dit goed, alleen bij andere twee soorten gaat dit niet goed. Bij de twee laatste soorten zegt mijn Levene's test dat de data niet homogenous verdeelt is.

Ook mag ik niet sphericity aannemen.

Ik heb de data al proberen te transformeren maar dit zorgt er niet voor dat de data homogeen wordt.

De data punten zijn waarden van ongeveer 0.100 tot 1.999

Misschien kan iemand mij helpen of wat adviseren.

Een non-parametrische toets biedt oplossing, die heeft minder sterke assumpties. Voordat je dat doet zou ik eerst de anova gewoon doen. Als daar niks uit blijkt te komen komt de non-parametrische toets ook niet uit.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator / Redactie Sport zaterdag 26 november 2011 @ 13:16:12 #42

borisz

Keurmeester

quote:
Op maandag 21 november 2011 17:13 schreef borisz het volgende:
Morgen weten we de juiste interpretatie is .
Vanavond even weer even verder

Goede antwoord was dus Eerst de data omgooien naar % en een dummy aanmaken voor de negatieve getallen. Waardoor je ziet dat de kosten er sneller bij gaan, maar minder snel af te halen zijn.

winnaar wielerprono 2007 :) Last.FM

maandag 28 november 2011 @ 19:05:30 #43

JohnSpek

Ik heb een A, B, C -> Y kwadratische regressie gedaan (alle beta's zijn positief) en de docent zei drie dingen wat ik nogal vaag vond:

- Het moet een parabool zijn de schattingslijn.

Dat vond ik raar aangezien de schaal van 1-7 is dus het zou gewoon een lijn moeten zijn die opwaarts sloped (tjah hoe leg je dat uit...).

- De beta's zijn erg laag terwijl de significantie heel hoog is.
De standaard deviatie is relatief aardig hoog in de afhankelijke variabel.
Nu is de beta van proces A behoorlijk laag maar is de p waarde 0,000 dus het is heel erg significant.
Hoe kan het een relatief lage beta zijn terwijl de p waarde toch heel laag is?

- De variabelen correleren heel erg met elkaar, dus mijn conclusie was dat ik er weinig over kon zeggen over de resultaten. Zij vond dat anders en zei dat ik toch per proces (A, B, C) moest zeggen waarom het wel of niet significant was. Wat is jullie mening?

[ Bericht 9% gewijzigd door JohnSpek op 28-11-2011 19:29:05 ]

vrijdag 2 december 2011 @ 14:55:42 #44

Koalatje

Ik denk dat het een erg simpele vraag voor jullie is, maar ik zit in dubio. Ik heb het gevoel dat ik ergens iets fout doe.

Ik heb een enquete gehouden onder 75 personen. Ik wil nu een gaan kijken of 'oudere' personen meer voor optie a kiezen dan voor optie b of c. Bij jongeren net andersom. De mensen konden kiezen bij punt a, b en c uit vijf opties op een ordinale schaal. (Strongly disagree tot Strongly agree).
De leeftijden zijn ook onderverdeeld in vijf delen, namelijk met leeftijdsklassen. (Let's say: 18-32)

Nu wil ik beide zaken met elkaar vergelijken. Dus de leeftijden met optie a, leeftijden met b en als laatste met c. Ik wil gebruik maken van de Chi-squared test, maar daar ga ik volgens mij de mist in?

vrijdag 2 december 2011 @ 16:08:05 #45

Operc

Nr. 40

Je kunt een 5-puntslikertschaal ook zien als continue variabele, al is het dat strikt genomen niet helemaal. Er is wat discussie over, sommigen zeggen van wel, anderen van niet. Als je het als continue schaal ziet, kun je er een 1-factor ANOVA op loslaten per letter (a, b, c)

vrijdag 2 december 2011 @ 16:09:59 #46

crossover

Is dat dan niet een two-way ANOVA?

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

vrijdag 2 december 2011 @ 16:21:00 #47

Operc

Nr. 40

quote:
Op vrijdag 2 december 2011 16:09 schreef crossover het volgende:
Is dat dan niet een two-way ANOVA?

Je gebruikt 1 factor (leeftijd, met 5 niveaus) voor 1 afhankelijke variabele: a/b of c. Het kan ook met andere modellen, waarin je in een keer a, b en c bekijkt, maar ik weet niet hoe groot iemands statistiek kennis is. (en ik durf er zelf ook even geen eenduidige uitspraken over te doen hoe dat ook weer moet.)

vrijdag 2 december 2011 @ 16:38:04 #48

Silverdigger2

2+2=5

Je kan gewoon een chi squared doen. Theoretisch het meest correct:-)

zaterdag 3 december 2011 @ 13:07:45 #49

Koalatje

Okee bedankt. Want ik had na onderzoek in de leerboeken gevonden dat je de Chi-Square test alleen met categorische variabelen mocht doen

zaterdag 3 december 2011 @ 13:21:53 #50

Koalatje

quote:
Op vrijdag 2 december 2011 16:08 schreef Operc het volgende:
Je kunt een 5-puntslikertschaal ook zien als continue variabele, al is het dat strikt genomen niet helemaal. Er is wat discussie over, sommigen zeggen van wel, anderen van niet. Als je het als continue schaal ziet, kun je er een 1-factor ANOVA op loslaten per letter (a, b, c)

Ik ben even hiermee aan de slag gegaan en dit lijkt ook wel een goede oplossing. Vooral icm de Post-Hoc test die je kunt uitvoeren lijkt mij dit de beste methode. Allen bedankt!

zondag 11 december 2011 @ 23:23:24 #51

nolitanolita

Hai,

Even de kluts kwijt met statistiek...

Mijn DV is een count variabele (aantal patenten), dus ik heb gekozen voor een negative binomial regression.

De regression output laat ook negatieve coëfficiënten zien, maar die kan je niet 1 op 1 overnemen. Die moet je eerst EXP(B) (eventueel + constant). Dus er kan nooit een negatief effect zijn.

Maar dat snap ik even niet meer. Ik snap wel dat ik geen negatieve waarden kan hebben, omdat ik zit met de count variabele, die niet negatief kan zijn. Maar een IV kan toch wel een negatieve impact hebben op mijn DV? Hoe moet ik dat zien?

bedankt...

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

Het SPSS topic #4 - Syntaxen verder.

» school, studie en onderwijs

» school, studie en onderwijs