Het SPSS topic #6 - En we SPSS-en nog even door.... | School, Studie en Onderwijs (SES)

zaterdag 1 februari 2014 @ 14:54:09 #251

Operc

Nr. 40

Dus, als ik het goed begrijp zit het als volgt: Je hebt aan de winkeliers gevraagd wat het percentage van mensen is dat terugkomt, introduceert daarna het "gratis terugbrengen" en vraagt vervolgens aan klanten hoe groot ze de kans inschatten dat ze nog een keer terugkomen en je wil die twee cijfers met elkaar vergelijken?

Achteraf kun je er weinig mee, dat begrijp ik, maar het was prettig geweest als je er een iets logischere schaal van had gemaakt, waarbij elke antwoordmogelijkheid een even grote groep procenten weergeeft.
Heb je toevallig de vraag ook gesteld in ja/nee? (dus: ga je nog eens kopen: ja/nee) want deze informatie is lastig te verwerken. Dit komt omdat er een optie 0-20 procent is, waarbij het nogal uitmaakt of iemand echt niet van plan is om nog eens te kopen (0 procent) of de kans niet heel groot is (20 procent).

zaterdag 1 februari 2014 @ 15:15:42 #252

stefanschippers

quote:
Op zaterdag 1 februari 2014 14:54 schreef Operc het volgende:
Dus, als ik het goed begrijp zit het als volgt: Je hebt aan de winkeliers gevraagd wat het percentage van mensen is dat terugkomt, introduceert daarna het "gratis terugbrengen"

Tot zover klopt het idd

quote:
en vraagt vervolgens aan klanten hoe groot ze de kans inschatten dat ze nog een keer terugkomen en je wil die twee cijfers met elkaar vergelijken?

Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.

quote:
Achteraf kun je er weinig mee, dat begrijp ik, maar het was prettig geweest als je er een iets logischere schaal van had gemaakt, waarbij elke antwoordmogelijkheid een even grote groep procenten weergeeft.
Heb je toevallig de vraag ook gesteld in ja/nee? (dus: ga je nog eens kopen: ja/nee) want deze informatie is lastig te verwerken. Dit komt omdat er een optie 0-20 procent is, waarbij het nogal uitmaakt of iemand echt niet van plan is om nog eens te kopen (0 procent) of de kans niet heel groot is (20 procent).

Ik heb dus de klanten niets gevraagd zoals ik zei

het gaat ook er ook niet om dat ze in de toekomst nog van plan zijn terug te keren maar of de winkel op dit moment in het algemeen veel terugkerende klanten heeft of niet.

Het betreft alleen webwinkels, deze kunnen dus aan de hand van statistieken meten hoeveel procent van de klanten blijft (voor degene die dat niet meten, was er de optie 'ik weet het niet').

zaterdag 1 februari 2014 @ 16:08:00 #253

Operc

Nr. 40

quote:
Op zaterdag 1 februari 2014 15:15 schreef stefanschippers het volgende:

[..]

Tot zover klopt het idd

[..]

Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.

[..]

Ik heb dus de klanten niets gevraagd zoals ik zei het gaat ook er ook niet om dat ze in de toekomst nog van plan zijn terug te keren maar of de winkel op dit moment in het algemeen veel terugkerende klanten heeft of niet.

Het betreft alleen webwinkels, deze kunnen dus aan de hand van statistieken meten hoeveel procent van de klanten blijft (voor degene die dat niet meten, was er de optie 'ik weet het niet').

Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?

zaterdag 1 februari 2014 @ 17:11:40 #254

stefanschippers

quote:
Op zaterdag 1 februari 2014 16:08 schreef Operc het volgende:

[..]

Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?

Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.
Zit daar hét probleem dus, die schaal? Want als dat de oplossing is, dan is het daarvoor nog wel de moeite waard om even opnieuw de respondenten (met schaamte

) benaderen.

zaterdag 1 februari 2014 @ 18:45:18 #255

Operc

Nr. 40

quote:
Op zaterdag 1 februari 2014 17:11 schreef stefanschippers het volgende:

[..]

Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.
Zit daar hét probleem dus, die schaal? Want als dat de oplossing is, dan is het daarvoor nog wel de moeite waard om even opnieuw de respondenten (met schaamte ) benaderen.

Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.

Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.

Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.

zondag 2 februari 2014 @ 11:58:20 #256

stefanschippers

quote:
Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:

[..]

Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.

Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..

quote:
Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.

Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.

Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?

zondag 2 februari 2014 @ 12:31:48 #257

Crack_

quote:
Op vrijdag 31 januari 2014 19:36 schreef Crack_ het volgende:
Hallo!
Ik hoop dat julle mij kunnen helpen met kijken of de dingen die ik wil meten ook gemeten worden met de daarbij behorende toetsen. In oderstaand schema staan de te meten variabelen met de toets waarvan ik denk dat die daarbij hoort.

[ afbeelding ]

Hier onder nog een schema waar het zelfde wordt gezegd maar dan met de meetschalen

[ afbeelding ]

Bedankt !

Niemand die mij zou kunnen helpen?

Baby darling doll face honey

zondag 2 februari 2014 @ 12:45:34 #258

Operc

Nr. 40

quote:
Op zondag 2 februari 2014 11:58 schreef stefanschippers het volgende:

[..]

Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..

[..]

Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?

Ja je gebruikt dan een t-toets of ANOVA, afhankelijk van uit hoeveel groepen je onafhankelijke variabele bestaat (in dit geval 2, ja/nee, dus dan kan een t-toets. Als het er meer worden, moet je richting de ANOVA waarschijnlijk, maar beide zijn geen hogere wiskunde en kunnen makkelijk via SPSS worden gedaan.)

zondag 2 februari 2014 @ 21:52:49 #259

FABIO91

Beste medemensen,

Ik ben voor mijn stage wat enquêtes aan het analyseren via spss. Nu zijn er sommige vragen die men niet per se hoeft in te vullen. Het gevolg hiervan dat ik veel missing values heb. Naar dit gegeven gaat niet naar mijn interesse uit en ik wil missing values niet terugzien in de diagrammen.

Hoe kan ik er voor zorgen dat de missing values niet worden meegeteld in de grafieken en diagrammen?

Ik hoop dat jullie mij zo snel mogelijk kunnen helpen!

Alvast bedankt,

Groet,
Fabio

maandag 3 februari 2014 @ 09:29:59 #260

Z

Door ze op missing te zetten.

IF (var = waarde) var = $SYSMIS.
EXE.

Aldus.

maandag 3 februari 2014 @ 21:34:20 #261

stefanschippers

quote:
Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:

[..]

Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.

Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.

Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.

Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.

http://s29.postimg.org/nr57jrntz/expected_count.jpg

Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is?

Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?

[ Bericht 0% gewijzigd door stefanschippers op 03-02-2014 22:08:22 ]

donderdag 6 februari 2014 @ 16:28:09 #263

eleganza

ik hou van koekjes.

Dacht dat ik hier niet meer terug hoefde te komen, helaas voor mijn laatste ... ALLERLAATSTE analyse nog wel.

Ik wil een crosstab maken met 2 variabelen, waar eentje al vast staat. De andere moet ik berekenen aan de hand van of cases boven/gelijk of onder het gemiddelde zitten. Het wordt dus een 0 (onder het gemiddelde) of 1(gelijk of hoger dan gemiddelde) waarde. Heb nu het volgende gedaan: Compute variable (nieuwe variabele) = oude variabele >= (gemiddelde oude variabele)

Krijg er dan wel uit wat ik wil? Ik heb .00 en 1.00's gekregen, en het lijkt te werken. Is mijn logica hier logisch? Ik volg mezelf namelijk ook niet altijd

Koekje d'r bij?

donderdag 6 februari 2014 @ 16:40:47 #264

Operc

Nr. 40

quote:
Op donderdag 6 februari 2014 16:28 schreef eleganza het volgende:
Dacht dat ik hier niet meer terug hoefde te komen, helaas voor mijn laatste ... ALLERLAATSTE analyse nog wel.

Ik wil een crosstab maken met 2 variabelen, waar eentje al vast staat. De andere moet ik berekenen aan de hand van of cases boven/gelijk of onder het gemiddelde zitten. Het wordt dus een 0 (onder het gemiddelde) of 1(gelijk of hoger dan gemiddelde) waarde. Heb nu het volgende gedaan: Compute variable (nieuwe variabele) = oude variabele >= (gemiddelde oude variabele)

Krijg er dan wel uit wat ik wil? Ik heb .00 en 1.00's gekregen, en het lijkt te werken. Is mijn logica hier logisch? Ik volg mezelf namelijk ook niet altijd

Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.

donderdag 6 februari 2014 @ 16:42:26 #265

Operc

Nr. 40

quote:
Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:

[..]

Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.

http://s29.postimg.org/nr57jrntz/expected_count.jpg

Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is? Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?

Waarom codeer je naar 0-20% etc? Als je gewoon de absolute percentages hebt (bedrijf A 7%, bedrijf B 43% etc) dan hoef je niet met die chi-squares te klooien en kun je met gemiddeldes, standaarddeviaties en t-toetsen werken.

EDIT: En ja, soms is er gewoon ECHT geen verband, zelfs al zou het logisch lijken.

donderdag 6 februari 2014 @ 17:44:42 #266

eleganza

ik hou van koekjes.

quote:
Op donderdag 6 februari 2014 16:40 schreef Operc het volgende:

[..]

Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.

Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:

Nieuwe var= attitude variabele >= 5.25
Volgens mij is alles nu 1 wat boven of gelijk is aan die 5.25, en alles dat daar niet aan voldoet 0.

Toch?

Koekje d'r bij?

donderdag 6 februari 2014 @ 18:31:47 #267

Operc

Nr. 40

quote:
Op donderdag 6 februari 2014 17:44 schreef eleganza het volgende:

[..]

Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:

Nieuwe var= attitude variabele >= 5.25
Volgens mij is alles nu 1 wat boven of gelijk is aan die 5.25, en alles dat daar niet aan voldoet 0.

Toch?

Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:
if attitude >=5.25 Nieuwe variabele = 1
if attitude <5.25 Nieuwe variabele = 0
Maar jouw methode werkt ook volgens mij.

EDIT: Aangezien ik gok dat je een helemaal niet mee eens - helemaal mee eens 7-puntsschaal hebt gebruikt is het effectief 1-5 en 6-7 natuurlijk.

donderdag 6 februari 2014 @ 22:33:03 #268

eleganza

ik hou van koekjes.

quote:
Op donderdag 6 februari 2014 18:31 schreef Operc het volgende:

[..]

Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:
if attitude >=5.25 Nieuwe variabele = 1
if attitude <5.25 Nieuwe variabele = 0
Maar jouw methode werkt ook volgens mij.

EDIT: Aangezien ik gok dat je een helemaal niet mee eens - helemaal mee eens 7-puntsschaal hebt gebruikt is het effectief 1-5 en 6-7 natuurlijk.

Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoel

)

EDIT: Ik zit dat ik niet duidelijk had gemaakt dat ik de kwartielen had berekend en daar t tweede kwartiel van gepakt had.

[ Bericht 3% gewijzigd door eleganza op 06-02-2014 22:47:40 ]

Koekje d'r bij?

donderdag 6 februari 2014 @ 23:31:05 #269

Operc

Nr. 40

quote:
Op donderdag 6 februari 2014 22:33 schreef eleganza het volgende:

[..]

Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoel )

EDIT: Ik zit dat ik niet duidelijk had gemaakt dat ik de kwartielen had berekend en daar t tweede kwartiel van gepakt had.

Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?

vrijdag 7 februari 2014 @ 12:41:50 #270

eleganza

ik hou van koekjes.

quote:
Op donderdag 6 februari 2014 23:31 schreef Operc het volgende:

[..]

Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?

Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.

FB_NRFUNCT * BI_ATTITUDE Crosstabulation
Count
BI_ATTITUDE Total

funct | laag | hoog
1.00 1 0 1
2.00 2 5 7
3.00 8 7 15
4.00 30 31 61
Total 41 43 84

4 van de 8 cellen hebben een waarde lager dan vijf door die scheve verdeling.

Hij geeft mij nu dit bij chisquare

Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 2.322a 3 .508
Likelihood Ratio 2.750 3 .432
Linear-by-Linear Association .038 1 .845
N of Valid Cases 84
a 4 cells (50.0%) have expected count less than 5. The minimum expected count is .49. (.45, .45, .15 en .13 voor andere variabelen)

Dat laatste betekent toch dat ik er niks mee kan?

Bij andere vier variabelen in dezelfde crosstab heb ik ook geen significante resultaten, maar ik mag daar ivm die expected count toch niks over zeggen?

Koekje d'r bij?

vrijdag 7 februari 2014 @ 13:26:12 #271

Operc

Nr. 40

quote:
Op vrijdag 7 februari 2014 12:41 schreef eleganza het volgende:

[..]

Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.

FB_NRFUNCT * BI_ATTITUDE Crosstabulation
Count
BI_ATTITUDE Total

funct | laag | hoog
1.00 1 0 1
2.00 2 5 7
3.00 8 7 15
4.00 30 31 61
Total 41 43 84

4 van de 8 cellen hebben een waarde lager dan vijf door die scheve verdeling.

Hij geeft mij nu dit bij chisquare

Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 2.322a 3 .508
Likelihood Ratio 2.750 3 .432
Linear-by-Linear Association .038 1 .845
N of Valid Cases 84
a 4 cells (50.0%) have expected count less than 5. The minimum expected count is .49. (.45, .45, .15 en .13 voor andere variabelen)

Dat laatste betekent toch dat ik er niks mee kan?

Bij andere vier variabelen in dezelfde crosstab heb ik ook geen significante resultaten, maar ik mag daar ivm die expected count toch niks over zeggen?

In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)

Als je kijkt naar de scores in de groepen, dan zie je dat er eigenlijk tussen laag en hoog weinig verschil zit (verschillen van -1, 3, -1, 1). Het is dus niet zo waarschijnlijk dat daar significante resultaten uit zullen komen, even afgezien van de minimale groepsgroottes. Dat kan deels komen door een plafondeffect. Je ziet dat het grootste deel van de deelnemers (61 van de 84) de maximale score heeft bereikt. Een mogelijke invloed van attitude om de score te verhogen in een van de twee groepen is daardoor dus vrijwel onmogelijk. Misschien had je een grotere spreiding gevonden als je maximale score 10 of hoger was geweest, maar dat weet je niet.

Wat je nog zou kunnen proberen, is score 1 en 2 eruit laten, wegens te weinig proefpersonen en in plaats van een mediaan als ijkpunt voor wat hoog en wat laag is, het eerste en derde kwartiel pakken. Je gooit dan een deel van je data weg, maar je kunt dat eventueel beredeneren door te stellen dat een score van 5.24 nu niet echt van 5.26 afwijkt, terwijl je volgens de eerste methode deze twee wel als totaal anders ziet (laag en hoog). Als je zoiets doet zou ik wel eerst een analyse met alle data draaien en in je scriptie opnemen, voordat je aan dergelijke subgroepen begint. Een heldere omschrijving van en redenatie waarom je bepaalde statistische keuzes maakt is heel belangrijk voor lezers van een artikel.

vrijdag 7 februari 2014 @ 13:52:53 #272

eleganza

ik hou van koekjes.

quote:
Op vrijdag 7 februari 2014 13:26 schreef Operc het volgende:

[..]

In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)

Als je kijkt naar de scores in de groepen, dan zie je dat er eigenlijk tussen laag en hoog weinig verschil zit (verschillen van -1, 3, -1, 1). Het is dus niet zo waarschijnlijk dat daar significante resultaten uit zullen komen, even afgezien van de minimale groepsgroottes. Dat kan deels komen door een plafondeffect. Je ziet dat het grootste deel van de deelnemers (61 van de 84) de maximale score heeft bereikt. Een mogelijke invloed van attitude om de score te verhogen in een van de twee groepen is daardoor dus vrijwel onmogelijk. Misschien had je een grotere spreiding gevonden als je maximale score 10 of hoger was geweest, maar dat weet je niet.

Wat je nog zou kunnen proberen, is score 1 en 2 eruit laten, wegens te weinig proefpersonen en in plaats van een mediaan als ijkpunt voor wat hoog en wat laag is, het eerste en derde kwartiel pakken. Je gooit dan een deel van je data weg, maar je kunt dat eventueel beredeneren door te stellen dat een score van 5.24 nu niet echt van 5.26 afwijkt, terwijl je volgens de eerste methode deze twee wel als totaal anders ziet (laag en hoog). Als je zoiets doet zou ik wel eerst een analyse met alle data draaien en in je scriptie opnemen, voordat je aan dergelijke subgroepen begint. Een heldere omschrijving van en redenatie waarom je bepaalde statistische keuzes maakt is heel belangrijk voor lezers van een artikel.

Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede.

(so much for inzicht in statistiek als masterstudent)

Wat ik hier eigenlijk van wil weten is gebruiken mensen met een hogere attitude (hoger dan de mediaan in mijn geval) nou meer functies dan mensen met een lagere attitude dan de mediaan? Dat heb ik als het goed is berekend met die eerste crosstabs (1,2,3,4 waren het aantal functies), maar is dan die chisquare 'valide' genoeg om te zeggen dat het niet significant is? Doet me verder niks dat het niet significant is, is ook een resultaat

- maar het moet wel valide zijn als ik dat wil aanvoeren als argument!

Koekje d'r bij?

vrijdag 7 februari 2014 @ 13:55:18 #273

Operc

Nr. 40

quote:
Op vrijdag 7 februari 2014 13:52 schreef eleganza het volgende:

[..]

Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede. (so much for inzicht in statistiek als masterstudent)

Wat ik hier eigenlijk van wil weten is gebruiken mensen met een hogere attitude (hoger dan de mediaan in mijn geval) nou meer functies dan mensen met een lagere attitude dan de mediaan? Dat heb ik als het goed is berekend met die eerste crosstabs (1,2,3,4 waren het aantal functies), maar is dan die chisquare 'valide' genoeg om te zeggen dat het niet significant is? Doet me verder niks dat het niet significant is, is ook een resultaat - maar het moet wel valide zijn als ik dat wil aanvoeren als argument!

Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.

vrijdag 7 februari 2014 @ 14:20:19 #274

eleganza

ik hou van koekjes.

quote:
Op vrijdag 7 februari 2014 13:55 schreef Operc het volgende:

[..]

Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.

Uiteraard, uiteraard

Over het algemeen is er wel een positievere wending, dus hoe positiever men op een variabele scoort, des te meer functies respondenten gebruiken, maar het is dus niet significant

* eleganza heeft net antwoord gegeven op haar onderzoeksvraag uit haar scriptie

Koekje d'r bij?

vrijdag 7 februari 2014 @ 14:54:37 #275

Operc

Nr. 40

quote:
Op vrijdag 7 februari 2014 14:20 schreef eleganza het volgende:

[..]

Uiteraard, uiteraard Over het algemeen is er wel een positievere wending, dus hoe positiever men op een variabele scoort, des te meer functies respondenten gebruiken, maar het is dus niet significant

* eleganza heeft net antwoord gegeven op haar onderzoeksvraag uit haar scriptie

Gefeliciteerd!

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

Het SPSS topic #6 - En we SPSS-en nog even door....

» school, studie en onderwijs

» school, studie en onderwijs