Tot zover klopt het iddquote:Op zaterdag 1 februari 2014 14:54 schreef Operc het volgende:
Dus, als ik het goed begrijp zit het als volgt: Je hebt aan de winkeliers gevraagd wat het percentage van mensen is dat terugkomt, introduceert daarna het "gratis terugbrengen"
Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.quote:en vraagt vervolgens aan klanten hoe groot ze de kans inschatten dat ze nog een keer terugkomen en je wil die twee cijfers met elkaar vergelijken?
Ik heb dus de klanten niets gevraagd zoals ik zeiquote:Achteraf kun je er weinig mee, dat begrijp ik, maar het was prettig geweest als je er een iets logischere schaal van had gemaakt, waarbij elke antwoordmogelijkheid een even grote groep procenten weergeeft.
Heb je toevallig de vraag ook gesteld in ja/nee? (dus: ga je nog eens kopen: ja/nee) want deze informatie is lastig te verwerken. Dit komt omdat er een optie 0-20 procent is, waarbij het nogal uitmaakt of iemand echt niet van plan is om nog eens te kopen (0 procent) of de kans niet heel groot is (20 procent).
Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?quote:Op zaterdag 1 februari 2014 15:15 schreef stefanschippers het volgende:
[..]
Tot zover klopt het idd
[..]
Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.
[..]
Ik heb dus de klanten niets gevraagd zoals ik zeihet gaat ook er ook niet om dat ze in de toekomst nog van plan zijn terug te keren maar of de winkel op dit moment in het algemeen veel terugkerende klanten heeft of niet.
Het betreft alleen webwinkels, deze kunnen dus aan de hand van statistieken meten hoeveel procent van de klanten blijft (voor degene die dat niet meten, was er de optie 'ik weet het niet').
Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.quote:Op zaterdag 1 februari 2014 16:08 schreef Operc het volgende:
[..]
Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.quote:Op zaterdag 1 februari 2014 17:11 schreef stefanschippers het volgende:
[..]
Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.
Zit daar hét probleem dus, die schaal? Want als dat de oplossing is, dan is het daarvoor nog wel de moeite waard om even opnieuw de respondenten (met schaamte) benaderen.
Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..quote:Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:
[..]
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.
Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?quote:Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.
Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.
Niemand die mij zou kunnen helpen?quote:Op vrijdag 31 januari 2014 19:36 schreef Crack_ het volgende:
Hallo!
Ik hoop dat julle mij kunnen helpen met kijken of de dingen die ik wil meten ook gemeten worden met de daarbij behorende toetsen. In oderstaand schema staan de te meten variabelen met de toets waarvan ik denk dat die daarbij hoort.
[ afbeelding ]
Hier onder nog een schema waar het zelfde wordt gezegd maar dan met de meetschalen
[ afbeelding ]
Bedankt!
Ja je gebruikt dan een t-toets of ANOVA, afhankelijk van uit hoeveel groepen je onafhankelijke variabele bestaat (in dit geval 2, ja/nee, dus dan kan een t-toets. Als het er meer worden, moet je richting de ANOVA waarschijnlijk, maar beide zijn geen hogere wiskunde en kunnen makkelijk via SPSS worden gedaan.)quote:Op zondag 2 februari 2014 11:58 schreef stefanschippers het volgende:
[..]
Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..
[..]
Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.quote:Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:
[..]
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.
Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.
Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.
De counts bij een correcte chi-square test moeten minimaal 5 zijn!quote:Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:
[..]
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.
http://s29.postimg.org/nr57jrntz/expected_count.jpg
Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is?Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?
Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.quote:Op donderdag 6 februari 2014 16:28 schreef eleganza het volgende:
Dacht dat ik hier niet meer terug hoefde te komen, helaas voor mijn laatste ... ALLERLAATSTE analyse nog wel.
Ik wil een crosstab maken met 2 variabelen, waar eentje al vast staat. De andere moet ik berekenen aan de hand van of cases boven/gelijk of onder het gemiddelde zitten. Het wordt dus een 0 (onder het gemiddelde) of 1(gelijk of hoger dan gemiddelde) waarde. Heb nu het volgende gedaan: Compute variable (nieuwe variabele) = oude variabele >= (gemiddelde oude variabele)
Krijg er dan wel uit wat ik wil? Ik heb .00 en 1.00's gekregen, en het lijkt te werken. Is mijn logica hier logisch? Ik volg mezelf namelijk ook niet altijd![]()
![]()
Waarom codeer je naar 0-20% etc? Als je gewoon de absolute percentages hebt (bedrijf A 7%, bedrijf B 43% etc) dan hoef je niet met die chi-squares te klooien en kun je met gemiddeldes, standaarddeviaties en t-toetsen werken.quote:Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:
[..]
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.
http://s29.postimg.org/nr57jrntz/expected_count.jpg
Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is?Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?
Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:quote:Op donderdag 6 februari 2014 16:40 schreef Operc het volgende:
[..]
Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.
Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:quote:Op donderdag 6 februari 2014 17:44 schreef eleganza het volgende:
[..]
Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:
Nieuwe var= attitude variabele >= 5.25
Volgens mij is alles nu 1 wat boven of gelijk is aan die 5.25, en alles dat daar niet aan voldoet 0.
Toch?
Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoelquote:Op donderdag 6 februari 2014 18:31 schreef Operc het volgende:
[..]
Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:
if attitude >=5.25 Nieuwe variabele = 1
if attitude <5.25 Nieuwe variabele = 0
Maar jouw methode werkt ook volgens mij.
EDIT: Aangezien ik gok dat je een helemaal niet mee eens - helemaal mee eens 7-puntsschaal hebt gebruikt is het effectief 1-5 en 6-7 natuurlijk.
Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?quote:Op donderdag 6 februari 2014 22:33 schreef eleganza het volgende:
[..]
Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoel)
EDIT: Ik zit dat ik niet duidelijk had gemaakt dat ik de kwartielen had berekend en daar t tweede kwartiel van gepakt had.
Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.quote:Op donderdag 6 februari 2014 23:31 schreef Operc het volgende:
[..]
Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?
In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)quote:Op vrijdag 7 februari 2014 12:41 schreef eleganza het volgende:
[..]
Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.
FB_NRFUNCT * BI_ATTITUDE Crosstabulation
Count
BI_ATTITUDE Total
funct | laag | hoog
1.00 1 0 1
2.00 2 5 7
3.00 8 7 15
4.00 30 31 61
Total 41 43 84
4 van de 8 cellen hebben een waarde lager dan vijf door die scheve verdeling.
Hij geeft mij nu dit bij chisquare
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 2.322a 3 .508
Likelihood Ratio 2.750 3 .432
Linear-by-Linear Association .038 1 .845
N of Valid Cases 84
a 4 cells (50.0%) have expected count less than 5. The minimum expected count is .49. (.45, .45, .15 en .13 voor andere variabelen)
Dat laatste betekent toch dat ik er niks mee kan?
Bij andere vier variabelen in dezelfde crosstab heb ik ook geen significante resultaten, maar ik mag daar ivm die expected count toch niks over zeggen?
Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede.quote:Op vrijdag 7 februari 2014 13:26 schreef Operc het volgende:
[..]
In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)
Als je kijkt naar de scores in de groepen, dan zie je dat er eigenlijk tussen laag en hoog weinig verschil zit (verschillen van -1, 3, -1, 1). Het is dus niet zo waarschijnlijk dat daar significante resultaten uit zullen komen, even afgezien van de minimale groepsgroottes. Dat kan deels komen door een plafondeffect. Je ziet dat het grootste deel van de deelnemers (61 van de 84) de maximale score heeft bereikt. Een mogelijke invloed van attitude om de score te verhogen in een van de twee groepen is daardoor dus vrijwel onmogelijk. Misschien had je een grotere spreiding gevonden als je maximale score 10 of hoger was geweest, maar dat weet je niet.
Wat je nog zou kunnen proberen, is score 1 en 2 eruit laten, wegens te weinig proefpersonen en in plaats van een mediaan als ijkpunt voor wat hoog en wat laag is, het eerste en derde kwartiel pakken. Je gooit dan een deel van je data weg, maar je kunt dat eventueel beredeneren door te stellen dat een score van 5.24 nu niet echt van 5.26 afwijkt, terwijl je volgens de eerste methode deze twee wel als totaal anders ziet (laag en hoog). Als je zoiets doet zou ik wel eerst een analyse met alle data draaien en in je scriptie opnemen, voordat je aan dergelijke subgroepen begint. Een heldere omschrijving van en redenatie waarom je bepaalde statistische keuzes maakt is heel belangrijk voor lezers van een artikel.
Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.quote:Op vrijdag 7 februari 2014 13:52 schreef eleganza het volgende:
[..]
Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede.(so much for inzicht in statistiek als masterstudent)
Wat ik hier eigenlijk van wil weten is gebruiken mensen met een hogere attitude (hoger dan de mediaan in mijn geval) nou meer functies dan mensen met een lagere attitude dan de mediaan? Dat heb ik als het goed is berekend met die eerste crosstabs (1,2,3,4 waren het aantal functies), maar is dan die chisquare 'valide' genoeg om te zeggen dat het niet significant is? Doet me verder niks dat het niet significant is, is ook een resultaat- maar het moet wel valide zijn als ik dat wil aanvoeren als argument!
Uiteraard, uiteraardquote:Op vrijdag 7 februari 2014 13:55 schreef Operc het volgende:
[..]
Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.
Gefeliciteerd!quote:Op vrijdag 7 februari 2014 14:20 schreef eleganza het volgende:
[..]
Uiteraard, uiteraardOver het algemeen is er wel een positievere wending, dus hoe positiever men op een variabele scoort, des te meer functies respondenten gebruiken, maar het is dus niet significant
![]()
* eleganza heeft net antwoord gegeven op haar onderzoeksvraag uit haar scriptie![]()
| Forum Opties | |
|---|---|
| Forumhop: | |
| Hop naar: | |