Heb je de cellen met de Limburger/Nederlander variabele gecodeerd in cijfers en deze cijfers labels gegeven? Of heb je in die cellen gewoon echt LM en NL getypt?quote:Op dinsdag 21 januari 2014 15:51 schreef sirdanilot het volgende:
Ik heb een hoop problemen met SPSS.
Even kort verhaaltje:
Twee groepen, Limburgers (LM) en Nederlanders (NL), hebben een bepaalde test gedaan. Hieruit kwam een bepaalde reactie tijd. Ik wil kijken of er een significant verschil is tussen de resultaten van de twee groepen; waren de Limburgers significant sneller, waren de NL significant sneller, of is er geen significant verschil.
Dus ik doe de Independent-Samples T-test.
[ link | afbeelding ]
Maar ik krijg deze foutmelding:
The GROUPS subcommand specifies an unknown variable or a long string variable. This subcommand must specify either a numeric variable or a short string variable. Text found: SubjLang
Wat doe ik fout? Ik ben echt ten einde raad met dit verschrikkelijke programma.
Even geprobeerd, maakt geen klap uit, doet het bij beide. Is er misschien 1 rij (of meerdere) waarin iets anders staat dan LM/NL of de reactietijd? (Zoals het woord 'reactietijd' bijvoorbeeld?)quote:Op dinsdag 21 januari 2014 16:29 schreef Operc het volgende:
[..]
Heb je de cellen met de Limburger/Nederlander variabele gecodeerd in cijfers en deze cijfers labels gegeven? Of heb je in die cellen gewoon echt LM en NL getypt?
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Had inderdaad gewoon getypt, stom ! Nu doet hij wel iets. Dankquote:Op dinsdag 21 januari 2014 16:29 schreef Operc het volgende:
[..]
Heb je de cellen met de Limburger/Nederlander variabele gecodeerd in cijfers en deze cijfers labels gegeven? Of heb je in die cellen gewoon echt LM en NL getypt?
Zelfs met die laatste variant zou het wel moeten werken, maar fijn dat je weer verder kunt.quote:Op dinsdag 21 januari 2014 17:11 schreef sirdanilot het volgende:
[..]
Had inderdaad gewoon getypt, stom ! Nu doet hij wel iets. Dank
Zou kunnen, of een iets andere variabele instelling ofzo.quote:Op dinsdag 21 januari 2014 17:34 schreef sirdanilot het volgende:
Misschien heb ik een oudere versie van spss?
Wat wil je nu precies weten? Hoe je een F-statistiek krijgt of welk percentage mannen er in je sample zit?quote:Op dinsdag 28 januari 2014 15:21 schreef Milchat het volgende:
Wat tof dat dit topic er is! Ook al ontdek je het pas als je het nodig hebt..Ik heb een SPSS/statistiek vraagje. In de resultaten zie je vaak zo'n tabel met gegevens over de proefpersonen, meestal means en SD's. Daarachter staat dan ook een kolom met F-waarden en * voor significant of niet.
Mijn vraag is, hoe bereken je nou die F-waardes, voor bijvoorbeeld zoiets als het procent mannen in de sample? Het is vast héél simpel, maar ik kom er maar niet achter hoe ik dit bereken in SPSS![]()
Heeft iemand een idee?
Nou, beide? Het percentage mannen en of dit een significant percentage is.quote:Op dinsdag 28 januari 2014 15:28 schreef Noppie2000 het volgende:
[..]
Wat wil je nu precies weten? Hoe je een F-statistiek krijgt of welk percentage mannen er in je sample zit?
SPSS is volgens mij vooral handig om bestaande datasets te analyseren, terwijl je in R de datasets uitgebreid kunt aanpassen. Daarnaast heb je in R veel meer controle over wat je doet (je kunt een grafiek precies zo maken als jij wilt), en je kunt ook real-time data verwerken. R is ook gratis natuurlijk.quote:Op donderdag 23 januari 2014 23:08 schreef _Dido_ het volgende:
Wat is eigenlijk het verschil tussen spss en R?kunnen ze precies dezelfde dingen? Ik wil mn statistiek- en spss-kennis weer afstoffen
Percentage mannen kan je simpelweg berekenen door (ik denk via desciptives) te vragen naar de hoeveelheden mannelijke en vrouwelijke proefpersonen. Dan aantal mannelijke proefpersonen delen door het totaal aantal proefpersonen vermenigvuldigen met 100quote:Op dinsdag 28 januari 2014 15:29 schreef Milchat het volgende:
[..]
Nou, beide? Het percentage mannen en of dit een significant percentage is.
Oké, dat zal ik eens proberen ja.quote:Op dinsdag 28 januari 2014 15:39 schreef Noppie2000 het volgende:
[..]
Percentage mannen kan je simpelweg berekenen door (ik denk via desciptives) te vragen naar de hoeveelheden mannelijke en vrouwelijke proefpersonen. Dan aantal mannelijke proefpersonen delen door het totaal aantal proefpersonen vermenigvuldigen met 100
Of het een significant percentage is, waar wil je dat voor weten? Denk sowieso niet dat je daar een F-statistiek aan moet koppelen.
Zou je output eens moeten zien, snap nog niet helemaal hoe of watquote:Op dinsdag 28 januari 2014 15:45 schreef Milchat het volgende:
[..]
Oké, dat zal ik eens proberen ja.
Het is een tabel met sample characteristics, en onder andere staan daar de F-waardes en significantie van het percentage man, en bijvoorbeeld ook het IQ. Ik wil het ook niet persé weten, maar het schijnt in zo'n overzichtstabel te horen en daarom moet het erbij van mijn begeleiderHet is een vaag verhaal, I know..
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
quote:Op dinsdag 28 januari 2014 15:59 schreef Milchat het volgende:
Thanks voor het mee denken in elk gevalField heb ik al bekeken van kaft tot kaft. Het punt is niet dat ik mijn output niet snap, ik weet niet hoe ik het ín mijn output krijg. Ik wil iets weten, maar heb geen idee hoe ik dat uit SPSS laat rollen.
Hierbij een plaatje van hoe zo'n tabel eruit zou moeten zien (met gevoelige informatie weggewerkt).Mjah, voor zover ik zie is er geen output bij F. Dit zijn gewoon standaard gegevens zoals je zegt. Weet niet hoe je het er bij moet krijgen, maar lijkt me aardig triviaal. Moet het er echt bij?SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.![]()
Nee, dit is geen output. En inderdaad, standaardgegevens, maar die F-waarde moet er echt bij.quote:Op dinsdag 28 januari 2014 16:12 schreef Noppie2000 het volgende:
[..]
Mjah, voor zover ik zie is er geen output bij F. Dit zijn gewoon standaard gegevens zoals je zegt. Weet niet hoe je het er bij moet krijgen, maar lijkt me aardig triviaal. Moet het er echt bij?
Om maar even een balletje op te gooien, bedoelt hij niet het percentage Female? Dus: 100 proefpersonen (F=60%) bijvoorbeeld?quote:Op dinsdag 28 januari 2014 16:18 schreef Milchat het volgende:
[..]
Nee, dit is geen output. En inderdaad, standaardgegevens, maar die F-waarde moet er echt bij.![]()
Ik zou eigenlijk ook niet weten of je dan significant verschil berekent ten opzichte van de hele sample, of ten opzichte van de andere groepen ofzo. Geen flauw idee![]()
Maar misschien dat iemand die hier wel bekend mee is dit leest?
Maar heb je daar dan ook een F-waarde van?quote:Op dinsdag 28 januari 2014 17:13 schreef Operc het volgende:
[..]
Om maar even een balletje op te gooien, bedoelt hij niet het percentage Female? Dus: 100 proefpersonen (F=60%) bijvoorbeeld?
Ik bedoelde meer: Zit er niet een communicatie fout tussen jullie dat hij met 'F' aantal vrouwen bedoelde maar het leek alsof hij het had over een F-waarde?quote:Op woensdag 29 januari 2014 10:28 schreef Milchat het volgende:
[..]
Maar heb je daar dan ook een F-waarde van?
quote:Op woensdag 29 januari 2014 10:49 schreef motorbloempje het volgende:
Ik denk alleen maar een fuckability-waarde. Maar dat klopt vast niet.
Je kan wel kijken of er een significant verschil zit tussen mannen in de verschillende groepen op je afhankelijke variabelen, als je dat dan misschien bedoelt. Anders zou ik even gaan naar je begeleider ja.quote:Op woensdag 29 januari 2014 11:38 schreef Milchat het volgende:
LOL, nee ik bedoel oprecht een F-waarde. Het zou ook tussen groepen kunnen zijn, want ik heb groepen in mijn analyse. Hoeveel procent er man is van elke groep en of dit significant is ofzo?![]()
Ik ga mijn begeleider dan wel weer lastig vallen, blijkbaar is het toch niet zo'n domme vraag
Verstandig als je een lager cijfer wil hebbenquote:Op woensdag 29 januari 2014 11:38 schreef Milchat het volgende:
LOL, nee ik bedoel oprecht een F-waarde. Het zou ook tussen groepen kunnen zijn, want ik heb groepen in mijn analyse. Hoeveel procent er man is van elke groep en of dit significant is ofzo?![]()
Ik ga mijn begeleider dan wel weer lastig vallen, blijkbaar is het toch niet zo'n domme vraag
Als je zo denkt ga je Andy Field briljant vinden. Volgens hem is SPSS een afkorting voor Satan's Personal Statistics Slave.quote:Op woensdag 29 januari 2014 10:49 schreef motorbloempje het volgende:
Ik denk alleen maar een fuckability-waarde. Maar dat klopt vast niet.
Even vragen waar hij precies de F-waarde van wil hebben kan geen kwaad nee.quote:Op woensdag 29 januari 2014 11:38 schreef Milchat het volgende:
LOL, nee ik bedoel oprecht een F-waarde. Het zou ook tussen groepen kunnen zijn, want ik heb groepen in mijn analyse. Hoeveel procent er man is van elke groep en of dit significant is ofzo?![]()
Ik ga mijn begeleider dan wel weer lastig vallen, blijkbaar is het toch niet zo'n domme vraag
Ach, je moet wel zelf nadenken, maar vragen om verduidelijking als je feedback krijgt van je begeleider is echt niet desastreus voor je cijfer.quote:Op woensdag 29 januari 2014 13:29 schreef Syntix het volgende:
[..]
Verstandig als je een lager cijfer wil hebben
Overigens SPSSBen toch maar geswitched naar wat anders, want hoe langer je met SPSS werkt hoe meer je merkt dat het een heel beperkt programma is.
Eens, tijdens je feedback kun je best zulke vragen stellen. Echter, als je elke week gaat mailen om vragen over SPSS dan kan dat zeker invloed hebben of je cijfer.quote:Op woensdag 29 januari 2014 13:35 schreef Operc het volgende:
[..]
Als je zo denkt ga je Andy Field briljant vinden. Volgens hem is SPSS een afkorting voor Satan's Personal Statistics Slave.
[..]
Even vragen waar hij precies de F-waarde van wil hebben kan geen kwaad nee.
[..]
Ach, je moet wel zelf nadenken, maar vragen om verduidelijking als je feedback krijgt van je begeleider is echt niet desastreus voor je cijfer.
Klopt, veel universiteiten hebben ook nog wel een SPSS/statistiek helpdesk waar je beter met die vragen terecht kunt (of hier natuurlijk). Al hebben wij meer informatie nodig over wat er nu precies bedoeld wordt.quote:Op woensdag 29 januari 2014 13:44 schreef Syntix het volgende:
[..]
Eens, tijdens je feedback kun je best zulke vragen stellen. Echter, als je elke week gaat mailen om vragen over SPSS dan kan dat zeker invloed hebben of je cijfer.
Hebben jullie wel mijn plaatje van de tabel bekeken? Als jullie ook allemaal niet begrijpen wat er bedoeld wordt dan vind ik het wel een steeds vreemdere tabel worden..quote:Op woensdag 29 januari 2014 13:45 schreef Operc het volgende:
[..]
Klopt, veel universiteiten hebben ook nog wel een SPSS/statistiek helpdesk waar je beter met die vragen terecht kunt (of hier natuurlijk). Al hebben wij meer informatie nodig over wat er nu precies bedoeld wordt.
Ah, dat verklaart. Ja dan kun je gewoon een ANOVA doen en dan komt de F waarde (en daarna de p-waarde) er vanzelf uitrollen.quote:Op woensdag 29 januari 2014 15:49 schreef Milchat het volgende:
[..]
Hebben jullie wel mijn plaatje van de tabel bekeken? Als jullie ook allemaal niet begrijpen wat er bedoeld wordt dan vind ik het wel een steeds vreemdere tabel worden..
Stel dat ik de F-waarde van IQ wil weten in die tabel in plaats van geslacht, en je hebt van de 4 verschillende groepen de means en standaard deviaties al in de tabel gezet. Zou het dan gaan om significant verschil in IQ tussen groepen? (Er komt maar 1 F-waarde kolom in de tabel voor verschillende variabelen, dus niet een F waarde per groep t.o.v. de sample).
Stel het gaat dan bij IQ om een significant verschil tussen groepen, hoe krijg je dat dan uit SPSS?
Ah! Ik wist dat het eenvoudig moest zijn, maar zo eenvoudig.. thanks!quote:Op woensdag 29 januari 2014 15:52 schreef Operc het volgende:
[..]
Ah, dat verklaart. Ja dan kun je gewoon een ANOVA doen en dan komt de F waarde (en daarna de p-waarde) er vanzelf uitrollen.
Dit inderdaad. Had dat meteen gezegd joh!quote:Op woensdag 29 januari 2014 15:52 schreef Operc het volgende:
[..]
Ah, dat verklaart. Ja dan kun je gewoon een ANOVA doen en dan komt de F waarde (en daarna de p-waarde) er vanzelf uitrollen.
Graag gedaan.quote:Op woensdag 29 januari 2014 15:56 schreef Milchat het volgende:
[..]
Ah! Ik wist dat het eenvoudig moest zijn, maar zo eenvoudig.. thanks!
Ik snap je tabel niet helemaal. Wat heb je precies gedaan qua groepen en vragen?quote:Op vrijdag 31 januari 2014 21:40 schreef stefanschippers het volgende:
Goedenavond,
Ik werk voor het eerst met SPSS en ik heb een aantal kruistabellen gemaakt voor verbanden die ik wil bekijken. Deze voldoen aan de voorwaarden voor de chi2-toets, maar ik snap niet hoe ik nou aan de hand van de observed count en de expected count een 'uitspraak' kan doen. Bij een 'ja' 'nee' vraag lukt me dat nog wel nu niet.
Zijn er hier wellicht mensen met een beetje SPSS-kennis die me kunnen helpen? als ik er eentje heb gedaan dan lukken die andere ook wel. Het gaat in het onderstaande voorbeeld-geval over het effect van gratis retour aanbieden op het percentage terugkerende klanten. Ik wil daar gewoon kortweg iets over kunnen zeggen.
http://postimg.org/image/qm35b3p65/
Zeer bedankt alvast
P.S. ja ik weet dat ik achteraf ook boven de 40 % verder had moeten tellen, maar de groep die 50 %, 60 % etc. zou antwoorden verwachte ik erg laag.
Bedankt voor je reactiequote:Op vrijdag 31 januari 2014 23:06 schreef sirdanilot het volgende:
Je moet kijken bij Sig (van significance). Sig > 0,05, dus niet significant.
EDIT: Ik zal nog iets verduidelijken
Het gaat erom of de groepen die jij hebt ingedeeld, de waarden 'above chance level' beïnvloeden. Dat wil zeggen; er moet minder dan 5% kans zijn, dat de waarden door toeval gewoon zijn zoals ze zijn. De waarden moeten dus voldoende verschillen van de expected value. De expected value is meestal totaal van de rij * totaal van de kolom / totaal van rijen + kolommen bij elkaar.
Misschien als je je groepen anders indeelt, dat je wel een effect krijgt. Dat is meestal de crux bij dit soort dingen. Je deelt je groepen arbitrair in, en dan rolt er niks uit. Je moet idealiter ook een reden hebben om je groepen in te delen zoals je doet.
De statistiek hier is dus niet zo heel zinnig. Misschien kun je iets van een correlatie-test doen of zo, kijk maar in je handboek. Maar dan moet je eigenlijk eerst een significante chi square hebben? Hier eindigt mijn kennis zo'n beetje.
Jij ook bedankt voor de reactie! De hypothese die getoetst moet worden is eigenlijk dat aanbieden van gratis retour een positief effect heeft op het percentage bezoekers dat terugkeert na een aankoop. Eerst heb ik dus de winkels gevraagd in een enquête welk percentage van de bezoekers terugkeert en daarna heb ik een aantal vragen gesteld over o.a. wel of geen gratis retour (en nog 10 andere elementen die mogelijk van invloed zijn op een hoger 'terugkeer-percentage' klanten). Nu wil ik dus gaan kijken welke van deze dingen duidelijk invloed hebben.quote:Op zaterdag 1 februari 2014 01:13 schreef Operc het volgende:
[..]
Ik snap je tabel niet helemaal. Wat heb je precies gedaan qua groepen en vragen?
Ik neem aan dat 'opnieuw kopen' de afhankelijke variabele is? Maar wat is gratis_retourtoepassing dan? En waar staat de ja/nee voor?
Tot zover klopt het iddquote:Op zaterdag 1 februari 2014 14:54 schreef Operc het volgende:
Dus, als ik het goed begrijp zit het als volgt: Je hebt aan de winkeliers gevraagd wat het percentage van mensen is dat terugkomt, introduceert daarna het "gratis terugbrengen"
Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.quote:en vraagt vervolgens aan klanten hoe groot ze de kans inschatten dat ze nog een keer terugkomen en je wil die twee cijfers met elkaar vergelijken?
Ik heb dus de klanten niets gevraagd zoals ik zeiquote:Achteraf kun je er weinig mee, dat begrijp ik, maar het was prettig geweest als je er een iets logischere schaal van had gemaakt, waarbij elke antwoordmogelijkheid een even grote groep procenten weergeeft.
Heb je toevallig de vraag ook gesteld in ja/nee? (dus: ga je nog eens kopen: ja/nee) want deze informatie is lastig te verwerken. Dit komt omdat er een optie 0-20 procent is, waarbij het nogal uitmaakt of iemand echt niet van plan is om nog eens te kopen (0 procent) of de kans niet heel groot is (20 procent).
Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?quote:Op zaterdag 1 februari 2014 15:15 schreef stefanschippers het volgende:
[..]
Tot zover klopt het idd
[..]
Nee, dit niet. Ik heb niets aan de klanten gevraagd. Ik heb de winkels zelf gevraagd hoe hoog het algemene percentage klanten is dat terugkeert. Daarna heb ik gekeken of ze diverse punten die in de literatuur genoemd worden als 'klantenbinder' ingevoerd hebben bij hun beleid. Zo wil ik dus eigenlijk bekijken of winkels die bijvoorbeeld gratis retour aanbieden, beter scoren wat betreft klantenbinding.
[..]
Ik heb dus de klanten niets gevraagd zoals ik zeihet gaat ook er ook niet om dat ze in de toekomst nog van plan zijn terug te keren maar of de winkel op dit moment in het algemeen veel terugkerende klanten heeft of niet.
Het betreft alleen webwinkels, deze kunnen dus aan de hand van statistieken meten hoeveel procent van de klanten blijft (voor degene die dat niet meten, was er de optie 'ik weet het niet').
Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.quote:Op zaterdag 1 februari 2014 16:08 schreef Operc het volgende:
[..]
Helder. Is er een mogelijkheid om van de webshops nog een keer de percentages te krijgen maar dan 'precies' zeg maar? Dus zonder antwoordmogelijkheden, maar gewoon een continue schaal van 0-100 procent?
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.quote:Op zaterdag 1 februari 2014 17:11 schreef stefanschippers het volgende:
[..]
Dat is inderdaad een stomme fout die ik gemaakt heb. Heerlijke beginnersfout voor een onderzoeker.
Zit daar hét probleem dus, die schaal? Want als dat de oplossing is, dan is het daarvoor nog wel de moeite waard om even opnieuw de respondenten (met schaamte) benaderen.
Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..quote:Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:
[..]
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.
Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?quote:Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.
Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.
Niemand die mij zou kunnen helpen?quote:Op vrijdag 31 januari 2014 19:36 schreef Crack_ het volgende:
Hallo!
Ik hoop dat julle mij kunnen helpen met kijken of de dingen die ik wil meten ook gemeten worden met de daarbij behorende toetsen. In oderstaand schema staan de te meten variabelen met de toets waarvan ik denk dat die daarbij hoort.
[ afbeelding ]
Hier onder nog een schema waar het zelfde wordt gezegd maar dan met de meetschalen
[ afbeelding ]
Bedankt!
Ja je gebruikt dan een t-toets of ANOVA, afhankelijk van uit hoeveel groepen je onafhankelijke variabele bestaat (in dit geval 2, ja/nee, dus dan kan een t-toets. Als het er meer worden, moet je richting de ANOVA waarschijnlijk, maar beide zijn geen hogere wiskunde en kunnen makkelijk via SPSS worden gedaan.)quote:Op zondag 2 februari 2014 11:58 schreef stefanschippers het volgende:
[..]
Nou ja, met een dagje bellen en mailen lukt dat me wel. Vooral omdat een belangrijke variabele is die ik tegen een aantal variabelen wil afzetten..
[..]
Bij parametrisch raakte je me even kwijt maar zo snap ik het. Maar in dat geval: moet ik niet een hele andere toets gebruiken?
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.quote:Op zaterdag 1 februari 2014 18:45 schreef Operc het volgende:
[..]
Vanachter mijn computer, waar ikzelf totaal niet merk hoeveel extra tijd het jou kost als ik 'Ja' zeg, is het gemakkelijk om te zeggen "doe maar over" natuurlijk.
Het voordeel van een continue schaal, is dat je parametrisch kunt testen (als de assumpties daarvan kloppen) in plaats van non-parametrisch met tabellen etc. Dit kan ook een type II error verkleinen, waarbij een verschil tussen groepen niet significant wordt geacht, terwijl het dat stiekem wel is. Hoe preciezer de data die jij krijgt (in groepen van 20 procent, in groepen van 1 procent, of zelfs met een decimaal achter de komma.) hoe waarschijnlijker het wordt dat je een significant resultaat vindt, als er daadwerkelijk een verschil is tussen de groepen.
Stel bijvoorbeeld, dat bij de bedrijven uit de "ja" categorie, gemiddeld 10 procent van de klanten terugkomt en uit de "nee" categorie 5 procent van de klanten terugkomt. In de huidige situatie merk je dan geen verschil, omdat van 0-20 procent 1 groep is, terwijl het in realiteit een verdubbeling is van het aantal terugkerende klanten.
De counts bij een correcte chi-square test moeten minimaal 5 zijn!quote:Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:
[..]
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.
http://s29.postimg.org/nr57jrntz/expected_count.jpg
Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is?Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?
Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.quote:Op donderdag 6 februari 2014 16:28 schreef eleganza het volgende:
Dacht dat ik hier niet meer terug hoefde te komen, helaas voor mijn laatste ... ALLERLAATSTE analyse nog wel.
Ik wil een crosstab maken met 2 variabelen, waar eentje al vast staat. De andere moet ik berekenen aan de hand van of cases boven/gelijk of onder het gemiddelde zitten. Het wordt dus een 0 (onder het gemiddelde) of 1(gelijk of hoger dan gemiddelde) waarde. Heb nu het volgende gedaan: Compute variable (nieuwe variabele) = oude variabele >= (gemiddelde oude variabele)
Krijg er dan wel uit wat ik wil? Ik heb .00 en 1.00's gekregen, en het lijkt te werken. Is mijn logica hier logisch? Ik volg mezelf namelijk ook niet altijd![]()
![]()
Waarom codeer je naar 0-20% etc? Als je gewoon de absolute percentages hebt (bedrijf A 7%, bedrijf B 43% etc) dan hoef je niet met die chi-squares te klooien en kun je met gemiddeldes, standaarddeviaties en t-toetsen werken.quote:Op maandag 3 februari 2014 21:34 schreef stefanschippers het volgende:
[..]
Intussen (verrassend snel) gelukt. Helaas zelfde probleem, de expected count blijft te laag bij de 'hogere procenten'-categorieën. Overal waar ik de 'opnieuw kopen'-variabel tegen af zet, krijg ik dit probleem.
http://s29.postimg.org/nr57jrntz/expected_count.jpg
Ook hercoderen door 0-10 en 11-20% etc. samen te voegen hielp niet. Betekent dit gewoon dat er echt geen verband is?Dat lijkt me enorm vreemd, aangezien ik hem tegen wel 10 andere variabelen heb afgezet. Of is er nog iets mogelijk?
Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:quote:Op donderdag 6 februari 2014 16:40 schreef Operc het volgende:
[..]
Ik neem aan dat je met 'If' hebt gewerkt? Dan zal het wel kloppen ja.
Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:quote:Op donderdag 6 februari 2014 17:44 schreef eleganza het volgende:
[..]
Niet met if gewerkt, omdat alle cases voor die variabele meetellen voor de berekening en ik die variabelen die er niet aan voldoen niet 'weggooien'. Ik wil voor de attitude de hoogste 50% scheiden van de laatste 50%, gescheiden door het gemiddelde. Gemiddelde berekend voor de attitude (5.25 van 7 max) dus dit gedaan:
Nieuwe var= attitude variabele >= 5.25
Volgens mij is alles nu 1 wat boven of gelijk is aan die 5.25, en alles dat daar niet aan voldoet 0.
Toch?
Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoelquote:Op donderdag 6 februari 2014 18:31 schreef Operc het volgende:
[..]
Ohja, dat zal hij automatisch wel regelen dan. Ik zat te denken aan 'recode into different variable' en dan:
if attitude >=5.25 Nieuwe variabele = 1
if attitude <5.25 Nieuwe variabele = 0
Maar jouw methode werkt ook volgens mij.
EDIT: Aangezien ik gok dat je een helemaal niet mee eens - helemaal mee eens 7-puntsschaal hebt gebruikt is het effectief 1-5 en 6-7 natuurlijk.
Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?quote:Op donderdag 6 februari 2014 22:33 schreef eleganza het volgende:
[..]
Attitude is al een opschaling van vijf vragen uit mijn onderzoek, dus zijn het vaak x.xx waarden, waar ze niet helemaal rond zijn omdat het al een gemiddelde is. Die 5.25 is de mediaan van de metingen en ik kijk of de mensen op of boven de mediaan vaker bepaald gedrag vertonen (X/4 functies gebruiken - verwachting is positiever -dus boven mediaan- dat mensen meer van de vier functies gebruiken). Kan ik significant helaas niks over zeggen omdat de verdeling scheef is en de chi-square niet werkt omdat er dus niet vijf respondenten per hokje zijn (als je begrijpt wat ik bedoel)
EDIT: Ik zit dat ik niet duidelijk had gemaakt dat ik de kwartielen had berekend en daar t tweede kwartiel van gepakt had.
Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.quote:Op donderdag 6 februari 2014 23:31 schreef Operc het volgende:
[..]
Je chi-square probleem zie ik nog even niet. Hoe groot zijn je groepen <5.25 en >=5.25 en de groepen X = 1/2/3/4?
In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)quote:Op vrijdag 7 februari 2014 12:41 schreef eleganza het volgende:
[..]
Groepen zijn ongeveer even groot volgens mij, bij attitude is het 41/43, maar all in valt 80% in de 4/4 groep.
FB_NRFUNCT * BI_ATTITUDE Crosstabulation
Count
BI_ATTITUDE Total
funct | laag | hoog
1.00 1 0 1
2.00 2 5 7
3.00 8 7 15
4.00 30 31 61
Total 41 43 84
4 van de 8 cellen hebben een waarde lager dan vijf door die scheve verdeling.
Hij geeft mij nu dit bij chisquare
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 2.322a 3 .508
Likelihood Ratio 2.750 3 .432
Linear-by-Linear Association .038 1 .845
N of Valid Cases 84
a 4 cells (50.0%) have expected count less than 5. The minimum expected count is .49. (.45, .45, .15 en .13 voor andere variabelen)
Dat laatste betekent toch dat ik er niks mee kan?
Bij andere vier variabelen in dezelfde crosstab heb ik ook geen significante resultaten, maar ik mag daar ivm die expected count toch niks over zeggen?
Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede.quote:Op vrijdag 7 februari 2014 13:26 schreef Operc het volgende:
[..]
In principe moet je analyse strategie vaststaan voor je de data verzamelt, omdat het anders goochelen wordt in plaats van echt statistiek toepassen. Ik verwacht echter dat als je in je scriptie (?) schrijft dat je niets gevonden hebt en daarom nog een beetje bent gaan klooien, dat ze die onderzoekende houding misschien wel kunnen waarderen. (Zolang je er maar bij zegt dat je van te voren iets anders had bedacht.)
Als je kijkt naar de scores in de groepen, dan zie je dat er eigenlijk tussen laag en hoog weinig verschil zit (verschillen van -1, 3, -1, 1). Het is dus niet zo waarschijnlijk dat daar significante resultaten uit zullen komen, even afgezien van de minimale groepsgroottes. Dat kan deels komen door een plafondeffect. Je ziet dat het grootste deel van de deelnemers (61 van de 84) de maximale score heeft bereikt. Een mogelijke invloed van attitude om de score te verhogen in een van de twee groepen is daardoor dus vrijwel onmogelijk. Misschien had je een grotere spreiding gevonden als je maximale score 10 of hoger was geweest, maar dat weet je niet.
Wat je nog zou kunnen proberen, is score 1 en 2 eruit laten, wegens te weinig proefpersonen en in plaats van een mediaan als ijkpunt voor wat hoog en wat laag is, het eerste en derde kwartiel pakken. Je gooit dan een deel van je data weg, maar je kunt dat eventueel beredeneren door te stellen dat een score van 5.24 nu niet echt van 5.26 afwijkt, terwijl je volgens de eerste methode deze twee wel als totaal anders ziet (laag en hoog). Als je zoiets doet zou ik wel eerst een analyse met alle data draaien en in je scriptie opnemen, voordat je aan dergelijke subgroepen begint. Een heldere omschrijving van en redenatie waarom je bepaalde statistische keuzes maakt is heel belangrijk voor lezers van een artikel.
Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.quote:Op vrijdag 7 februari 2014 13:52 schreef eleganza het volgende:
[..]
Nja, dit was een aanvulling van mijn docente die eigenlijk antwoord geeft op mijn hoofdvraag (in welke mate hebben variabele a,b,c,d,e invloed op het aantal functies dat er gebruikt wordt (zijn er 4 onderzocht, dus max aantal is 4)?). Mijn logica in mijn scriptie is sowieso ver te zoeken, ben alles door elkaar heen gaan doen, want zo werk ik ook. Plus, mijn lack of insight in statistics heeft hier wel de overhand. Ik heb allerlei leuke ideeën maar dan daar de passende analyse bij bedenken is een tweede.(so much for inzicht in statistiek als masterstudent)
Wat ik hier eigenlijk van wil weten is gebruiken mensen met een hogere attitude (hoger dan de mediaan in mijn geval) nou meer functies dan mensen met een lagere attitude dan de mediaan? Dat heb ik als het goed is berekend met die eerste crosstabs (1,2,3,4 waren het aantal functies), maar is dan die chisquare 'valide' genoeg om te zeggen dat het niet significant is? Doet me verder niks dat het niet significant is, is ook een resultaat- maar het moet wel valide zijn als ik dat wil aanvoeren als argument!
Uiteraard, uiteraardquote:Op vrijdag 7 februari 2014 13:55 schreef Operc het volgende:
[..]
Je kunt niet heel veel anders volgens mij, dus zou die conclusie inderdaad trekken. Wel even opletten dat niet significant niet betekent dat er zeker geen invloed is, enkel dat je die niet hebt gemeten.
Gefeliciteerd!quote:Op vrijdag 7 februari 2014 14:20 schreef eleganza het volgende:
[..]
Uiteraard, uiteraardOver het algemeen is er wel een positievere wending, dus hoe positiever men op een variabele scoort, des te meer functies respondenten gebruiken, maar het is dus niet significant
![]()
* eleganza heeft net antwoord gegeven op haar onderzoeksvraag uit haar scriptie![]()
Als het niet ingewikkelder wordt dan dit:quote:Op vrijdag 14 februari 2014 14:40 schreef Droplollie het volgende:
Ik ben momenteel een syntax aan het schrijven voor een reeks onderzoek die eraan gaan komen.
Nou wil ik een standaard syntax schrijven die een categorial variable omzet naar een dummy.
Voorbeeld:
Van variabele 'locatie' zijn duizend mogelijkheden van 1 t/m 1000.
In onderzoek A worden locaties 100, 200 en 300 aangevinkt.
Voor de variabele 'locatie' wil ik dan voor locatie 100, 200 en 300 een dummy gemaakt wordt.
Er komen dan dus drie nieuwe variabelen bij.
Is dit op één of andere manier mogelijk geautomatiseerd doen?
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | Do IF locatie=100. compute locatie100 = 1. compute locatie200 = 0. compute locatie300 = 0. Else if locatie=200. compute locatie100 = 0. compute locatie200 = 1. compute locatie300 = 0. Else if locatie = 300. compute locatie100 = 0. compute locatie200 = 0. compute locatie300 = 1. Else. compute locatie100 = 0. compute locatie200 = 0. compute locatie300 = 0. End if. Execute. |
Die syntax ken ik, maar ik wil dan dus van alle mogelijke locaties (1 - 10.000) een dummy hebben.quote:Op vrijdag 14 februari 2014 15:04 schreef dotKoen het volgende:
[..]
Als het niet ingewikkelder wordt dan dit:
[ code verwijderd ]
Maar volgens mij zijn er ook wel mooiere macro's voor creëren van dummies te vinden.
Dat moet je dus met een macro doen. Zoiets als http://www.glennlthompson.com/?p=92.quote:Op vrijdag 14 februari 2014 16:32 schreef Droplollie het volgende:
[..]
Die syntax ken ik, maar ik wil dan dus van alle mogelijke locaties (1 - 10.000) een dummy hebben.
Dus mogelijk zit er locatie 101 tussen. Dan wordt het met jouw voorbeeld niet als dummy gepakt.
| 1 2 3 4 5 6 | naam1 geslacht score 1 naam1 geslacht score 2 naam1 geslacht score 3 naam2 geslacht score 1 naam2 geslacht score 2 naam2 geslacht score 3 |
| 1 2 | naam1 geslacht score 1 score 2 score 3 naam2 geslacht score 1 score 2 score 3 |
quote:Op woensdag 19 februari 2014 10:53 schreef Z het volgende:
Met 'restructure'. Is een SPSS functie (ergens in een menu te vinden).
Is dat uberhaupt nodig? een hardnekkig misverstand is dat data normaal verdeeld moeten zijn voor parametrische testen, maar dat is helemaal niet de assumptie, deze is slechts dat de means normaal verdeeld zijn.quote:Op donderdag 27 februari 2014 13:54 schreef Krizzyboy89 het volgende:
Vraagje: Ik ben nu bezig met multipele lineaire regressie en heb voor mijn analyses een aantal log transformaties gedaan, zodat ze wat normaler verdeeld zijn.
Het heeft te maken met het soort missing value dat je hebt. Niets invullen is een system missing en wel iets invullen maar het aanstippen als missing is een andere missing.quote:Op dinsdag 18 maart 2014 17:49 schreef oompaloompa het volgende:
Ik begrijp niet waarom mensen uberhaupt nummers invoeren bij missing values (alhoewel wij het ook aanleerden met "999") waarom zou je die cellen niet gewoon leeg laten?
Of heb ik al die jaren een superhandige functie gemist ergens?
http://www.ats.ucla.edu/stat/spss/modules/missing.htmquote:There is no way to get a system missing value to appear in a crosstabs table. The closest you will come is to change the system-missing value to a user-missing value. This can be accomplished with a recode command, as is shown below. The keyword sysmis can be used on the recode command, and it stands for the system-missing value.
dank!quote:Op dinsdag 18 maart 2014 17:59 schreef Operc het volgende:
[..]
Het heeft te maken met het soort missing value dat je hebt. Niets invullen is een system missing en wel iets invullen maar het aanstippen als missing is een andere missing.
De link hieronder legt er wat over uit, met het volgende voorbeeld over het verschil tussen die twee bij het analyseren:
[..]
http://www.ats.ucla.edu/stat/spss/modules/missing.htm
Graag gedaan.quote:
Geen oplossing, misschien wel omweg trucje maar waarom doe je een crosstab? Zolang je geen chi-squares oid nodig hebt is het misschien gemakkelijker split file en frequencies te gebruiken?quote:Op maandag 24 maart 2014 14:25 schreef Thrills het volgende:
Niet zozeer een inhoudelijke vraag, meer een technische maar wellicht dat iemand er ervaring mee heeft. Tijdens het analyseren van mijn data maak ik af en toe een crosstab, dit resulteert erin dat SPSS compleet de pan uit flipt met dit als resultaat:
[ afbeelding ]
Zoals je kan zien staat de crosstab werkelijk waar all over the place, eigenlijk volgt alles mijn muis een beetje, zo gauw ik naar data view of variable view ga verschuift daar alles ook met de muis mee :S
EDIT: hij doet het nu meteen na het openen van het programma zonder ook maar een actie te hebben ondernomen...
Neem aan dat je ook een afhankelijke variabele hebt, anders is het een beetje een flutdesignquote:Op woensdag 26 maart 2014 21:57 schreef Andyy het volgende:
Hoe heet een design met alleen drie condities (intern, extern en controle) zonder verdere variabele?
Als wel of geen hulp bij dezelfde proefpersoon gevarieerd is, is het idd een mixed design.quote:Op donderdag 27 maart 2014 00:14 schreef Andyy het volgende:
Reactietijd en wel of geen hulp.
1 blok geleden statistiek afgesloten, nu al deze shit vergeten
3x2 mixed design dus, thanks
Kut, ze staan allemaal los van elkaar, between subjects design dusquote:Op donderdag 27 maart 2014 06:54 schreef oompaloompa het volgende:
[..]
Als wel of geen hulp bij dezelfde proefpersoon gevarieerd is, is het idd een mixed design.
quote:Op donderdag 27 maart 2014 11:10 schreef Andyy het volgende:
[..]
Kut, ze staan allemaal los van elkaar, between subjects design dus
Je brengt het naar boven zonder het te zeggen
repeated measures / within participants / multilevelquote:Op zaterdag 5 april 2014 13:49 schreef puspuistje het volgende:
Stel een groep participanten vertonen bepaald gedrag. Vervolgens neem je een screeningsinstrument bij ze af om dit gedrag in beeld te brengen en deze patiënten hulp aan te bieden. Na een jaar ga je checken hoe het gaat en of de situatie verbeterd is. Wat soort onderzoek is dit? (dit vergelijk je eventueel met een controle groep) hoe kun je dit het beste meten, dus welke methode voor SPSS?
| Forum Opties | |
|---|---|
| Forumhop: | |
| Hop naar: | |