Het SPSS topic #2 - Waar we gezellig verder analyseren | School, Studie en Onderwijs (SES)

donderdag 25 november 2010 @ 19:07:09 #201

Z

Er zijn andere analysemethoden voor zulke lage n-en (daar kan ik je niet mee helpen). Alles wat hierboven door je beschreven is komt door de lage n-en.

Aldus.

donderdag 25 november 2010 @ 22:48:14 #202

gewooneenuser

"aan de hand van deze gegevens trek ik de conclusie dat begrip 'a', 'b' en 'c' het begrip niet meten en 'd', 'e' en 'f'' wel"

Dit soort uitspraken kun je nooit doen aan de hand van statistiek. Je kan hooguit zeggen dat je twee (of meer) factoren hebt gevonden. Welke factoren dit zijn moet je zelf (aan de hand van theorie) invullen.

Als je Cronbach's alpha negatief is, moet je je items en dataset nog eens goed bekijken en niet gewoon maar een andere analysetechniek gaan gebruiken die minder of niet geschikt is maar wel resultaten geeft die in je verhaal passen. (ook nogal kort door de bocht om te zeggen dat het allemaal gewoon komt door een kleine n trouwens)

Ik begrijp ook niet hoe je erbij komt t-testen te gaan doen. Waarom ga je ervan uit dat je respondenten op elk element gemiddeld moeten scoren? En dat gemiddelde is dan het 'neutrale' antwoord? Zegt dat niet eerder iets over je respondenten dan over de kwaliteit van je vragenlijst? Wat is het bestaansrecht van je vragenlijst als je de kwaliteit van je vragenlijst afleidt uit het al dan niet gemiddeld scoren van je respondenten? Dan kun je de vragenlijst dus evengoed niet afnemen, mensen scoren toch gemiddeld en als dat niet zo is, is de vragenlijst ineens niet goed.

Probeer eens een factoranalyse (al is dat eigenlijk PCA in SPSS geloof ik?) en kijk of daar iets zinvols uitkomt. Al is je n voor al dit soort dingen wel érg laag. Met tien vragen zou je toch best een 200-tal respondenten bevragen.

donderdag 25 november 2010 @ 22:55:20 #203

Skv

Cynist.

CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.

Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

vrijdag 26 november 2010 @ 08:16:39 #204

gewooneenuser

quote:
Op donderdag 25 november 2010 22:55 schreef Skv het volgende:
CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.

Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.

Hier haal je toch wat dingen door elkaar. Nagaan of hoog-scoorders op alle elementen hoog scoren en laag-scoorders op alle elementen laag scoren (wat er volgens jouw beschrijving is gedaan), is heel iets anders dan nagaan of alle personen op alle elementen gemiddeld 'neutraal' scoren.
Je hebt dus wel degelijk Cronbach's alpha nodig hier.

Als je wilt nagaan welke items in de praktijk niet goed passen, gaat het dus wél om de kwaliteit van je vragenlijst.
Aan je gemiddeldes en standaardafwijkingen kan je al duidelijk zien dat de verschillende elementen heel verschillend worden gewaardeerd en dat er veel verschillen zitten tussen de mensen onderling.
Het lijkt me met deze data verstandig de inferentiële statistiek even te laten voor wat het is en eens goed naar je data te kijken. Maak bijvoorbeeld een lijngrafiekje per participant met de scores per element. Zo kan je zien of het bij elke participant dezelfde items zijn die veel lager/hoger scoren. Als dat het geval is, kun je gaan bekijken waarom deze items anders scoren. Waarschijnlijk kun je daar de data uit je interview wel voor gebruiken en er is vast ook wat theorie over. Welke groep items dan 'het concept' meet en welke groep een 'ander concept' moet je toch echt hieruit halen en niet uit statistiek en p-waardes.

zaterdag 27 november 2010 @ 20:55:28 #205

schaal_9

Caissière B

Wat leuk, een SPSS topic

Ik ga het allemaal eens doorlezen...

Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).

Eindoordeel: je gaat boven de gestelde eisen uit.

donderdag 2 december 2010 @ 15:13:25 #206

Citizen.Erased

7\

Ik zit met een klein dilemma en weet niet of ik nu verder kan gaan in mijn analyse.

Ik ben bezig met een multiple regressie en niet alle data lijkt normaal verdeeld.
Mijn Dependent Variable (Switchintentie) lijkt bijvoorbeeld niet normaal.
_{De wijze waarom de scores verdeeld zijn is wel de verdeling die ik vooraf verwacht heb. Het overgrote deel van de mensen in de markt die ik onderzoek heeft niet de intentie om over te schakelen naar een andere aanbieder.}

Ik heb geprobeerd om enkele transformaties toe te passen, maar op de een of andere manier wordt de verdeling daardoor niet beter.

Mijn vraag is:

1. Hoe moet ik de scores van Kurtosis en Skewness interpreteren?
2. Kan ik met deze data een multiple regressie uitvoeren (en de resultaten hiervan interpreteren)?
3. Zijn er nog 'n aantal transformaties die ik kan gebruiken?

De teloorgang van de PI

donderdag 2 december 2010 @ 17:19:00 #207

crossover

1.: Kurtosus is de mate van scheefheid. Google even op afbeeldingen dan krijg je er een beeld bij. Skewness houdt in naar welke kant je verdeling neigt.

Houd ook rekening met je meetschaal. Als je in je vragenlijst de alle keuzemogelijkheden van 1 t/m 5 hebt gedefinieerd, is het een ordinale meetschaal en mag je strict genomen geen regressie uitvoeren. Als je alleen de 1 en 5 hebt benoemd 'mag' het wel.

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

donderdag 2 december 2010 @ 17:25:53 #208

crossover

Wat is/zijn je onafhankelijke variabele(n)?

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

donderdag 2 december 2010 @ 18:14:09 #209

Citizen.Erased

7\

quote:
Op donderdag 2 december 2010 17:25 schreef crossover het volgende:
Wat is/zijn je onafhankelijke variabele(n)?

Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.

Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is

{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.

De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.

De teloorgang van de PI

donderdag 9 december 2010 @ 21:10:07 #210

Susanna

Welke analyses kun je dan uitvoeren als je gebruik maakt van een ordinale meetschaal met (zoals je in het voorbeeld schetst) antwoord 1-5? Een regressieanalyse lijkt me dan bij voorbaat onzinnig, wat kun je dan over de data zeggen?

donderdag 9 december 2010 @ 21:13:20 #211

Susanna

quote:
Op donderdag 2 december 2010 18:14 schreef Citizen.Erased het volgende:

[..]

Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.

Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is
{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.

De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.

Geen normale verdeling = geen regressieanalyse

Ben echt benieuwd wat je er dan wel nog mee kan. Heb zelf namelijk ook steekproeven met in elke cel >30 waarnemingen en (gezien de vraagstelling logisch) niet normaal verdeeld...

donderdag 9 december 2010 @ 21:30:05 #212

Operc

Nr. 40

quote:
Op zaterdag 27 november 2010 20:55 schreef schaal_9 het volgende:
Wat leuk, een SPSS topic
Ik ga het allemaal eens doorlezen...

Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).

Niet gewoon Select Cases en dan kiezen voor opslaan in nieuw venster?

donderdag 9 december 2010 @ 22:45:58 #213

Gestiech

Oké, hier ook nog maar even mijn vraag droppen dan. Nouja, ik heb er eigenlijk twee.
Als eerste een vraag over Chi-square. 2 groepen: mannen en vrouwen, hebben aangegeven of ze wel of niet voorkeur geven aan vroeg college. De output van spss is reeds gegeven, maar er wordt gevraagd deze te interpreteren. Hoe kan ik weten wat de uitkomst nou eigenlijk is? Het resultaat is significant, maar dat kan in principe zowel betekenen dat mannen liever vroeg college hebben, dan dat het kan betekenen dat vrouwen vroeg college hebben, toch? Hoe moet ik dit terugzien?

Verder een vraag over MSG en MSE. Bij een andere opgave werden de standaarddeviaties en standaardfouten gegeven, de df's werden gegeven, en de n's werden gegeven. Vervolgens moest je dan op basis daarvan eerst de sum of square groups en square errors berekenen en daarna dus MSG en MSE. Het leek mij dat je voor sum gewoon zowel de sd als de sf allemaal in het kwadraat doet en optelt. Dan heb je je sum, toch? Nou, als ik dat doe kom ik al niet op de juiste waarde. Vervolgens dus naar de mean, en dat zou dan het delen door de df moeten zijn? Indien nodig kan ik de opgave wel even hier neer zetten.

donderdag 9 december 2010 @ 23:03:42 #214

Gestiech

Overigens, @ Citizen.Erased, volgens mij is het normaal dat bij het meten van een categorische nominale variabele - zoals jij die meet - de verdeling niet normaal is. Als ik een enquete houd onder de bevolking met de vraag of ze altijd al eens iemand hebben willen vermoorden zal 90% ook 'nee' zeggen. of 1 / 2 wanneer we het hebben over een 5-puntsschaal. Is het probleem niet meer het feit dat de uitkomst evident is, en geen analyse behoeft?

donderdag 9 december 2010 @ 23:06:34 #215

crossover

Volgens mij kan je bij een chi square gewoon een kruistabel maken en vanaf daar interpreteren.

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

donderdag 9 december 2010 @ 23:22:01 #216

Gestiech

Hoe bedoel je dat...? Ik moet immers wel bepalen of het resultaat significant is. Bij 2*2 zou dat nog enigszins kunnen i guess, maar stel het is 2*3, of 3*3, wat dan? Hoe bepaal je dan welke nou significant is?

vrijdag 10 december 2010 @ 07:32:06 #217

crossover

Als ik me niet vergis kan je ook bij de wat grotere kruistabellen de gegevens aflezen. Ik denk dat de significantie verwijst naar de gehele tabel. Maar kan iemand anders dit bevestigen of ontkrachten? Is voor mij ook weer een tijdje geleden..

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

vrijdag 10 december 2010 @ 11:05:41 #218

Rick.Gulmans

een chi square tabel geeft aan of iets afhankelijk van elkaar is, als je dus een significante chi square krijgt (de observed value wijkt af van expected value) dan betekent het dat de groepen wat met elkaar te maken.
maak hier een crosstabel/grafiek van en je kan interpreteren!
je ziet dan bv met die lijnen zien wat je verband is.

voor MSE, moet je eerst SS berekenen. De SSE is kwadratensom, die deel je door de Df, en dan krijg je de MSE. en dit kan je met elke SS doen ( groeps of individu niveau)

[ Bericht 1% gewijzigd door Rick.Gulmans op 10-12-2010 11:06:33 (typfouten) ]

vrijdag 17 december 2010 @ 21:33:44 #219

Susanna

Wat te doen als een somers'd test nagenoeg géén relatie laat zien tussen twee variabelen. Dan ben je lijkt me uitgeanalyseerd? Ik wilde namelijk met de somers'd test laten zien dat er wél een (positief danwel negatief) verband is en aan de hand daarvan met regressieanalyse aan de slag gaan.

dinsdag 21 december 2010 @ 22:04:58 #220

Susanna

Niemand??

dinsdag 21 december 2010 @ 22:08:24 #221

Susanna

Volgende vraag

Ik heb een logistische regressie uitgevoerd. De afhankelijke variabele is een dummy, de predictorvariabele is categorisch.

Uitkomst:

Model Summary:
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 ,000a ,692 1,000
a. Estimation terminated at iteration number 19 because a perfect fit is detected. This solution is not unique.

Het gaat me om de opmerking bij a (kan niet zo goed een tabel hierin plakken, sorry). Because a perfect fit is detected. Betekend dit dat ik niets aan deze analyse heb? En komt dat dan doordat ik het model verkeerd heb gebouwd, of omdat de data gewoon niet meewerkt (het liefst dat laatste natuurlijk

)

zondag 13 februari 2011 @ 20:58:14 #222

Susanna

Ik heb het volgende gelezen: Tevens kan de variabele getransformeerd worden door het natuurlijk logaritme (LN) te nemen van de variabele.
Hoe kun je in spss dan een logaritme berekenen? Is dat een bewerking (en zo ja, welke) waarna je een 'nieuwe' variabele krijgt waarmee je dan weer de normale dingen kunt doen, zoals descriptives draaien en nagaan of er een normale verdeling is en een skewness van tussen -2 en +2 bijvoorbeeld?

zondag 13 februari 2011 @ 21:27:03 #223

crossover

Al bij compute variable gekeken?

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

maandag 14 februari 2011 @ 15:03:50 #224

yozd

FR1908 Vakkie R

Ik wil graag weten hoe ik kan bepalen of gevonden coëfficiënten bij regressies voor 2 verschillende groepen significant verschillen.

Stel je hebt dit model:

y = c + X1 + X2 + X3

waarbij X3 een dummy variabele is (man/vrouw, 0/1). Als ik nu wil weten of de coëfficiënten van X1 en X2 voor mannen en vrouwen verschillen, moet ik interactievariabelen toevoegen voor elk van die predictors:

y = c + X1 + X2 + X3 + (X1 * X3) + (X2 * X3)

Nu kan ik in de output zien of de coëfficiënten van die interactietermen significant zijn en dus bepalen of geslacht de invloed van X1 en X2 op y beïnvloedt.

Maar nu hoorde ik laatst van iemand dat je dit ook op een andere manier kon checken. Je hebt dan 2 samples (mannen en vrouwen) en je runt dan 2x (1x voor mannen en 1x voor de vrouwensample):

y = c + X1 + X2

Vervolgens doe je een T-test op de 4 (2x2) gevonden coëfficiënten. Maar hoe doe je dat precies?

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

dinsdag 15 maart 2011 @ 11:44:01 #225

Don_Gurgen

Al een tijdje rustig hier, maar toch nog even proberen...

Ik ben een vragenlijst aan het coderen en ben op een type vraag gestuit waar ik niet zo goed van weet wat ik ermee aan moet.

Het gaat erom dat de respondenten vijf mogelijkheden krijgen aangeboden en deze naar voorkeur in een volgorde moeten zetten. Oftewel vijf antwoorden moeten worden ingevoerd waarvan het ook belangrijk is welke ze als eerste, welke ze als tweede etc hebben ingevoerd.

Weet iemand hoe dit moet? Ik ben eeuwig dankbaar!

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

Het SPSS topic #2 - Waar we gezellig verder analyseren

» school, studie en onderwijs

» school, studie en onderwijs