Het SPSS topic #2 - Waar we gezellig verder analyseren | School, Studie en Onderwijs (SES)

donderdag 29 april 2010 @ 15:57:39 #26

yozd

FR1908 Vakkie R

quote:
Op donderdag 29 april 2010 13:14 schreef Skv het volgende:
Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.

Dat is op zich ook een goed idee ja. Je hebt wel gelijk wat betreft de vraag of het concept wel goed gemeten wordt. Probleem is echter dat ik voor een of andere opdracht een analyse moet uitvoeren aan de hand van gegevens die er al liggen. Men heeft dus eerst de enquetes verstuurd en achteraf bedacht wat men wil weten. Dat is de omgekeerde wereld, maar ik probeer er nog wat van te maken

.

Op de site (http://www.nd.edu/~rwilliam/stats2/) van een of andere statistiek docent, heb ik trouwens iets gevonden wat ik ongeveer wilde gaan doen: http://www.nd.edu/~rwilliam/stats2/l23.pdf . Deze man construeert een schaal op basis van een aantal stellingen waar men eens (1) of oneens (0) op moest antwoorden. Met die info en jouw tips moet het lukken!

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

donderdag 29 april 2010 @ 16:02:25 #27

crossover

quote:
Op donderdag 29 april 2010 15:32 schreef Karen1987 het volgende:
Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...

Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?

Wie kan mij helpen?

Wat wil je precies doen? Je kan ze toch samenvoegen naar een bestand en dan vergelijken?

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

donderdag 29 april 2010 @ 20:35:20 #28

Skv

Cynist.

quote:
Op donderdag 29 april 2010 15:32 schreef Karen1987 het volgende:
Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...

Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?

Wie kan mij helpen?

Meten ze hetzelfde concept? Zoek eerst de samenhang tussen afzonderlijke vragen uit. Vervolgens filter je de vragen die niet goed correleren met de andere vragen. Daarna construeer je 2 nieuwe variabelen die je gewoon tegen elkaar kan toetsen.

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

donderdag 29 april 2010 @ 20:36:24 #29

Skv

Cynist.

quote:
Op donderdag 29 april 2010 15:57 schreef yozd het volgende:

[..]

Dat is op zich ook een goed idee ja. Je hebt wel gelijk wat betreft de vraag of het concept wel goed gemeten wordt. Probleem is echter dat ik voor een of andere opdracht een analyse moet uitvoeren aan de hand van gegevens die er al liggen. Men heeft dus eerst de enquetes verstuurd en achteraf bedacht wat men wil weten. Dat is de omgekeerde wereld, maar ik probeer er nog wat van te maken .

Op de site (http://www.nd.edu/~rwilliam/stats2/) van een of andere statistiek docent, heb ik trouwens iets gevonden wat ik ongeveer wilde gaan doen: http://www.nd.edu/~rwilliam/stats2/l23.pdf . Deze man construeert een schaal op basis van een aantal stellingen waar men eens (1) of oneens (0) op moest antwoorden. Met die info en jouw tips moet het lukken!

Succes! Wil je de uiteindelijk gebruikte methode nog even posten hier? Vind ik wel interessant.

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

donderdag 29 april 2010 @ 20:38:12 #30

Citizen.Erased

7\

TVP.

De komende tijd mag ik ook weer met SPSS aan de slag.

De teloorgang van de PI

maandag 3 mei 2010 @ 11:59:01 #31

Karen1987

quote:
Op donderdag 29 april 2010 20:35 schreef Skv het volgende:

[..]

Meten ze hetzelfde concept? Zoek eerst de samenhang tussen afzonderlijke vragen uit. Vervolgens filter je de vragen die niet goed correleren met de andere vragen. Daarna construeer je 2 nieuwe variabelen die je gewoon tegen elkaar kan toetsen.

Ja ze meten hetzelfde concept. De ene vragenlijst meet het 'nu' en de andere de gewenste toekomst. Ik zou graag willen weten of hier tussen een verschil bestaat. Er worden in beide vragenlijsten 6 concepten uitgevraagd, dus bij de ene vragenlijst is dat 1 vraag per concept, bij de andere 5 per concept. Vragen uitfilteren kan niet, want de lange vragenlijst is een bestaande vragenlijst. Hoe kan ik dit vergelijken als de twee schalen dus niet gelijk zijn in grootte? Op deze manier kan ik ze niet vergelijken...

maandag 3 mei 2010 @ 12:01:43 #32

Skv

Cynist.

quote:
Op maandag 3 mei 2010 11:59 schreef Karen1987 het volgende:

[..]

Ja ze meten hetzelfde concept. De ene vragenlijst meet het 'nu' en de andere de gewenste toekomst. Ik zou graag willen weten of hier tussen een verschil bestaat. Er worden in beide vragenlijsten 6 concepten uitgevraagd, dus bij de ene vragenlijst is dat 1 vraag per concept, bij de andere 5 per concept. Vragen uitfilteren kan niet, want de lange vragenlijst is een bestaande vragenlijst. Hoe kan ik dit vergelijken als de twee schalen dus niet gelijk zijn in grootte? Op deze manier kan ik ze niet vergelijken...

Maak van de vragenlijst met 5 per concept een nieuwe variabele met de samenvoeging van de 5 vragen die telkens een concept meten. Zoek wel uit of die vijf variabelen wel genoeg samenhangen.

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

maandag 3 mei 2010 @ 12:05:28 #33

Karen1987

quote:
Op maandag 3 mei 2010 12:01 schreef Skv het volgende:

[..]

Maak van de vragenlijst met 5 per concept een nieuwe variabele met de samenvoeging van de 5 vragen die telkens een concept meten. Zoek wel uit of die vijf variabelen wel genoeg samenhangen.

Dankje! Ik zou het gewoon moeten weten, maar ik ben er zolang uit geweest.. En nooit een held geweest natuurlijk... Als ik gecontroleerd heb of ze genoeg samenhangen, kan ik ze dan samenvoegen door het gemiddelde te nemen? Of zeg ik dan weer iets compleet gestoords..

vrijdag 7 mei 2010 @ 13:40:44 #34

Skv

Cynist.

Samenhang controleren kan met Chronbach's alpha. Vervolgens kan je een nieuwe variabele aanmaken met -inderdaad- het gemiddelde van de vijf variabelen. Zorg wel dat je alle 'missing values' eerst verwijderd en niet meetelt bij het nemen van het gemiddelde. (als een missing value bijvoorbeeld de code 9 heeft gekregen en rest een score van 1 t/m 5 Likert en je neemt het gemiddelde van iemand die slechts één van de vijf vragen heeft ingevuld, dan zou de totale score van die persoon richting de 9 liggen).

Succes!

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

maandag 10 mei 2010 @ 17:16:02 #35

Pablo88

Ik moet voor mijn Bachelor eindopdracht verzamelde data analyseren; zijn de verschillen tussen 2 situaties significant?
Dit gaat met de Paired T-test of met de Wilcoxon signed Rank test, welke van de twee hangt af of de data al dan niet normaal verdeeld is. Is dit met SPSS gemakkelijk te bepalen?

U kunt hier adverteren voor maar €10 per maand. Neem contact op via PM.

maandag 10 mei 2010 @ 17:45:35 #36

yozd

FR1908 Vakkie R

Ik gebruik in mijn syntax onderstaand filter:

USE ALL.
COMPUTE filter_$=((v17a=3 | v17a=4 | v17a=9 | SYSMIS(v17a)) & (v17b=3 |
v17b=4 | v17b=9 | SYSMIS(v17b)) & (countmissing17 <= 1)).
VARIABLE LABEL filter_$ '(Vraag 17 geen ja) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .

Wat er precies gefilterd wordt, is niet heel boeiend; het werkt wel. De juiste selectie blijft over en de rest wordt "weggestreept". Nu wil ik van de selectie die overblijft een vraag hercoderen (d.w.z. alles blijft gelijk, maar de system missings krijgen een 0.5):

RECODE
v18a (1=1) (2=2) (3=3) (SYSMIS=0.5) .
EXECUTE .

Probleem is echter dat die nu voor alles cases de vraag hercodeert (alle sysmis'es worden 0.5), terwijl ik dat alleen voor de selectie wilde doen. Waar doe ik het verkeerd?

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

maandag 10 mei 2010 @ 17:45:35 #37

Skv

Cynist.

Ja.

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

dinsdag 11 mei 2010 @ 14:32:27 #38

Pablo88

quote:
Op maandag 10 mei 2010 17:45 schreef Skv het volgende:
Ja.

en hoe gaat dat dan?

U kunt hier adverteren voor maar €10 per maand. Neem contact op via PM.

dinsdag 11 mei 2010 @ 14:36:14 #39

Z

quote:
Op maandag 10 mei 2010 17:45 schreef yozd het volgende:
Ik gebruik in mijn syntax onderstaand filter:

USE ALL.
COMPUTE filter_$=((v17a=3 | v17a=4 | v17a=9 | SYSMIS(v17a)) & (v17b=3 |
v17b=4 | v17b=9 | SYSMIS(v17b)) & (countmissing17 <= 1)).
VARIABLE LABEL filter_$ '(Vraag 17 geen ja) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .

Wat er precies gefilterd wordt, is niet heel boeiend; het werkt wel. De juiste selectie blijft over en de rest wordt "weggestreept". Nu wil ik van de selectie die overblijft een vraag hercoderen (d.w.z. alles blijft gelijk, maar de system missings krijgen een 0.5):

RECODE
v18a (1=1) (2=2) (3=3) (SYSMIS=0.5) .
EXECUTE .

Probleem is echter dat die nu voor alles cases de vraag hercodeert (alle sysmis'es worden 0.5), terwijl ik dat alleen voor de selectie wilde doen. Waar doe ik het verkeerd?

SPSS doet raar als je onder voorwaarde hercodeerd. Ik zou het via een omweg doen, als je bij het filteren 'delete unselected cases' doet, het bestand onder een andere naam opslaat, heocdeerd en de data via een merge weer aan elkaar plakt, lukt het wel.

Aldus.

dinsdag 11 mei 2010 @ 14:41:28 #40

Z

Je kan ook 'update' gebruiken ipv mergen.

Aldus.

woensdag 12 mei 2010 @ 21:39:56 #41

yozd

FR1908 Vakkie R

quote:
Op dinsdag 11 mei 2010 14:36 schreef Z het volgende:

SPSS doet raar als je onder voorwaarde hercodeerd. Ik zou het via een omweg doen, als je bij het filteren 'delete unselected cases' doet, het bestand onder een andere naam opslaat, heocdeerd en de data via een merge weer aan elkaar plakt, lukt het wel.

Hartstikke bedankt! Het werkt via die omweg wel

.

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

vrijdag 14 mei 2010 @ 00:33:22 #42

yozd

FR1908 Vakkie R

Nog een vraag over het construeren van mijn schaal. Eerst nog even de eerdere posts:

quote:
Op woensdag 28 april 2010 22:21 schreef yozd het volgende:

Mjah, dit is wat ik eigenlijk probeer te bewerkstelligen, voorbeeld:

Heeft u A?
Heeft u B?
Heeft u C?
Heeft u X?
Heeft u Y?
Heeft u Z?

Op alle vragen kan men ja of nee antwoorden --> 0 of 1. Al die vragen samen zeggen iets over het gevoerde "beleid" (betreffende dat onderwerp). Nu wil ik een totaalscore hebben van dat beleid. Ik dacht er eerst aan om alle scores op te tellen. Een respondent scoort dan, in dit voorbeeld, maximaal 6 ("veel beleid") en minimaal 0 (weinig beleid). Nu zou dat ietwat problematisch worden bij missing scores, aangezien die de totaalscores verpesten.

Bij het middelen liggen de scores tussen 0 (weinig beleid) en 1 (veel beleid). De waardes die eruit komen zijn dus niet 0 of 1, maar liggen daar tussen in (kunnen natuurlijk wel 0 of 1 zijn).

Ik zie alleen door de bomen het bos niet meer zo...

quote:
Op donderdag 29 april 2010 13:14 schreef Skv het volgende:
Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.

Ik heb het nu gedaan op de hierboven beschreven manier voor begrip X. Ik ga dat ook nog doen voor begrip Y en daarna kan ik ze met elkaar gaan vergelijken.

Ik gebruik overigens een schaal gebaseerd op gemiddelde scores. Zoals iemand al eerder zei, is dat beter, omdat je bij somscores vaak te laag zit als iemand missings heeft. Neem je gemiddelde scores, dan worden die missings "geneutraliseerd". Mijn schaal is de gemiddelde score (tussen 0 en 1) over 28 vragen.

Ik wil alleen graag ook iets zeggen over de betrouwbaarheid van de schalen. Met SPSS kan je daarvoor de Reliability Analysis gebruiken. Je selecteert dan alle variabelen (in mijn geval 28 vragen) en dan krijg je via de Cronbach's alpha te zien of je schaal betrouwbaar is (valide is een ander verhaal...). Een C alpha van 0.8 of hoger is goed en van 0.6 is ongeveer de minimum vereiste.

Probleem is echter dat wanneer een case/respondent een missing value heeft op 1 van de 28 vragen (wat bij mij heel vaak het geval is), deze case wordt weggelaten uit de analyse. Gevolg is dat ik er bij het berekenen maar 7 van de oorspronkelijke 1403 respondenten worden gebruikt

. Dit gebeurt bij mij o.a. doordat ik de "weet niet" scores als missing heb behandeld. Als ik die i.p.v. missing als neutraal behandel (een 0.5 score, aangezien mijn schaal tussen de 0 en 1 is), dan worden er al wat meer cases gebruikt, maar nog steeds heel weinig (65 ofzo).

Een belangrijker oorzaak van dit probleem is het volgende: 2 van de 28 vragen zijn "vervolgvragen". Die vragen hoeven alleen maar ingevuld te worden als er op eerdere vragen "ja" is geantwoord. Veel mensen hebben die vragen dus niet ingevuld, ergo: dat worden missings en de cases worden uitgesloten van de analyse. In feite zijn dit geen "echte" missings. Twee oplossingen: (1) deze vragen niet in de schaal opnemen als de betrouwbaarheid wordt getest, of (2) de dataset hercoderen. Met dit hercoderen bedoel ik dat er gekeken wordt in de dataset of er op de beginvragen een "ja" is geantwoord, is dat niet het geval, dan worden die 2 vragen waar het om gaat gehercodeerd als neutraal (0.5), zodat ze niet meer missing zijn, maar een waarde krijgen.

In beide gevallen wordt bij het testen op betrouwbaarheid meer dan 90% van de cases meegenomen, wat natuurlijk een beter beeld geeft.

Dus:

(1) Hoe moet ik mijn schaal testen op betrouwbaarheid?
a. alle 28 vragen, "weet niet" = missing
b. alle 28 vragen, "weet niet" = neutraal (0.5 score)
c. alle 28 vragen, 2 vragen gehercodeerd (missings, zijn nepmissings en worden neutraal)
d. niet alle vragen, 2 vragen eruit, 26 vragen over

(2) Welke schaal kan ik het beste gebruiken in de verdere analyses (regressie e.d.)?

Is het erg als ik een schaal gebruik, waarvan de betrouwbaarheid niet getest kan worden? Stel ik gebruik schaal a of b. Die zijn eigenlijk niet te testen. Via bovenstaande bewerkingen is wel aan te tonen dat de 28 vragen samenhangen (de alpha verandert niet veel door de bewerkingen, het enige is dat er veel meer cases worden gebruikt bij de laatste 2). Ik gebruik dan dus voor de (regressie)analyses een bepaalde schaal en om aan te tonen dat die vragen/items überhaupt zijn te combineren tot 1 schaal gebruik ik die bewerkingen. Kan dat?

Excuses voor de lange post trouwens!

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

zondag 16 mei 2010 @ 15:17:48 #43

yozd

FR1908 Vakkie R

Niemand?

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

dinsdag 18 mei 2010 @ 15:13:37 #44

Pablo88

Okay, ik weet nu dat ik met SPSS kan bepalen of mijn data al dan wel niet normaal is verdeeld. Maar hoe doe ik dit? Iemand een gemakkelijke beschrijving?

thx

U kunt hier adverteren voor maar €10 per maand. Neem contact op via PM.

Moderator dinsdag 18 mei 2010 @ 15:57:34 #45

Rene

Dabadee dabadaa

tvp

Moet er denk ik ook aan geloven soon or later...

 | ❤ | Triquester... | ツ Met een accént aigu

dinsdag 18 mei 2010 @ 16:57:57 #46

Skv

Cynist.

quote:
Op dinsdag 18 mei 2010 15:13 schreef Pablo88 het volgende:
Okay, ik weet nu dat ik met SPSS kan bepalen of mijn data al dan wel niet normaal is verdeeld. Maar hoe doe ik dit? Iemand een gemakkelijke beschrijving?

thx

-Analyze->Descriptives->Frequencies->Histogram met vink bij normal curve. Kijken of het histogram overeenkomt.

Analyze->descriptives->Explore->dependent var geeft een Q-Q-plot, waarbij de waarnemingen op de lijn moeten liggen voor een normale verdeling.

-Shapiro-Wilktoets geeft ook normaliteit aan:
H0: de verdeling van variabele is standaard-normaal verdeeld.
Ha: de verdeling van variabele is niet standaard-normaal verdeeld.
Komt neer op Sig <0.05: geen normale verdeling bij alpha van 5%.

Ons soort mensen, trapt reeds jaren blij van zin, het vuile plebs de modder in.
Ons soort mensen, steunpilaar van vaderland en koningin.

dinsdag 18 mei 2010 @ 21:20:19 #47

StephanL

Wat een but om alles te analyseren

Heb het ook sinds enkele weken, op zich een goed programma, maar je moet alle antwoorden verantwoorden

vrijdag 4 juni 2010 @ 13:30:43 #48

thedarkside

Weet iemand toevallig hoe je een variabele kunt kwadrateren in SPSS? Via compute variables moet ik iets kwadrateren, maar ik kan de juiste functie niet vinden. Ik kan het wel via excel doen en dan kopieeren in SPSS, maar met veel data wordt dat een beetje vervelend.

vrijdag 4 juni 2010 @ 13:36:39 #49

Z

Compute varx = varx * varx.
exe.

Aldus.

vrijdag 4 juni 2010 @ 13:53:58 #50

thedarkside

Te simpel om zelf op te komen.. Thnx.

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

Het SPSS topic #2 - Waar we gezellig verder analyseren

» school, studie en onderwijs

» school, studie en onderwijs