quote:Op dinsdag 23 maart 2010 11:23 schreef bergkamp85 het volgende:
Ik heb een vraagje. Ik heb momenteel een construct bestaande uit 4 vragen. Zodra ik Cronbach Alpha doe, kom ik uit op 0,804. Als ik echter één vraag verwijder, stijgt mijn Cronbach naar 0,812, en als ik vervolgens nog een vraag verwijder komt mijn Cronbach uit op 0,884. Moet ik nu wel of niet deze vragen verwijderen?
quote:Op vrijdag 2 april 2010 12:22 schreef Zocalo het volgende:
Nee, geloof dat 0,7 de ondergrens is, en daar zit je al ruim aan.
Bekijk de samenhang van de factoren per variabele met Chronbach's alpha. Dingen die erg afwijken van de rest verwijderen en kijken of chronbach's alpha > 0.7. Is dat zo, dan een nieuwe variabele aanmaken met compute, waarbij je de gemiddelden van alle vorige vragen bij elkaar optelt en op elkaar deelt. Die nieuwe variabelen kan je dan gewoon regressie-analyse op toepassen.quote:Op maandag 19 april 2010 13:55 schreef Barbalena het volgende:
Hoi Z,
Anova dus, dat gaat vast lukken.
Maar die regressieanalyse, kan dat wel? Ivm multicollineariteit, de 15 vragen over betrokkenheid zullen naar verwachting onderling een hoge correlatie met elkaar hebben en de 10 over de relatie met de leidinggevende ook.
Als ik nu heel simpel denk, kan ik gemiddelden nemen van de vragen, en zo een score krijgen op betrokkenheid en op relatie-leidinggevende en dan kijken naar de correlatie daarvan?
Of bega ik dan een grote zonde...![]()
SPSS rekent het vast allemaal mooi uit, maar mág het ook...
Ik las dat Spearman en Kendall allebei zouden kunnen. Spearman is ook voor ordinale variabelen of voor interval/ratio variabelen die niet voldoen aan bepaalde assumpties. Vaak geven beide testen ongeveer dezelfde uitkomsten. Kendall's tau is alleen makkelijker te interpreteren en praktischer, al wordt het me niet echt duidelijk waarom...quote:Op woensdag 28 april 2010 08:22 schreef Skv het volgende:
Vergelijking van twee ordinale variabelen zou ik kiezen voor kendalls tau-b voor een vierkantstabel of kendalls tau-c voor een rechthoekige tabel. Voor spearmans rho heb je een variabele van ordinaal en een variabele van interval of rationiveau nodig.
Lijkt me moeilijk om met slechts 'ja' of 'nee' een sterkte van samenhang te genereren. 'ja' en 'nee' is gewoon een bivariate variabele in plaats van een ordinale!quote:Op woensdag 28 april 2010 09:14 schreef yozd het volgende:
Bedankt! Ik ga ze middelen.
[..]
Ik las dat Spearman en Kendall allebei zouden kunnen. Spearman is ook voor ordinale variabelen of voor interval/ratio variabelen die niet voldoen aan bepaalde assumpties. Vaak geven beide testen ongeveer dezelfde uitkomsten. Kendall's tau is alleen makkelijker te interpreteren en praktischer, al wordt het me niet echt duidelijk waarom...
-edit-
Ik zie trouwens bij alle voorbeelden (gevonden via Google) van het samenstellen van een index variabele dat ze een Likert schaal o.i.d. hebben; met keuzes van 1 t/m 5 ("helemaal nooit, bijna nooit, neutraal, soms, heel vaak" ofzo). Ik heb echter bij mijn 1e variabele alleen maar "ja" of "nee" (ook nog "weet niet", maar die gebruik ik niet) en bij die 2e (X) slechts 3 keuzes. Maakt dat wat uit?
Mjah, dit is wat ik eigenlijk probeer te bewerkstelligen, voorbeeld:quote:Op woensdag 28 april 2010 16:46 schreef Skv het volgende:
Lijkt me moeilijk om met slechts 'ja' of 'nee' een sterkte van samenhang te genereren. 'ja' en 'nee' is gewoon een bivariate variabele in plaats van een ordinale!
Dat is op zich ook een goed idee ja. Je hebt wel gelijk wat betreft de vraag of het concept wel goed gemeten wordt. Probleem is echter dat ik voor een of andere opdracht een analyse moet uitvoeren aan de hand van gegevens die er al liggen. Men heeft dus eerst de enquetes verstuurd en achteraf bedacht wat men wil weten. Dat is de omgekeerde wereld, maar ik probeer er nog wat van te makenquote:Op donderdag 29 april 2010 13:14 schreef Skv het volgende:
Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.
Wat wil je precies doen? Je kan ze toch samenvoegen naar een bestand en dan vergelijken?quote:Op donderdag 29 april 2010 15:32 schreef Karen1987 het volgende:
Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...
Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?
Wie kan mij helpen?
Meten ze hetzelfde concept? Zoek eerst de samenhang tussen afzonderlijke vragen uit. Vervolgens filter je de vragen die niet goed correleren met de andere vragen. Daarna construeer je 2 nieuwe variabelen die je gewoon tegen elkaar kan toetsen.quote:Op donderdag 29 april 2010 15:32 schreef Karen1987 het volgende:
Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...
Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?
Wie kan mij helpen?
Succes! Wil je de uiteindelijk gebruikte methode nog even posten hier? Vind ik wel interessant.quote:Op donderdag 29 april 2010 15:57 schreef yozd het volgende:
[..]
Dat is op zich ook een goed idee ja. Je hebt wel gelijk wat betreft de vraag of het concept wel goed gemeten wordt. Probleem is echter dat ik voor een of andere opdracht een analyse moet uitvoeren aan de hand van gegevens die er al liggen. Men heeft dus eerst de enquetes verstuurd en achteraf bedacht wat men wil weten. Dat is de omgekeerde wereld, maar ik probeer er nog wat van te maken.
Op de site (http://www.nd.edu/~rwilliam/stats2/) van een of andere statistiek docent, heb ik trouwens iets gevonden wat ik ongeveer wilde gaan doen: http://www.nd.edu/~rwilliam/stats2/l23.pdf . Deze man construeert een schaal op basis van een aantal stellingen waar men eens (1) of oneens (0) op moest antwoorden. Met die info en jouw tips moet het lukken!
Ja ze meten hetzelfde concept. De ene vragenlijst meet het 'nu' en de andere de gewenste toekomst. Ik zou graag willen weten of hier tussen een verschil bestaat. Er worden in beide vragenlijsten 6 concepten uitgevraagd, dus bij de ene vragenlijst is dat 1 vraag per concept, bij de andere 5 per concept. Vragen uitfilteren kan niet, want de lange vragenlijst is een bestaande vragenlijst. Hoe kan ik dit vergelijken als de twee schalen dus niet gelijk zijn in grootte? Op deze manier kan ik ze niet vergelijken...quote:Op donderdag 29 april 2010 20:35 schreef Skv het volgende:
[..]
Meten ze hetzelfde concept? Zoek eerst de samenhang tussen afzonderlijke vragen uit. Vervolgens filter je de vragen die niet goed correleren met de andere vragen. Daarna construeer je 2 nieuwe variabelen die je gewoon tegen elkaar kan toetsen.
Maak van de vragenlijst met 5 per concept een nieuwe variabele met de samenvoeging van de 5 vragen die telkens een concept meten. Zoek wel uit of die vijf variabelen wel genoeg samenhangen.quote:Op maandag 3 mei 2010 11:59 schreef Karen1987 het volgende:
[..]
Ja ze meten hetzelfde concept. De ene vragenlijst meet het 'nu' en de andere de gewenste toekomst. Ik zou graag willen weten of hier tussen een verschil bestaat. Er worden in beide vragenlijsten 6 concepten uitgevraagd, dus bij de ene vragenlijst is dat 1 vraag per concept, bij de andere 5 per concept. Vragen uitfilteren kan niet, want de lange vragenlijst is een bestaande vragenlijst. Hoe kan ik dit vergelijken als de twee schalen dus niet gelijk zijn in grootte? Op deze manier kan ik ze niet vergelijken...
Dankje! Ik zou het gewoon moeten weten, maar ik ben er zolang uit geweest.. En nooit een held geweest natuurlijk... Als ik gecontroleerd heb of ze genoeg samenhangen, kan ik ze dan samenvoegen door het gemiddelde te nemen? Of zeg ik dan weer iets compleet gestoords..quote:Op maandag 3 mei 2010 12:01 schreef Skv het volgende:
[..]
Maak van de vragenlijst met 5 per concept een nieuwe variabele met de samenvoeging van de 5 vragen die telkens een concept meten. Zoek wel uit of die vijf variabelen wel genoeg samenhangen.
SPSS doet raar als je onder voorwaarde hercodeerd. Ik zou het via een omweg doen, als je bij het filteren 'delete unselected cases' doet, het bestand onder een andere naam opslaat, heocdeerd en de data via een merge weer aan elkaar plakt, lukt het wel.quote:Op maandag 10 mei 2010 17:45 schreef yozd het volgende:
Ik gebruik in mijn syntax onderstaand filter:
USE ALL.
COMPUTE filter_$=((v17a=3 | v17a=4 | v17a=9 | SYSMIS(v17a)) & (v17b=3 |
v17b=4 | v17b=9 | SYSMIS(v17b)) & (countmissing17 <= 1)).
VARIABLE LABEL filter_$ '(Vraag 17 geen ja) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .
Wat er precies gefilterd wordt, is niet heel boeiend; het werkt wel. De juiste selectie blijft over en de rest wordt "weggestreept". Nu wil ik van de selectie die overblijft een vraag hercoderen (d.w.z. alles blijft gelijk, maar de system missings krijgen een 0.5):
RECODE
v18a (1=1) (2=2) (3=3) (SYSMIS=0.5) .
EXECUTE .
Probleem is echter dat die nu voor alles cases de vraag hercodeert (alle sysmis'es worden 0.5), terwijl ik dat alleen voor de selectie wilde doen. Waar doe ik het verkeerd?
Hartstikke bedankt! Het werkt via die omweg welquote:Op dinsdag 11 mei 2010 14:36 schreef Z het volgende:
SPSS doet raar als je onder voorwaarde hercodeerd. Ik zou het via een omweg doen, als je bij het filteren 'delete unselected cases' doet, het bestand onder een andere naam opslaat, heocdeerd en de data via een merge weer aan elkaar plakt, lukt het wel.
quote:Op woensdag 28 april 2010 22:21 schreef yozd het volgende:
Mjah, dit is wat ik eigenlijk probeer te bewerkstelligen, voorbeeld:
Heeft u A?
Heeft u B?
Heeft u C?
Heeft u X?
Heeft u Y?
Heeft u Z?
Op alle vragen kan men ja of nee antwoorden --> 0 of 1. Al die vragen samen zeggen iets over het gevoerde "beleid" (betreffende dat onderwerp). Nu wil ik een totaalscore hebben van dat beleid. Ik dacht er eerst aan om alle scores op te tellen. Een respondent scoort dan, in dit voorbeeld, maximaal 6 ("veel beleid") en minimaal 0 (weinig beleid). Nu zou dat ietwat problematisch worden bij missing scores, aangezien die de totaalscores verpesten.
Bij het middelen liggen de scores tussen 0 (weinig beleid) en 1 (veel beleid). De waardes die eruit komen zijn dus niet 0 of 1, maar liggen daar tussen in (kunnen natuurlijk wel 0 of 1 zijn).
Ik zie alleen door de bomen het bos niet meer zo...
Ik heb het nu gedaan op de hierboven beschreven manier voor begrip X. Ik ga dat ook nog doen voor begrip Y en daarna kan ik ze met elkaar gaan vergelijken.quote:Op donderdag 29 april 2010 13:14 schreef Skv het volgende:
Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.
-Analyze->Descriptives->Frequencies->Histogram met vink bij normal curve. Kijken of het histogram overeenkomt.quote:Op dinsdag 18 mei 2010 15:13 schreef Pablo88 het volgende:
Okay, ik weet nu dat ik met SPSS kan bepalen of mijn data al dan wel niet normaal is verdeeld. Maar hoe doe ik dit? Iemand een gemakkelijke beschrijving?
thx
Ik heb mijn twijfels of dit überhaupt kan met SPSS, voor conjoint analyses wordt vaak andere software gebruikt dan SPSS, aparte pakketten speciaal ontwikkeld voor conjoint analyses.quote:Op maandag 28 juni 2010 12:39 schreef The_Eye het volgende:
Hier weer een SPSS probleem:
Voor mijn scriptie ben ik bezig met een conjoint analyse. Aangezien ik de afhankelijke variabele op nominaal als interval niveau gemeten heb, maak ik zowel van dummy variable multiple regression als binary logistic regression gebruik. Nu wil ik ook interactie effecten meten (geslacht, opleiding, etc). Mijn vraag is hoe ik dit precies moet doen? Ik heb al wat gegoogled maar maar kom niks bruikbaars tegen.
Hoop dat iemand mij hiermee kan helpen. Alvast dank voor de hulp.
Het doel is om je nul-hypothese te verwerpen. Daarin veronderstel je normaliter dat er geen effect/verschil is. In je alternatieve hypothese ga je wel uit van een effect/verschil.quote:Op maandag 5 juli 2010 23:36 schreef Hiya het volgende:
Basic vraagje over H0 en H1;
Is H0 altijd gelijk aan wat je verwacht dat uit de toets komt en wat je daarna dus gaat toetsen?
Bijvoorbeeld bij 100 mensen a-select ondervraagd:
H0 = er bestaat geen signifant verschil in de seksen van de respondenten
H1 = er bestaat wel....
Of kan dit ook anders om?
Even wat anders. Een hypothese is nooit significant, het is namelijk een uitspraak over de populatie. En die uitspraak is waar of onwaar.quote:Op maandag 5 juli 2010 23:36 schreef Hiya het volgende:
Basic vraagje over H0 en H1;
Is H0 altijd gelijk aan wat je verwacht dat uit de toets komt en wat je daarna dus gaat toetsen?
Bijvoorbeeld bij 100 mensen a-select ondervraagd:
H0 = er bestaat geen signifant verschil in de seksen van de respondenten
H1 = er bestaat wel....
Of kan dit ook anders om?
waarbij we dan ook maar zullen toevoegen dat de criteria voor wanneer een geproduceerd effect met significantie al dan niet de nul-hypothese verwerpt, grotendeels afhankelijk zijn van het wetenschappelijke veld waarin je jezelf bevind. Uiteraard wel met wat technische correcties voor de methode zelf, maar dat spreekt voor zich.quote:Op dinsdag 6 juli 2010 10:10 schreef mies1983 het volgende:
[..]
Even wat anders. Een hypothese is nooit significant, het is namelijk een uitspraak over de populatie. En die uitspraak is waar of onwaar.
Kan iemand mij nog hier mee helpen?quote:Op maandag 5 juli 2010 09:28 schreef Brammie1 het volgende:
Na een jaar niet met SPSS gewerkt te hebben, weet ik niet meer hoe het moet
Ik wil, simpel gezegd, SPSS laten uitrekenen of 2 series met waarden significant van elkaar verschillen (P<0.05)
Ik zal het omschrijven als knikkers in een pot, ipv waar het echt om draait.
2 groepen van 5 potten met elk 100 knikkers, en er zijn 3 verschillende kleuren knikkers: rood, geel en blauw.
Groep 1:
Pot 1: 95 rood, 5 geel, 0 blauw
Pot 2: 98 rood, 2 geel, 0 blauw
Pot 3: 98 rood, 2 geel, 0 blauw
Pot 4: 85 rood, 15 geel, 0 blauw
Pot 5: 100 rood, 0 geel, 0 blauw
Groep 2:
Pot 1: 55 rood, 43 geel, 2 blauw
Pot 2: 78 rood, 22 geel, 0 blauw
Pot 3: 76 rood, 24 geel, 0 blauw
Pot 4: 72 rood, 27 geel, 2 blauw
Pot 5: 87 rood, 13 geel, 0 blauw
Het programma moet per groep het gemiddelde aantal rode, gele en blauwe knikkers uitrekenen, en de standaard deviatie.
De vraag is: zitten er in groep 2 significant meer gele knikkers in de potten dan in groep 1? Welke test moet ik daarvoor nemen? Is dat de Univariate test? Welke waarde (pot, rode knikkers, gele knikkers, blauwe knikkers) moet ik in welk vakje zetten?
Meer info: ik heb 26 vragen - vragenlijst gedaan, met statements waarop mensen konden reageren op een likertscale. Hier is nu een exploratieve factor analyse uit gekomen. Maar het onderzoek waar het mijne op gebaseerd is, doet conclusies n.a.v. de Z-scores die uit de factor analyze komen. Hoe o hoe?quote:Hoi!
Vraagje. Ik heb net een exploratory factor analysis gedraait in SPSS. Hieruit zijn 7 factoren gekomen. Nu kom ik erachter dat ik ook Z-scores moet berekenen. Nou kan dat normaal wel, maar ik heb geen flauw idee hoe ik dat moet doen en dat er dan relevante scores uitkomen waar ook conclusies aan kunnen worden verbonden.
Wie helpt me op weg?
Ehm nou de enquete is soort van een experimenteel design, dus er zitten 4 vragenlijsten in (condities) die random toegewezen worden aan een persoon. Door wat gehannes moesten er op het laatste moment nogal wat namen van variabelen gewijzigd worden in elke vragenlijst (had iets te maken met exporteren) en toen is dit foutje erin geslopen. De vragen moesten dus identiek zijn, maar dat zijn ze niet, vandaar dat ik ze wil samenvoegen om het recht te trekken.quote:
Ehm..hoe kan je dat met recode doen dan? Want ik heb het geprobeerd maar het zijn dus 2 variabelen, die 1 moeten worden..en dat wilde SPSS niet doen?quote:Op woensdag 14 juli 2010 10:39 schreef Z het volgende:
Klink overigens als iets wat je met RECODE zou moeten kunnen doen.
Compute new variablequote:Op woensdag 14 juli 2010 10:45 schreef InsaneM666 het volgende:
[..]
dan krijg ik alsnog 2 losse variabelen?
maar dat kan ik niet doen met optellen oid..weet je toevallig iets van syntax? of hoe het wel werkt?quote:
Transform - Compute Variable - Target Variable: naam van nieuwe variabele invoeren ; Numeric expression: namen invoeren van de variabelen die moeten worden samengevoegd, met steeds een plusteken ertussenin (of wat in de betreffende berekening van toepassing is) - OKquote:Op woensdag 14 juli 2010 10:51 schreef InsaneM666 het volgende:
[..]
maar dat kan ik niet doen met optellen oid..weet je toevallig iets van syntax? of hoe het wel werkt?
1 2 3 | Rwb_energiek50 + wb_somber51 + wb_uitgeblust52 + Rwb_gelukkig53 + wb_moe54) . EXECUTE |
Als ik dat doe zit er helemaal geen data in de nieuwe variabele..de ene variabele moet de lege plekken opvullen van de andere, dat is een beetje het principequote:Op woensdag 14 juli 2010 10:54 schreef crossover het volgende:
[..]
Transform - Compute Variable - Target Variable: naam van nieuwe variabele invoeren ; Numeric expression: namen invoeren van de variabelen die moeten worden samengevoegd, met steeds een plusteken ertussenin (of wat in de betreffende berekening van toepassing is) - OK
Voorbeeld van een syntax:
[ code verwijderd ]
nou het is eigenlijk zo:quote:Op woensdag 14 juli 2010 11:03 schreef crossover het volgende:
Dan begrijp ik het niet helemaal.
Je hebt twee variabelen met een verschillende naam waarvan de data hetzelfde is? Of verschilt de data?
En je wilt ze samenvoegen. Waarom kan je ze niet kopieren?
The number of variables to be recoded does not match the number of variablesquote:Op woensdag 14 juli 2010 11:05 schreef Z het volgende:
En zoiets?
RECODE VarA VarB (else=copy) into nVar.
EXECUTE .
Dit maakt het voor mij wel duidelijkerquote:Op woensdag 14 juli 2010 11:07 schreef InsaneM666 het volgende:
[..]
nou het is eigenlijk zo:
persoon 1 heeft vragenlijst 1, daar heet vraag 10 bijv vraag10. Hier heeft hij 1 ingevuld.
persoon 2 heeft vragenlijst 2, daar heet vraag 10 bijv. vraagtien, hier vult hij 0 in.
Dus vraag 10 heeft 2 variabelen, maar met openplekken omdat de 1 het ingevuld heeft bij vraag10 en de ander bij vraagtien. Dus die moeten samengevoegd worden tot 1. En dat kan natuurlijk ook door ze over te typen oid, maar dat is een beetje teveel werk denk ik zo..
Oftewel, de ene var heeft missing values, maar deze zitten in een andere var..
Ik heb zo het idee dat dit het niet duidelijker maakt..
Bedankt voor het meedenken trouwens
ehm nee ze zijn dichotoom.quote:Op woensdag 14 juli 2010 11:11 schreef crossover het volgende:
[..]
Dit maakt het voor mij wel duidelijker
Je kan dit het beste doen met de RECODE optie, denk ik. Zijn het nominale variabelen? Dan kan je je doelvariabele constant houden en in de bronvariabele de waardes die je over wil nemen laten kopieren naar de doelvariabele.
Een variabele kan nominaal EN dichotoom zijn.quote:Op woensdag 14 juli 2010 11:14 schreef InsaneM666 het volgende:
[..]
ehm nee ze zijn dichotoom.
en hoe doe je dat dan met kopieren enzo? dit soort handige dingen leren ze je jou niet hè
ik krijg dan een error..quote:Op woensdag 14 juli 2010 11:14 schreef crossover het volgende:
[ afbeelding ]
Bij mij werkt dit dus.
[..]
Een variabele kan nominaal EN dichotoom zijn.
17.quote:Op woensdag 14 juli 2010 11:20 schreef InsaneM666 het volgende:
[..]
ik krijg dan een error..
"the variable name duplicates another variable being created"
ik heb versie 16 trouwens, weet niet welke versie jij hebt?
ga ik 17 is even proberenquote:Op woensdag 14 juli 2010 11:20 schreef crossover het volgende:
[..]
17.
Bij mij is het geen error maar alleen een melding..
thanksquote:Op woensdag 14 juli 2010 11:21 schreef Z het volgende:
Het kan ook met 'update'. Dan moet je de data alleen even opslaan in losse databestanden.
Dus je maakt bijvoorbeeld twee databestanden voor jouw Vraag10. In beid ebestanden moet het unieke ID zitten en de te update variabelen, de variabelen moeten dan ook hetzelfde heten.
UPDATE FILE='/data/maillist.sav'
/FILE='/data/newlist.sav'
/BY=ID.
Het is wel een beetje omslachtig.
Oh die heb je zelf ook. Waarom gebruik je die dan niet in eerste instantiequote:
ik had m nog niet, maar nu welquote:Op woensdag 14 juli 2010 11:25 schreef crossover het volgende:
Als je wil, kan je mij het databestand mailen inclusief syntax, dan run ik 'm even en stuur ik 'm terug.
[..]
Oh die heb je zelf ook. Waarom gebruik je die dan niet in eerste instantie
De nieuwe variabele (de schaal) moet altijd worden samengesteld uit gelijk gedefinieerde items.quote:Op woensdag 21 juli 2010 03:17 schreef Wrigkey het volgende:
Ik heb ook een SPSS vraag, geen idee of ik mijn gegevens op de juiste wijze analyseer.
Heb een enquête gehouden met vragen op een 5-punts likert scale.
Een bepaald aantal vragen meten een positieve ervaring en een bepaald aantal vragen meet een negatieve ervaring. Deze ervaringen wil ik samen vergelijken. Hiervoor kan ik het beste Cronbachs Alpha gebruiken maar moet ik de negatieve ervaringen dan een - poling toekennen in SPSS?
Wanneer Cronbachs Alpha voldoende is (hoger dan 0.6) kan er met compute een nieuw variabele gemaakt worden denk ik. (MEAN(Variabele1,Variabele2,Variabele3))
En wat kan ik dan doen met die nieuwe variabele? Anova?
Alvast bedankt.
binaire logistische regressiequote:Op donderdag 22 juli 2010 13:50 schreef L.J.V. het volgende:
Hallo,
ik probeer met mijn scriptie werkprestatie te voorspellen dmv persoonlijkheid.
Daarbij heb ik onder andere als criterium "target gehaald ja/nee"
Stel, ik heb 5 persoonlijkheidstrekken, en ik wil kijken of en hoeveel deze trekken dat criterium voorspellen, hoe moet ik dat dan doen?
Ik zit dus met het ja/nee aspect... want als ik een mra doe, dan komt er troep uit, aangezien ik alleen een 0(nee) en 1 (ja) heb..
Dankje!quote:
ik heb hier geen spss maar er zou binary logistic tussen moeten staan?quote:Op donderdag 22 juli 2010 14:39 schreef L.J.V. het volgende:
[..]
Dankje!
Maar als ik bij regression kijk kan ik kiezen uitLinear Curve estimation partial least squares ordinal
Heb ik een verkeerde versie spss ofzo (17.0)? Omdat logistic er niet bij staat.. of zie ik iets over het hoofd.
Het staat er niet tussenquote:Op donderdag 22 juli 2010 14:43 schreef oompaloompa het volgende:
[..]
ik heb hier geen spss maar er zou binary logistic tussen moeten staan?
dat is echt heel erg vreemd. Vooral omdat ik zeker weet dat 14 en of 17 of 18 (weet zo uit mn hoofd niet welke op de uni staat) het wel hebben. Misschien even zoeken in de help-functie?quote:Op donderdag 22 juli 2010 14:47 schreef L.J.V. het volgende:
[..]
Het staat er niet tussen![]()
Hopelijk ligt dat dan aan mijn versie spss en hebben ze het op de universiteit wel.
dankjewel voor je hulp!
quote:Op donderdag 22 juli 2010 15:39 schreef oompaloompa het volgende:
[..]
dat is echt heel erg vreemd. Vooral omdat ik zeker weet dat 14 en of 17 of 18 (weet zo uit mn hoofd niet welke op de uni staat) het wel hebben. Misschien even zoeken in de help-functie?
Tis echt een van de meest standaard analyses, ik weet bijna zeker dat het ergens verstopt moet staan.
dan moet je ook niet zomaar wat downloaden van het internet. Ik ken dit geintje van anderen die hetzelfde probleem hadden.quote:Op donderdag 22 juli 2010 15:54 schreef L.J.V. het volgende:
[..]
Nog vreemder is dat ik logistic regression wel kan vinden in het Help gedeelte, en daar word ook gezegd dat het onder analyze>regression staat. Maar dat is dus niet zo.
16.50 incl. verzendingquote:Op vrijdag 23 juli 2010 02:35 schreef Frith het volgende:
[..]
dan moet je ook niet zomaar wat downloaden van het internet. Ik ken dit geintje van anderen die hetzelfde probleem hadden.
Het is echter onzinnig, aangezien de volumelicensie via de uni (of hbo) iets van 15 euro is en vervolgens jaren geldig, dus je hebt er niets aan om het te downloaden.
Overigens is je model letterlijk een voorbeeldvraag van het hoofdstuk over logistische regressie in 'learning statistics with SPSS' van Andy Field. De antwoorden daarvan (en uitleg) zijn zelfs te downloaden op de bijhorende site.
hoe bedoel je vaker voorkomt als elke ppn elke campagne heeft beoordeeld/ingevuld?quote:Op vrijdag 23 juli 2010 16:41 schreef aarstulp het volgende:
Het probleem is als volgt: Heb 6 soorten campagnes als onafhankelijke variabelen en consumptie als afhankelijke. De 6 campagnes worden met ieder 5 vragen gemeten (5-punts Likert). Heb door wat rotte appels te verwijderen mooie Cronbach's Alphas verkregen. Nu ga ik iedere campagne aan consumptie linken met een regressie analyse, dat moet lukken hoop ik. Maar allereerst wil ik gewoon het verschil tussen de campagnes meten. Mijn begeleider had het over een t-test of ANOVA. Maar bij een t-test krijg je gewoon de gemiddelden, standaardafwijkingen, vrijheidsgraden en de p-waarde. Ik bedoelde eigenlijk meer van welke vaker voorkomt. Uiteraard weten jullie niet wat mijn begeleider bedoelt, maar vanuit een kennersoogpunt, ben ik nou goed bezig of heb ik de verkeerde analyse te pakken?
Ik raak heel erg verward dat je campagnes zowel de independent variable / manipulatie zijn als de afhankelijke?quote:Op vrijdag 23 juli 2010 17:52 schreef aarstulp het volgende:
Stel: zes soorten campagnes waar wordt ingespeeld op persoonlijkheden. Sportief, upperclass, ruig, mannelijk, vrouwelijk, hip. Dit zijn de IV's en zijn opgebouwd door bij ieder construct 5 items samen te voegen middels compute variable. De items werden gemeten op 5-punts Likert en het construct is een gemiddelde van de items (Ordinaal). De DV is de consumptie in aantallen, dus scale.
Heb onvolledige surveys verwijderd, dus alles is compleet wat dat betreft.
Na even gedacht te hebben, gewoon voor ieder construct een t-test doen en mean&std dev in een tabelletje zetten? Ik denk dat mijn begeleider gewoon een soort algemeen statistiekje wil zien van de data ofzo.
Ik snap dat het niet duidelijk is wat ik bedoel, dat snap ik zelf ook niet. Hoop toch dat je hier nog wat mee kan.
quote:Op donderdag 22 juli 2010 14:43 schreef oompaloompa het volgende:
[..]
ik heb hier geen spss maar er zou binary logistic tussen moeten staan?
sorry ik begrijp echt niet wat je wilt precies. Is het een soort manipulatiecheck? Je manipuleert(?) campagne en kijkt naar het effect op consumptie. maar als je campagne manipuleert valt er weinig aan te meten toch? Of meet je slechts campagne en heb je dus een andere IV die je nog niet genoemd hebt?quote:Op vrijdag 23 juli 2010 18:07 schreef aarstulp het volgende:
Had 6 hypotheses die betrekking hadden op de relatie tussen de campagne(IV) en de consumptie van die persoon(DV). Toen heeft mijn begeleider gezegd: maak daar H2a - H2f van en in mn aantekeningen staat: "nieuwe H1: verschil in campagne (t-test / ANOVA?)". Omdat ik pas maandag weer contact met hem kan hebben dacht ik misschien begrijpt een SPSS-er wat er bedoeld wordt zodat ik dit weekend door kan.
Kan voorlopig nog met die regressies aan de slag dus lukt het niet, dan lukt het niet. Bedankt iig!
edit: bij de nieuwe H1 is er dus geen sprake van IV/DV maar het is meer iets van: is dit aanwezig of niet ofzo. moeilijk uit te leggen als je zelf niet weet wat je pccs bedoelt
quote:Op vrijdag 23 juli 2010 16:41 schreef aarstulp het volgende:
Het probleem is als volgt: Heb 6 soorten campagnes als onafhankelijke variabelen en consumptie als afhankelijke. De 6 campagnes worden met ieder 5 vragen gemeten (5-punts Likert). Heb door wat rotte appels te verwijderen mooie Cronbach's Alphas verkregen. Nu ga ik iedere campagne aan consumptie linken met een regressie analyse, dat moet lukken hoop ik. Maar allereerst wil ik gewoon het verschil tussen de campagnes meten. Mijn begeleider had het over een t-test of ANOVA. Maar bij een t-test krijg je gewoon de gemiddelden, standaardafwijkingen, vrijheidsgraden en de p-waarde. Ik bedoelde eigenlijk meer van welke vaker voorkomt. Uiteraard weten jullie niet wat mijn begeleider bedoelt, maar vanuit een kennersoogpunt, ben ik nou goed bezig of heb ik de verkeerde analyse te pakken?
quote:Op vrijdag 23 juli 2010 21:29 schreef Frith het volgende:
[..]
Dit is wat ik lees:
er zijn 6 campagnes (als onafhankelijke variabelen) tegenover consumptie als afhankelijke variabele. Hiermee wil je het effect per campagne bepalen op consumptie. (dus een 1-op-1 connectie wat het model betreft).
Verder heb je deze campagnes samengesteld uit 5 vragen met likert schalen en de missings (latere post) verwijderd. Verder wil je de campagnes ook met elkaar vergelijken om te zien of de gemiddelden (en wat betekent dit dan precies?) van elkaar verschillen.
1. het gebruik van lineaire regressie is hier enigszins overbodig aangezien het hier om een nuldeorde correlatie gaat. Wat dus betekent dat regressie hier hetzelfde resultaat geeft als directe correlatie, maar dat je wel rekening moet houden met de extra voorwaarden voor het gebruik van regressie.
Dit doe je vervolgens zes maal, voor iedere campagne apart. Dit heb je al, als het goed is.
2. je begeleider wijst je qua methode terecht naar t-toets of ANOVA, ware het niet dat een serie t-testen over dezelfde data leidt tot een toenemende kans op een type I fout. Deze 'familywise error' is te voorkomen door met een ANOVA de gemiddelden te vergelijken, aangezien je hier meer dan twee groepen hebt.
(ANOVA is vanaf drie of meer)
en volgens mij is dat het, tenzij je nog werkelijk frequentietabellen wilt gaan uitdraaien (why?).
quote:Op vrijdag 23 juli 2010 21:29 schreef Frith het volgende:
en je meetniveau is interval of ratio, want anders kun je al helemaal geen regressie uitvoeren. (het is ratio overigens, voor zover ik hier kan inschatten).
nu ben je zelf helemaal van de leg af.quote:Op vrijdag 23 juli 2010 21:36 schreef oompaloompa het volgende:
[..]
als je 2 continue variabelen hebt over 6 groepen heb je meer aan regressie dan correlatie omdat je meer info daaruit krijgt om je data te interpreteren toch?
(en anova kan ook gewoon bij 2 ^^)
edit:
[..]
een logistische ^_^
quote:Op vrijdag 23 juli 2010 21:56 schreef Frith het volgende:
[..]
nu ben je zelf helemaal van de leg af.
Logistische regressie gaat over het optreden van een categorische waarde op de afhankelijke variabele, niet de onafhankelijke(n).
en de uitleg van Andy Field (p.350) geeft aan dat het ANOVA model in SPSS gerepresenteerd kan worden als een multiple regressie vergelijking, dus dat er sowieso drie variabelen betrokken moeten zijn. De t-test kan als een lineaire regressie worden uitgedrukt en voldoet dus wel met twee variabelen.
en ik heb de uitleg opgevat als zes campagnes, waarvan het effect van deze afzonderlijk gemeten moet worden. Wat jij in gedachten hebt is het meten van een concept over meerdere groepen, wat je via split file kunt doen.
Zoiets doe je als bijvoorbeeld 'barmhartigheid' over verschillende religies zou willen toetsen, waarbij je de data simpelweg uitsplitst naar de categorieën van 'religie'.
Ik doe het op m'n stage-adres, geen idee hoe die spss hier erop is gezet. Maar ik zal het doorgeven.quote:Op vrijdag 23 juli 2010 02:35 schreef Frith het volgende:
[..]
dan moet je ook niet zomaar wat downloaden van het internet. Ik ken dit geintje van anderen die hetzelfde probleem hadden.
Het is echter onzinnig, aangezien de volumelicensie via de uni (of hbo) iets van 15 euro is en vervolgens jaren geldig, dus je hebt er niets aan om het te downloaden.
Overigens is je model letterlijk een voorbeeldvraag van het hoofdstuk over logistische regressie in 'learning statistics with SPSS' van Andy Field. De antwoorden daarvan (en uitleg) zijn zelfs te downloaden op de bijhorende site.
Is er iemand die mij hiermee kan helpen?quote:Op vrijdag 23 juli 2010 01:56 schreef pdegroot het volgende:
Dames en Heren, ik heb de volgende vraag met betrekking tot SPSS:
Hoe voer je een onderzoek uit naar stationariteit met SPSS?
Hartstikke bedankt!
ik heb geen flauw idee wat het inhoudt =D sorryquote:Op woensdag 28 juli 2010 13:33 schreef pdegroot het volgende:
[..]
Is er iemand die mij hiermee kan helpen?
heb je 1 of meerdere afhankelijken?quote:Op woensdag 28 juli 2010 16:53 schreef FabFabFabFab het volgende:
Hallo allemaal, momenteel ben ik bezig aan mijn scriptie, maar ik loop een beetje vast op de analyses.
Ik heb 3 onafhankelijke variabelen (ratio), 3 modererende variabelen (gemiddelden van een aantal Likert scales) en een controle variabele.
Ik wil nu voor iedere onafhankelijke variabele meten hoe de modererende variabelen de relatie tussen deze onfhankelijke en de afhankelijke variabele beïnvloeden. Dus eigenlijk 3 x 3 = 9 hypothesen.
Ik weet dat ik voor alle modererende effecten ook de interactie moet berekenen, daar heb ik dus ook 9 variabelen voor gemaakt.
Moet ik dan in de regressie-analyse deze variabelen toch allemaal tegelijk invoeren, of moet ik 9 keer een regressie-analyse doen?
M'n begeleider is op vakantie, dus die kan ik het momenteel ook niet vragen helaas.
In ieder geval alvast bedankt!
succes! ik weet alleen niet 100% zeker dat wat ik zei goed is natuurlijkquote:Op woensdag 28 juli 2010 17:55 schreef FabFabFabFab het volgende:
Bedankt voor je snelle antwoord! Nu kan ik in ieder geval weer verder!
Komt uit tijdreeksen, de verdeling van het verschil van de waarde op tijdstip t en tijdstip t+x mag alleen van x afhangen en niet van t. Testen bij discrete data voor een vaste x is vast niet lastig.quote:Op woensdag 28 juli 2010 14:09 schreef oompaloompa het volgende:
[..]
ik heb geen flauw idee wat het inhoudt =D sorry
een soort homogeneity of variance over tijd? of een soort uitsluiting van een interactie met t?quote:Op woensdag 28 juli 2010 18:52 schreef GlowMouse het volgende:
[..]
Komt uit tijdreeksen, de verdeling van het verschil van de waarde op tijdstip t en tijdstip t+x mag alleen van x afhangen en niet van t. Testen bij discrete data voor een vaste x is vast niet lastig.
Gelijk verdeeld is de eis, en die verdeling hoeft geen variantie te hebben. Simpele tests zullen wel lukken, maar alle interactie met t uitsluiten zal lastig zijn, want een eenmalige schommeling zul je nooit detecteren.quote:Op woensdag 28 juli 2010 19:02 schreef oompaloompa het volgende:
[..]
een soort homogeneity of variance over tijd? of een soort uitsluiting van een interactie met t?
maakt niet uit. Als je de gecentreerde gebruikt zal je constant anders zijnquote:Op donderdag 29 juli 2010 12:20 schreef FabFabFabFab het volgende:
Ik heb nog één vraagje. Ik heb zoals gezegd de interacties berekend door de variabelen eerst te centreren en daarna de gecentreerde variabelen te vermenigvuldigen voor de interactie-variabelen.
Als ik nu de regressie-analyse wil uitvoeren, moet ik dan ook voor de onafhankelijke variabelen de gecentreerde variabelen nemen of niet?
Alvast bedankt weer!
In praktijk wordt dit getest door allerlei testjes te draaien; autocorrelatie, trend, dat soort dingen.quote:Op woensdag 28 juli 2010 19:02 schreef oompaloompa het volgende:
[..]
een soort homogeneity of variance over tijd? of een soort uitsluiting van een interactie met t?
ah okquote:Op zondag 1 augustus 2010 15:18 schreef GlowMouse het volgende:
[..]
In praktijk wordt dit getest door allerlei testjes te draaien; autocorrelatie, trend, dat soort dingen.
residuenquote:Op zondag 1 augustus 2010 15:30 schreef Hiya het volgende:
Iemand een mooie vertaling voor het woord risiduals bij de ANOVA test bij meervoudige regressie analyse? Verslag moet in het Nederlands en om dan met engelse termen te gaan smijten is niet zo netjes...
Wellicht kun jij mij dan helpen als het niet lastig isquote:Op woensdag 28 juli 2010 18:52 schreef GlowMouse het volgende:
[..]
Komt uit tijdreeksen, de verdeling van het verschil van de waarde op tijdstip t en tijdstip t+x mag alleen van x afhangen en niet van t. Testen bij discrete data voor een vaste x is vast niet lastig.
Over multicollineariteit als je in het scherm van regressieanalyse zit kan je onder het kopje Stats nog meer testen aanvinken oa. die collinariteit. Als je met tijdreeksen werkt kan je ook Durbin-Watson aanvinken.quote:Op zondag 1 augustus 2010 17:01 schreef pdegroot het volgende:
[..]
Wellicht kun jij mij dan helpen als het niet lastig is
Ik moet met de volgende data werken:
X= computeraankopen per maand van een bedrijf
Y= omzet per maand van het bedrijf
Eerst moet ik een aantal waardes berekenen die niet zo moeilijk zijn, namelijk:
- gemiddelde
- standaardafwijking
- tijdlijn van beide variabelen in 1 figuur
- spreidingsdiagram
- correlatiematrix
- lineaire regressie van Y op X
Hierna moet ik voor X een onderzoek doen naar stationariteit. Daarnaast moet ik een correlatiematrix maken van alle gebruikte variabelen en controleren of er sprake is van multicollineariteit. Vervolgens moet ik hetzelfde doen voor Y.
Hoe doe ik dit in SPSS?
Je interpreteert je getransformeerde data, daarna zou je een interpretatie van je normale data kunnen geven. Maar aangezien je de getransformeerde test doe je daar de uitspraken over.quote:Op woensdag 4 augustus 2010 13:11 schreef de_nachtwacht het volgende:
Hoi,
Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.
Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.
Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?
Data reduceren doe je met een factor analyse. Volgens mij moeten de antwoordcategorien wel gelijk zijn voor deze procedure. Google anders factor analyse zodat je meer over deze techniek te weten komt.quote:Op vrijdag 27 augustus 2010 12:43 schreef gember het volgende:
Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!
Met Kendall's Tau-B ben ik niet zo bekend. De toepassing van Pearson of Spearman Rho om een correlatie tussen variabelen te toetsen is afhankelijk van je data. Bij interval geschaalde data, dat normaal verdeeld is, gebruik je Pearson (product-momentcorrelatiecoëfficiënt). De Spearman Rho wordt ook wel Spearman rangcorrelatiecoeffiecient genoemd. Deze gebruik je als je interval data niet normaal verdeeld is, of als je te maken hebt met ordinaal geschaalde data.quote:Op woensdag 11 augustus 2010 15:24 schreef Hiya het volgende:
Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Uitgereikt formulier:quote:In een experiment worden mannen en vrouwen willekeurig ingedeeld in vier experimentele groepen. De proefpersonen moeten twee taken uitvoeren en de experimentele groep waarin ze zijn ingedeeld bepaalt onder welke condities de taken moeten worden uitgevoerd (groep 1 lichtste condities t/m groep 4 zwaarste condities). In de tabel op het uitgereikte formulier staan de gegevens van 20 personen.
Ik had zelf eerst als 4 variabelen de condities, maar merkte op dat anderen meer in de juiste richting zaten [waarschijnlijk] met 4 variabelen als 'Sekse, Conditie, Taak1, Taak2'. Maar eigenlijk snap ik er niks van, want ook met die variabelen kom ik niet echt verder met wat ik er precies bij moet invullen,quote:Open SPSS en voer de data in. Zorg ervoor dat er in je dataset vier variabelen zijn. Kies, waar nodig, zelf een codering voor de variabelen.
Het zijn de scores idd. Maar het moeten per se 4 variabelen worden, dus 5 gaat niet lukken.quote:Op maandag 18 oktober 2010 18:45 schreef crossover het volgende:
Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)
Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).
Beetje duidelijker zo?
whoops.quote:Op maandag 18 oktober 2010 19:04 schreef ChipsZak. het volgende:
Maar ze zitten toch juist in beide taken,? Want ze moeten ze beiden doen?
Ik las ook nog ergens dat ik de cijfers moet opvatten als individuen en dus moest kijken naar hun score op zowel taak1 als taak2 en dan zou mijn spss ding op deze manier goed moeten zijn.quote:Op maandag 18 oktober 2010 19:15 schreef Frith het volgende:
[..]
whoops.![]()
Me smart!![]()
In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.
Moet je dit met eigen data of gegeven data zijn?quote:Op maandag 8 november 2010 19:23 schreef uppie83 het volgende:
Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R2 waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?
We hebben een deel van een data bestand gekregen van een oud onderzoek. Hiermee moesten we voor ons vak een paper schrijven met onder andere de eis dat er een multiple regressie in zou komen. Inmiddels ben ik er achter gekomen dat de eis voor multiple regressie niet zozeer is dat alle factoren een hoge lineaire regressie moeten hebben, maar ze moeten met elkaar correleren. Niet dat dat overal netjes gebeurd, maar dat is nu eenmaal 'the real deal'. Dit is zeg maar een voorbereidingsvak op de masterscriptie.quote:Op dinsdag 9 november 2010 22:15 schreef Hiya het volgende:
[..]
Moet je dit met eigen data of gegeven data zijn?
Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R2 waarden. Weet je zeker dat je alles goed hebt ingevoerd?
Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?
Daar moet je Transform > Recode in to New Variables ( Als je dus een nieuwe column wil aan maken) of Recode in to Same Variables (als je het wil veranderen in dezelfde column). Ik raad je aan om het in een nieuwe column te doen, als je wat fout doet kan je gemakkelijk opnieuw doen.quote:Op maandag 15 november 2010 10:09 schreef Susanna het volgende:
Ik ben nu aan het uitzoeken hoe ik de waardes van twee variabelen kan mixen, zodat ik één gemiddelde variabele krijg (betreft twee vragen met een ordinale schaal, alleen loopt de ene van 1 tot 5 (positief-negatief) en de andere van 5 tot 1 (negatief-positief)...)
Dat dus.quote:Op donderdag 25 november 2010 16:23 schreef Z het volgende:
Cronbach's alpha (> 0.7)?
RELIABILITY
/VARIABLES= A B C D etc.
/FORMAT=NOLABELS
/SCALE(ALPHA)=ALL/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE CORR
/SUMMARY=TOTAL MEANS .
quote:Je kunt de betrouwbaarheid berekenen bij analyse scale reliability analysis. Daar moet je aangeven van welke variabelen je de betrouwbaarheid wilt berekenen. De Cronbachs alpha staat standaard aangevinkt. Bij Statistics moet je Scale nog aanvinken. Met de optie scale if item deleted kun je onderzoeken wat er gebeurt met de samenhang als je één variabele verwijdert.
Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.quote:Op donderdag 25 november 2010 16:33 schreef Skv het volgende:
Yes. Het gaat om tien aspecten die 'maatschappelijk verantwoord ondernemen' moeten meten.
De tien zijn op een rijtje gezet en de respondenten hebben deze genummerd van 1(relevant) tot 5(irrelevant).
Moet ik nu net zo lang variabelen met een lage score verwijderen tot cronbach's alpha >0.7? Of mag dat niet zomaar?
Het heeft sowieso in de meeste gevallen niet de voorkeur om veel elementen te verwijderen.quote:Op donderdag 25 november 2010 16:35 schreef crossover het volgende:
[..]
Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.
Ik meet de toepasbaarheid van een tiental richtlijnen die door Nederland zijn opgesteld voor internationale toepassing op het Zuid-Afrikaanse bedrijfsleven. Het is dus de bedoeling dat er een selectie overblijft van een paar items die dus toepasbaar zijn..quote:Op donderdag 25 november 2010 16:35 schreef crossover het volgende:
[..]
Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.
Goed, Cronbach gaat hem dus niet worden. Is er een andere manier om een statistische analyse te trekken over deze gegevens?quote:Op donderdag 25 november 2010 18:01 schreef Z het volgende:
Met Cronbach bekijk je of de verschillende schaaltjes (stellingen) hetzelfde meten, dat is dus duidelijk niet het geval. Volgens mij gaat dat dan ook problemen opleveren bij een factoranalyse.
Hier haal je toch wat dingen door elkaar. Nagaan of hoog-scoorders op alle elementen hoog scoren en laag-scoorders op alle elementen laag scoren (wat er volgens jouw beschrijving is gedaan), is heel iets anders dan nagaan of alle personen op alle elementen gemiddeld 'neutraal' scoren.quote:Op donderdag 25 november 2010 22:55 schreef Skv het volgende:
CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.
Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.
Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.quote:Op donderdag 2 december 2010 17:25 schreef crossover het volgende:
Wat is/zijn je onafhankelijke variabele(n)?
Geen normale verdeling = geen regressieanalysequote:Op donderdag 2 december 2010 18:14 schreef Citizen.Erased het volgende:
[..]
Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.
Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is
{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.
De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.
Niet gewoon Select Cases en dan kiezen voor opslaan in nieuw venster?quote:Op zaterdag 27 november 2010 20:55 schreef schaal_9 het volgende:
Wat leuk, een SPSS topic
Ik ga het allemaal eens doorlezen...
Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).
Dank voor de snelle reactie! Ik zat daar inderdaad ook al een beejte over na te denken, maar nu ik het zo lees lijkt het me inderdaad echt wel een betere oplossing. Ik vroeg me alleen of SPSS een simpele manier had om zo'n vraag te verwerken. Anders dan loont het inderdaad de moeite niet.quote:Op dinsdag 15 maart 2011 11:57 schreef Z het volgende:
Ik kan nooit zo veel met dat soort vragen (in marktonderzoek). Ik vind het niet interessant om te zeggen dat een antwoord een x aantal keer als eerste en een x aantal keer als tweede enz. wordt genoemd. Op een gegeven moment zegt het niets meer en antwoorden die vaak als eerste gerankt worden, worden logischerwijs niet vaak als laatste gerankt en vice versa. Ik doe het meestal in een multiple respons vraag met een maximaal te geven antwoorden, dus bijvoorbeeld 'kies er twee van de vijf'. In jouw geval zou ik denk ik alleen de percentages 'als eerst genoemd' rapporteren.
Je kan een random bruto steekproef trekken die representatief is voor (bijvoorbeeld) heel Nederland (of een andere bekende populatie). Via selectievragen selecteer je de netto steekproef. Omdat de bruto steekproef representatief is voor Nederland, kan je er (tot op zekere hoogte) vanuit gaan dat de netto steekproef dat ook is.quote:Op donderdag 24 maart 2011 11:52 schreef yozd het volgende:
Hoe kan ik een representatieve steekproef trekken van een onbekende populatie?
Je open antwoorden coderen. Daan kan je analyseren.quote:Op woensdag 23 maart 2011 22:19 schreef HoneybeeNL het volgende:
Ik ben hier nieuw, dus ik weet niet of deze vragen al eerder zijn gevraagd, maar goed. Ik heb twee vraagjes.
In mijn enquete heb ik een vraag waar meerdere antwoorden gegeven kunnen worden en één antwoord daarvan is anders, namelijk (hier kunnen mensen zelf een antwoord invullen)
Hoe kan het analyseren in SPSS waarbij ik ook de antwoorden zie van de open categorie?
Mijn tweede vraag is: In mijn enquete heb ik de volgende vraag; Kunt u in 3 woorden beschrijven?
Hoe moet ik dit invoeren en analyseren in SPSS?
Groetjes
Ok. Het gaat namelijk om het volgende; ik wil onderzoeken hoeveel werkgelegenheid er is voor een bepaalde opleiding in diverse sectoren. Daarvoor wil ik werkgevers gaan benaderen. Maar de verdeling van werkgelegenheid in de verschillende sectoren is momenteel onbekend. Nu weet ik dus nooit hoeveel organisaties ik per sector moet gaan benaderen...quote:Op donderdag 24 maart 2011 11:58 schreef Z het volgende:
Je kan een random bruto steekproef trekken die representatief is voor (bijvoorbeeld) heel Nederland (of een andere bekende populatie). Via selectievragen selecteer je de netto steekproef. Omdat de bruto steekproef representatief is voor Nederland, kan je er (tot op zekere hoogte) vanuit gaan dat de netto steekproef dat ook is.
Dan zou ik 'the next best thing' kiezen en de verhouding tussen de sectoren gebruiken. En werkgelegenheid (en aantallen banen) buiten beschouwing houden. Dan kan je iets zeggen over de werkgelegenheid maar niet (minder goed) over het aantal banen.quote:Op donderdag 24 maart 2011 12:27 schreef yozd het volgende:
[..]
Ok. Het gaat namelijk om het volgende; ik wil onderzoeken hoeveel werkgelegenheid er is voor een bepaalde opleiding in diverse sectoren. Daarvoor wil ik werkgevers gaan benaderen. Maar de verdeling van werkgelegenheid in de verschillende sectoren is momenteel onbekend. Nu weet ik dus nooit hoeveel organisaties ik per sector moet gaan benaderen...
Wederom dank.quote:Op vrijdag 25 maart 2011 15:26 schreef Z het volgende:
IF VarA = X VarB = 9.
exe.
Plakken in je syntax en draaien.
Nee, is het ook niet. Maar ben van nature een beetje luiquote:Op vrijdag 25 maart 2011 16:01 schreef Z het volgende:
Dat kan wel maar dat is wat 'hogere school syntax schrijven' vermoed ik. Dus toch maar uitschrijven, zoveel kan het niet zijn toch?
toch gewoon cronbachs alpha onder het kopje scale?quote:Op maandag 4 april 2011 21:19 schreef Zocalo het volgende:
Ik heb ook een vraag, die wellicht heel simpel is, maar ik weet het gewoon niet
Voor mijn scriptie moet ik de validiteit van constructen gaan bepalen en daarna hun relatie, zeg X en Y. X en Y bestaan beiden uit ongeveer 20 vragen, en daaruit dienen verschillende factoren te komen.
Hoe kan ik die validiteit (en dan voornamelijk convergente) het beste bepalen? Ik heb nu van bijvoorbeeld factor 1 van X alle vragen met elkaar gecorreleerd, maar daar komen geen zeer hoge scores uit. Is dit zo goed, of dien je er eerst dmv de factoranalyze verschillende factoren van te maken en daarop dan de validiteit te testen?
Heb je zelf al gezocht? Nee he? Met de termen 'define multiple response sets spss' vind je maar 112.000 resultaten. Maar vooruit, omdat ik zo aardig ben:quote:Op woensdag 27 april 2011 14:04 schreef Dalliance het volgende:
Ik heb ook een vraag; hoe verwerkt je in SPSS een vraag met gecombineerde antwoordmogelijkheden? Voorbeeld:
Vraag x (meerdere antwoorden mogelijk)
Antwoord 1
Antwoord 2
Antwoord 3
Anders, nl.
Hoe verwerk ik dit in SPSS en welk meetniveau moet daaraan worden toegekend?
Je hebt gelijk, zelf heb ik niet gezocht. Ik stelde de vraag voor mijn afstudeerpartner die zich momenteel bukt over het opstellen van het codeboek. Niettemin bedanktquote:Op woensdag 27 april 2011 22:06 schreef crossover het volgende:
[..]
Heb je zelf al gezocht? Nee he? Met de termen 'define multiple response sets spss' vind je maar 112.000 resultaten. Maar vooruit, omdat ik zo aardig ben:
Op deze manier maakt spss één variabele van meerdere variabelen. Je kan hier een aantal berekeningen mee kunt maken (frequencies en crosstabs). Dit kan via analyze multiple responses - frequencies of crosstabs.
Om hier op terug te komen, dit blijkt niet te zijn wat wij bedoelen.quote:Op woensdag 27 april 2011 22:06 schreef crossover het volgende:
[..]
Heb je zelf al gezocht? Nee he? Met de termen 'define multiple response sets spss' vind je maar 112.000 resultaten. Maar vooruit, omdat ik zo aardig ben:
Op deze manier maakt spss één variabele van meerdere variabelen. Je kan hier een aantal berekeningen mee kunt maken (frequencies en crosstabs). Dit kan via analyze multiple responses - frequencies of crosstabs.
Wij denken iedere antwoordmogelijkheid in het codeboek op te nemen als 6a, 6b, 6c etc, maar waar laten we de 'geen informatie' optie voor als vraag 6 in zijn geheel niet is ingevuld?quote:6) Waarom heeft u (........)? (meerdere antwoorden zijn mogelijk)
ik was ....
deze mogelijkheid ...
ik wilde ....
anders, namelijk..…………………………… …………………………………………………
Nee, je moet die 0 meenemen als missing value o.i.d.quote:Op maandag 9 mei 2011 23:48 schreef Coacheling het volgende:
In SPSS heb ik de 0 gebruikt alszijnde n.v.t., de overige getallen lopen van 1= Geheel oneens t/m 5= Geheel eens.
Nu ben ik de standaard gegevens per variabele aan het kijken en vroeg ik me af of mijn uitkomsten wel kloppen nu die 0 is meegerekend.
De 999 heb ik al in gebruik als mensen de vraag niet hebben ingevuld.
In principe wel. Als je voor je onderzoek een verschil aan wil geven tussen de mensen die niks ingevuld hebben en de n.v.t. zou je eventueel een dummy-variabele aan kunnen maken die b.v. 1 is voor de n.v.t. mensen en 0 voor de rest. Dan kun je die er los van de echte missing values uit filteren en zou je evt. nog een proportie analyse o.i.d. daar op kunnen doen.quote:Op maandag 9 mei 2011 23:59 schreef Coacheling het volgende:
De 0 alszijnde niet van toepassing heb ik gebruikt voor de mensen die eigenlijk die vraag niet hoefden in te vullen zodat ze niets zouden hoeven overslaan.
Die 0 als missing value kan ik die in hetzelfde rijtje invullen als die 999? ( Variable view -> Missing values
-> discrete missing values) en dan in het tweede hokje de 0?
n.p. succes!quote:Op dinsdag 10 mei 2011 00:13 schreef Coacheling het volgende:
Ik kan al eerder de mensen filteren die op een eerdere vraag negatief hebben geantwoord waardoor deze vragen door hun zouden moeten worden beantwoord met n.v.t. Ik zal dus inderdaad morgen mijn data moeten aanpassen en frequenties even opnieuw uitdraaien.
Super bedankt!
Gewoon een Anova - regressie?quote:Op dinsdag 10 mei 2011 14:50 schreef Dutchie11 het volgende:
Voor mijn bachelorscriptie doe ik een onderzoek naar het effect van instructie en ik heb een vraag over welke test ik moet uitvoeren in SPSS.
Korte omschrijving onderzoek:
Onderzoek op basisschool en middelbare school. Beide schooltypes ingedeeld in 3 groepen:
1. Engelse instructie
2. Nederlandse instructie
3. Geen instructie (controle groep)
Alle groepen hebben 3 toetsen gedaan: 1 pre-instructie, 2 post instructie.
Ik heb dus 2 independent variabelen (schooltype, soort instructie) en 1 dependent (test score).
Ik wil uitzoeken welke instructiegroep beter presteert: Engelse instructie of Nederlandse instructie. Hiervoor heb ik een Kruskal-Wallis test gedaan, maar die resultaten helpen me niet verder.
Ik wil graag resultaten die zeggen:
basisschool, test 1, Engelse instructie
basisschool, test 1, Nederlandse instructie en zo verder voor alle testen; hetzelfde voor de middelbare school.
Kruskal-Wallis geeft óf resultaten per test voor basisschool en middelbare school samen óf resultaten per soort instructie (zonder te splitsen voor schooltype), terwijl ik graag resultaten zou willen van de combi (schooltype + soort instructie). Maar Kruskal-Wallis geeft die resultaten niet.
Is er iemand die een idee heeft welke test ik zou moeten uitvoeren? Ik heb nooit statistiek gehad en loop nu vast. Alvast bedankt!
Dat laatste klopt, alle deelnemers (n=110) hebben 3 testen gedaan. Repeated measures is een parametric test toch? Als ik kijk naar mijn variabelen (nominal en ratio) dan zou ik een non-parametric test moeten uitvoeren (als ik het goed begrijp). Vandaar dat ik bij Kruskal-Wallis uitkwam. Bestaat er uberhaupt een non-parametric variant van repeated measures?quote:Op dinsdag 10 mei 2011 16:25 schreef oompaloompa het volgende:
multilevel heeft niet zoveel zin met maar 2 groepen
Ik zou gewoon een univariate analysis (of regressie is uitiendelijk hetzelfde) doen. Schooltype & instructie als independents, test score als dependent.
(behalve als ik het verkeerd begrijp en ze3 testen per persoon hebben gedaan, dan repeated measures)
nee hoor, gewoon met dummies, regressie analyses zijn namelijk eigenlijk precies hetzelfde als anovas.quote:Op woensdag 11 mei 2011 18:20 schreef Coacheling het volgende:
Voor regressie moet je minimaal op intervalniveau zitten voor zover ik begrijp.
Daar zijn geen vaste waardes voor, ligt dus een beetje aan je theorie.quote:Eens zien, vraagje.
Ik heb een schaalconstruct met 2 items en een Cronbach's alpha van 0.697
Moet ik hier moeilijk over gaan denken, weglaten of kan ik hem als betrouwbaar zien?
Er zijn vuistregels die je leert, meestal zijn die redelijk arbitrair, zoals de alpha van .70quote:Op woensdag 11 mei 2011 18:49 schreef Coacheling het volgende:
Weet ik dat van die regressie ook weer
Met betrekking tot die alpha, ik heb geleerd dat een schaal pas voldoende homogeen is vanaf een alpha van 0.70 en afgerond is die dat ook. Ik had inderdaad verwacht dat deze items samen zouden hangen. Zal morgen eens vragen wat de methodologie docente ervan denkt.
Ik ga me eens verdiepen in de Friedman, kijken of daar dingen uitkomt waar ik wat aan heb (/wat van snapquote:Op woensdag 11 mei 2011 18:20 schreef Coacheling het volgende:
Voor regressie moet je minimaal op intervalniveau zitten voor zover ik begrijp. Non-parametrisch kun je testen als je steekproef niet normaal verdeeld is of als je een kleine 'n' hebt.
Een non-parametrische test met drie of meer afhankelijke steekproeven is de Friedmantoets.
Die heeft 2 voorwaarden:
- het gaat om 3 of meer afhankelijke steekproeven
- testvariabele is (minimaal) op ordinaal niveau gemeten.
Ik weet niet of je er iets aan hebt, ik hoop het.
Zelf gebruik ik graag:
Baarda, Goede de & Dijkum van (2007) Basisboek statistiek met SPSS: Handleiding voor het verwerken en analyseren van en rapporteren over (onderzoeks)gegevens.(3e dr.) Houten: Noordhoff Uitgevers Groningen.
(sorry, kon ik weer even APA oefenen)
Maar waarom zou je een non-parametrische toets doen als je gewoon een parametrische kunt gebruiken?quote:Op woensdag 11 mei 2011 20:39 schreef Dutchie11 het volgende:
[..]
Ik ga me eens verdiepen in de Friedman, kijken of daar dingen uitkomt waar ik wat aan heb (/wat van snap). Bedankt voor het meedenken iig!
Je boektip onthou ik voor de volgende keer! (als ik nog durf haha). Nu helaas geen gelegenheid om bij de bib te komen (iets met operatie en 6 weken niet lopen...), zal het moeten doen met de 4 SPSS boeken die ik heb. En google
Nou, parametrische toetsen hebben een lagere power, gevolg is dus dat je vooral bij lage n minder snel significante resultaten zult vinden, ook al zijn die er wel als je een non-parametrische toets doet.quote:Op donderdag 12 mei 2011 08:30 schreef Coacheling het volgende:
Hmm, vaag.... Ik moet sommige toetsen juist non-parametrisch doen omdat ik een kleine n heb uit een populatiesteekproef omdat ze anders niet betrouwbaar zouden zijn :-S Ga vanmiddag eerst op school eens even de oren van het hoofd zeuren. Dit is echt ontmoedigend. Laat wel weten wat ze daar zeggen.
@dutchie, natuurlijk durf je volgende keer nog!
Ik heb 2x nominal (schooltype, instructie type) en 1 ratio variable (test scores), en de boeken die ik gebruik geven aan dat je dan een non-parametrische test moet doen. Dus daar ben ik maar op afgegaan, aangezien mijn statistische kennis (heel wat) te wensen overlaatquote:Op woensdag 11 mei 2011 21:05 schreef oompaloompa het volgende:
[..]
Maar waarom zou je een non-parametrische toets doen als je gewoon een parametrische kunt gebruiken?
Non-parametrische zijn "slechtere" toetsen die je doet wanneer je data niet aan de assumpties van b.v. anova's voldoen...
(Overigens zijn non-parametrische testen juist niet geschikt bij een kleine n omdat ze veel minder power hebben)
Dan heb je een heel erg verkeerd boek (of misschien niet zo goed gelezen?).quote:Op vrijdag 13 mei 2011 17:36 schreef Dutchie11 het volgende:
[..]
Ik heb 2x nominal (schooltype, instructie type) en 1 ratio variable (test scores), en de boeken die ik gebruik geven aan dat je dan een non-parametrische test moet doen. Dus daar ben ik maar op afgegaan, aangezien mijn statistische kennis (heel wat) te wensen overlaat
Maakt dat dan niet zoveel uit als de data wél aan de assumpties voldoet?
Net terug uit het ziekenhuis na operatie, dus ik snap het nog minder dan als ik wel helder ben...
Dan ga ik dat nog eens goed nakijken. Bedankt!quote:Op vrijdag 13 mei 2011 17:54 schreef oompaloompa het volgende:
[..]
Dan heb je een heel erg verkeerd boek (of misschien niet zo goed gelezen?).
Als de data wel aan de assumpties voldoet, is de kans vrij groot dat je sterkere resultaten zult krijgen uit b.v. een regressie omdat je met minder ruis rekening hoeft te houden.
& beterschap / herstel ze!
Die Chi2 snap ik ook niet, ik weet alleen dat df staat voor 'degrees of freedom'. Heb Kruskal Wallis ook gedaan, maar idd heel lastig te vinden wat de uitkomst nou betekent.quote:Op zaterdag 14 mei 2011 16:30 schreef Coacheling het volgende:
En daar zijn we weer, dit keer met de Kruskal-wallistoets.
Dit komt eruit:
Gemiddelde deskundigheid
N Mean rank
School 1 11 23.32
School 2 15 19.23
School 3 11 14.36
Chi2 = 3.817
df = 2
Asymp.Sig. = 0.148
Ik begrijp dus dat de uitkomst niet significant is, er is 15% kans dat de uitkomst niet klopt.
Maar, wat zegt die Chi2, die 3.817 ? Ik kan er niet op komen en ik kan het ook niet makkelijk terug vinden.
3.817 is de waarde van de toetsingsgrootheid die blijkbaar onder de nulhypothese een chi-kwadraat verdeling volgt met 2 vrijheidsgraden.quote:Op zaterdag 14 mei 2011 17:29 schreef Coacheling het volgende:
Wat het totaal betekend weet ik wel, hoe het zo komt begrijp ik ook inmiddels (die rank valt nog niet helemaal maar wel ver) en significantie en df is ook geen probleem, alleen die Chi2 kan ik niet plaatsen
de chi-square is gewoon een verdelingsmaat. Hetzelfde als een F bij een anova of een T bij een t-toets. De combinatie toets-waarde (in dit geval chi-square) en df leidt tot de sig.quote:Op zaterdag 14 mei 2011 16:30 schreef Coacheling het volgende:
En daar zijn we weer, dit keer met de Kruskal-wallistoets.
Dit komt eruit:
Gemiddelde deskundigheid
N Mean rank
School 1 11 23.32
School 2 15 19.23
School 3 11 14.36
Chi2 = 3.817
df = 2
Asymp.Sig. = 0.148
Ik begrijp dus dat de uitkomst niet significant is, er is 15% kans dat de uitkomst niet klopt.
Maar, wat zegt die Chi2, die 3.817 ? Ik kan er niet op komen en ik kan het ook niet makkelijk terug vinden.
Nou ja ik ookquote:Op zaterdag 14 mei 2011 20:48 schreef Coacheling het volgende:
Fontys, maar het zal wel aan mijn verwoording van de situatie liggen. Zij heeft ervoor gestudeerd, ik niet...
Dat post ik liever niet zo op het internet, kan je wel pm-en als je wilt?quote:Op zaterdag 14 mei 2011 21:30 schreef Coacheling het volgende:
Ik zat net te kijken bij de voorwaarden voor een ANOVA. Een van de voorwaarden is per niet gekoppelde steekproef minimaal 25 proefpersonen, die heb ik niet dus dan houdt het op...
Het was niet mijn bedoeling je voor het hoofd te stoten hoor, ik ben ontzettend blij met je hulp!
Het is inderdaad voor mijn scriptie...
Met jouw vraag kan ik je absoluut niet helpen, het klinkt wel heel logisch, maar ik ken echt een minimaal aantal testenWat doe je voor onderzoek? Ben verder niet nieuwsgierig hoor
(Bron: http://www.gmw.rug.nl/~methodologiewinkel/index?id=265)quote:Als voorbeeld wordt gebruik gemaakt van een 7-puntsschaal. Ompolen doe je bij Transform/Recode/Into Different Variables. Je selecteert de om te polen variabelen, geeft hen een iets gewijzigde naam bij Output Variable (afstand wordt bijvoorbeeld afstand1) en vult bij old en new values de volgende transformaties in: 1 wordt 7, 2 wordt 6, 3 wordt 5, 4 wordt 4, 5 wordt 3, 6 wordt 2 en 7 wordt 1. Nadat je op OK hebt gedrukt, moet je nog een keer op Change drukken, en dan nog een keer op OK. In je dataset zie je dat er aan de rechterkant een kolom is
bijgekomen met je nieuwe variabele.
Nog een keer op "change" drukken kan niet. Op OK klikken kan wel.quote:Nadat je op OK hebt gedrukt, moet je nog een keer op Change drukken, en dan nog een keer op OK
Kun je je syntax posten?quote:Op dinsdag 17 mei 2011 20:02 schreef Pinklady89 het volgende:
Oke, ik maak wss een hele domme fout, maar is er iemand die me vertelt wat ik verkeerd doe en nog belangrijker: hoe ik het goed doe?
Ik wil een x aantal vragen ompolen. Nu heb ik de volgende "handleiding" opgevolgd:
[..]
(Bron: http://www.gmw.rug.nl/~methodologiewinkel/index?id=265)
Dat gaat tot op zekere hoogte goed, want ik krijg een nieuwe kolom erbij.
[..]
Nog een keer op "change" drukken kan niet. Op OK klikken kan wel.
Maar dan het resultaat: in mijn 'variable view' staat dan 'values' en 'missing' niet ingevuld. Bij 'columns' staan "vreemde" getallen (10, 12, 20, etc.; bij de andere variabelen staat 8). Het meest aparte is dus: als ik dan iets bij de oorspronkelijke variabele invul, dan staat er dus niets bij de omgepoolde variant.
Ik heb versie 17.0 (maakt dat iets uit?).
Begrijpt iemand hier wat er verkeerd gaat?
1 2 | RECODE variabelenaam1 variabelenaam2 (1=5) (2=4) (3=3) (4=2) (5=1) INTO Rvariabelenaam1 Rvariabelenaam2 . |
God heb ik me dus echt kapot lopen staren op hoe dat fout heeft kunnen gaanquote:Op dinsdag 17 mei 2011 22:13 schreef crossover het volgende:
Syntax zou er zo ongeveer uit moeten zien:
[ code verwijderd ]
betrokkeheid moeder - betrokkenheid vaderquote:Op woensdag 18 mei 2011 12:44 schreef Ananajasje het volgende:
Ook ik kom er even niet uit...
Het gaat om ouderlijke betrokkenheid bij het kind en het verschil tussen vader en moeder uit gescheiden gezinnen.
Ik heb een variabele familiestructuur (codes: 1 = intacte gezin, 2 = gescheiden gezin). Een variabele 'betrokkenheid van moeder' (gemiddelde score per respondent) en een 'betrokkenheid van vader'. Nu wil ik alle 'gescheiden moeders' apart en alle 'gescheiden vaders' apart. Zodat ik later deze met een t-test kan vergelijken.
Hoe maak ik nou die nieuwe variabelen?
Die snap ik niet helemaal... Ik heb het nu zo gedaan: select cases en alleen de cases geselecteerd die een 2 hadden bij familiestructuur (dus gescheiden). Daarna een test gedaan waarbij ik betrokkenheid moeder en vader met elkaar vergelijk, dus dan pakt ie alleen de gescheiden ouders..quote:Op woensdag 18 mei 2011 12:51 schreef oompaloompa het volgende:
[..]
betrokkeheid moeder - betrokkenheid vader
split file op familistructuur, daarna binnen gescheiden gezinnen alles met hogere betrokkenheid moeder dan vader = 1, lager = 2?
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |