Het SPSS topic #2 - Waar we gezellig verder analyseren

FOK!forum / School, Studie en Onderwijs / Het SPSS topic #2 - Waar we gezellig verder analyseren

Zocalo

vrijdag 2 april 2010 @ 12:27

Hier verder met Deel 2.

Links:
http://www.spsslog.com/
http://www.spss.com/nl/

Laatste bericht:

quote:
Op dinsdag 23 maart 2010 11:23 schreef bergkamp85 het volgende:
Ik heb een vraagje. Ik heb momenteel een construct bestaande uit 4 vragen. Zodra ik Cronbach Alpha doe, kom ik uit op 0,804. Als ik echter één vraag verwijder, stijgt mijn Cronbach naar 0,812, en als ik vervolgens nog een vraag verwijder komt mijn Cronbach uit op 0,884. Moet ik nu wel of niet deze vragen verwijderen?

quote:
Op vrijdag 2 april 2010 12:22 schreef Zocalo het volgende:
Nee, geloof dat 0,7 de ondergrens is, en daar zit je al ruim aan.

Zocalo

vrijdag 2 april 2010 @ 12:34

Ik heb ook gelijk een vraag:
Ik wil voor mijn scriptie kijken of de vier dimensies van Hofstede (waarde 0-100) invloed hebben op innovatie (gemeten in diverse eenheden, zoals patenten, uitgaven, etc.).

Hoe kan ik dit doen? Van de onafhankelijke variabele cultuur meet ik dus vier dingen, van de afhankelijke variabele zeg drie. Elk land zou dan een datapunt worden in SPSS. Kan dit dan 'gewoon' via regressie? Moet ik op de innovatiewaarden een factoranalyse uitvoeren, zodat ik daarna de dimensies kan toetsen op de nieuwe factor oid?

Lucky_Strike

vrijdag 2 april 2010 @ 12:40

Even een tvp hier, denk dat ik vandaag of morgen wel hulp nodig heb. Ben bezig om een risicotaxatie instrument op te zetten m.b.v. een multipele regressie analyse. Moet alleen nog even 15 variabelen gaan vinden die dat risico volgens mijn theorie moeten gaan voorspellen....

crossover

vrijdag 2 april 2010 @ 12:43

Present.

gekke_sandra

vrijdag 2 april 2010 @ 14:46

Weet iemand hier toevallig hoe je getallen in de output af kan ronden naar boven?
Bij mij rond hij soms af naar onder en soms naar boven.
68,85 rond hij af naar beneden terwijl het naar boven moet.

vrijdag 2 april 2010 @ 16:47

Ha.

diginoob2

woensdag 7 april 2010 @ 14:06

Ik heb morgen spss tentamen maar om een of andere reden lukt me iets niet in SPSS. Als ik een 2 related samples test wil doen, dus een nonparametrische tekentoets, en ik vul alles mooi in (en vink ´sign´ aan), dan krijg ik wel het tabelletje met ´negative differences, positive differences, ties en total´ maar in de tabel met de overschrijdingskans staan dan drie puntjes in plaats van de overschrijdingskans.
Iemand enig idee waardoor dit komt?

BouliBouli

maandag 12 april 2010 @ 13:30

Ik heb een vraag die waarschijnlijk zeer simpel is, maar ik kom er ff niet meer uit

:
ik heb een vragenlijst afgenomen bij 1 groep pp. Ik heb hierin 4 schalen en ik wil de totaalscores op deze schalen vergelijken (dus of mijn proefpersonen meer type A zijn of meer type B, C of D). Nu heb ik de descriptives al gedraaid en kan ik daarin zien dat de verschillen waarschijnlijk klein zijn, maar ik wil graag zeker weten of deze wel of niet significant zijn.
Met welke toets doe ik dit ook alweer???

maandag 12 april 2010 @ 13:39

Chi.

BouliBouli

maandag 12 april 2010 @ 15:22

Ik weet eigenlijk niet hoe ik hier een Chi-square van zou kunnen maken...het lukt me nml niet om de data als een 2x2 tabel te beschrijven (er is geen categorische variabele).
Ik heb 4 schalen op intervalniveau die elk 1 type meten (maar pp kunnen meerdere types tegelijk zijn) en ik wil weten of mijn proefpersonen gemiddeld hoger scoren op 1 van deze. Als ik maar 2 schalen had gehad, had ik denk ik een one-sample T-test gedaan, maar nu weet ik dus niet zo goed wat ik moet doen...

Barbalena

maandag 19 april 2010 @ 10:55

Na vele jaren SPSS afwezigheid mag ik er nu weer gebruik van maken. Van de schrik bekomen dat we niet meer bij versie 8/9 zijn, maar bij versie 18, tot de conclusie gekomen dat de kennis wel ver vergezakt is.

Oftewel: hellup!
Het gaat om het volgende:
Voor een onderzoek binnen een organisatie is een vragenlijst met Likert items (5 puntsschaal) afgenomen. Bijna alle medewerkers hebben gereageerd (n=70). De scores op de Likert items worden als interval gebruikt.

Er zijn een aantal onderzoekvragen:
1. in hoeverre is er verschil in de betrokkenheid tussen medewerkers met een vast dienst verband en medewerkers met een tijdelijk dienstverband
2. in hoeverre is er verschil in de betrokkenheid tussen medewerkers in verschillende teams?
3. in hoeverre speelt de relatie met de leidinggevende een rol bij de betrokkenheid?

Vraag 1 en 2 zijn vergelijkbaar, het gaat om
-2 opties: vast of tijdelijk en dan de score op 15 likert items
-en om 8 opties: de teams en dan de score op 15 likert items
Kan ik het gemiddelde van de Likert items berekenen en daar dan een t-toets op doen?
Of het ik voor die met 8 opties ANOVA al nodig?

Vraag 3 lijkt mij met het lastigst:
Er zijn 15 Likert items over betrokkenheid en 10 over de relatie met de leidinggevende.
Hoe kan ik nagaan of hier samenhang tussen is?

Hopelijk kan iemand me helpen, en gaan er ergens ver weg in mn hoofd bellen rinkelen en kwartjes vallen...

maandag 19 april 2010 @ 12:12

Met acht opties inderdaad de ANOVA gebruiken en voor vraag drie is een regressieanalyse wellicht mogelijk.

Barbalena

maandag 19 april 2010 @ 13:55

Hoi Z,

Anova dus, dat gaat vast lukken.

Maar die regressieanalyse, kan dat wel? Ivm multicollineariteit, de 15 vragen over betrokkenheid zullen naar verwachting onderling een hoge correlatie met elkaar hebben en de 10 over de relatie met de leidinggevende ook.

Als ik nu heel simpel denk, kan ik gemiddelden nemen van de vragen, en zo een score krijgen op betrokkenheid en op relatie-leidinggevende en dan kijken naar de correlatie daarvan?
Of bega ik dan een grote zonde...

SPSS rekent het vast allemaal mooi uit, maar mág het ook...

Skv

maandag 19 april 2010 @ 14:18

Vorige week statistiek 2 gedaan, volgens mij ging het tentamen best prima.
Onderdelen:
# t-toetsen, binomiaal toets, Chi-kwadraat en tekentoets
# Regressieanalyse - Enkelvoudige en meervoudige regressie
# Variantie Analyse - One-Way Anova, Bonferonni procedure,
- Two-Way Anova en interactie effecten
# Non-parametrische toetsen - Rangsomtoets Wilcoxon (Mann-Whitney-toets)
- Rangtekentoets, Kruskal-Wallis toets
#
- (Fisher's Exact Test) Shapiro-Wilk, Levene test
# Schaalanalyse: Reliability
# Samenhangsmaten:
- Cramer's V, Kendall's tau-b, Kendall's tau-c,
- Eta, Spearman's rho, Correlation

Ik vind SPSS zelfs wel leuk beginnen te worden

Skv

maandag 19 april 2010 @ 14:21

quote:
Op maandag 19 april 2010 13:55 schreef Barbalena het volgende:
Hoi Z,

Anova dus, dat gaat vast lukken.

Maar die regressieanalyse, kan dat wel? Ivm multicollineariteit, de 15 vragen over betrokkenheid zullen naar verwachting onderling een hoge correlatie met elkaar hebben en de 10 over de relatie met de leidinggevende ook.

Als ik nu heel simpel denk, kan ik gemiddelden nemen van de vragen, en zo een score krijgen op betrokkenheid en op relatie-leidinggevende en dan kijken naar de correlatie daarvan?
Of bega ik dan een grote zonde...
SPSS rekent het vast allemaal mooi uit, maar mág het ook...

Bekijk de samenhang van de factoren per variabele met Chronbach's alpha. Dingen die erg afwijken van de rest verwijderen en kijken of chronbach's alpha > 0.7. Is dat zo, dan een nieuwe variabele aanmaken met compute, waarbij je de gemiddelden van alle vorige vragen bij elkaar optelt en op elkaar deelt. Die nieuwe variabelen kan je dan gewoon regressie-analyse op toepassen.

Barbalena

woensdag 21 april 2010 @ 09:45

Even nog een hele andere vraag, misschien een beetje raar want meestal werk je met een grote populatie en een steekproef daaruit, maar als ik nou data van bijna de hele populatie heb, maakt dat nog verschil?
Het gaat hier om een onderzoek onder alle 73 medewerkers binnen een bedrijf en 65 hebben de enquete ingevuld, 89% dus.
Is dit als de hele populatie te zien of blijft het een steekproef?
Zijn er andere berekeningen voor een hele populatie?
Of kan ik bv bij de ANOVA om voorwaarden zoals een normale verdeling heen?

Skv

vrijdag 23 april 2010 @ 15:35

Tuurlijk is er verschil tussen populaties en steekproeven. Of je werkt met xgemiddeld en standaardafwijking s, of je werkt met u en o. (mu en sigma)

yozd

dinsdag 27 april 2010 @ 12:30

Het is lang geleden dat ik met SPSS gewerkt heb, vandaar even een vraag.

Stel ik heb 5 vragen waarop respondenten ja (1) of nee (0) op konden antwoorden. Die 5 vragen zeggen allemaal iets over "beleid". De vragen correleren positief, dus een 1 op vraag a, "komt overeen" met een 1 bij vraag b t/m e.

Kan ik nu een variabele "beleid" maken door vraag a t/m e op te tellen? Zo ja, is het dan mogelijk om een regressie analyse uit te voeren met die variabele als afhankelijke variabele en wat andere variabelen (die ook zo zijn samengesteld) als onafhankelijke variabelen?

-edit-

begrip --> BELEID --> verschillende indicatoren: A,B,C,D,E --> elke indicator heeft eigen vragen waarop steeds '0' (nee), of '1' (ja) is geantwoord --> variabele 'BELEID' heeft dus een minimum van 0 en een maximum van 5.

begrip --> X --> verschillende indicatoren: A,B,C,D,E --> elke indicator heeft eigen vragen waarop steeds '0' (nooit), '1' (soms), '2' (bijna altijd) of '3' (altijd) is geantwoord --> variabele 'X' heeft dus een minimum van 0 en een maximum van 15.

Verband tussen beiden? (dat is namelijk waar me het allemaal om te doen is)

(1) Spearman's rho (want het zijn ordinale variabelen, dus een gewone correlatiematrix mag niet)
(2) Een 'ordinal logistic regression' uitvoeren (OLS kan niet, want het zijn ordinale variabelen)

Kan dit zo?

-edit 2-

Ik zat nog even over het "ordinale" vraagstuk na te denken. Op zich zijn de antwoorden die respondenten gekozen hebben wel ordinaal, maar verandert dat niet na het coderen in SPSS? Zijn het daarna geen variabelen op ratio schaal? Of werkt dat niet zo?

[ Bericht 25% gewijzigd door yozd op 27-04-2010 19:52:35 ]

yozd

dinsdag 27 april 2010 @ 17:00

Niemand?

Skv

woensdag 28 april 2010 @ 08:22

Bij het aanmaken van een nieuwe variabele niet met de som van de voorgaanden werken, maar met het gemiddelde. Als je met de som werkt en er zijn respondenten die een vraag niet in hebben gevuld, zou dat in plaats van een neutrale score gelden als een lage score. Verwijder deze niet ingevulden en werk per respondent met het gemiddelde van de ingevulde scores op de vragen die het concept meten. Zorg hierbij ook dat de scores hetzelfde meten (kijk naar de positieve of negatieve formulering en zorg dat een hoge score een positieve beoordeling voor je eindconcept is). Vergelijking van twee ordinale variabelen zou ik kiezen voor kendalls tau-b voor een vierkantstabel of kendalls tau-c voor een rechthoekige tabel. Voor spearmans rho heb je een variabele van ordinaal en een variabele van interval of rationiveau nodig.

yozd

woensdag 28 april 2010 @ 09:14

Bedankt! Ik ga ze middelen.

quote:
Op woensdag 28 april 2010 08:22 schreef Skv het volgende:
Vergelijking van twee ordinale variabelen zou ik kiezen voor kendalls tau-b voor een vierkantstabel of kendalls tau-c voor een rechthoekige tabel. Voor spearmans rho heb je een variabele van ordinaal en een variabele van interval of rationiveau nodig.

Ik las dat Spearman en Kendall allebei zouden kunnen. Spearman is ook voor ordinale variabelen of voor interval/ratio variabelen die niet voldoen aan bepaalde assumpties. Vaak geven beide testen ongeveer dezelfde uitkomsten. Kendall's tau is alleen makkelijker te interpreteren en praktischer, al wordt het me niet echt duidelijk waarom...

-edit-

Ik zie trouwens bij alle voorbeelden (gevonden via Google) van het samenstellen van een index variabele dat ze een Likert schaal o.i.d. hebben; met keuzes van 1 t/m 5 ("helemaal nooit, bijna nooit, neutraal, soms, heel vaak" ofzo). Ik heb echter bij mijn 1e variabele alleen maar "ja" of "nee" (ook nog "weet niet", maar die gebruik ik niet) en bij die 2e (X) slechts 3 keuzes. Maakt dat wat uit?

[ Bericht 20% gewijzigd door yozd op 28-04-2010 09:40:44 ]

Skv

woensdag 28 april 2010 @ 16:46

quote:
Op woensdag 28 april 2010 09:14 schreef yozd het volgende:
Bedankt! Ik ga ze middelen.
[..]

Ik las dat Spearman en Kendall allebei zouden kunnen. Spearman is ook voor ordinale variabelen of voor interval/ratio variabelen die niet voldoen aan bepaalde assumpties. Vaak geven beide testen ongeveer dezelfde uitkomsten. Kendall's tau is alleen makkelijker te interpreteren en praktischer, al wordt het me niet echt duidelijk waarom...

-edit-

Ik zie trouwens bij alle voorbeelden (gevonden via Google) van het samenstellen van een index variabele dat ze een Likert schaal o.i.d. hebben; met keuzes van 1 t/m 5 ("helemaal nooit, bijna nooit, neutraal, soms, heel vaak" ofzo). Ik heb echter bij mijn 1e variabele alleen maar "ja" of "nee" (ook nog "weet niet", maar die gebruik ik niet) en bij die 2e (X) slechts 3 keuzes. Maakt dat wat uit?

Lijkt me moeilijk om met slechts 'ja' of 'nee' een sterkte van samenhang te genereren. 'ja' en 'nee' is gewoon een bivariate variabele in plaats van een ordinale!

yozd

woensdag 28 april 2010 @ 22:21

quote:
Op woensdag 28 april 2010 16:46 schreef Skv het volgende:

Lijkt me moeilijk om met slechts 'ja' of 'nee' een sterkte van samenhang te genereren. 'ja' en 'nee' is gewoon een bivariate variabele in plaats van een ordinale!

Mjah, dit is wat ik eigenlijk probeer te bewerkstelligen, voorbeeld:

Heeft u A?
Heeft u B?
Heeft u C?
Heeft u X?
Heeft u Y?
Heeft u Z?

Op alle vragen kan men ja of nee antwoorden --> 0 of 1. Al die vragen samen zeggen iets over het gevoerde "beleid" (betreffende dat onderwerp). Nu wil ik een totaalscore hebben van dat beleid. Ik dacht er eerst aan om alle scores op te tellen. Een respondent scoort dan, in dit voorbeeld, maximaal 6 ("veel beleid") en minimaal 0 (weinig beleid). Nu zou dat ietwat problematisch worden bij missing scores, aangezien die de totaalscores verpesten.

Bij het middelen liggen de scores tussen 0 (weinig beleid) en 1 (veel beleid). De waardes die eruit komen zijn dus niet 0 of 1, maar liggen daar tussen in (kunnen natuurlijk wel 0 of 1 zijn).

Ik zie alleen door de bomen het bos niet meer zo...

Skv

donderdag 29 april 2010 @ 13:14

Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.

Karen1987

donderdag 29 april 2010 @ 15:32

Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...

Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?

Wie kan mij helpen?

yozd

donderdag 29 april 2010 @ 15:57

quote:
Op donderdag 29 april 2010 13:14 schreef Skv het volgende:
Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.

Dat is op zich ook een goed idee ja. Je hebt wel gelijk wat betreft de vraag of het concept wel goed gemeten wordt. Probleem is echter dat ik voor een of andere opdracht een analyse moet uitvoeren aan de hand van gegevens die er al liggen. Men heeft dus eerst de enquetes verstuurd en achteraf bedacht wat men wil weten. Dat is de omgekeerde wereld, maar ik probeer er nog wat van te maken

.

Op de site (http://www.nd.edu/~rwilliam/stats2/) van een of andere statistiek docent, heb ik trouwens iets gevonden wat ik ongeveer wilde gaan doen: http://www.nd.edu/~rwilliam/stats2/l23.pdf . Deze man construeert een schaal op basis van een aantal stellingen waar men eens (1) of oneens (0) op moest antwoorden. Met die info en jouw tips moet het lukken!

crossover

donderdag 29 april 2010 @ 16:02

quote:
Op donderdag 29 april 2010 15:32 schreef Karen1987 het volgende:
Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...

Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?

Wie kan mij helpen?

Wat wil je precies doen? Je kan ze toch samenvoegen naar een bestand en dan vergelijken?

Skv

donderdag 29 april 2010 @ 20:35

quote:
Op donderdag 29 april 2010 15:32 schreef Karen1987 het volgende:
Ik heb waarschijnlijk een domme vraag, maar ik ben al een tijdje uit het hele SPSS gebeuren...

Ik heb twee vragenlijsten afgenomen, allebei 7puntslikertschalen. De ene vragenlijst bestaat uit 5 vragen, de andere uit 30. Hoe kan ik deze twee met elkaar vergelijken? Of moet ik ze dan eerst indelen naar bijv een lagen/middel/hoge score om het gelijk te maken?

Wie kan mij helpen?

Meten ze hetzelfde concept? Zoek eerst de samenhang tussen afzonderlijke vragen uit. Vervolgens filter je de vragen die niet goed correleren met de andere vragen. Daarna construeer je 2 nieuwe variabelen die je gewoon tegen elkaar kan toetsen.

Skv

donderdag 29 april 2010 @ 20:36

quote:
Op donderdag 29 april 2010 15:57 schreef yozd het volgende:

[..]

Dat is op zich ook een goed idee ja. Je hebt wel gelijk wat betreft de vraag of het concept wel goed gemeten wordt. Probleem is echter dat ik voor een of andere opdracht een analyse moet uitvoeren aan de hand van gegevens die er al liggen. Men heeft dus eerst de enquetes verstuurd en achteraf bedacht wat men wil weten. Dat is de omgekeerde wereld, maar ik probeer er nog wat van te maken .

Op de site (http://www.nd.edu/~rwilliam/stats2/) van een of andere statistiek docent, heb ik trouwens iets gevonden wat ik ongeveer wilde gaan doen: http://www.nd.edu/~rwilliam/stats2/l23.pdf . Deze man construeert een schaal op basis van een aantal stellingen waar men eens (1) of oneens (0) op moest antwoorden. Met die info en jouw tips moet het lukken!

Succes! Wil je de uiteindelijk gebruikte methode nog even posten hier? Vind ik wel interessant.

Citizen.Erased

donderdag 29 april 2010 @ 20:38

TVP.

De komende tijd mag ik ook weer met SPSS aan de slag.

Karen1987

maandag 3 mei 2010 @ 11:59

quote:
Op donderdag 29 april 2010 20:35 schreef Skv het volgende:

[..]

Meten ze hetzelfde concept? Zoek eerst de samenhang tussen afzonderlijke vragen uit. Vervolgens filter je de vragen die niet goed correleren met de andere vragen. Daarna construeer je 2 nieuwe variabelen die je gewoon tegen elkaar kan toetsen.

Ja ze meten hetzelfde concept. De ene vragenlijst meet het 'nu' en de andere de gewenste toekomst. Ik zou graag willen weten of hier tussen een verschil bestaat. Er worden in beide vragenlijsten 6 concepten uitgevraagd, dus bij de ene vragenlijst is dat 1 vraag per concept, bij de andere 5 per concept. Vragen uitfilteren kan niet, want de lange vragenlijst is een bestaande vragenlijst. Hoe kan ik dit vergelijken als de twee schalen dus niet gelijk zijn in grootte? Op deze manier kan ik ze niet vergelijken...

Skv

maandag 3 mei 2010 @ 12:01

quote:
Op maandag 3 mei 2010 11:59 schreef Karen1987 het volgende:

[..]

Ja ze meten hetzelfde concept. De ene vragenlijst meet het 'nu' en de andere de gewenste toekomst. Ik zou graag willen weten of hier tussen een verschil bestaat. Er worden in beide vragenlijsten 6 concepten uitgevraagd, dus bij de ene vragenlijst is dat 1 vraag per concept, bij de andere 5 per concept. Vragen uitfilteren kan niet, want de lange vragenlijst is een bestaande vragenlijst. Hoe kan ik dit vergelijken als de twee schalen dus niet gelijk zijn in grootte? Op deze manier kan ik ze niet vergelijken...

Maak van de vragenlijst met 5 per concept een nieuwe variabele met de samenvoeging van de 5 vragen die telkens een concept meten. Zoek wel uit of die vijf variabelen wel genoeg samenhangen.

Karen1987

maandag 3 mei 2010 @ 12:05

quote:
Op maandag 3 mei 2010 12:01 schreef Skv het volgende:

[..]

Maak van de vragenlijst met 5 per concept een nieuwe variabele met de samenvoeging van de 5 vragen die telkens een concept meten. Zoek wel uit of die vijf variabelen wel genoeg samenhangen.

Dankje! Ik zou het gewoon moeten weten, maar ik ben er zolang uit geweest.. En nooit een held geweest natuurlijk... Als ik gecontroleerd heb of ze genoeg samenhangen, kan ik ze dan samenvoegen door het gemiddelde te nemen? Of zeg ik dan weer iets compleet gestoords..

Skv

vrijdag 7 mei 2010 @ 13:40

Samenhang controleren kan met Chronbach's alpha. Vervolgens kan je een nieuwe variabele aanmaken met -inderdaad- het gemiddelde van de vijf variabelen. Zorg wel dat je alle 'missing values' eerst verwijderd en niet meetelt bij het nemen van het gemiddelde. (als een missing value bijvoorbeeld de code 9 heeft gekregen en rest een score van 1 t/m 5 Likert en je neemt het gemiddelde van iemand die slechts één van de vijf vragen heeft ingevuld, dan zou de totale score van die persoon richting de 9 liggen).

Succes!

Pablo88

maandag 10 mei 2010 @ 17:16

Ik moet voor mijn Bachelor eindopdracht verzamelde data analyseren; zijn de verschillen tussen 2 situaties significant?
Dit gaat met de Paired T-test of met de Wilcoxon signed Rank test, welke van de twee hangt af of de data al dan niet normaal verdeeld is. Is dit met SPSS gemakkelijk te bepalen?

yozd

maandag 10 mei 2010 @ 17:45

Ik gebruik in mijn syntax onderstaand filter:

USE ALL.
COMPUTE filter_$=((v17a=3 | v17a=4 | v17a=9 | SYSMIS(v17a)) & (v17b=3 |
v17b=4 | v17b=9 | SYSMIS(v17b)) & (countmissing17 <= 1)).
VARIABLE LABEL filter_$ '(Vraag 17 geen ja) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .

Wat er precies gefilterd wordt, is niet heel boeiend; het werkt wel. De juiste selectie blijft over en de rest wordt "weggestreept". Nu wil ik van de selectie die overblijft een vraag hercoderen (d.w.z. alles blijft gelijk, maar de system missings krijgen een 0.5):

RECODE
v18a (1=1) (2=2) (3=3) (SYSMIS=0.5) .
EXECUTE .

Probleem is echter dat die nu voor alles cases de vraag hercodeert (alle sysmis'es worden 0.5), terwijl ik dat alleen voor de selectie wilde doen. Waar doe ik het verkeerd?

Skv

maandag 10 mei 2010 @ 17:45

Ja.

Pablo88

dinsdag 11 mei 2010 @ 14:32

quote:
Op maandag 10 mei 2010 17:45 schreef Skv het volgende:
Ja.

en hoe gaat dat dan?

dinsdag 11 mei 2010 @ 14:36

quote:
Op maandag 10 mei 2010 17:45 schreef yozd het volgende:
Ik gebruik in mijn syntax onderstaand filter:

USE ALL.
COMPUTE filter_$=((v17a=3 | v17a=4 | v17a=9 | SYSMIS(v17a)) & (v17b=3 |
v17b=4 | v17b=9 | SYSMIS(v17b)) & (countmissing17 <= 1)).
VARIABLE LABEL filter_$ '(Vraag 17 geen ja) (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE .

Wat er precies gefilterd wordt, is niet heel boeiend; het werkt wel. De juiste selectie blijft over en de rest wordt "weggestreept". Nu wil ik van de selectie die overblijft een vraag hercoderen (d.w.z. alles blijft gelijk, maar de system missings krijgen een 0.5):

RECODE
v18a (1=1) (2=2) (3=3) (SYSMIS=0.5) .
EXECUTE .

Probleem is echter dat die nu voor alles cases de vraag hercodeert (alle sysmis'es worden 0.5), terwijl ik dat alleen voor de selectie wilde doen. Waar doe ik het verkeerd?

SPSS doet raar als je onder voorwaarde hercodeerd. Ik zou het via een omweg doen, als je bij het filteren 'delete unselected cases' doet, het bestand onder een andere naam opslaat, heocdeerd en de data via een merge weer aan elkaar plakt, lukt het wel.

dinsdag 11 mei 2010 @ 14:41

Je kan ook 'update' gebruiken ipv mergen.

yozd

woensdag 12 mei 2010 @ 21:39

quote:
Op dinsdag 11 mei 2010 14:36 schreef Z het volgende:

SPSS doet raar als je onder voorwaarde hercodeerd. Ik zou het via een omweg doen, als je bij het filteren 'delete unselected cases' doet, het bestand onder een andere naam opslaat, heocdeerd en de data via een merge weer aan elkaar plakt, lukt het wel.

Hartstikke bedankt! Het werkt via die omweg wel

yozd

vrijdag 14 mei 2010 @ 00:33

Nog een vraag over het construeren van mijn schaal. Eerst nog even de eerdere posts:

quote:
Op woensdag 28 april 2010 22:21 schreef yozd het volgende:

Mjah, dit is wat ik eigenlijk probeer te bewerkstelligen, voorbeeld:

Heeft u A?
Heeft u B?
Heeft u C?
Heeft u X?
Heeft u Y?
Heeft u Z?

Op alle vragen kan men ja of nee antwoorden --> 0 of 1. Al die vragen samen zeggen iets over het gevoerde "beleid" (betreffende dat onderwerp). Nu wil ik een totaalscore hebben van dat beleid. Ik dacht er eerst aan om alle scores op te tellen. Een respondent scoort dan, in dit voorbeeld, maximaal 6 ("veel beleid") en minimaal 0 (weinig beleid). Nu zou dat ietwat problematisch worden bij missing scores, aangezien die de totaalscores verpesten.

Bij het middelen liggen de scores tussen 0 (weinig beleid) en 1 (veel beleid). De waardes die eruit komen zijn dus niet 0 of 1, maar liggen daar tussen in (kunnen natuurlijk wel 0 of 1 zijn).

Ik zie alleen door de bomen het bos niet meer zo...

quote:
Op donderdag 29 april 2010 13:14 schreef Skv het volgende:
Volgens mij is het erg moeilijk om te kijken of je vragen het concept wel goed meten met een bivariate variabele. Je gaat er vanuit dat die zaken het 'beleid' meten, maar statistisch kan je dit met Chronbach's alpha volgens mij niet aantonen. Maar, je kan toch met het gemiddelde per groep werken? Dan flikker je de 'geen antwoord'-dingen er uit en kijk je wat het gemiddelde is per respondent? Je zal dan per respondent een score tussen de 0 en 1 krijgen, die aangeeft hoeveel mensen gemiddeld hebben.

Ik heb het nu gedaan op de hierboven beschreven manier voor begrip X. Ik ga dat ook nog doen voor begrip Y en daarna kan ik ze met elkaar gaan vergelijken.

Ik gebruik overigens een schaal gebaseerd op gemiddelde scores. Zoals iemand al eerder zei, is dat beter, omdat je bij somscores vaak te laag zit als iemand missings heeft. Neem je gemiddelde scores, dan worden die missings "geneutraliseerd". Mijn schaal is de gemiddelde score (tussen 0 en 1) over 28 vragen.

Ik wil alleen graag ook iets zeggen over de betrouwbaarheid van de schalen. Met SPSS kan je daarvoor de Reliability Analysis gebruiken. Je selecteert dan alle variabelen (in mijn geval 28 vragen) en dan krijg je via de Cronbach's alpha te zien of je schaal betrouwbaar is (valide is een ander verhaal...). Een C alpha van 0.8 of hoger is goed en van 0.6 is ongeveer de minimum vereiste.

Probleem is echter dat wanneer een case/respondent een missing value heeft op 1 van de 28 vragen (wat bij mij heel vaak het geval is), deze case wordt weggelaten uit de analyse. Gevolg is dat ik er bij het berekenen maar 7 van de oorspronkelijke 1403 respondenten worden gebruikt

. Dit gebeurt bij mij o.a. doordat ik de "weet niet" scores als missing heb behandeld. Als ik die i.p.v. missing als neutraal behandel (een 0.5 score, aangezien mijn schaal tussen de 0 en 1 is), dan worden er al wat meer cases gebruikt, maar nog steeds heel weinig (65 ofzo).

Een belangrijker oorzaak van dit probleem is het volgende: 2 van de 28 vragen zijn "vervolgvragen". Die vragen hoeven alleen maar ingevuld te worden als er op eerdere vragen "ja" is geantwoord. Veel mensen hebben die vragen dus niet ingevuld, ergo: dat worden missings en de cases worden uitgesloten van de analyse. In feite zijn dit geen "echte" missings. Twee oplossingen: (1) deze vragen niet in de schaal opnemen als de betrouwbaarheid wordt getest, of (2) de dataset hercoderen. Met dit hercoderen bedoel ik dat er gekeken wordt in de dataset of er op de beginvragen een "ja" is geantwoord, is dat niet het geval, dan worden die 2 vragen waar het om gaat gehercodeerd als neutraal (0.5), zodat ze niet meer missing zijn, maar een waarde krijgen.

In beide gevallen wordt bij het testen op betrouwbaarheid meer dan 90% van de cases meegenomen, wat natuurlijk een beter beeld geeft.

Dus:

(1) Hoe moet ik mijn schaal testen op betrouwbaarheid?
a. alle 28 vragen, "weet niet" = missing
b. alle 28 vragen, "weet niet" = neutraal (0.5 score)
c. alle 28 vragen, 2 vragen gehercodeerd (missings, zijn nepmissings en worden neutraal)
d. niet alle vragen, 2 vragen eruit, 26 vragen over

(2) Welke schaal kan ik het beste gebruiken in de verdere analyses (regressie e.d.)?

Is het erg als ik een schaal gebruik, waarvan de betrouwbaarheid niet getest kan worden? Stel ik gebruik schaal a of b. Die zijn eigenlijk niet te testen. Via bovenstaande bewerkingen is wel aan te tonen dat de 28 vragen samenhangen (de alpha verandert niet veel door de bewerkingen, het enige is dat er veel meer cases worden gebruikt bij de laatste 2). Ik gebruik dan dus voor de (regressie)analyses een bepaalde schaal en om aan te tonen dat die vragen/items überhaupt zijn te combineren tot 1 schaal gebruik ik die bewerkingen. Kan dat?

Excuses voor de lange post trouwens!

yozd

zondag 16 mei 2010 @ 15:17

Niemand?

Pablo88

dinsdag 18 mei 2010 @ 15:13

Okay, ik weet nu dat ik met SPSS kan bepalen of mijn data al dan wel niet normaal is verdeeld. Maar hoe doe ik dit? Iemand een gemakkelijke beschrijving?

thx

Rene

dinsdag 18 mei 2010 @ 15:57

tvp

Moet er denk ik ook aan geloven soon or later...

Skv

dinsdag 18 mei 2010 @ 16:57

quote:
Op dinsdag 18 mei 2010 15:13 schreef Pablo88 het volgende:
Okay, ik weet nu dat ik met SPSS kan bepalen of mijn data al dan wel niet normaal is verdeeld. Maar hoe doe ik dit? Iemand een gemakkelijke beschrijving?

thx

-Analyze->Descriptives->Frequencies->Histogram met vink bij normal curve. Kijken of het histogram overeenkomt.

Analyze->descriptives->Explore->dependent var geeft een Q-Q-plot, waarbij de waarnemingen op de lijn moeten liggen voor een normale verdeling.

-Shapiro-Wilktoets geeft ook normaliteit aan:
H0: de verdeling van variabele is standaard-normaal verdeeld.
Ha: de verdeling van variabele is niet standaard-normaal verdeeld.
Komt neer op Sig <0.05: geen normale verdeling bij alpha van 5%.

StephanL

dinsdag 18 mei 2010 @ 21:20

Wat een but om alles te analyseren

Heb het ook sinds enkele weken, op zich een goed programma, maar je moet alle antwoorden verantwoorden

thedarkside

vrijdag 4 juni 2010 @ 13:30

Weet iemand toevallig hoe je een variabele kunt kwadrateren in SPSS? Via compute variables moet ik iets kwadrateren, maar ik kan de juiste functie niet vinden. Ik kan het wel via excel doen en dan kopieeren in SPSS, maar met veel data wordt dat een beetje vervelend.

vrijdag 4 juni 2010 @ 13:36

Compute varx = varx * varx.
exe.

thedarkside

vrijdag 4 juni 2010 @ 13:53

Te simpel om zelf op te komen.. Thnx.

Gleen

woensdag 9 juni 2010 @ 18:56

Hi,

ik vraag me af hoe ik meerdere binaire variabelen kan samen voegen tot 1 variabele waarbij ze worden gecodeerd in groepen waarbij bv bij de eerste 2 beide een 1 werd gescoord.

Dus eigenlijk wil ik een variabele maken die de scores optelt als verschillende variabelen aan een bepaalde voorwaarden voldoen.

Ik hoop dat ik het duidelijk uit heb kunnen leggen en dat iemand me kan helpen,
Bedankt

crossover

woensdag 9 juni 2010 @ 19:19

Transform - Compute variable.

woensdag 9 juni 2010 @ 20:49

Of:
compute nVar = 0.
exe.

IF var_a = 1 nVar = 1.
IF var_b = 1 nVar = 1.
IF var_c = 1 nVar = 2.
IF var_d = 1 nVar = 2.
enzovoorts
exe.

Plakken in een syntax en runnen.

uppie83

vrijdag 11 juni 2010 @ 00:31

Om een of andere vage reden neemt mijn SPSS 'missing values' mee wanneer ik een nieuwe variabele compute.

Bij het berekenen van de betrouwbaarheid van een nieuw te maken schaal werden netjes de missing values overgeslagen en kreeg ik een N=180. Toen ik vervolgens met dezelfde variabelen een nieuwe schaal creeerde die het gemiddelde weer geeft, kwam er een N=260 uit en werden alleen respondenten overgeslagen die over de gehele schaal missing values hadden (oftewel niets hadden ingevuld bij alle vragen van deze schaal).

Volgens mij klopt er iets niet :S

crossover

vrijdag 11 juni 2010 @ 08:17

-Heb je aangegeven dat je die missende waardes wil kopieren naar de nieuwe variabele? Zie hier, system missing aanvinken.
-Staat het bij je instelling van de nieuwe variabele wel goed, dus een waarde bij de kolom missing in het veld 'Variable view'?

Darkzell

woensdag 23 juni 2010 @ 12:13

Hopelijk kan iemand me helpen met het volgende:
Ik moet een confidence interval van het gemiddelde van Y voorspellen en daarbij voor x1, x2 en x3 een bepaalde waarde opgeven.

Nou ben ik niet heel handig met SPSS dus hopelijk weet iemand welke functie ik moet gebruiken en hoe dat precies in te stellen.

crossover

woensdag 23 juni 2010 @ 13:18

Multiple regressieanalyse?

The_Eye

maandag 28 juni 2010 @ 12:39

Hier weer een SPSS probleem:

Voor mijn scriptie ben ik bezig met een conjoint analyse. Aangezien ik de afhankelijke variabele op nominaal als interval niveau gemeten heb, maak ik zowel van dummy variable multiple regression als binary logistic regression gebruik. Nu wil ik ook interactie effecten meten (geslacht, opleiding, etc). Mijn vraag is hoe ik dit precies moet doen? Ik heb al wat gegoogled maar maar kom niks bruikbaars tegen.

Hoop dat iemand mij hiermee kan helpen. Alvast dank voor de hulp.

Rene

donderdag 1 juli 2010 @ 12:26

Deze maken we ff unsticky

zondag 4 juli 2010 @ 20:39

quote:
Op maandag 28 juni 2010 12:39 schreef The_Eye het volgende:
Hier weer een SPSS probleem:

Voor mijn scriptie ben ik bezig met een conjoint analyse. Aangezien ik de afhankelijke variabele op nominaal als interval niveau gemeten heb, maak ik zowel van dummy variable multiple regression als binary logistic regression gebruik. Nu wil ik ook interactie effecten meten (geslacht, opleiding, etc). Mijn vraag is hoe ik dit precies moet doen? Ik heb al wat gegoogled maar maar kom niks bruikbaars tegen.

Hoop dat iemand mij hiermee kan helpen. Alvast dank voor de hulp.

Ik heb mijn twijfels of dit überhaupt kan met SPSS, voor conjoint analyses wordt vaak andere software gebruikt dan SPSS, aparte pakketten speciaal ontwikkeld voor conjoint analyses.

Brammie1

maandag 5 juli 2010 @ 09:28

Na een jaar niet met SPSS gewerkt te hebben, weet ik niet meer hoe het moet

Ik wil, simpel gezegd, SPSS laten uitrekenen of 2 series met waarden significant van elkaar verschillen (P<0.05)

Ik zal het omschrijven als knikkers in een pot, ipv waar het echt om draait.
2 groepen van 5 potten met elk 100 knikkers, en er zijn 3 verschillende kleuren knikkers: rood, geel en blauw.

Groep 1:
Pot 1: 95 rood, 5 geel, 0 blauw
Pot 2: 98 rood, 2 geel, 0 blauw
Pot 3: 98 rood, 2 geel, 0 blauw
Pot 4: 85 rood, 15 geel, 0 blauw
Pot 5: 100 rood, 0 geel, 0 blauw

Groep 2:
Pot 1: 55 rood, 43 geel, 2 blauw
Pot 2: 78 rood, 22 geel, 0 blauw
Pot 3: 76 rood, 24 geel, 0 blauw
Pot 4: 72 rood, 27 geel, 2 blauw
Pot 5: 87 rood, 13 geel, 0 blauw

Het programma moet per groep het gemiddelde aantal rode, gele en blauwe knikkers uitrekenen, en de standaard deviatie.
De vraag is: zitten er in groep 2 significant meer gele knikkers in de potten dan in groep 1? Welke test moet ik daarvoor nemen? Is dat de Univariate test? Welke waarde (pot, rode knikkers, gele knikkers, blauwe knikkers) moet ik in welk vakje zetten?

Hiya

maandag 5 juli 2010 @ 23:36

Basic vraagje over H0 en H1;

Is H0 altijd gelijk aan wat je verwacht dat uit de toets komt en wat je daarna dus gaat toetsen?

Bijvoorbeeld bij 100 mensen a-select ondervraagd:

H0 = er bestaat geen signifant verschil in de seksen van de respondenten
H1 = er bestaat wel....

Of kan dit ook anders om?

Citizen.Erased

dinsdag 6 juli 2010 @ 07:10

quote:
Op maandag 5 juli 2010 23:36 schreef Hiya het volgende:
Basic vraagje over H0 en H1;

Is H0 altijd gelijk aan wat je verwacht dat uit de toets komt en wat je daarna dus gaat toetsen?

Bijvoorbeeld bij 100 mensen a-select ondervraagd:

H0 = er bestaat geen signifant verschil in de seksen van de respondenten
H1 = er bestaat wel....

Of kan dit ook anders om?

Het doel is om je nul-hypothese te verwerpen. Daarin veronderstel je normaliter dat er geen effect/verschil is. In je alternatieve hypothese ga je wel uit van een effect/verschil.

mies1983

dinsdag 6 juli 2010 @ 10:10

quote:
Op maandag 5 juli 2010 23:36 schreef Hiya het volgende:
Basic vraagje over H0 en H1;

Is H0 altijd gelijk aan wat je verwacht dat uit de toets komt en wat je daarna dus gaat toetsen?

Bijvoorbeeld bij 100 mensen a-select ondervraagd:

H0 = er bestaat geen signifant verschil in de seksen van de respondenten
H1 = er bestaat wel....

Of kan dit ook anders om?

Even wat anders. Een hypothese is nooit significant, het is namelijk een uitspraak over de populatie. En die uitspraak is waar of onwaar.

Frith

dinsdag 6 juli 2010 @ 14:02

quote:
Op dinsdag 6 juli 2010 10:10 schreef mies1983 het volgende:

[..]

Even wat anders. Een hypothese is nooit significant, het is namelijk een uitspraak over de populatie. En die uitspraak is waar of onwaar.

waarbij we dan ook maar zullen toevoegen dat de criteria voor wanneer een geproduceerd effect met significantie al dan niet de nul-hypothese verwerpt, grotendeels afhankelijk zijn van het wetenschappelijke veld waarin je jezelf bevind. Uiteraard wel met wat technische correcties voor de methode zelf, maar dat spreekt voor zich.

Medici gaan bijvoorbeeld uit van zeer lage effecten (minder dan 0,1 zelfs), maar dan op zeer grote steekproeven. (waarbij je moet inzien dat de mogelijkheden van een groter effect bij een grotere steekproef steeds kleiner worden en dat de afwijking op een kleine waarde dan ook steeds waarschijnlijker wordt veroorzaakt door een niet-toevallige variatie). In vergelijking doen sociale wetenschappers het met een zeer beperkt aantal cases of op grotere schaal met de 1000-2000 aantallen, waarbij op effectgrotes van 0,1 of meer wordt gehoopt.

/2 centen of zo iets.

Brammie1

woensdag 7 juli 2010 @ 13:37

quote:
Op maandag 5 juli 2010 09:28 schreef Brammie1 het volgende:
Na een jaar niet met SPSS gewerkt te hebben, weet ik niet meer hoe het moet

Ik wil, simpel gezegd, SPSS laten uitrekenen of 2 series met waarden significant van elkaar verschillen (P<0.05)

Ik zal het omschrijven als knikkers in een pot, ipv waar het echt om draait.
2 groepen van 5 potten met elk 100 knikkers, en er zijn 3 verschillende kleuren knikkers: rood, geel en blauw.

Groep 1:
Pot 1: 95 rood, 5 geel, 0 blauw
Pot 2: 98 rood, 2 geel, 0 blauw
Pot 3: 98 rood, 2 geel, 0 blauw
Pot 4: 85 rood, 15 geel, 0 blauw
Pot 5: 100 rood, 0 geel, 0 blauw

Groep 2:
Pot 1: 55 rood, 43 geel, 2 blauw
Pot 2: 78 rood, 22 geel, 0 blauw
Pot 3: 76 rood, 24 geel, 0 blauw
Pot 4: 72 rood, 27 geel, 2 blauw
Pot 5: 87 rood, 13 geel, 0 blauw

Het programma moet per groep het gemiddelde aantal rode, gele en blauwe knikkers uitrekenen, en de standaard deviatie.
De vraag is: zitten er in groep 2 significant meer gele knikkers in de potten dan in groep 1? Welke test moet ik daarvoor nemen? Is dat de Univariate test? Welke waarde (pot, rode knikkers, gele knikkers, blauwe knikkers) moet ik in welk vakje zetten?

Kan iemand mij nog hier mee helpen?

thedarkside

woensdag 7 juli 2010 @ 17:04

Ik weet niet of het goed is, maar ik zou het zo doen:
Data zo invoeren in spss en een extra rij maken waarbij je de groep aangeeft met een cijfer.
Dan een multivariate test uitvoeren met de kleuren als dependent variables en de groep als independent variable. Bij options kun je dan descriptive statistics aanvinken voor de standaarddeviatie enzo.

Brammie1

woensdag 7 juli 2010 @ 19:26

thanks! Ga ik morgen proberen

thedarkside

donderdag 8 juli 2010 @ 22:55

En, werkte het?

Brammie1

vrijdag 9 juli 2010 @ 15:51

misschien, ik kan er nog niet echt wijs uit worden. Maandag verder proberen.

Perruche

vrijdag 9 juli 2010 @ 18:18

Ha! Hier is een SPSS topic! ik heb net een post gedaan, maar ik post hem even hier:

quote:
Hoi!

Vraagje. Ik heb net een exploratory factor analysis gedraait in SPSS. Hieruit zijn 7 factoren gekomen. Nu kom ik erachter dat ik ook Z-scores moet berekenen. Nou kan dat normaal wel, maar ik heb geen flauw idee hoe ik dat moet doen en dat er dan relevante scores uitkomen waar ook conclusies aan kunnen worden verbonden.

Wie helpt me op weg?

Meer info: ik heb 26 vragen - vragenlijst gedaan, met statements waarop mensen konden reageren op een likertscale. Hier is nu een exploratieve factor analyse uit gekomen. Maar het onderzoek waar het mijne op gebaseerd is, doet conclusies n.a.v. de Z-scores die uit de factor analyze komen. Hoe o hoe?

InsaneM666

woensdag 14 juli 2010 @ 10:35

Ik ben momenteel bezig met een dataset, alleen er is een foutje ingeslopen bij het verzamelen van de data. Bij 2 van de 4 condities heten variabelen net iets anders terwijl ze hetzelfde zijn als de variabelen in de andere condities.

Bijvoorbeeld:

Conditie 1: cinhsta

In de 2de conditie heet dezelfde var: cinh1sta

Deze variabelen moeten dus 1 worden, want ze zijn hetzelfde..

Weet iemand hoe ik deze variabelen kan samenvoegen? Want ik kan het nergens vinden :S

Hoop dat iemand kan helpen, thanks!

Voor de extra uitleg:

Ik heb dus eigenlijk 2 variabelen (ik noem ze even a en b). Deze variabelen zijn dezelfde vraag, alleen in verschillende condities (foutje die erin geslopen is) dus ik wil ze samenvoegen, omdat ik nu dus lege plekken in mijn data heb.

woensdag 14 juli 2010 @ 10:38

En wat bedoel je precies met condities?

woensdag 14 juli 2010 @ 10:39

Klink overigens als iets wat je met RECODE zou moeten kunnen doen.

InsaneM666

woensdag 14 juli 2010 @ 10:41

quote:
Op woensdag 14 juli 2010 10:38 schreef Z het volgende:
En wat bedoel je precies met condities?

Ehm nou de enquete is soort van een experimenteel design, dus er zitten 4 vragenlijsten in (condities) die random toegewezen worden aan een persoon. Door wat gehannes moesten er op het laatste moment nogal wat namen van variabelen gewijzigd worden in elke vragenlijst (had iets te maken met exporteren) en toen is dit foutje erin geslopen. De vragen moesten dus identiek zijn, maar dat zijn ze niet, vandaar dat ik ze wil samenvoegen om het recht te trekken.

InsaneM666

woensdag 14 juli 2010 @ 10:43

quote:
Op woensdag 14 juli 2010 10:39 schreef Z het volgende:
Klink overigens als iets wat je met RECODE zou moeten kunnen doen.

Ehm..hoe kan je dat met recode doen dan? Want ik heb het geprobeerd maar het zijn dus 2 variabelen, die 1 moeten worden..en dat wilde SPSS niet doen?

alors

woensdag 14 juli 2010 @ 10:43

Recode into same variabeles?

InsaneM666

woensdag 14 juli 2010 @ 10:45

quote:
Op woensdag 14 juli 2010 10:43 schreef alors het volgende:
Recode into same variabeles?

dan krijg ik alsnog 2 losse variabelen?

crossover

woensdag 14 juli 2010 @ 10:49

quote:
Op woensdag 14 juli 2010 10:45 schreef InsaneM666 het volgende:

[..]

dan krijg ik alsnog 2 losse variabelen?

Compute new variable

InsaneM666

woensdag 14 juli 2010 @ 10:51

quote:
Op woensdag 14 juli 2010 10:49 schreef crossover het volgende:

[..]

Compute new variable

maar dat kan ik niet doen met optellen oid..weet je toevallig iets van syntax? of hoe het wel werkt?

crossover

woensdag 14 juli 2010 @ 10:54

quote:
Op woensdag 14 juli 2010 10:51 schreef InsaneM666 het volgende:

[..]

maar dat kan ik niet doen met optellen oid..weet je toevallig iets van syntax? of hoe het wel werkt?

Transform - Compute Variable - Target Variable: naam van nieuwe variabele invoeren ; Numeric expression: namen invoeren van de variabelen die moeten worden samengevoegd, met steeds een plusteken ertussenin (of wat in de betreffende berekening van toepassing is) - OK

Voorbeeld van een syntax:

1
2
3

COMPUTE mean_welb2 = MEAN(Rwb_levensl46 + wb_zenuw47+ wb_put48 + Rwb_kalm49 +
Rwb_energiek50 + wb_somber51 + wb_uitgeblust52 + Rwb_gelukkig53 + wb_moe54) .
EXECUTE

InsaneM666

woensdag 14 juli 2010 @ 10:57

quote:
Op woensdag 14 juli 2010 10:54 schreef crossover het volgende:

[..]

Transform - Compute Variable - Target Variable: naam van nieuwe variabele invoeren ; Numeric expression: namen invoeren van de variabelen die moeten worden samengevoegd, met steeds een plusteken ertussenin (of wat in de betreffende berekening van toepassing is) - OK

Voorbeeld van een syntax:
[ code verwijderd ]

Als ik dat doe zit er helemaal geen data in de nieuwe variabele..de ene variabele moet de lege plekken opvullen van de andere, dat is een beetje het principe

crossover

woensdag 14 juli 2010 @ 11:03

Dan begrijp ik het niet helemaal.
Je hebt twee variabelen met een verschillende naam waarvan de data hetzelfde is? Of verschilt de data?
En je wilt ze samenvoegen. Waarom kan je ze niet kopieren?

crossover

woensdag 14 juli 2010 @ 11:04

Misschien kan je met een filter werken, door alle waardes die niet leeg zijn af te strepen, en dan die te kopieren naar een nieuwe variabele, en hetzelfde doen voor de overige waardes (kopieren vanuit de andere variabele).

woensdag 14 juli 2010 @ 11:05

En zoiets?

RECODE VarA VarB (else=copy) into nVar.
EXECUTE .

InsaneM666

woensdag 14 juli 2010 @ 11:07

quote:
Op woensdag 14 juli 2010 11:03 schreef crossover het volgende:
Dan begrijp ik het niet helemaal.
Je hebt twee variabelen met een verschillende naam waarvan de data hetzelfde is? Of verschilt de data?
En je wilt ze samenvoegen. Waarom kan je ze niet kopieren?

nou het is eigenlijk zo:

persoon 1 heeft vragenlijst 1, daar heet vraag 10 bijv vraag10. Hier heeft hij 1 ingevuld.
persoon 2 heeft vragenlijst 2, daar heet vraag 10 bijv. vraagtien, hier vult hij 0 in.

Dus vraag 10 heeft 2 variabelen, maar met openplekken omdat de 1 het ingevuld heeft bij vraag10 en de ander bij vraagtien. Dus die moeten samengevoegd worden tot 1. En dat kan natuurlijk ook door ze over te typen oid, maar dat is een beetje teveel werk denk ik zo..

Oftewel, de ene var heeft missing values, maar deze zitten in een andere var..

Ik heb zo het idee dat dit het niet duidelijker maakt..

Bedankt voor het meedenken trouwens

InsaneM666

woensdag 14 juli 2010 @ 11:09

quote:
Op woensdag 14 juli 2010 11:05 schreef Z het volgende:
En zoiets?

RECODE VarA VarB (else=copy) into nVar.
EXECUTE .

The number of variables to be recoded does not match the number of variables
>following the keyword INTO.

helaas..

het lijkt wel of je niet mag recoden van 2 naar 1 var ofzo? beetje lomp eigenlijk

woensdag 14 juli 2010 @ 11:09

Hmmm. Ik ga het zelf even proberen.

crossover

woensdag 14 juli 2010 @ 11:11

quote:
Op woensdag 14 juli 2010 11:07 schreef InsaneM666 het volgende:

[..]

nou het is eigenlijk zo:

persoon 1 heeft vragenlijst 1, daar heet vraag 10 bijv vraag10. Hier heeft hij 1 ingevuld.
persoon 2 heeft vragenlijst 2, daar heet vraag 10 bijv. vraagtien, hier vult hij 0 in.

Dus vraag 10 heeft 2 variabelen, maar met openplekken omdat de 1 het ingevuld heeft bij vraag10 en de ander bij vraagtien. Dus die moeten samengevoegd worden tot 1. En dat kan natuurlijk ook door ze over te typen oid, maar dat is een beetje teveel werk denk ik zo..

Oftewel, de ene var heeft missing values, maar deze zitten in een andere var..

Ik heb zo het idee dat dit het niet duidelijker maakt..

Bedankt voor het meedenken trouwens

Dit maakt het voor mij wel duidelijker

Je kan dit het beste doen met de RECODE optie, denk ik. Zijn het nominale variabelen? Dan kan je je doelvariabele constant houden en in de bronvariabele de waardes die je over wil nemen laten kopieren naar de doelvariabele.

InsaneM666

woensdag 14 juli 2010 @ 11:14

quote:
Op woensdag 14 juli 2010 11:11 schreef crossover het volgende:

[..]

Dit maakt het voor mij wel duidelijker
Je kan dit het beste doen met de RECODE optie, denk ik. Zijn het nominale variabelen? Dan kan je je doelvariabele constant houden en in de bronvariabele de waardes die je over wil nemen laten kopieren naar de doelvariabele.

ehm nee ze zijn dichotoom.

en hoe doe je dat dan met kopieren enzo? dit soort handige dingen leren ze je jou niet hč

crossover

woensdag 14 juli 2010 @ 11:14

Bij mij werkt dit dus.

quote:
Op woensdag 14 juli 2010 11:14 schreef InsaneM666 het volgende:

[..]

ehm nee ze zijn dichotoom.

en hoe doe je dat dan met kopieren enzo? dit soort handige dingen leren ze je jou niet hč

Een variabele kan nominaal EN dichotoom zijn.

InsaneM666

woensdag 14 juli 2010 @ 11:20

quote:
Op woensdag 14 juli 2010 11:14 schreef crossover het volgende:
[ afbeelding ]

Bij mij werkt dit dus.
[..]

Een variabele kan nominaal EN dichotoom zijn.

ik krijg dan een error..

"the variable name duplicates another variable being created"

ik heb versie 16 trouwens, weet niet welke versie jij hebt?

crossover

woensdag 14 juli 2010 @ 11:20

quote:
Op woensdag 14 juli 2010 11:20 schreef InsaneM666 het volgende:

[..]

ik krijg dan een error..

"the variable name duplicates another variable being created"

ik heb versie 16 trouwens, weet niet welke versie jij hebt?

17.
Bij mij is het geen error maar alleen een melding..

woensdag 14 juli 2010 @ 11:21

Het kan ook met 'update'. Dan moet je de data alleen even opslaan in losse databestanden.

Dus je maakt bijvoorbeeld twee databestanden voor jouw Vraag10. In beid ebestanden moet het unieke ID zitten en de te update variabelen, de variabelen moeten dan ook hetzelfde heten.

UPDATE FILE='/data/maillist.sav'
/FILE='/data/newlist.sav'
/BY=ID.

Het is wel een beetje omslachtig.

InsaneM666

woensdag 14 juli 2010 @ 11:24

quote:
Op woensdag 14 juli 2010 11:20 schreef crossover het volgende:

[..]

17.
Bij mij is het geen error maar alleen een melding..

ga ik 17 is even proberen

InsaneM666

woensdag 14 juli 2010 @ 11:24

quote:
Op woensdag 14 juli 2010 11:21 schreef Z het volgende:
Het kan ook met 'update'. Dan moet je de data alleen even opslaan in losse databestanden.

Dus je maakt bijvoorbeeld twee databestanden voor jouw Vraag10. In beid ebestanden moet het unieke ID zitten en de te update variabelen, de variabelen moeten dan ook hetzelfde heten.

UPDATE FILE='/data/maillist.sav'
/FILE='/data/newlist.sav'
/BY=ID.

Het is wel een beetje omslachtig.

thanks

als niks werkt dan is er iig nog iets toch

crossover

woensdag 14 juli 2010 @ 11:25

Als je wil, kan je mij het databestand mailen inclusief syntax, dan run ik 'm even en stuur ik 'm terug.

quote:
Op woensdag 14 juli 2010 11:24 schreef InsaneM666 het volgende:

[..]

ga ik 17 is even proberen

Oh die heb je zelf ook. Waarom gebruik je die dan niet in eerste instantie

woensdag 14 juli 2010 @ 11:26

Bij mij doet de oplossing van crossover het ook. Syntax:

RECODE varb vara (1=Copy) (2=Copy) INTO nvar nvar.
EXECUTE.

InsaneM666

woensdag 14 juli 2010 @ 11:27

quote:
Op woensdag 14 juli 2010 11:25 schreef crossover het volgende:
Als je wil, kan je mij het databestand mailen inclusief syntax, dan run ik 'm even en stuur ik 'm terug.
[..]

Oh die heb je zelf ook. Waarom gebruik je die dan niet in eerste instantie

ik had m nog niet, maar nu wel

InsaneM666

woensdag 14 juli 2010 @ 11:40

Ok met spss17 krijg ik dus nog steeds die error en wil hij niet werken. Maar met de syntax van Z werkt het wel

oftewel mission accomplished

Heel erg bedankt voor de hulp!

lisbabs

vrijdag 16 juli 2010 @ 12:31

Hoi.
Ik heb een vraag over het gebruiken van de if-functie.
Bij een bepaalde vraag in mijn enquete moeten respondenten aangeven hoe ze iets vinden door middel van het aankruisen van een rondje. Links staat een positief woord, rechts het negatieve.
plezierig O O O O O vervelend
Als ze een van de twee linkse rondjes invullen, zijn ze dus positief. Het middelste rondje is neutraal en de twee rechtse rondjes zijn negatief.

Ik heb 7 van dit soort vragen die hetzelfde meten (namelijk leesplezier). De antwoorden op deze zeven vragen heb ik samengevoegd in één variabele (namelijk door ze allemaal bij elkaar op te tellen en dan te delen door 7).
Nu wil ik eigenlijk die neutrale mensen er uit halen (want héél veel mensen hebben gewoon het derde rondje aangekruist, maar dan weet ik dus nog niets). Ik heb eerst met de if-functie alle mensen die op één van de 7 vragen neutraal hadden geantwoord eruit gehaald, maar dan bleven er 14 respondenten van de 200 over.
Daarom wil ik nu alleen de respondenten eruit halen die op minimaal 3 van de 7 vragen neutraal (dus rondje 3) hebben geantwoord.
Ik weet dat het moet kunnen, want ik heb het ooit gehad in mijn SPSS les, maar ik kan het nergens meer vinden! Ik kan me iets herinneren van .2mean of mean.2 en dan if ... maar weet niet meer hoe het precies zit.

Heeft iemand enig idee hoe ik de voorwaarde kan geven dat ik alleen de respondenten eruit haal die op minimaal 3 vragen neutraal (dus optie 3) hebben geantwoord?

Ik hoop dat het zo een beetje duidelijk omschreven is haha, alvast bedankt

vrijdag 16 juli 2010 @ 12:36

Het wordt dan een soort stappenplan.
Eerst:
IF V1 = 3 nVar1 = 1.
IF V2 = 3 nVar2 = 1.
IF V3 = 3 nVar3 = 1.
IF V4 = 3 nVar4 = 1.
IF V5 = 3 nVar5 = 1.
IF V6 = 3 nVar6 = 1.
IF V7 = 3 nVar7 = 1.

Dan tel je de nVars bij elkaar op en vervolgens kan je filteren.

lisbabs

vrijdag 16 juli 2010 @ 14:14

Top! Dankjewel, is me nu gelukt!
Eerst lukte het optellen niet, omdat alles wat niet 1 was als missing werd gerekend, dus nu heb ik het zo gedaan:
if b04a <> 3 nVar1 = 1 .
if b04b <> 3 nVar2 = 1 .
enz.
en daarna heb ik gedaan
if b04a = 3 nVar1 =0 .
if b04b = 3 nVar2 =0 .
enz.

Nu lukte het optellen wel, want nu stond er bij de vragen die waren ingevuld met een 3 gewoon een 0 ipv een . dat ie missing was

Super bedankt! Hopelijk zijn nu mn resultaten wel significant haha.

vrijdag 16 juli 2010 @ 14:40

En de volgende keer gewoon een 4-puntschaal gebruiken.

Wrigkey

woensdag 21 juli 2010 @ 03:17

Ik heb ook een SPSS vraag, geen idee of ik mijn gegevens op de juiste wijze analyseer.

Heb een enquęte gehouden met vragen op een 5-punts likert scale.
Een bepaald aantal vragen meten een positieve ervaring en een bepaald aantal vragen meet een negatieve ervaring. Deze ervaringen wil ik samen vergelijken. Hiervoor kan ik het beste Cronbachs Alpha gebruiken maar moet ik de negatieve ervaringen dan een - poling toekennen in SPSS?

Wanneer Cronbachs Alpha voldoende is (hoger dan 0.6) kan er met compute een nieuw variabele gemaakt worden denk ik. (MEAN(Variabele1,Variabele2,Variabele3))

En wat kan ik dan doen met die nieuwe variabele? Anova?

Alvast bedankt.

Frith

woensdag 21 juli 2010 @ 20:27

quote:
Op woensdag 21 juli 2010 03:17 schreef Wrigkey het volgende:
Ik heb ook een SPSS vraag, geen idee of ik mijn gegevens op de juiste wijze analyseer.

Heb een enquęte gehouden met vragen op een 5-punts likert scale.
Een bepaald aantal vragen meten een positieve ervaring en een bepaald aantal vragen meet een negatieve ervaring. Deze ervaringen wil ik samen vergelijken. Hiervoor kan ik het beste Cronbachs Alpha gebruiken maar moet ik de negatieve ervaringen dan een - poling toekennen in SPSS?

Wanneer Cronbachs Alpha voldoende is (hoger dan 0.6) kan er met compute een nieuw variabele gemaakt worden denk ik. (MEAN(Variabele1,Variabele2,Variabele3))

En wat kan ik dan doen met die nieuwe variabele? Anova?

Alvast bedankt.

De nieuwe variabele (de schaal) moet altijd worden samengesteld uit gelijk gedefinieerde items.
Immers: x1 + x2 + x3 ... +Xn / n als gemiddelde en zo verder. Indien een item negatief gedefinieerd zou blijven (of positief als je een negatieve schaal wilt maken), dan klopt je schaal niet.

Je moet die negatieve items dus eerst hercoderen (ompolen dus), daarna pas een somschaal van maken (indien dat hier werkelijk toepasselijk is voor je analyse).

Je wilt overigens niet de alpha hebben, maar de factorlading. Een factoranalyse van items waarvan jij weet dat ze allen hetzelfde concept meten zal vaak meteen een lage of negatieve factorlading tonen in de componenten analyse.
Al moet ik wel bij zeggen dat de cronbach alpha dit gebrek aan samenhang van een item met de schaal ook zal tonen, maar dat hoeft niet. (betrouwbaarheid is niet validiteit of omgekeerd)

De alpha is pas echt nuttig nadat je de items hebt hercodeerd, aangezien die over de gehele schaal heen de betrouwbaarheid meet. Hou er dan ook rekening mee dat de cronbach alpha zich makkelijk laat manipuleren tot hogere waarden bij meer items, zelfs als die items niet in de schaal thuishoren (gekenmerkt door lage factorladingen in factoranalyse of door een kritische onderzoeker die de stelling als niet valide herkent).

Je volgende vraag (analyse van een model) is geheel afhankelijk van het model, je theorie en data die je hebt gebruikt. En dit model heb je niet gegeven.

L.J.V.

donderdag 22 juli 2010 @ 13:50

Hallo,

ik probeer met mijn scriptie werkprestatie te voorspellen dmv persoonlijkheid.
Daarbij heb ik onder andere als criterium "target gehaald ja/nee"
Stel, ik heb 5 persoonlijkheidstrekken, en ik wil kijken of en hoeveel deze trekken dat criterium voorspellen, hoe moet ik dat dan doen?

Ik zit dus met het ja/nee aspect... want als ik een mra doe, dan komt er troep uit, aangezien ik alleen een 0(nee) en 1 (ja) heb..

oompaloompa

donderdag 22 juli 2010 @ 14:05

quote:
Op donderdag 22 juli 2010 13:50 schreef L.J.V. het volgende:
Hallo,

ik probeer met mijn scriptie werkprestatie te voorspellen dmv persoonlijkheid.
Daarbij heb ik onder andere als criterium "target gehaald ja/nee"
Stel, ik heb 5 persoonlijkheidstrekken, en ik wil kijken of en hoeveel deze trekken dat criterium voorspellen, hoe moet ik dat dan doen?

Ik zit dus met het ja/nee aspect... want als ik een mra doe, dan komt er troep uit, aangezien ik alleen een 0(nee) en 1 (ja) heb..

binaire logistische regressie

L.J.V.

donderdag 22 juli 2010 @ 14:39

quote:
Op donderdag 22 juli 2010 14:05 schreef oompaloompa het volgende:

[..]

binaire logistische regressie

Dankje!

Maar als ik bij regression kijk kan ik kiezen uit

Linear

Curve estimation

partial least squares

ordinal

Heb ik een verkeerde versie spss ofzo (17.0)? Omdat logistic er niet bij staat.. of zie ik iets over het hoofd.

oompaloompa

donderdag 22 juli 2010 @ 14:43

quote:
Op donderdag 22 juli 2010 14:39 schreef L.J.V. het volgende:

[..]

Dankje!

Maar als ik bij regression kijk kan ik kiezen uit

Linear
Curve estimation
partial least squares
ordinal

Heb ik een verkeerde versie spss ofzo (17.0)? Omdat logistic er niet bij staat.. of zie ik iets over het hoofd.

ik heb hier geen spss maar er zou binary logistic tussen moeten staan?

L.J.V.

donderdag 22 juli 2010 @ 14:47

quote:
Op donderdag 22 juli 2010 14:43 schreef oompaloompa het volgende:

[..]

ik heb hier geen spss maar er zou binary logistic tussen moeten staan?

Het staat er niet tussen

Hopelijk ligt dat dan aan mijn versie spss en hebben ze het op de universiteit wel.
dankjewel voor je hulp!

oompaloompa

donderdag 22 juli 2010 @ 15:39

quote:
Op donderdag 22 juli 2010 14:47 schreef L.J.V. het volgende:

[..]

Het staat er niet tussen
Hopelijk ligt dat dan aan mijn versie spss en hebben ze het op de universiteit wel.
dankjewel voor je hulp!

dat is echt heel erg vreemd. Vooral omdat ik zeker weet dat 14 en of 17 of 18 (weet zo uit mn hoofd niet welke op de uni staat) het wel hebben. Misschien even zoeken in de help-functie?

Tis echt een van de meest standaard analyses, ik weet bijna zeker dat het ergens verstopt moet staan.

L.J.V.

donderdag 22 juli 2010 @ 15:54

quote:
Op donderdag 22 juli 2010 15:39 schreef oompaloompa het volgende:

[..]

dat is echt heel erg vreemd. Vooral omdat ik zeker weet dat 14 en of 17 of 18 (weet zo uit mn hoofd niet welke op de uni staat) het wel hebben. Misschien even zoeken in de help-functie?

Tis echt een van de meest standaard analyses, ik weet bijna zeker dat het ergens verstopt moet staan.

Nog vreemder is dat ik logistic regression wel kan vinden in het Help gedeelte, en daar word ook gezegd dat het onder analyze>regression staat. Maar dat is dus niet zo.

pdegroot

vrijdag 23 juli 2010 @ 01:56

Dames en Heren, ik heb de volgende vraag met betrekking tot SPSS:

Hoe voer je een onderzoek uit naar stationariteit met SPSS?

Hartstikke bedankt!

Frith

vrijdag 23 juli 2010 @ 02:35

quote:
Op donderdag 22 juli 2010 15:54 schreef L.J.V. het volgende:

[..]

Nog vreemder is dat ik logistic regression wel kan vinden in het Help gedeelte, en daar word ook gezegd dat het onder analyze>regression staat. Maar dat is dus niet zo.

dan moet je ook niet zomaar wat downloaden van het internet. Ik ken dit geintje van anderen die hetzelfde probleem hadden.

Het is echter onzinnig, aangezien de volumelicensie via de uni (of hbo) iets van 15 euro is en vervolgens jaren geldig, dus je hebt er niets aan om het te downloaden.

Overigens is je model letterlijk een voorbeeldvraag van het hoofdstuk over logistische regressie in 'learning statistics with SPSS' van Andy Field. De antwoorden daarvan (en uitleg) zijn zelfs te downloaden op de bijhorende site.

Killaht

vrijdag 23 juli 2010 @ 15:53

tvp

oompaloompa

vrijdag 23 juli 2010 @ 15:56

quote:
Op vrijdag 23 juli 2010 02:35 schreef Frith het volgende:

[..]

dan moet je ook niet zomaar wat downloaden van het internet. Ik ken dit geintje van anderen die hetzelfde probleem hadden.

Het is echter onzinnig, aangezien de volumelicensie via de uni (of hbo) iets van 15 euro is en vervolgens jaren geldig, dus je hebt er niets aan om het te downloaden.

Overigens is je model letterlijk een voorbeeldvraag van het hoofdstuk over logistische regressie in 'learning statistics with SPSS' van Andy Field. De antwoorden daarvan (en uitleg) zijn zelfs te downloaden op de bijhorende site.

16.50 incl. verzending
nmlk besteld toen ik door die post doorkreeg dat het verlopen was.

aarstulp

vrijdag 23 juli 2010 @ 16:41

Het probleem is als volgt: Heb 6 soorten campagnes als onafhankelijke variabelen en consumptie als afhankelijke. De 6 campagnes worden met ieder 5 vragen gemeten (5-punts Likert). Heb door wat rotte appels te verwijderen mooie Cronbach's Alphas verkregen. Nu ga ik iedere campagne aan consumptie linken met een regressie analyse, dat moet lukken hoop ik. Maar allereerst wil ik gewoon het verschil tussen de campagnes meten. Mijn begeleider had het over een t-test of ANOVA. Maar bij een t-test krijg je gewoon de gemiddelden, standaardafwijkingen, vrijheidsgraden en de p-waarde. Ik bedoelde eigenlijk meer van welke vaker voorkomt. Uiteraard weten jullie niet wat mijn begeleider bedoelt, maar vanuit een kennersoogpunt, ben ik nou goed bezig of heb ik de verkeerde analyse te pakken?

oompaloompa

vrijdag 23 juli 2010 @ 16:51

quote:
Op vrijdag 23 juli 2010 16:41 schreef aarstulp het volgende:
Het probleem is als volgt: Heb 6 soorten campagnes als onafhankelijke variabelen en consumptie als afhankelijke. De 6 campagnes worden met ieder 5 vragen gemeten (5-punts Likert). Heb door wat rotte appels te verwijderen mooie Cronbach's Alphas verkregen. Nu ga ik iedere campagne aan consumptie linken met een regressie analyse, dat moet lukken hoop ik. Maar allereerst wil ik gewoon het verschil tussen de campagnes meten. Mijn begeleider had het over een t-test of ANOVA. Maar bij een t-test krijg je gewoon de gemiddelden, standaardafwijkingen, vrijheidsgraden en de p-waarde. Ik bedoelde eigenlijk meer van welke vaker voorkomt. Uiteraard weten jullie niet wat mijn begeleider bedoelt, maar vanuit een kennersoogpunt, ben ik nou goed bezig of heb ik de verkeerde analyse te pakken?

hoe bedoel je vaker voorkomt als elke ppn elke campagne heeft beoordeeld/ingevuld?

wat is/ zijn je IV's en zijn ze categorisch of scale?

wat is / zijn je dv's en cat/scale?

aarstulp

vrijdag 23 juli 2010 @ 17:52

Stel: zes soorten campagnes waar wordt ingespeeld op persoonlijkheden. Sportief, upperclass, ruig, mannelijk, vrouwelijk, hip. Dit zijn de IV's en zijn opgebouwd door bij ieder construct 5 items samen te voegen middels compute variable. De items werden gemeten op 5-punts Likert en het construct is een gemiddelde van de items (Ordinaal). De DV is de consumptie in aantallen, dus scale.

Heb onvolledige surveys verwijderd, dus alles is compleet wat dat betreft.

Na even gedacht te hebben, gewoon voor ieder construct een t-test doen en mean&std dev in een tabelletje zetten? Ik denk dat mijn begeleider gewoon een soort algemeen statistiekje wil zien van de data ofzo.

Ik snap dat het niet duidelijk is wat ik bedoel, dat snap ik zelf ook niet. Hoop toch dat je hier nog wat mee kan.

oompaloompa

vrijdag 23 juli 2010 @ 17:54

quote:
Op vrijdag 23 juli 2010 17:52 schreef aarstulp het volgende:
Stel: zes soorten campagnes waar wordt ingespeeld op persoonlijkheden. Sportief, upperclass, ruig, mannelijk, vrouwelijk, hip. Dit zijn de IV's en zijn opgebouwd door bij ieder construct 5 items samen te voegen middels compute variable. De items werden gemeten op 5-punts Likert en het construct is een gemiddelde van de items (Ordinaal). De DV is de consumptie in aantallen, dus scale.

Heb onvolledige surveys verwijderd, dus alles is compleet wat dat betreft.

Na even gedacht te hebben, gewoon voor ieder construct een t-test doen en mean&std dev in een tabelletje zetten? Ik denk dat mijn begeleider gewoon een soort algemeen statistiekje wil zien van de data ofzo.

Ik snap dat het niet duidelijk is wat ik bedoel, dat snap ik zelf ook niet. Hoop toch dat je hier nog wat mee kan.

Ik raak heel erg verward dat je campagnes zowel de independent variable / manipulatie zijn als de afhankelijke?

ik loop je niet op te fokken & wil graag helpen, maar ik begrijp helemaal niet wat je precies hebt gedaan en wilt meten

aarstulp

vrijdag 23 juli 2010 @ 18:07

Had 6 hypotheses die betrekking hadden op de relatie tussen de campagne(IV) en de consumptie van die persoon(DV). Toen heeft mijn begeleider gezegd: maak daar H2a - H2f van en in mn aantekeningen staat: "nieuwe H1: verschil in campagne (t-test / ANOVA?)". Omdat ik pas maandag weer contact met hem kan hebben dacht ik misschien begrijpt een SPSS-er wat er bedoeld wordt zodat ik dit weekend door kan.

Kan voorlopig nog met die regressies aan de slag dus lukt het niet, dan lukt het niet. Bedankt iig!

edit: bij de nieuwe H1 is er dus geen sprake van IV/DV maar het is meer iets van: is dit aanwezig of niet ofzo. moeilijk uit te leggen als je zelf niet weet wat je pccs bedoelt

GlowMouse

vrijdag 23 juli 2010 @ 19:20

quote:
Op donderdag 22 juli 2010 14:43 schreef oompaloompa het volgende:

[..]

ik heb hier geen spss maar er zou binary logistic tussen moeten staan?

Bij twee keuzes kun je net zo goed voor ordinal kiezen.

oompaloompa

vrijdag 23 juli 2010 @ 20:14

quote:
Op vrijdag 23 juli 2010 18:07 schreef aarstulp het volgende:
Had 6 hypotheses die betrekking hadden op de relatie tussen de campagne(IV) en de consumptie van die persoon(DV). Toen heeft mijn begeleider gezegd: maak daar H2a - H2f van en in mn aantekeningen staat: "nieuwe H1: verschil in campagne (t-test / ANOVA?)". Omdat ik pas maandag weer contact met hem kan hebben dacht ik misschien begrijpt een SPSS-er wat er bedoeld wordt zodat ik dit weekend door kan.

Kan voorlopig nog met die regressies aan de slag dus lukt het niet, dan lukt het niet. Bedankt iig!

edit: bij de nieuwe H1 is er dus geen sprake van IV/DV maar het is meer iets van: is dit aanwezig of niet ofzo. moeilijk uit te leggen als je zelf niet weet wat je pccs bedoelt

sorry ik begrijp echt niet wat je wilt precies. Is het een soort manipulatiecheck? Je manipuleert(?) campagne en kijkt naar het effect op consumptie. maar als je campagne manipuleert valt er weinig aan te meten toch? Of meet je slechts campagne en heb je dus een andere IV die je nog niet genoemd hebt?

Frith

vrijdag 23 juli 2010 @ 21:29

quote:
Op vrijdag 23 juli 2010 16:41 schreef aarstulp het volgende:
Het probleem is als volgt: Heb 6 soorten campagnes als onafhankelijke variabelen en consumptie als afhankelijke. De 6 campagnes worden met ieder 5 vragen gemeten (5-punts Likert). Heb door wat rotte appels te verwijderen mooie Cronbach's Alphas verkregen. Nu ga ik iedere campagne aan consumptie linken met een regressie analyse, dat moet lukken hoop ik. Maar allereerst wil ik gewoon het verschil tussen de campagnes meten. Mijn begeleider had het over een t-test of ANOVA. Maar bij een t-test krijg je gewoon de gemiddelden, standaardafwijkingen, vrijheidsgraden en de p-waarde. Ik bedoelde eigenlijk meer van welke vaker voorkomt. Uiteraard weten jullie niet wat mijn begeleider bedoelt, maar vanuit een kennersoogpunt, ben ik nou goed bezig of heb ik de verkeerde analyse te pakken?

Dit is wat ik lees:

er zijn 6 campagnes (als onafhankelijke variabelen) tegenover consumptie als afhankelijke variabele. Hiermee wil je het effect per campagne bepalen op consumptie. (dus een 1-op-1 connectie wat het model betreft).

Verder heb je deze campagnes samengesteld uit 5 vragen met likert schalen en de missings (latere post) verwijderd. Verder wil je de campagnes ook met elkaar vergelijken om te zien of de gemiddelden (en wat betekent dit dan precies?) van elkaar verschillen.

1. het gebruik van lineaire regressie is hier enigszins overbodig aangezien het hier om een nuldeorde correlatie gaat. Wat dus betekent dat regressie hier hetzelfde resultaat geeft als directe correlatie, maar dat je wel rekening moet houden met de extra voorwaarden voor het gebruik van regressie.

Dit doe je vervolgens zes maal, voor iedere campagne apart. Dit heb je al, als het goed is.

2. je begeleider wijst je qua methode terecht naar t-toets of ANOVA, ware het niet dat een serie t-testen over dezelfde data leidt tot een toenemende kans op een type I fout. Deze 'familywise error' is te voorkomen door met een ANOVA de gemiddelden te vergelijken, aangezien je hier meer dan twee groepen hebt.
(ANOVA is vanaf drie of meer)

en volgens mij is dat het, tenzij je nog werkelijk frequentietabellen wilt gaan uitdraaien (why?).

edit:

overigens geldt ook hier weer dat factoranalyse + cronbach's alpha gebruikt moet worden. Je stelt immers een supervariabele vast aan de hand van meerdere items / variabelen.

en je meetniveau is interval of ratio, want anders kun je al helemaal geen regressie uitvoeren. (het is ratio overigens, voor zover ik hier kan inschatten).

[ Bericht 7% gewijzigd door Frith op 23-07-2010 21:36:31 ]

oompaloompa

vrijdag 23 juli 2010 @ 21:36

quote:
Op vrijdag 23 juli 2010 21:29 schreef Frith het volgende:

[..]

Dit is wat ik lees:

er zijn 6 campagnes (als onafhankelijke variabelen) tegenover consumptie als afhankelijke variabele. Hiermee wil je het effect per campagne bepalen op consumptie. (dus een 1-op-1 connectie wat het model betreft).

Verder heb je deze campagnes samengesteld uit 5 vragen met likert schalen en de missings (latere post) verwijderd. Verder wil je de campagnes ook met elkaar vergelijken om te zien of de gemiddelden (en wat betekent dit dan precies?) van elkaar verschillen.

1. het gebruik van lineaire regressie is hier enigszins overbodig aangezien het hier om een nuldeorde correlatie gaat. Wat dus betekent dat regressie hier hetzelfde resultaat geeft als directe correlatie, maar dat je wel rekening moet houden met de extra voorwaarden voor het gebruik van regressie.

Dit doe je vervolgens zes maal, voor iedere campagne apart. Dit heb je al, als het goed is.

2. je begeleider wijst je qua methode terecht naar t-toets of ANOVA, ware het niet dat een serie t-testen over dezelfde data leidt tot een toenemende kans op een type I fout. Deze 'familywise error' is te voorkomen door met een ANOVA de gemiddelden te vergelijken, aangezien je hier meer dan twee groepen hebt.
(ANOVA is vanaf drie of meer)

en volgens mij is dat het, tenzij je nog werkelijk frequentietabellen wilt gaan uitdraaien (why?).

als je 2 continue variabelen hebt over 6 groepen heb je meer aan regressie dan correlatie omdat je meer info daaruit krijgt om je data te interpreteren toch?

(en anova kan ook gewoon bij 2 ^^)

edit:

quote:
Op vrijdag 23 juli 2010 21:29 schreef Frith het volgende:

en je meetniveau is interval of ratio, want anders kun je al helemaal geen regressie uitvoeren. (het is ratio overigens, voor zover ik hier kan inschatten).

een logistische ^_^

[ Bericht 7% gewijzigd door oompaloompa op 23-07-2010 21:42:23 ]

Frith

vrijdag 23 juli 2010 @ 21:56

quote:
Op vrijdag 23 juli 2010 21:36 schreef oompaloompa het volgende:

[..]

als je 2 continue variabelen hebt over 6 groepen heb je meer aan regressie dan correlatie omdat je meer info daaruit krijgt om je data te interpreteren toch?

(en anova kan ook gewoon bij 2 ^^)

edit:
[..]

een logistische ^_^

nu ben je zelf helemaal van de leg af.

Logistische regressie gaat over het optreden van een categorische waarde op de afhankelijke variabele, niet de onafhankelijke(n).

en de uitleg van Andy Field (p.350) geeft aan dat het ANOVA model in SPSS gerepresenteerd kan worden als een multiple regressie vergelijking, dus dat er sowieso drie variabelen betrokken moeten zijn. De t-test kan als een lineaire regressie worden uitgedrukt en voldoet dus wel met twee variabelen.

en ik heb de uitleg opgevat als zes campagnes, waarvan het effect van deze afzonderlijk gemeten moet worden. Wat jij in gedachten hebt is het meten van een concept over meerdere groepen, wat je via split file kunt doen.
Zoiets doe je als bijvoorbeeld 'barmhartigheid' over verschillende religies zou willen toetsen, waarbij je de data simpelweg uitsplitst naar de categorieën van 'religie'.

oompaloompa

vrijdag 23 juli 2010 @ 22:08

quote:
Op vrijdag 23 juli 2010 21:56 schreef Frith het volgende:

[..]

nu ben je zelf helemaal van de leg af.

Logistische regressie gaat over het optreden van een categorische waarde op de afhankelijke variabele, niet de onafhankelijke(n).

en de uitleg van Andy Field (p.350) geeft aan dat het ANOVA model in SPSS gerepresenteerd kan worden als een multiple regressie vergelijking, dus dat er sowieso drie variabelen betrokken moeten zijn. De t-test kan als een lineaire regressie worden uitgedrukt en voldoet dus wel met twee variabelen.

en ik heb de uitleg opgevat als zes campagnes, waarvan het effect van deze afzonderlijk gemeten moet worden. Wat jij in gedachten hebt is het meten van een concept over meerdere groepen, wat je via split file kunt doen.
Zoiets doe je als bijvoorbeeld 'barmhartigheid' over verschillende religies zou willen toetsen, waarbij je de data simpelweg uitsplitst naar de categorieën van 'religie'.

ja ik dacht dat je het over de afhankelijke had

Ik heb niks van Andy Field maar weet 99.9% zeker dat een Anova gewoon met twee kan

multi- is meestal een complexere versie van, maar geen voorwaarde aan. I.a.w. de theorie achter een manova kun je gewoon gebruiken voor een anova. Hoe zou je anders contrasten tussen 2 groepen kunnen doen in een anova?

Ik snap het verschil tussen je laatste twee voorbeelden niet maar snap de ts ook niet

ik dacht consumptie (dv) over 6 verschillende groepen (campagnes)

[ Bericht 7% gewijzigd door oompaloompa op 23-07-2010 22:14:52 ]

L.J.V.

maandag 26 juli 2010 @ 11:59

quote:
Op vrijdag 23 juli 2010 02:35 schreef Frith het volgende:

[..]

dan moet je ook niet zomaar wat downloaden van het internet. Ik ken dit geintje van anderen die hetzelfde probleem hadden.

Het is echter onzinnig, aangezien de volumelicensie via de uni (of hbo) iets van 15 euro is en vervolgens jaren geldig, dus je hebt er niets aan om het te downloaden.

Overigens is je model letterlijk een voorbeeldvraag van het hoofdstuk over logistische regressie in 'learning statistics with SPSS' van Andy Field. De antwoorden daarvan (en uitleg) zijn zelfs te downloaden op de bijhorende site.

Ik doe het op m'n stage-adres, geen idee hoe die spss hier erop is gezet. Maar ik zal het doorgeven.

Maar wat ik net genoemd heb is maar een heel klein stukje van mijn onderzoek hoor, maar thanks voor de tip, heb Field ook. Zal op de site kijken!

pdegroot

woensdag 28 juli 2010 @ 13:33

quote:
Op vrijdag 23 juli 2010 01:56 schreef pdegroot het volgende:
Dames en Heren, ik heb de volgende vraag met betrekking tot SPSS:

Hoe voer je een onderzoek uit naar stationariteit met SPSS?

Hartstikke bedankt!

Is er iemand die mij hiermee kan helpen?

oompaloompa

woensdag 28 juli 2010 @ 14:09

quote:
Op woensdag 28 juli 2010 13:33 schreef pdegroot het volgende:

[..]

Is er iemand die mij hiermee kan helpen?

ik heb geen flauw idee wat het inhoudt =D sorry

FabFabFabFab

woensdag 28 juli 2010 @ 16:53

Hallo allemaal, momenteel ben ik bezig aan mijn scriptie, maar ik loop een beetje vast op de analyses.
Ik heb 3 onafhankelijke variabelen (ratio), 3 modererende variabelen (gemiddelden van een aantal Likert scales) en een controle variabele.
Ik wil nu voor iedere onafhankelijke variabele meten hoe de modererende variabelen de relatie tussen deze onfhankelijke en de afhankelijke variabele beďnvloeden. Dus eigenlijk 3 x 3 = 9 hypothesen.
Ik weet dat ik voor alle modererende effecten ook de interactie moet berekenen, daar heb ik dus ook 9 variabelen voor gemaakt.
Moet ik dan in de regressie-analyse deze variabelen toch allemaal tegelijk invoeren, of moet ik 9 keer een regressie-analyse doen?
M'n begeleider is op vakantie, dus die kan ik het momenteel ook niet vragen helaas.
In ieder geval alvast bedankt!

[ Bericht 8% gewijzigd door FabFabFabFab op 28-07-2010 16:58:11 ]

oompaloompa

woensdag 28 juli 2010 @ 17:08

quote:
Op woensdag 28 juli 2010 16:53 schreef FabFabFabFab het volgende:
Hallo allemaal, momenteel ben ik bezig aan mijn scriptie, maar ik loop een beetje vast op de analyses.
Ik heb 3 onafhankelijke variabelen (ratio), 3 modererende variabelen (gemiddelden van een aantal Likert scales) en een controle variabele.
Ik wil nu voor iedere onafhankelijke variabele meten hoe de modererende variabelen de relatie tussen deze onfhankelijke en de afhankelijke variabele beďnvloeden. Dus eigenlijk 3 x 3 = 9 hypothesen.
Ik weet dat ik voor alle modererende effecten ook de interactie moet berekenen, daar heb ik dus ook 9 variabelen voor gemaakt.
Moet ik dan in de regressie-analyse deze variabelen toch allemaal tegelijk invoeren, of moet ik 9 keer een regressie-analyse doen?
M'n begeleider is op vakantie, dus die kan ik het momenteel ook niet vragen helaas.
In ieder geval alvast bedankt!

heb je 1 of meerdere afhankelijken?

Eerst regressie vergelijking zonder de moderatoren doen, daarna met & sobel-toets lijkt me?

FabFabFabFab

woensdag 28 juli 2010 @ 17:17

Ik heb 1 afhankelijke.
Moet ik alle moderatoren er in één keer in doen of allemaal apart?

oompaloompa

woensdag 28 juli 2010 @ 17:32

ligt een beetje aan je hypothese om eerlijk te zijn :/

zou beginnen met een model met enkel predictoren, daarna model met alle 3 de moderatoren er bij en eentje met de interacties er nog bij (interacties wel centreren). Dan heb je in principe alles getest.

Of andersom beginnen met het grote model en langzaam dingen uitknikkeren naar de sig kijkend, maar das niet zo netjes meestal

(hangt weer af van je onderzoeksvraag)

FabFabFabFab

woensdag 28 juli 2010 @ 17:55

Bedankt voor je snelle antwoord! Nu kan ik in ieder geval weer verder!

oompaloompa

woensdag 28 juli 2010 @ 18:01

quote:
Op woensdag 28 juli 2010 17:55 schreef FabFabFabFab het volgende:
Bedankt voor je snelle antwoord! Nu kan ik in ieder geval weer verder!

succes! ik weet alleen niet 100% zeker dat wat ik zei goed is natuurlijk

Maar volgens mij zou het zo moeten lukken.

GlowMouse

woensdag 28 juli 2010 @ 18:52

quote:
Op woensdag 28 juli 2010 14:09 schreef oompaloompa het volgende:

[..]

ik heb geen flauw idee wat het inhoudt =D sorry

Komt uit tijdreeksen, de verdeling van het verschil van de waarde op tijdstip t en tijdstip t+x mag alleen van x afhangen en niet van t. Testen bij discrete data voor een vaste x is vast niet lastig.

oompaloompa

woensdag 28 juli 2010 @ 19:02

quote:
Op woensdag 28 juli 2010 18:52 schreef GlowMouse het volgende:

[..]

Komt uit tijdreeksen, de verdeling van het verschil van de waarde op tijdstip t en tijdstip t+x mag alleen van x afhangen en niet van t. Testen bij discrete data voor een vaste x is vast niet lastig.

een soort homogeneity of variance over tijd? of een soort uitsluiting van een interactie met t?

GlowMouse

woensdag 28 juli 2010 @ 19:05

quote:
Op woensdag 28 juli 2010 19:02 schreef oompaloompa het volgende:

[..]

een soort homogeneity of variance over tijd? of een soort uitsluiting van een interactie met t?

Gelijk verdeeld is de eis, en die verdeling hoeft geen variantie te hebben. Simpele tests zullen wel lukken, maar alle interactie met t uitsluiten zal lastig zijn, want een eenmalige schommeling zul je nooit detecteren.

FabFabFabFab

donderdag 29 juli 2010 @ 12:20

Ik heb nog één vraagje. Ik heb zoals gezegd de interacties berekend door de variabelen eerst te centreren en daarna de gecentreerde variabelen te vermenigvuldigen voor de interactie-variabelen.
Als ik nu de regressie-analyse wil uitvoeren, moet ik dan ook voor de onafhankelijke variabelen de gecentreerde variabelen nemen of niet?
Alvast bedankt weer!

oompaloompa

donderdag 29 juli 2010 @ 12:21

quote:
Op donderdag 29 juli 2010 12:20 schreef FabFabFabFab het volgende:
Ik heb nog één vraagje. Ik heb zoals gezegd de interacties berekend door de variabelen eerst te centreren en daarna de gecentreerde variabelen te vermenigvuldigen voor de interactie-variabelen.
Als ik nu de regressie-analyse wil uitvoeren, moet ik dan ook voor de onafhankelijke variabelen de gecentreerde variabelen nemen of niet?
Alvast bedankt weer!

maakt niet uit. Als je de gecentreerde gebruikt zal je constant anders zijn

Hiya

zondag 1 augustus 2010 @ 02:48

Bezig met mijn afstuderen voor het HBO en daarvoor moet ik ook een regressie analyse uitvoeren. Tijdens het onderzoeken hoe ik zo iets moet uitvoeren kwam ik het volgende youtube channel tegen wat ik jullie zeker niet wil onthouden. Hier legt hij stap voor stap uit hoe je zo iets doet (in excel) en wat alle gegevens en berekeningen concreet betekenen.

Regression #1: Sample regression function (SRF)

Verwacht de komende dagen nog wel een aantal vragen hier te zullen stellen over mijn onderzoek

glycera

zondag 1 augustus 2010 @ 13:16

Hey,

Ik vraag me al een tijdje af hoeveel items er van een vragenlijst maximum mogen worden laten opengelaten. Iemand vertelde me dat dit afhangt van je vragenlijst, betrouwbaarheid en validiteit. Nu de handleiding van de vragenlijst waar veel items zijn opengelaten is nergens te verkrijgen.

Ik doe trouwens ook maar een pilootonderzoek voor mijn masterproef. Het komt allemaal niet zo nauw hebben ze mij verteld, maar toch... Bestaat er in zoverre dat jullie weten, een maximum percentage van items dat mag worden opengelaten? Bij mijn overige vragenlijsten waren er slechts een beperkt aantal items opengelaten, deze heb ik moeten opvullen met het gemiddelde van de variabele.

Ik zit nogal in tijdsnood, dus ik apprecieer het ten zeerste als iemand van jullie probeert een antwoord te geven!!

Hiya

zondag 1 augustus 2010 @ 14:47

Je kan natuurlijk de respondenten eruit filteren die het niet volledig hebben ingevuld, als je n voldoende groot blijft simpelste oplossing lijkt mij.

oompaloompa

zondag 1 augustus 2010 @ 15:07

ik denk dat het er een beetje van af hangt wat het doel van je pilot-test is. Sowieso moet je outliers & niet ingevuld etc vermelden. Als het aantal zo hoog is dat je bv. zou kunnen concluderen dat je vragen niet duidelijk waren voor de proefpersonen kan simpel er uit halen voor veel skepticisme zorgen.

GlowMouse

zondag 1 augustus 2010 @ 15:18

quote:
Op woensdag 28 juli 2010 19:02 schreef oompaloompa het volgende:

[..]

een soort homogeneity of variance over tijd? of een soort uitsluiting van een interactie met t?

In praktijk wordt dit getest door allerlei testjes te draaien; autocorrelatie, trend, dat soort dingen.

Hiya

zondag 1 augustus 2010 @ 15:30

Iemand een mooie vertaling voor het woord risiduals bij de ANOVA test bij meervoudige regressie analyse? Verslag moet in het Nederlands en om dan met engelse termen te gaan smijten is niet zo netjes...

oompaloompa

zondag 1 augustus 2010 @ 15:39

quote:
Op zondag 1 augustus 2010 15:18 schreef GlowMouse het volgende:

[..]

In praktijk wordt dit getest door allerlei testjes te draaien; autocorrelatie, trend, dat soort dingen.

ah ok

quote:
Op zondag 1 augustus 2010 15:30 schreef Hiya het volgende:
Iemand een mooie vertaling voor het woord risiduals bij de ANOVA test bij meervoudige regressie analyse? Verslag moet in het Nederlands en om dan met engelse termen te gaan smijten is niet zo netjes...

residuen

pdegroot

zondag 1 augustus 2010 @ 17:01

quote:
Op woensdag 28 juli 2010 18:52 schreef GlowMouse het volgende:

[..]

Komt uit tijdreeksen, de verdeling van het verschil van de waarde op tijdstip t en tijdstip t+x mag alleen van x afhangen en niet van t. Testen bij discrete data voor een vaste x is vast niet lastig.

Wellicht kun jij mij dan helpen als het niet lastig is

Ik moet met de volgende data werken:
X= computeraankopen per maand van een bedrijf
Y= omzet per maand van het bedrijf

Eerst moet ik een aantal waardes berekenen die niet zo moeilijk zijn, namelijk:
- gemiddelde
- standaardafwijking
- tijdlijn van beide variabelen in 1 figuur
- spreidingsdiagram
- correlatiematrix
- lineaire regressie van Y op X

Hierna moet ik voor X een onderzoek doen naar stationariteit. Daarnaast moet ik een correlatiematrix maken van alle gebruikte variabelen en controleren of er sprake is van multicollineariteit. Vervolgens moet ik hetzelfde doen voor Y.

Hoe doe ik dit in SPSS?

de_nachtwacht

woensdag 4 augustus 2010 @ 13:11

Hoi,

Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.

Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.

Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?

Hiya

woensdag 4 augustus 2010 @ 16:24

quote:
Op zondag 1 augustus 2010 17:01 schreef pdegroot het volgende:

[..]

Wellicht kun jij mij dan helpen als het niet lastig is

Ik moet met de volgende data werken:
X= computeraankopen per maand van een bedrijf
Y= omzet per maand van het bedrijf

Eerst moet ik een aantal waardes berekenen die niet zo moeilijk zijn, namelijk:
- gemiddelde
- standaardafwijking
- tijdlijn van beide variabelen in 1 figuur
- spreidingsdiagram
- correlatiematrix
- lineaire regressie van Y op X

Hierna moet ik voor X een onderzoek doen naar stationariteit. Daarnaast moet ik een correlatiematrix maken van alle gebruikte variabelen en controleren of er sprake is van multicollineariteit. Vervolgens moet ik hetzelfde doen voor Y.

Hoe doe ik dit in SPSS?

Over multicollineariteit als je in het scherm van regressieanalyse zit kan je onder het kopje Stats nog meer testen aanvinken oa. die collinariteit. Als je met tijdreeksen werkt kan je ook Durbin-Watson aanvinken.

Hiya

woensdag 4 augustus 2010 @ 16:26

En ik heb nog een vraagje over regressieanalyse; de standaardafwijking van mijn residuen is nogal groot. Is er een manier om deze te verkleinen?

oompaloompa

woensdag 4 augustus 2010 @ 16:47

quote:
Op woensdag 4 augustus 2010 13:11 schreef de_nachtwacht het volgende:
Hoi,

Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.

Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.

Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?

Je interpreteert je getransformeerde data, daarna zou je een interpretatie van je normale data kunnen geven. Maar aangezien je de getransformeerde test doe je daar de uitspraken over.

Hiya

woensdag 11 augustus 2010 @ 15:24

Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?

gember

vrijdag 27 augustus 2010 @ 12:43

Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!

The_Eye

zaterdag 28 augustus 2010 @ 17:51

quote:
Op vrijdag 27 augustus 2010 12:43 schreef gember het volgende:
Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!

Data reduceren doe je met een factor analyse. Volgens mij moeten de antwoordcategorien wel gelijk zijn voor deze procedure. Google anders factor analyse zodat je meer over deze techniek te weten komt.

The_Eye

zaterdag 28 augustus 2010 @ 18:00

quote:
Op woensdag 11 augustus 2010 15:24 schreef Hiya het volgende:
Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?

Met Kendall's Tau-B ben ik niet zo bekend. De toepassing van Pearson of Spearman Rho om een correlatie tussen variabelen te toetsen is afhankelijk van je data. Bij interval geschaalde data, dat normaal verdeeld is, gebruik je Pearson (product-momentcorrelatiecoëfficiënt). De Spearman Rho wordt ook wel Spearman rangcorrelatiecoeffiecient genoemd. Deze gebruik je als je interval data niet normaal verdeeld is, of als je te maken hebt met ordinaal geschaalde data.

gember

zondag 29 augustus 2010 @ 15:16

Bedankt voor de snelle reactie!
Een factoranalyse heb ik al uitgewerkt. Het is niet de bedoeling de data te reduceren, maar tot een soort van "gemiddelde" schaalscore te komen zodat ik deze in mijn regressievergelijking kan opnemen.
Als alle schalen gemeten worden op een vijfpuntschaal doe je bijvoorbeeld bij Compute
(VRAAG1 + VRAAG2 + VRAAG 3) / 3 voor het gemiddelde van het hele concept. Simpel uitgelegt zien mijn vragen er zo uit:
vraag 1: antwoordcategorieen van 1 t/m 5
vraag 2: antwoordcategoieen van 1 t/m 6
vraag 3: antwoordcategorieen van 1 t/m 10
Als je nu via compute (VRAAG1 + VRAAG2 + VRAAG 3) / 3 invoert bij compute, krijg je een gemiddelde dat aangetast is door het feit dat de ene vraag vijf antwoordcategorien heeft en de ander zes.
Er moet (lijkt me) een manier zijn om deze vragen toch vergelijkbaar te maken?

SPOILER
ik ben volgens mij niet zo goed in uitleggen hihi

ChipsZak.

maandag 18 oktober 2010 @ 18:13

Hey! Ik heb morgen een SPSS toets en ik kom al niet uit de oefenopgave,

.
Kan iemand helpen?

quote:
In een experiment worden mannen en vrouwen willekeurig ingedeeld in vier experimentele groepen. De proefpersonen moeten twee taken uitvoeren en de experimentele groep waarin ze zijn ingedeeld bepaalt onder welke condities de taken moeten worden uitgevoerd (groep 1 lichtste condities t/m groep 4 zwaarste condities). In de tabel op het uitgereikte formulier staan de gegevens van 20 personen.

Uitgereikt formulier:

Ik loop al direct vast bij het makkelijkste gedeelte,

.
De vraag is namelijk.

quote:
Open SPSS en voer de data in. Zorg ervoor dat er in je dataset vier variabelen zijn. Kies, waar nodig, zelf een codering voor de variabelen.

Ik had zelf eerst als 4 variabelen de condities, maar merkte op dat anderen meer in de juiste richting zaten [waarschijnlijk] met 4 variabelen als 'Sekse, Conditie, Taak1, Taak2'. Maar eigenlijk snap ik er niks van, want ook met die variabelen kom ik niet echt verder met wat ik er precies bij moet invullen,

. Ook moet ik later in de opgave nog een nieuwe variabele maken die gelijk is aan de som van de beide variabelen.

Help?

crossover

maandag 18 oktober 2010 @ 18:45

Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)

Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).

Beetje duidelijker zo?

ChipsZak.

maandag 18 oktober 2010 @ 18:49

quote:
Op maandag 18 oktober 2010 18:45 schreef crossover het volgende:
Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)

Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).

Beetje duidelijker zo?

Het zijn de scores idd. Maar het moeten per se 4 variabelen worden, dus 5 gaat niet lukken.
Meetschaal zal wel lukken.

Alleen ik snap niet helemaal hoe en wat ik nu precies moet invullen.
Voorbeeld: Ik wilde eerst onder geslacht voor een man een 0 invullen en voor vrouwen een 1 maar dat liep ergens ineens niet goed omdat er in de groepen van taak1 al niet constant hetzelfde aantal mannen zitten.

Frith

maandag 18 oktober 2010 @ 19:01

Het enige wat een beetje onder de radar zit is dat je uiteraard "taak" ook maar een enkele variabele maakt.

Wat latere bewerkingen selecteer je gewoon op "1" of "2" onder de variabele 'taak'.

Uiteraard is iedere persoon een aparte case en zijn de twee taken (of meer) mutual exclusive, wat betekent dat iemand óf in 1 zit of in 2, maar nooit in beide.

taak: 1,2
sekse: 1,2
groep: 1,2,3,4
score: 0-99 (interval)

In SPSS levert je dat drie categorische variabelen op (weet de naam even niet) en een enkele scale-variabele, omdat SPSS geen interval meetniveau kent. Dacht ik dan toch.

ChipsZak.

maandag 18 oktober 2010 @ 19:04

Maar ze zitten toch juist in beide taken,

? Want ze moeten ze beiden doen?

Frith

maandag 18 oktober 2010 @ 19:15

quote:
Op maandag 18 oktober 2010 19:04 schreef ChipsZak. het volgende:
Maar ze zitten toch juist in beide taken, ? Want ze moeten ze beiden doen?

whoops.

Me smart!

In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.

ChipsZak.

maandag 18 oktober 2010 @ 19:40

quote:
Op maandag 18 oktober 2010 19:15 schreef Frith het volgende:

[..]

whoops.

Me smart!

In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.

Ik las ook nog ergens dat ik de cijfers moet opvatten als individuen en dus moest kijken naar hun score op zowel taak1 als taak2 en dan zou mijn spss ding op deze manier goed moeten zijn.

(man (=0) uit groep 1 heeft op taak1 een score van 65 maar bij taak2 een van 42.

uppie83

maandag 8 november 2010 @ 19:23

Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R² waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?

Citizen.Erased

maandag 8 november 2010 @ 19:30

TVP. Over een paar weken mag ik ook weer aan de slag met SPSS.

yozd

dinsdag 9 november 2010 @ 19:47

Even een kort vraagje; als ik een (lineair) regressie run met meerdere variabelen en bij ANOVA is mijn model significant en al die variabelen zijn ook significant, BEHALVE de 'constant'. Wat betekent dit dan concreet?

Hiya

dinsdag 9 november 2010 @ 22:15

quote:
Op maandag 8 november 2010 19:23 schreef uppie83 het volgende:
Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R² waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?

Moet je dit met eigen data of gegeven data zijn?

Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R² waarden. Weet je zeker dat je alles goed hebt ingevoerd?

Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?

uppie83

donderdag 11 november 2010 @ 22:03

quote:
Op dinsdag 9 november 2010 22:15 schreef Hiya het volgende:

[..]

Moet je dit met eigen data of gegeven data zijn?

Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R² waarden. Weet je zeker dat je alles goed hebt ingevoerd?

Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?

We hebben een deel van een data bestand gekregen van een oud onderzoek. Hiermee moesten we voor ons vak een paper schrijven met onder andere de eis dat er een multiple regressie in zou komen. Inmiddels ben ik er achter gekomen dat de eis voor multiple regressie niet zozeer is dat alle factoren een hoge lineaire regressie moeten hebben, maar ze moeten met elkaar correleren. Niet dat dat overal netjes gebeurd, maar dat is nu eenmaal 'the real deal'. Dit is zeg maar een voorbereidingsvak op de masterscriptie.

Susanna

zaterdag 13 november 2010 @ 16:18

Whoehoe, een spss-topic!

Mag ik meteen een vraag stellen?

Ik heb een database met onder andere als vraag: hoeveel geeft u uit aan a, b, c, d, e.
Ik wil de antwoorden op deze vragen indelen in drie categorieën, namelijk mensen die bij a iets (maakt niet uit wat) hebben ingevuld, mensen die bij b iets hebben ingevuld en mensen die bij c, d of e iets hebben.
Complicerende factor: ik wil dat alleen weten voor 2009 (of indien niet beschikbaar 2008) terwijl deze vraag voor 2005 tot en met 2009 is beantwoord.

Hoe krijg ik dit voor elkaar?! Ik hóóp dat jullie een antwoord weten, alvast heel erg bedankt!

Susanna

zaterdag 13 november 2010 @ 16:20

uppie, mag je zelf je variabelen kiezen? En als je daar nu in varieert?

zaterdag 13 november 2010 @ 17:02

Hoe ziet de "jaarvariabele" er uit? En hoe blijkt uit de uitgave variabele of het een uitgave a, b, cde is

Susanna

zondag 14 november 2010 @ 10:24

Per deelnemer wordt per jaar al dan niet een waarde ingegeven in de kolommen a t/m e. Dus: ik heb onder elkaar steeds 5 dezelfde deelnemer (dus nr. 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, etc), tweede kolom is 2005,2006,2007,2008,2009,2005,2006,2007 etc. En dan volgen de kolommen a t/m e waar waardes ingegeven kunnen zijn (en ik ben dus niet geďnteresseerd in de waardes, maar of er al dan geen waarde in staat). Is dat hoe je de vraag bedoeld? Ik hoop dat ik zo duidelijk ben.

Susanna

maandag 15 november 2010 @ 09:54

Nog een suf vraagje trouwens: Ik heb met select cases een aantal bedrijven eruit geselecteerd, maar hoe kan ik deze filter bewaren? Als ik spss opnieuw open, is de selectie weer ongedaan gemaakt.

maandag 15 november 2010 @ 10:00

Het is een [b]must[/b]!! om in SPSS met syntaxen te werken. In je syntax kan je al je commando's opslaan. Als je je selectie gemaakt hebt via de menu's, klik je niet op 'OK' maar op 'PASTE', de opdracht wordt geopend in een syntax die je vervolgens kan draaien. Verdiep je daar een beetje in zou ik zeggen, op een gegeven moment laat je de menu's voor wat ze zijn en schrijf je direct syntaxen. Als ik vandaag tijd heb kom ik nog terug op de andere vraag. Het is in ieder geval niet handig dat één respondent data op verschillende regels heeft staan.

Susanna

maandag 15 november 2010 @ 10:09

Oké, dat ga ik zeker uitproberen vandaag, met die syntax.

Wat betreft de vraag óf er een waarde is ingegeven (in plaats van wát die waarde is), volgens mij kom ik er als ik de variabele hercodeer. Er worden bedragen genoemd, dus als ik alles wat groter of gelijk is aan ¤ 1 klasse a noem en alles wat kleiner is dan ¤ 1 klasse b, dan heb ik dat alvast voor elkaar.

Blijft dat ik er dan achter moet komen wie er alleen a, alleen b, a en b, of a, b, c, e heeft ingevuld. Hmm, vind dat nog lastig, ben benieuwd of jij nog iets weet, ik denk er zelf ook nog over na.

Heel fijn dat je meedenkt!

Ik ben nu aan het uitzoeken hoe ik de waardes van twee variabelen kan mixen, zodat ik één gemiddelde variabele krijg (betreft twee vragen met een ordinale schaal, alleen loopt de ene van 1 tot 5 (positief-negatief) en de andere van 5 tot 1 (negatief-positief)...)

Susanna

maandag 15 november 2010 @ 14:59

Pfff, werd helemaal gek van die database (heb hem zelf niet in elkaar gezet, het is echt slordig gedaan). Heb nu gewoon de variabelen die ik wil middelen naar excel gekopieerd. Daar een nieuwe variabele van gemaakt en dat probeer ik dan weer in spss te krijgen. Je moet er wat voor overhebben

uppie83

woensdag 17 november 2010 @ 02:24

Update: ik ben inmiddels klaar. Er hoefde geen relaties verbeterd te worden. Moest mijn conclusies er enkel op aanpassen

Hiya

woensdag 17 november 2010 @ 15:50

quote:
Op maandag 15 november 2010 10:09 schreef Susanna het volgende:
Ik ben nu aan het uitzoeken hoe ik de waardes van twee variabelen kan mixen, zodat ik één gemiddelde variabele krijg (betreft twee vragen met een ordinale schaal, alleen loopt de ene van 1 tot 5 (positief-negatief) en de andere van 5 tot 1 (negatief-positief)...)

Daar moet je Transform > Recode in to New Variables ( Als je dus een nieuwe column wil aan maken) of Recode in to Same Variables (als je het wil veranderen in dezelfde column). Ik raad je aan om het in een nieuwe column te doen, als je wat fout doet kan je gemakkelijk opnieuw doen.

Wat je dus in dat scherm moet doen is per variabele aangeven in wat hij moet veranderen.

Voorbeeldje: nu loopt je data gespiegeld dus een 5 moet een 1 worden.

Old Value 5
New Value 1
Klik op Add.

Doe dit voor 4 t/m 1 natuurlijk ook.
Elke keer moet je weer op Add drukken trouwens. Enter werkt niet.

Daarna OK aan klikken, en daarna weer ok om het uit te voeren.

Hiya

woensdag 17 november 2010 @ 15:51

Mixen kan je trouwens doen door Transform > Compute new variabele. Daar kan je aangeven welk columns je wil delen, vermenigvuldigen et cetera.

alexissi

zondag 21 november 2010 @ 10:52

Ik heb ook een SPSS-vraagje. Ik moet morgen presentatie geven over de voortgang van ons onderzoek en daarom ben ik nu al (met de niet volledige data) wat analyses aan het uitvoeren.
Ik wil graag een ANOVA uitvoeren om te kijken of de antwoorden op enquetes op drie verschillende scholen van elkaar verschillen. Nu heb ik van school 1 23 enquetes terug, van school 2 15 en van school 3 9 enquetes. De n is dus niet helemaal gelijk. Iemand enig idee hoe ik dit recht kan trekken in SPSS, zonder dat er dus scheve verschillen ontstaan tussen deze scholen?

zondag 21 november 2010 @ 12:26

De toets houdt rekening met steekproefgrootte, de betrouwbaarheidsintervallen zullen erg groot zijn alleen met zo'n lage n.

Skv

donderdag 25 november 2010 @ 16:19

Ik was altijd goed in SPSS, maar ben het nu even helemaal kwijt.

Ik heb een enquete afgenomen onder een aantal respondenten met een likert scale.
Er werden tien elementen genoemd die allemaal verondersteld worden samen onderdeel te zijn van één concept. De respondenten hebben de tien elementen genummerd van 1 (zeer relevant) tot 5 (niet relevant).

Heb alles nu in SPSS staan, maar ik weet niet meer hoe ik nou kan kijken welke items wél het concept meten en welke niet.

donderdag 25 november 2010 @ 16:23

Cronbach's alpha (> 0.7)?

RELIABILITY
/VARIABLES= A B C D etc.
/FORMAT=NOLABELS
/SCALE(ALPHA)=ALL/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE CORR
/SUMMARY=TOTAL MEANS .

crossover

donderdag 25 november 2010 @ 16:25

quote:
Op donderdag 25 november 2010 16:23 schreef Z het volgende:
Cronbach's alpha (> 0.7)?

RELIABILITY
/VARIABLES= A B C D etc.
/FORMAT=NOLABELS
/SCALE(ALPHA)=ALL/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE CORR
/SUMMARY=TOTAL MEANS .

Dat dus.

quote:
Je kunt de betrouwbaarheid berekenen bij analyse scale reliability analysis. Daar moet je aangeven van welke variabelen je de betrouwbaarheid wilt berekenen. De Cronbachs alpha staat standaard aangevinkt. Bij Statistics moet je Scale nog aanvinken. Met de optie scale if item deleted kun je onderzoeken wat er gebeurt met de samenhang als je één variabele verwijdert.

Skv

donderdag 25 november 2010 @ 16:29

Die had ik al gedaan, maar daar krijg ik dit uit:

Citizen.Erased

donderdag 25 november 2010 @ 16:31

Heb je al je variabelen wel goed gecodeerd (werken ze allemaal dezelfde richting op)?

Skv

donderdag 25 november 2010 @ 16:33

Yes. Het gaat om tien aspecten die 'maatschappelijk verantwoord ondernemen' moeten meten.
De tien zijn op een rijtje gezet en de respondenten hebben deze genummerd van 1(relevant) tot 5(irrelevant).

Moet ik nu net zo lang variabelen met een lage score verwijderen tot cronbach's alpha >0.7? Of mag dat niet zomaar?

crossover

donderdag 25 november 2010 @ 16:35

quote:
Op donderdag 25 november 2010 16:33 schreef Skv het volgende:
Yes. Het gaat om tien aspecten die 'maatschappelijk verantwoord ondernemen' moeten meten.
De tien zijn op een rijtje gezet en de respondenten hebben deze genummerd van 1(relevant) tot 5(irrelevant).

Moet ik nu net zo lang variabelen met een lage score verwijderen tot cronbach's alpha >0.7? Of mag dat niet zomaar?

Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.

Citizen.Erased

donderdag 25 november 2010 @ 16:37

quote:
Op donderdag 25 november 2010 16:35 schreef crossover het volgende:

[..]

Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.

Het heeft sowieso in de meeste gevallen niet de voorkeur om veel elementen te verwijderen.

Wellicht meten deze 10 elementen dan ook meer dan 1 concept. Ik weet niet of je dat eenvoudig middels een factor-analyse zou kunnen achterhalen. Als je vervolgens op een tweetal aan relevante factoren uitkomt dan zijn de scores waarschijnlijk een stuk beter.

De benamingen van elementen die je meeneemt lopen in mijn ogen ook vrij ver uiteen. Het lijkt me dan ook aannemelijk dat je niet dezelfde scores krijgt.

Wat voor soort analyse wil je gaan doen?

[ Bericht 6% gewijzigd door Citizen.Erased op 25-11-2010 16:47:34 ]

Skv

donderdag 25 november 2010 @ 16:54

quote:
Op donderdag 25 november 2010 16:35 schreef crossover het volgende:

[..]

Volgens mij mag dat wel. Maar als je er uiteindelijk te weinig overhoudt, is dat ook niet goed natuurlijk. Dan heb je gewoon slechte vragen opgesteld, om het even bot te zeggen.

Ik meet de toepasbaarheid van een tiental richtlijnen die door Nederland zijn opgesteld voor internationale toepassing op het Zuid-Afrikaanse bedrijfsleven. Het is dus de bedoeling dat er een selectie overblijft van een paar items die dus toepasbaar zijn..

Het is niet de bedoeling dat er een bepaald aantal overeenkomt.

Skv

donderdag 25 november 2010 @ 17:01

Ik kan overigens aan het laatste plaatje dat ik heb gepost al opmaken dat de items 'forced labor' en 'child labor' niet relevant zijn vanwege de hoge scores en dat bijvoorbeeld health care, corruption en working conditions het meest relevant zijn vanwege de lage scores. Echter, om nou in mijn thesis mijn conclusie te bevestigen op deze losse scores.. Dat gaat niet. Maar items verwijderen bij Cronbach's alpha zou dan dus de oplossing zijn?

Citizen.Erased

donderdag 25 november 2010 @ 17:03

Ik weet niet precies wat voor soort analyse je doet. Wil je weten of ze een significant effect hebben op een andere variabele?

Skv

donderdag 25 november 2010 @ 17:09

Nou nee, het enige doel is het destilleren van de items die het begrip 'maatschappelijk verantwoord ondernemen' meten en dat resultaat statistisch kunnen verantwoorden. Verder geen effectanalyse of wat dan ook.

Met die samenhang van Cronbach's alpha gaat dat dus niet, omdat de extreme waarden van de items die als 'zeer relevant' worden geschat worden gezien als afwijkend in plaats van als toonaangevend. (de hoge scores die dus extra relevant worden geacht door respondenten correleren niet goed met het gemiddelde).

Of zou ik gewoon op basis van de gemiddelden en standaarddviaties er naast kunnen zeggen dat er een paar items sowieso te hoog scoren?

[ Bericht 21% gewijzigd door Skv op 25-11-2010 17:41:40 ]

Skv

donderdag 25 november 2010 @ 17:35

-

[ Bericht 50% gewijzigd door Skv op 25-11-2010 17:38:50 ]

donderdag 25 november 2010 @ 18:01

Met Cronbach bekijk je of de verschillende schaaltjes (stellingen) hetzelfde meten, dat is dus duidelijk niet het geval. Volgens mij gaat dat dan ook problemen opleveren bij een factoranalyse.

Skv

donderdag 25 november 2010 @ 18:20

quote:
Op donderdag 25 november 2010 18:01 schreef Z het volgende:
Met Cronbach bekijk je of de verschillende schaaltjes (stellingen) hetzelfde meten, dat is dus duidelijk niet het geval. Volgens mij gaat dat dan ook problemen opleveren bij een factoranalyse.

Goed, Cronbach gaat hem dus niet worden. Is er een andere manier om een statistische analyse te trekken over deze gegevens?

Het gaat er dus alleen maar om dat ik in mijn rapport kan zeggen: 'aan de hand van deze gegevens trek ik de conclusie dat begrip 'a', 'b' en 'c' het begrip niet meten en 'd', 'e' en 'f'' wel.

Skv

donderdag 25 november 2010 @ 18:47

Een ander idee: een T-toets op het gemiddelde (3, gezien de verwachting is dat elk element gemiddeld scoort).

Dat geeft dit resultaat:

Alles verschilt dus significant van het gemiddelde (sig 2-tailed = P <0.05). Ik denk echter dat dit veroorzaakt wordt door de lage N(=14). Zou ik deze tabel neer kunnen zetten als indicator welke begrippen belangrijker worden geacht dan andere begrippen? Ik zou hierbij kunnen refereren aan mean difference: hoe lager het mean difference, hoe relevanter het item is.. Iemand?

donderdag 25 november 2010 @ 19:07

Er zijn andere analysemethoden voor zulke lage n-en (daar kan ik je niet mee helpen). Alles wat hierboven door je beschreven is komt door de lage n-en.

gewooneenuser

donderdag 25 november 2010 @ 22:48

"aan de hand van deze gegevens trek ik de conclusie dat begrip 'a', 'b' en 'c' het begrip niet meten en 'd', 'e' en 'f'' wel"

Dit soort uitspraken kun je nooit doen aan de hand van statistiek. Je kan hooguit zeggen dat je twee (of meer) factoren hebt gevonden. Welke factoren dit zijn moet je zelf (aan de hand van theorie) invullen.

Als je Cronbach's alpha negatief is, moet je je items en dataset nog eens goed bekijken en niet gewoon maar een andere analysetechniek gaan gebruiken die minder of niet geschikt is maar wel resultaten geeft die in je verhaal passen. (ook nogal kort door de bocht om te zeggen dat het allemaal gewoon komt door een kleine n trouwens)

Ik begrijp ook niet hoe je erbij komt t-testen te gaan doen. Waarom ga je ervan uit dat je respondenten op elk element gemiddeld moeten scoren? En dat gemiddelde is dan het 'neutrale' antwoord? Zegt dat niet eerder iets over je respondenten dan over de kwaliteit van je vragenlijst? Wat is het bestaansrecht van je vragenlijst als je de kwaliteit van je vragenlijst afleidt uit het al dan niet gemiddeld scoren van je respondenten? Dan kun je de vragenlijst dus evengoed niet afnemen, mensen scoren toch gemiddeld en als dat niet zo is, is de vragenlijst ineens niet goed.

Probeer eens een factoranalyse (al is dat eigenlijk PCA in SPSS geloof ik?) en kijk of daar iets zinvols uitkomt. Al is je n voor al dit soort dingen wel érg laag. Met tien vragen zou je toch best een 200-tal respondenten bevragen.

Skv

donderdag 25 november 2010 @ 22:55

CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.

Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.

gewooneenuser

vrijdag 26 november 2010 @ 08:16

quote:
Op donderdag 25 november 2010 22:55 schreef Skv het volgende:
CA is factoranalyse in SPSS ja.
En een t-toets op de gemiddelde verwachte score lijkt me niet heel vreemd. Het concept is vastgesteld met een evengroot belang gehecht aan alle tien de verschillende items. Dus zou je kunnen stellen dat al die items evenveel waard zijn voor het concept en dus als neutraal uitgangspunt genomen kunnen worden. Er is immers geen preferentie van een bepaald item boven een andere.

Dat vergelijk je daarna met de daadwerkelijke scores op de tien items die je hebt geobserveerd.. Het gaat niet om de kwaliteit van de vragenlijst of de respondenten, maar om het elimineren van items die in de praktijk niet goed passen bij het concept. Ik weet dat de N erg klein is, maar ik heb het lijstje gebruikt bij alle respondenten van mijn diepte-interviews. Voor de interviews is dd N erg hoog, ik zou graag een klein stukje statistiek gebruiken om mijn claims adhv de interviews wat te ondersteunen.

Hier haal je toch wat dingen door elkaar. Nagaan of hoog-scoorders op alle elementen hoog scoren en laag-scoorders op alle elementen laag scoren (wat er volgens jouw beschrijving is gedaan), is heel iets anders dan nagaan of alle personen op alle elementen gemiddeld 'neutraal' scoren.
Je hebt dus wel degelijk Cronbach's alpha nodig hier.

Als je wilt nagaan welke items in de praktijk niet goed passen, gaat het dus wél om de kwaliteit van je vragenlijst.
Aan je gemiddeldes en standaardafwijkingen kan je al duidelijk zien dat de verschillende elementen heel verschillend worden gewaardeerd en dat er veel verschillen zitten tussen de mensen onderling.
Het lijkt me met deze data verstandig de inferentiële statistiek even te laten voor wat het is en eens goed naar je data te kijken. Maak bijvoorbeeld een lijngrafiekje per participant met de scores per element. Zo kan je zien of het bij elke participant dezelfde items zijn die veel lager/hoger scoren. Als dat het geval is, kun je gaan bekijken waarom deze items anders scoren. Waarschijnlijk kun je daar de data uit je interview wel voor gebruiken en er is vast ook wat theorie over. Welke groep items dan 'het concept' meet en welke groep een 'ander concept' moet je toch echt hieruit halen en niet uit statistiek en p-waardes.

schaal_9

zaterdag 27 november 2010 @ 20:55

Wat leuk, een SPSS topic

Ik ga het allemaal eens doorlezen...

Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).

Citizen.Erased

donderdag 2 december 2010 @ 15:13

Ik zit met een klein dilemma en weet niet of ik nu verder kan gaan in mijn analyse.

Ik ben bezig met een multiple regressie en niet alle data lijkt normaal verdeeld.
Mijn Dependent Variable (Switchintentie) lijkt bijvoorbeeld niet normaal.
_{De wijze waarom de scores verdeeld zijn is wel de verdeling die ik vooraf verwacht heb. Het overgrote deel van de mensen in de markt die ik onderzoek heeft niet de intentie om over te schakelen naar een andere aanbieder.}

Ik heb geprobeerd om enkele transformaties toe te passen, maar op de een of andere manier wordt de verdeling daardoor niet beter.

Mijn vraag is:

1. Hoe moet ik de scores van Kurtosis en Skewness interpreteren?
2. Kan ik met deze data een multiple regressie uitvoeren (en de resultaten hiervan interpreteren)?
3. Zijn er nog 'n aantal transformaties die ik kan gebruiken?

crossover

donderdag 2 december 2010 @ 17:19

1.: Kurtosus is de mate van scheefheid. Google even op afbeeldingen dan krijg je er een beeld bij. Skewness houdt in naar welke kant je verdeling neigt.

Houd ook rekening met je meetschaal. Als je in je vragenlijst de alle keuzemogelijkheden van 1 t/m 5 hebt gedefinieerd, is het een ordinale meetschaal en mag je strict genomen geen regressie uitvoeren. Als je alleen de 1 en 5 hebt benoemd 'mag' het wel.

crossover

donderdag 2 december 2010 @ 17:25

Wat is/zijn je onafhankelijke variabele(n)?

Citizen.Erased

donderdag 2 december 2010 @ 18:14

quote:
Op donderdag 2 december 2010 17:25 schreef crossover het volgende:
Wat is/zijn je onafhankelijke variabele(n)?

Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.

Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is

{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.

De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.

Susanna

donderdag 9 december 2010 @ 21:10

Welke analyses kun je dan uitvoeren als je gebruik maakt van een ordinale meetschaal met (zoals je in het voorbeeld schetst) antwoord 1-5? Een regressieanalyse lijkt me dan bij voorbaat onzinnig, wat kun je dan over de data zeggen?

Susanna

donderdag 9 december 2010 @ 21:13

quote:
Op donderdag 2 december 2010 18:14 schreef Citizen.Erased het volgende:

[..]

Mijn onafhankelijke vragen zijn zaken als "relationship quality" "alternative attractiveness" "procedural switching costs" "financial switching costs". Allemaal natuurlijk gemeten op 'n 5-punts likert-schaal.

Ik was in eerste instantie voorstander van 'n logistische regressie, alleen mijn docentbegeleider had de voorkeur voor multiple lineaire regressie. Nu blijkt dus dat dat niet zo geschikt is
{1,2,3,4,5} geeft de mate aan waarin men wil overstappen of bv. de mate waarin men switching costs percipieert.

De rest van mijn data is bij benadering wel normaal verdeeld, of in ieder geval niet extreem niet-normaal. Helaas werken de meest gangbare transformaties ook niet zoals ik het wil. Heb wel gelezen dat bij grote samples normaliteit in mindere mate belangrijk is, maar het is wel een van de belangrijkste assumpties voor regressie.

Geen normale verdeling = geen regressieanalyse

Ben echt benieuwd wat je er dan wel nog mee kan. Heb zelf namelijk ook steekproeven met in elke cel >30 waarnemingen en (gezien de vraagstelling logisch) niet normaal verdeeld...

Operc

donderdag 9 december 2010 @ 21:30

quote:
Op zaterdag 27 november 2010 20:55 schreef schaal_9 het volgende:
Wat leuk, een SPSS topic
Ik ga het allemaal eens doorlezen...

Ik programmeer er zelf ook een beetje in. En dat gaat lastig, maar er is geen andere mogelijkheid. Probeer maar eens van één databestand de gegevens van mensen van drie verschillende groepen in drie bestanden op te slaan. Dat gaat heel omslachtig (vergeleken met SAS, dat andere statistische programma).

Niet gewoon Select Cases en dan kiezen voor opslaan in nieuw venster?

Gestiech

donderdag 9 december 2010 @ 22:45

Oké, hier ook nog maar even mijn vraag droppen dan. Nouja, ik heb er eigenlijk twee.
Als eerste een vraag over Chi-square. 2 groepen: mannen en vrouwen, hebben aangegeven of ze wel of niet voorkeur geven aan vroeg college. De output van spss is reeds gegeven, maar er wordt gevraagd deze te interpreteren. Hoe kan ik weten wat de uitkomst nou eigenlijk is? Het resultaat is significant, maar dat kan in principe zowel betekenen dat mannen liever vroeg college hebben, dan dat het kan betekenen dat vrouwen vroeg college hebben, toch? Hoe moet ik dit terugzien?

Verder een vraag over MSG en MSE. Bij een andere opgave werden de standaarddeviaties en standaardfouten gegeven, de df's werden gegeven, en de n's werden gegeven. Vervolgens moest je dan op basis daarvan eerst de sum of square groups en square errors berekenen en daarna dus MSG en MSE. Het leek mij dat je voor sum gewoon zowel de sd als de sf allemaal in het kwadraat doet en optelt. Dan heb je je sum, toch? Nou, als ik dat doe kom ik al niet op de juiste waarde. Vervolgens dus naar de mean, en dat zou dan het delen door de df moeten zijn? Indien nodig kan ik de opgave wel even hier neer zetten.

Gestiech

donderdag 9 december 2010 @ 23:03

Overigens, @ Citizen.Erased, volgens mij is het normaal dat bij het meten van een categorische nominale variabele - zoals jij die meet - de verdeling niet normaal is. Als ik een enquete houd onder de bevolking met de vraag of ze altijd al eens iemand hebben willen vermoorden zal 90% ook 'nee' zeggen. of 1 / 2 wanneer we het hebben over een 5-puntsschaal. Is het probleem niet meer het feit dat de uitkomst evident is, en geen analyse behoeft?

crossover

donderdag 9 december 2010 @ 23:06

Volgens mij kan je bij een chi square gewoon een kruistabel maken en vanaf daar interpreteren.

Gestiech

donderdag 9 december 2010 @ 23:22

Hoe bedoel je dat...? Ik moet immers wel bepalen of het resultaat significant is. Bij 2*2 zou dat nog enigszins kunnen i guess, maar stel het is 2*3, of 3*3, wat dan? Hoe bepaal je dan welke nou significant is?

crossover

vrijdag 10 december 2010 @ 07:32

Als ik me niet vergis kan je ook bij de wat grotere kruistabellen de gegevens aflezen. Ik denk dat de significantie verwijst naar de gehele tabel. Maar kan iemand anders dit bevestigen of ontkrachten? Is voor mij ook weer een tijdje geleden..

Rick.Gulmans

vrijdag 10 december 2010 @ 11:05

een chi square tabel geeft aan of iets afhankelijk van elkaar is, als je dus een significante chi square krijgt (de observed value wijkt af van expected value) dan betekent het dat de groepen wat met elkaar te maken.
maak hier een crosstabel/grafiek van en je kan interpreteren!
je ziet dan bv met die lijnen zien wat je verband is.

voor MSE, moet je eerst SS berekenen. De SSE is kwadratensom, die deel je door de Df, en dan krijg je de MSE. en dit kan je met elke SS doen ( groeps of individu niveau)

[ Bericht 1% gewijzigd door Rick.Gulmans op 10-12-2010 11:06:33 (typfouten) ]

Susanna

vrijdag 17 december 2010 @ 21:33

Wat te doen als een somers'd test nagenoeg géén relatie laat zien tussen twee variabelen. Dan ben je lijkt me uitgeanalyseerd? Ik wilde namelijk met de somers'd test laten zien dat er wél een (positief danwel negatief) verband is en aan de hand daarvan met regressieanalyse aan de slag gaan.

Susanna

dinsdag 21 december 2010 @ 22:04

Niemand??

Susanna

dinsdag 21 december 2010 @ 22:08

Volgende vraag

Ik heb een logistische regressie uitgevoerd. De afhankelijke variabele is een dummy, de predictorvariabele is categorisch.

Uitkomst:

Model Summary:
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 ,000a ,692 1,000
a. Estimation terminated at iteration number 19 because a perfect fit is detected. This solution is not unique.

Het gaat me om de opmerking bij a (kan niet zo goed een tabel hierin plakken, sorry). Because a perfect fit is detected. Betekend dit dat ik niets aan deze analyse heb? En komt dat dan doordat ik het model verkeerd heb gebouwd, of omdat de data gewoon niet meewerkt (het liefst dat laatste natuurlijk

)

Susanna

zondag 13 februari 2011 @ 20:58

Ik heb het volgende gelezen: Tevens kan de variabele getransformeerd worden door het natuurlijk logaritme (LN) te nemen van de variabele.
Hoe kun je in spss dan een logaritme berekenen? Is dat een bewerking (en zo ja, welke) waarna je een 'nieuwe' variabele krijgt waarmee je dan weer de normale dingen kunt doen, zoals descriptives draaien en nagaan of er een normale verdeling is en een skewness van tussen -2 en +2 bijvoorbeeld?

crossover

zondag 13 februari 2011 @ 21:27

Al bij compute variable gekeken?

yozd

maandag 14 februari 2011 @ 15:03

Ik wil graag weten hoe ik kan bepalen of gevonden coëfficiënten bij regressies voor 2 verschillende groepen significant verschillen.

Stel je hebt dit model:

y = c + X1 + X2 + X3

waarbij X3 een dummy variabele is (man/vrouw, 0/1). Als ik nu wil weten of de coëfficiënten van X1 en X2 voor mannen en vrouwen verschillen, moet ik interactievariabelen toevoegen voor elk van die predictors:

y = c + X1 + X2 + X3 + (X1 * X3) + (X2 * X3)

Nu kan ik in de output zien of de coëfficiënten van die interactietermen significant zijn en dus bepalen of geslacht de invloed van X1 en X2 op y beďnvloedt.

Maar nu hoorde ik laatst van iemand dat je dit ook op een andere manier kon checken. Je hebt dan 2 samples (mannen en vrouwen) en je runt dan 2x (1x voor mannen en 1x voor de vrouwensample):

y = c + X1 + X2

Vervolgens doe je een T-test op de 4 (2x2) gevonden coëfficiënten. Maar hoe doe je dat precies?

Don_Gurgen

dinsdag 15 maart 2011 @ 11:44

Al een tijdje rustig hier, maar toch nog even proberen...

Ik ben een vragenlijst aan het coderen en ben op een type vraag gestuit waar ik niet zo goed van weet wat ik ermee aan moet.

Het gaat erom dat de respondenten vijf mogelijkheden krijgen aangeboden en deze naar voorkeur in een volgorde moeten zetten. Oftewel vijf antwoorden moeten worden ingevoerd waarvan het ook belangrijk is welke ze als eerste, welke ze als tweede etc hebben ingevoerd.

Weet iemand hoe dit moet? Ik ben eeuwig dankbaar!

dinsdag 15 maart 2011 @ 11:57

Ik kan nooit zo veel met dat soort vragen (in marktonderzoek). Ik vind het niet interessant om te zeggen dat een antwoord een x aantal keer als eerste en een x aantal keer als tweede enz. wordt genoemd. Op een gegeven moment zegt het niets meer en antwoorden die vaak als eerste gerankt worden, worden logischerwijs niet vaak als laatste gerankt en vice versa. Ik doe het meestal in een multiple respons vraag met een maximaal te geven antwoorden, dus bijvoorbeeld 'kies er twee van de vijf'. In jouw geval zou ik denk ik alleen de percentages 'als eerst genoemd' rapporteren.

Don_Gurgen

dinsdag 15 maart 2011 @ 12:01

quote:
Op dinsdag 15 maart 2011 11:57 schreef Z het volgende:
Ik kan nooit zo veel met dat soort vragen (in marktonderzoek). Ik vind het niet interessant om te zeggen dat een antwoord een x aantal keer als eerste en een x aantal keer als tweede enz. wordt genoemd. Op een gegeven moment zegt het niets meer en antwoorden die vaak als eerste gerankt worden, worden logischerwijs niet vaak als laatste gerankt en vice versa. Ik doe het meestal in een multiple respons vraag met een maximaal te geven antwoorden, dus bijvoorbeeld 'kies er twee van de vijf'. In jouw geval zou ik denk ik alleen de percentages 'als eerst genoemd' rapporteren.

Dank voor de snelle reactie! Ik zat daar inderdaad ook al een beejte over na te denken, maar nu ik het zo lees lijkt het me inderdaad echt wel een betere oplossing. Ik vroeg me alleen of SPSS een simpele manier had om zo'n vraag te verwerken. Anders dan loont het inderdaad de moeite niet.

Don_Gurgen

maandag 21 maart 2011 @ 09:59

Gezien het goede resultaat de vorige keer, heb ik nog een vraagje.

Als je een vragenlijst vertaald naar SPSS, dan heb je soms vragen die mensen gewoonweg niet invullen en vragen die ze niet hoeven in te vullen omdat ze in een eerdere vraag een bepaald antwoord hebben gegeven. Het bekende indien a ga dan naar vraag 20 verhaal. Er is echter wel een verschil tussen beide oningevulde vragen, is het nodig dit op te geven aan spss en hoe doe je dat?

Alvast bedankt!

maandag 21 maart 2011 @ 10:52

De respondenten die terecht geen data op een variabele hebben zijn 'discrete missing values'. Die kan je dus onder 'missing' scharen (zie variable view). Respondenten die ten onrechte geen antwoord (toga) hebben zou je op 'sysmis' kunnen zetten. Dat kan in een syntax, bijvoorbeeld:
IF V1 = 4 V1 = $sysmis.
exe.

En dan is '4' de waarde die de respondenten hebben gekregen die ten onrechte geen antwoord gegeven hebben. Deze respondenten worden nu niet meegenomen in je analyse.

Don_Gurgen

maandag 21 maart 2011 @ 11:39

Wederom veel dank voor deze snelle reactie. Maar wat is nu precies het verschil tussen de het toekennen van waarde 4 als $sysmis tov het niet invullen van de waarde in de spss tabel? Heeft dat effect op eventuele analyses die je kunt doen?

maandag 21 maart 2011 @ 11:55

Draai maar eens een frequentietabel, da zie je het zelf.

HoneybeeNL

woensdag 23 maart 2011 @ 22:19

Ik ben hier nieuw, dus ik weet niet of deze vragen al eerder zijn gevraagd, maar goed. Ik heb twee vraagjes.

In mijn enquete heb ik een vraag waar meerdere antwoorden gegeven kunnen worden en één antwoord daarvan is anders, namelijk (hier kunnen mensen zelf een antwoord invullen)
Hoe kan het analyseren in SPSS waarbij ik ook de antwoorden zie van de open categorie?

Mijn tweede vraag is: In mijn enquete heb ik de volgende vraag; Kunt u in 3 woorden beschrijven?
Hoe moet ik dit invoeren en analyseren in SPSS?

Groetjes

yozd

donderdag 24 maart 2011 @ 11:52

Hoe kan ik een representatieve steekproef trekken van een onbekende populatie?

donderdag 24 maart 2011 @ 11:58

quote:
Op donderdag 24 maart 2011 11:52 schreef yozd het volgende:
Hoe kan ik een representatieve steekproef trekken van een onbekende populatie?

Je kan een random bruto steekproef trekken die representatief is voor (bijvoorbeeld) heel Nederland (of een andere bekende populatie). Via selectievragen selecteer je de netto steekproef. Omdat de bruto steekproef representatief is voor Nederland, kan je er (tot op zekere hoogte) vanuit gaan dat de netto steekproef dat ook is.

donderdag 24 maart 2011 @ 11:59

quote:
Op woensdag 23 maart 2011 22:19 schreef HoneybeeNL het volgende:
Ik ben hier nieuw, dus ik weet niet of deze vragen al eerder zijn gevraagd, maar goed. Ik heb twee vraagjes.

In mijn enquete heb ik een vraag waar meerdere antwoorden gegeven kunnen worden en één antwoord daarvan is anders, namelijk (hier kunnen mensen zelf een antwoord invullen)
Hoe kan het analyseren in SPSS waarbij ik ook de antwoorden zie van de open categorie?

Mijn tweede vraag is: In mijn enquete heb ik de volgende vraag; Kunt u in 3 woorden beschrijven?
Hoe moet ik dit invoeren en analyseren in SPSS?

Groetjes

Je open antwoorden coderen. Daan kan je analyseren.

yozd

donderdag 24 maart 2011 @ 12:27

quote:
Op donderdag 24 maart 2011 11:58 schreef Z het volgende:

Je kan een random bruto steekproef trekken die representatief is voor (bijvoorbeeld) heel Nederland (of een andere bekende populatie). Via selectievragen selecteer je de netto steekproef. Omdat de bruto steekproef representatief is voor Nederland, kan je er (tot op zekere hoogte) vanuit gaan dat de netto steekproef dat ook is.

Ok. Het gaat namelijk om het volgende; ik wil onderzoeken hoeveel werkgelegenheid er is voor een bepaalde opleiding in diverse sectoren. Daarvoor wil ik werkgevers gaan benaderen. Maar de verdeling van werkgelegenheid in de verschillende sectoren is momenteel onbekend. Nu weet ik dus nooit hoeveel organisaties ik per sector moet gaan benaderen...

donderdag 24 maart 2011 @ 13:27

quote:
Op donderdag 24 maart 2011 12:27 schreef yozd het volgende:

[..]

Ok. Het gaat namelijk om het volgende; ik wil onderzoeken hoeveel werkgelegenheid er is voor een bepaalde opleiding in diverse sectoren. Daarvoor wil ik werkgevers gaan benaderen. Maar de verdeling van werkgelegenheid in de verschillende sectoren is momenteel onbekend. Nu weet ik dus nooit hoeveel organisaties ik per sector moet gaan benaderen...

Dan zou ik 'the next best thing' kiezen en de verhouding tussen de sectoren gebruiken. En werkgelegenheid (en aantallen banen) buiten beschouwing houden. Dan kan je iets zeggen over de werkgelegenheid maar niet (minder goed) over het aantal banen.

Don_Gurgen

vrijdag 25 maart 2011 @ 15:13

Z, je bent echt een held!

Ik ga je nog een keertje een vraagje stellen, anderen mogen natuurlijk ook antwoord geven

Ik heb dus een vragenlijst die ik aan het invoeren ben waarin af en toe een aantal vragen mogen worden overgeslagen, zoals Z voorstelde heb ik die overgeslagen vragen een missing value waarde toegekend, dank hiervoor.

Maar dat betekent wel dat ik steeds allemaal negens zit in te voeren

. Is er misschien een manier om de waarde van variabelen deels af te laten hangen van een andere variabele. Dus wanneer je bijvoorbeeld bij variabele a een 1 invult dat variabele b,c en d automatisch op 9 springen, en wanneer je bij a een 0 invult je deze nog met de hand kan invullen?

Ik hoop dat het een beetje duidelijk is... het is einde van de week...

Alvast bedankt!
Alle goeds!

vrijdag 25 maart 2011 @ 15:26

IF VarA = X VarB = 9.
exe.

Plakken in je syntax en draaien.

Don_Gurgen

vrijdag 25 maart 2011 @ 15:53

quote:
Op vrijdag 25 maart 2011 15:26 schreef Z het volgende:
IF VarA = X VarB = 9.
exe.

Plakken in je syntax en draaien.

Wederom dank.

Soms is het zo simpel... en dan nog lukt het niet helemaal. Want als ik meerdere van deze commando's tegelijk wil invoeren, kan dat ook? Dus VarA = X VarB = 9, maar ook VarC en VarD? Moeten die allemaal los, of kan dat in een keer?

vrijdag 25 maart 2011 @ 16:01

Dat kan wel maar dat is wat 'hogere school syntax schrijven' vermoed ik. Dus toch maar uitschrijven, zoveel kan het niet zijn toch?

Don_Gurgen

vrijdag 25 maart 2011 @ 16:08

quote:
Op vrijdag 25 maart 2011 16:01 schreef Z het volgende:
Dat kan wel maar dat is wat 'hogere school syntax schrijven' vermoed ik. Dus toch maar uitschrijven, zoveel kan het niet zijn toch?

Nee, is het ook niet. Maar ben van nature een beetje lui

Thanks again!

Sodeju

woensdag 30 maart 2011 @ 17:07

Ik heb ook even een vraag betreffende SPSS;

Hoe kan een spreidingsdiagram worden gemaakt waarbij twee scores tegen elkaar uitgezet worden? De vraag wordt als volgt weergeven;

Maak voor de eigenaren met maar 1 hond een spreidingsdiagram waarbij de totaalscore op houding (TOTHOUD) wordt uitgezet tegen die op kennis (TOTKEN). Teken in dit figuur ook een rechte lijn die het best door de punten past.

Zocalo

maandag 4 april 2011 @ 21:19

Ik heb ook een vraag, die wellicht heel simpel is, maar ik weet het gewoon niet

Voor mijn scriptie moet ik de validiteit van constructen gaan bepalen en daarna hun relatie, zeg X en Y. X en Y bestaan beiden uit ongeveer 20 vragen, en daaruit dienen verschillende factoren te komen.

Hoe kan ik die validiteit (en dan voornamelijk convergente) het beste bepalen? Ik heb nu van bijvoorbeeld factor 1 van X alle vragen met elkaar gecorreleerd, maar daar komen geen zeer hoge scores uit. Is dit zo goed, of dien je er eerst dmv de factoranalyze verschillende factoren van te maken en daarop dan de validiteit te testen?

oompaloompa

maandag 4 april 2011 @ 21:36

quote:
Op maandag 4 april 2011 21:19 schreef Zocalo het volgende:
Ik heb ook een vraag, die wellicht heel simpel is, maar ik weet het gewoon niet

Voor mijn scriptie moet ik de validiteit van constructen gaan bepalen en daarna hun relatie, zeg X en Y. X en Y bestaan beiden uit ongeveer 20 vragen, en daaruit dienen verschillende factoren te komen.

Hoe kan ik die validiteit (en dan voornamelijk convergente) het beste bepalen? Ik heb nu van bijvoorbeeld factor 1 van X alle vragen met elkaar gecorreleerd, maar daar komen geen zeer hoge scores uit. Is dit zo goed, of dien je er eerst dmv de factoranalyze verschillende factoren van te maken en daarop dan de validiteit te testen?

toch gewoon cronbachs alpha onder het kopje scale?

Zocalo

maandag 4 april 2011 @ 23:43

cronbach alpha is heeft betrekking op de reliability, de (construct) validity is wat anders...
voor zover ik begrijp tenminste

meerepeer

maandag 25 april 2011 @ 14:44

Hallo,

Ik ben bezig met het analyseren van mijn enquętes. Ik wil daar nu mooie tabellen van maken. Ik heb een aantal multiple response vragen. Hoe ik deze in een set zet, snap ik inmiddels. Echter, wanneer ik de output van een frequentietabel te zien krijg, valt mij op dat er aangegeven wordt dat er een aantal missing values zijn. Dit zijn geen missende antwoorden, maar hij bedoeld hier compleet missende invoeren van. Ik ben er inmiddels ook achter waarom dat is. Elke keuzeoptie is als een aparte variabele ingevoerd. Aankruist (ja) is gecodeerd als 1 en niet aangekruist (nee) is gecodeerd als 2. Eventuele missing values zijn gecodeerd als 9 (overigens niet aanwezig).

Wat nu het probleem is, hij ziet om een of andere reden de respondenten die op alle vragen nee hebben geantwoord (niet aangekruist) en dus als voor alle antwoorden code 2 hebben, staan als missing values. Dus wanneer iemand niks aangekruist heeft, denkt hij automatisch dat deze antwoorden missen, terwijl ik apart de missing value benoemd heb.

Wanneer ik dan een antwoord van code 2 naar 9 omzet, maakt dit geen verschil. Hij ziet 2 dan niet ineens als geldig antwoord.

Dit is natuurlijk een groot probleem, omdat zo de percentages niet correct berekend worden, omdat er een hoop antwoorden buiten beschouwing gelaten worden. Wanneer ik de vragen namelijk apart analyseer en de frequentie daarvan opvraag, ik wél de juiste uitslagen krijg. Ze worden dan niet als missing gezien. Nu is het makkelijk te zeggen dat ik dit dan maar handmatig moet berekenen. Daarom mijn vraag of iemand weet hoe dit probleem opgelost kan worden?

PS. Ik heb nog nooit les gehad in SPSS, maar leer het mezelf via tutorials en handleidingen als ook posts van anderen.

maandag 25 april 2011 @ 15:48

Stel jouw multiple respons vraag heet V1. En de verschillende antwoorden V1_1, V1_2, enz. Om jouw probleem op te lossen zou ik een extra V1_ aanmaken en die 'geen van deze' noemen. Als respondenten dan op allen V1_... een 2 hebben zou ik die een 1 op de nieuw aangemaakte variabele geven. In de syntax (ik hoop dat je wel met syntaxen werkt) kan je dat als volgt uitschrijven:
IF ((V1_1 = 2) and (V1_2 = 2) and (V1_3 = 2) and enz ...) V1_X = 2. En V1_X is dan de 'geen van deze' categorie.

meerepeer

dinsdag 26 april 2011 @ 09:58

Bedankt voor je reactie. Ik weet niet of ik met syntaxen werk, aangezien de term mij niks zegt. Ik dacht uit jouw antwoord te begrijpen dat ik een extra antwoordkeuze + code/label moest maken. Dit heb ik gedaan, waardoor ik 1=ja, 2=nee, 3=geen van allen, 9=geen antwoord (de missing value code). Maar... Geen verschil helaas

Dus waarschijnlijk heb jij iets anders bedoeld. Vanmiddag heb ik tijd, dan ga ik syntaxen even googlen en verder proberen.

Ik vind het nog steeds vreemd dat hij ze als missing ziet, wanneer het gewoon een antwoordoptie is.

meerepeer

dinsdag 26 april 2011 @ 18:40

Ik heb het inmiddels anders opgelost. Ik heb van de antwoordvariabelen de 'Valid Percent' overgenomen en in de multiple response tabel de 'Percent of Case' vervangen. Van daaruit heb ik weer twee grafieken kunnen maken, met de 'Valid percent' én het aandeel dat zij hebben van het totale aantal aangekruiste antwoorden. Meer heb ik niet nodig, dus ik ben blij! Het is ietsje meer werk, maar zeker te verwaarlozen.

Evengoed bedankt!

Dalliance

woensdag 27 april 2011 @ 14:04

Ik heb ook een vraag; hoe verwerkt je in SPSS een vraag met gecombineerde antwoordmogelijkheden? Voorbeeld:

Vraag x (meerdere antwoorden mogelijk)
Antwoord 1
Antwoord 2
Antwoord 3
Anders, nl.

Hoe verwerk ik dit in SPSS en welk meetniveau moet daaraan worden toegekend?

crossover

woensdag 27 april 2011 @ 22:06

quote:
Op woensdag 27 april 2011 14:04 schreef Dalliance het volgende:
Ik heb ook een vraag; hoe verwerkt je in SPSS een vraag met gecombineerde antwoordmogelijkheden? Voorbeeld:

Vraag x (meerdere antwoorden mogelijk)
Antwoord 1
Antwoord 2
Antwoord 3
Anders, nl.

Hoe verwerk ik dit in SPSS en welk meetniveau moet daaraan worden toegekend?

Heb je zelf al gezocht? Nee he? Met de termen 'define multiple response sets spss' vind je maar 112.000 resultaten. Maar vooruit, omdat ik zo aardig ben:

Op deze manier maakt spss één variabele van meerdere variabelen. Je kan hier een aantal berekeningen mee kunt maken (frequencies en crosstabs). Dit kan via analyze multiple responses - frequencies of crosstabs.

Dalliance

woensdag 27 april 2011 @ 22:40

quote:
Op woensdag 27 april 2011 22:06 schreef crossover het volgende:

[..]

Heb je zelf al gezocht? Nee he? Met de termen 'define multiple response sets spss' vind je maar 112.000 resultaten. Maar vooruit, omdat ik zo aardig ben:

Op deze manier maakt spss één variabele van meerdere variabelen. Je kan hier een aantal berekeningen mee kunt maken (frequencies en crosstabs). Dit kan via analyze multiple responses - frequencies of crosstabs.

Je hebt gelijk, zelf heb ik niet gezocht. Ik stelde de vraag voor mijn afstudeerpartner die zich momenteel bukt over het opstellen van het codeboek. Niettemin bedankt

crossover

donderdag 28 april 2011 @ 18:27

Geen probleem

Zocalo

woensdag 4 mei 2011 @ 09:52

Ik heb een multiple regression met meerder modellen, waarvan ik bij de laatste de interactie wil toetsen tussen twee variabelen. Hoe krijg ik bij de output een interaction plot te zien welke richting de interactie op gaat?

Dalliance

woensdag 4 mei 2011 @ 11:14

quote:
Op woensdag 27 april 2011 22:06 schreef crossover het volgende:

[..]

Heb je zelf al gezocht? Nee he? Met de termen 'define multiple response sets spss' vind je maar 112.000 resultaten. Maar vooruit, omdat ik zo aardig ben:

Op deze manier maakt spss één variabele van meerdere variabelen. Je kan hier een aantal berekeningen mee kunt maken (frequencies en crosstabs). Dit kan via analyze multiple responses - frequencies of crosstabs.

Om hier op terug te komen, dit blijkt niet te zijn wat wij bedoelen.

Het gaat dus om het verwerken van een vraag naar het codeboek (het tabblad 'view data'). Om deze vraag gaat het:

quote:
6) Waarom heeft u (........)? (meerdere antwoorden zijn mogelijk)
 ik was ....
 deze mogelijkheid ...
 ik wilde ....
 anders, namelijk..…………………………… …………………………………………………

Wij denken iedere antwoordmogelijkheid in het codeboek op te nemen als 6a, 6b, 6c etc, maar waar laten we de 'geen informatie' optie voor als vraag 6 in zijn geheel niet is ingevuld?

crossover

woensdag 4 mei 2011 @ 21:57

Wat gebeurt er als je missing value opgeeft bij alle vier de variabelen?

Coacheling

maandag 9 mei 2011 @ 23:48

In SPSS heb ik de 0 gebruikt alszijnde n.v.t., de overige getallen lopen van 1= Geheel oneens t/m 5= Geheel eens.
Nu ben ik de standaard gegevens per variabele aan het kijken en vroeg ik me af of mijn uitkomsten wel kloppen nu die 0 is meegerekend.
De 999 heb ik al in gebruik als mensen de vraag niet hebben ingevuld.

oompaloompa

maandag 9 mei 2011 @ 23:49

quote:
Op maandag 9 mei 2011 23:48 schreef Coacheling het volgende:
In SPSS heb ik de 0 gebruikt alszijnde n.v.t., de overige getallen lopen van 1= Geheel oneens t/m 5= Geheel eens.
Nu ben ik de standaard gegevens per variabele aan het kijken en vroeg ik me af of mijn uitkomsten wel kloppen nu die 0 is meegerekend.
De 999 heb ik al in gebruik als mensen de vraag niet hebben ingevuld.

Nee, je moet die 0 meenemen als missing value o.i.d.
Ligt een beetje aan je operationalisering van n.v.t

Coacheling

maandag 9 mei 2011 @ 23:59

De 0 alszijnde niet van toepassing heb ik gebruikt voor de mensen die eigenlijk die vraag niet hoefden in te vullen zodat ze niets zouden hoeven overslaan.
Die 0 als missing value kan ik die in hetzelfde rijtje invullen als die 999? ( Variable view -> Missing values
-> discrete missing values) en dan in het tweede hokje de 0?

oompaloompa

dinsdag 10 mei 2011 @ 00:01

quote:
Op maandag 9 mei 2011 23:59 schreef Coacheling het volgende:
De 0 alszijnde niet van toepassing heb ik gebruikt voor de mensen die eigenlijk die vraag niet hoefden in te vullen zodat ze niets zouden hoeven overslaan.
Die 0 als missing value kan ik die in hetzelfde rijtje invullen als die 999? ( Variable view -> Missing values
-> discrete missing values) en dan in het tweede hokje de 0?

In principe wel. Als je voor je onderzoek een verschil aan wil geven tussen de mensen die niks ingevuld hebben en de n.v.t. zou je eventueel een dummy-variabele aan kunnen maken die b.v. 1 is voor de n.v.t. mensen en 0 voor de rest. Dan kun je die er los van de echte missing values uit filteren en zou je evt. nog een proportie analyse o.i.d. daar op kunnen doen.

Coacheling

dinsdag 10 mei 2011 @ 00:13

Ik kan al eerder de mensen filteren die op een eerdere vraag negatief hebben geantwoord waardoor deze vragen door hun zouden moeten worden beantwoord met n.v.t. Ik zal dus inderdaad morgen mijn data moeten aanpassen en frequenties even opnieuw uitdraaien.
Super bedankt!

oompaloompa

dinsdag 10 mei 2011 @ 00:23

quote:
Op dinsdag 10 mei 2011 00:13 schreef Coacheling het volgende:
Ik kan al eerder de mensen filteren die op een eerdere vraag negatief hebben geantwoord waardoor deze vragen door hun zouden moeten worden beantwoord met n.v.t. Ik zal dus inderdaad morgen mijn data moeten aanpassen en frequenties even opnieuw uitdraaien.
Super bedankt!

n.p. succes!

Dutchie11

dinsdag 10 mei 2011 @ 14:50

Voor mijn bachelorscriptie doe ik een onderzoek naar het effect van instructie en ik heb een vraag over welke test ik moet uitvoeren in SPSS.

Korte omschrijving onderzoek:

Onderzoek op basisschool en middelbare school. Beide schooltypes ingedeeld in 3 groepen:
1. Engelse instructie
2. Nederlandse instructie
3. Geen instructie (controle groep)

Alle groepen hebben 3 toetsen gedaan: 1 pre-instructie, 2 post instructie.

Ik heb dus 2 independent variabelen (schooltype, soort instructie) en 1 dependent (test score).

Ik wil uitzoeken welke instructiegroep beter presteert: Engelse instructie of Nederlandse instructie. Hiervoor heb ik een Kruskal-Wallis test gedaan, maar die resultaten helpen me niet verder.

Ik wil graag resultaten die zeggen:
basisschool, test 1, Engelse instructie
basisschool, test 1, Nederlandse instructie en zo verder voor alle testen; hetzelfde voor de middelbare school.

Kruskal-Wallis geeft óf resultaten per test voor basisschool en middelbare school samen óf resultaten per soort instructie (zonder te splitsen voor schooltype), terwijl ik graag resultaten zou willen van de combi (schooltype + soort instructie). Maar Kruskal-Wallis geeft die resultaten niet.

Is er iemand die een idee heeft welke test ik zou moeten uitvoeren? Ik heb nooit statistiek gehad en loop nu vast. Alvast bedankt!

[ Bericht 0% gewijzigd door Dutchie11 op 10-05-2011 14:51:08 (Typo) ]

oompaloompa

dinsdag 10 mei 2011 @ 16:14

quote:
Op dinsdag 10 mei 2011 14:50 schreef Dutchie11 het volgende:
Voor mijn bachelorscriptie doe ik een onderzoek naar het effect van instructie en ik heb een vraag over welke test ik moet uitvoeren in SPSS.

Korte omschrijving onderzoek:

Onderzoek op basisschool en middelbare school. Beide schooltypes ingedeeld in 3 groepen:
1. Engelse instructie
2. Nederlandse instructie
3. Geen instructie (controle groep)

Alle groepen hebben 3 toetsen gedaan: 1 pre-instructie, 2 post instructie.

Ik heb dus 2 independent variabelen (schooltype, soort instructie) en 1 dependent (test score).

Ik wil uitzoeken welke instructiegroep beter presteert: Engelse instructie of Nederlandse instructie. Hiervoor heb ik een Kruskal-Wallis test gedaan, maar die resultaten helpen me niet verder.

Ik wil graag resultaten die zeggen:
basisschool, test 1, Engelse instructie
basisschool, test 1, Nederlandse instructie en zo verder voor alle testen; hetzelfde voor de middelbare school.

Kruskal-Wallis geeft óf resultaten per test voor basisschool en middelbare school samen óf resultaten per soort instructie (zonder te splitsen voor schooltype), terwijl ik graag resultaten zou willen van de combi (schooltype + soort instructie). Maar Kruskal-Wallis geeft die resultaten niet.

Is er iemand die een idee heeft welke test ik zou moeten uitvoeren? Ik heb nooit statistiek gehad en loop nu vast. Alvast bedankt!

Gewoon een Anova - regressie?

dinsdag 10 mei 2011 @ 16:17

Bij onderzoeken in verschillende klassen gaat bij mij altijd het 'multi level analyse' belletje rinkelen en loop ik naar een methodoloog. Weet niet of dat hier ook geldt overigens. Heb geen verstand van 'multi level analyses' .

oompaloompa

dinsdag 10 mei 2011 @ 16:25

multilevel heeft niet zoveel zin met maar 2 groepen

Ik zou gewoon een univariate analysis (of regressie is uitiendelijk hetzelfde) doen. Schooltype & instructie als independents, test score als dependent.

(behalve als ik het verkeerd begrijp en ze3 testen per persoon hebben gedaan, dan repeated measures)

Dutchie11

dinsdag 10 mei 2011 @ 17:41

quote:
Op dinsdag 10 mei 2011 16:25 schreef oompaloompa het volgende:
multilevel heeft niet zoveel zin met maar 2 groepen

Ik zou gewoon een univariate analysis (of regressie is uitiendelijk hetzelfde) doen. Schooltype & instructie als independents, test score als dependent.

(behalve als ik het verkeerd begrijp en ze3 testen per persoon hebben gedaan, dan repeated measures)

Dat laatste klopt, alle deelnemers (n=110) hebben 3 testen gedaan. Repeated measures is een parametric test toch? Als ik kijk naar mijn variabelen (nominal en ratio) dan zou ik een non-parametric test moeten uitvoeren (als ik het goed begrijp). Vandaar dat ik bij Kruskal-Wallis uitkwam. Bestaat er uberhaupt een non-parametric variant van repeated measures?

Iig bedankt voor de reacties!!

Coacheling

woensdag 11 mei 2011 @ 18:20

Voor regressie moet je minimaal op intervalniveau zitten voor zover ik begrijp. Non-parametrisch kun je testen als je steekproef niet normaal verdeeld is of als je een kleine 'n' hebt.
Een non-parametrische test met drie of meer afhankelijke steekproeven is de Friedmantoets.
Die heeft 2 voorwaarden:
- het gaat om 3 of meer afhankelijke steekproeven
- testvariabele is (minimaal) op ordinaal niveau gemeten.

Ik weet niet of je er iets aan hebt, ik hoop het.
Zelf gebruik ik graag:
Baarda, Goede de & Dijkum van (2007) Basisboek statistiek met SPSS: Handleiding voor het verwerken en analyseren van en rapporteren over (onderzoeks)gegevens.(3e dr.) Houten: Noordhoff Uitgevers Groningen.

(sorry, kon ik weer even APA oefenen)

Eens zien, vraagje.
Ik heb een schaalconstruct met 2 items en een Cronbach's alpha van 0.697
Moet ik hier moeilijk over gaan denken, weglaten of kan ik hem als betrouwbaar zien?

oompaloompa

woensdag 11 mei 2011 @ 18:36

quote:
Op woensdag 11 mei 2011 18:20 schreef Coacheling het volgende:
Voor regressie moet je minimaal op intervalniveau zitten voor zover ik begrijp.

nee hoor, gewoon met dummies, regressie analyses zijn namelijk eigenlijk precies hetzelfde als anovas.

quote:
Eens zien, vraagje.
Ik heb een schaalconstruct met 2 items en een Cronbach's alpha van 0.697
Moet ik hier moeilijk over gaan denken, weglaten of kan ik hem als betrouwbaar zien?

Daar zijn geen vaste waardes voor, ligt dus een beetje aan je theorie.
Het is een redelijk lage alpha, wat dat betekent kun je alleen interpreteren door te weten wat je precies hebt gedaan.

b.v. als je een bestaande, gevalideerde, schaal hebt gebruikt, zou je alpha veel hoger moeten zijn en is dat dus een hint om je sample wat beter te gaan bekijken.

Als het 2 vragen zijn waarvan je verwacht dat ze verband zouden moeten houden is het misschien een stuk minder erg.

Coacheling

woensdag 11 mei 2011 @ 18:49

Weet ik dat van die regressie ook weer

Met betrekking tot die alpha, ik heb geleerd dat een schaal pas voldoende homogeen is vanaf een alpha van 0.70 en afgerond is die dat ook. Ik had inderdaad verwacht dat deze items samen zouden hangen. Zal morgen eens vragen wat de methodologie docente ervan denkt.

oompaloompa

woensdag 11 mei 2011 @ 19:43

quote:
Op woensdag 11 mei 2011 18:49 schreef Coacheling het volgende:
Weet ik dat van die regressie ook weer

Met betrekking tot die alpha, ik heb geleerd dat een schaal pas voldoende homogeen is vanaf een alpha van 0.70 en afgerond is die dat ook. Ik had inderdaad verwacht dat deze items samen zouden hangen. Zal morgen eens vragen wat de methodologie docente ervan denkt.

Er zijn vuistregels die je leert, meestal zijn die redelijk arbitrair, zoals de alpha van .70
Daarnaast het je wat er gebeurt & wat interessant is, wat je mensen wil vertellen, dan zijn die arbitraire grenzen opeens wat minder interessant en gaat het om de context.

Dutchie11

woensdag 11 mei 2011 @ 20:39

quote:
Op woensdag 11 mei 2011 18:20 schreef Coacheling het volgende:
Voor regressie moet je minimaal op intervalniveau zitten voor zover ik begrijp. Non-parametrisch kun je testen als je steekproef niet normaal verdeeld is of als je een kleine 'n' hebt.
Een non-parametrische test met drie of meer afhankelijke steekproeven is de Friedmantoets.
Die heeft 2 voorwaarden:
- het gaat om 3 of meer afhankelijke steekproeven
- testvariabele is (minimaal) op ordinaal niveau gemeten.

Ik weet niet of je er iets aan hebt, ik hoop het.
Zelf gebruik ik graag:
Baarda, Goede de & Dijkum van (2007) Basisboek statistiek met SPSS: Handleiding voor het verwerken en analyseren van en rapporteren over (onderzoeks)gegevens.(3e dr.) Houten: Noordhoff Uitgevers Groningen.

(sorry, kon ik weer even APA oefenen)

Ik ga me eens verdiepen in de Friedman, kijken of daar dingen uitkomt waar ik wat aan heb (/wat van snap

). Bedankt voor het meedenken iig!

Je boektip onthou ik voor de volgende keer! (als ik nog durf haha). Nu helaas geen gelegenheid om bij de bib te komen (iets met operatie en 6 weken niet lopen...), zal het moeten doen met de 4 SPSS boeken die ik heb. En google

oompaloompa

woensdag 11 mei 2011 @ 21:05

quote:
Op woensdag 11 mei 2011 20:39 schreef Dutchie11 het volgende:

[..]

Ik ga me eens verdiepen in de Friedman, kijken of daar dingen uitkomt waar ik wat aan heb (/wat van snap ). Bedankt voor het meedenken iig!

Je boektip onthou ik voor de volgende keer! (als ik nog durf haha). Nu helaas geen gelegenheid om bij de bib te komen (iets met operatie en 6 weken niet lopen...), zal het moeten doen met de 4 SPSS boeken die ik heb. En google

Maar waarom zou je een non-parametrische toets doen als je gewoon een parametrische kunt gebruiken?
Non-parametrische zijn "slechtere" toetsen die je doet wanneer je data niet aan de assumpties van b.v. anova's voldoen...

(Overigens zijn non-parametrische testen juist niet geschikt bij een kleine n omdat ze veel minder power hebben)

[ Bericht 5% gewijzigd door oompaloompa op 11-05-2011 21:23:38 ]

Coacheling

donderdag 12 mei 2011 @ 08:30

Hmm, vaag.... Ik moet sommige toetsen juist non-parametrisch doen omdat ik een kleine n heb uit een populatiesteekproef omdat ze anders niet betrouwbaar zouden zijn :-S Ga vanmiddag eerst op school eens even de oren van het hoofd zeuren. Dit is echt ontmoedigend. Laat wel weten wat ze daar zeggen.

@dutchie, natuurlijk durf je volgende keer nog!

[ Bericht 20% gewijzigd door Coacheling op 12-05-2011 08:40:48 ]

donderdag 12 mei 2011 @ 11:08

Wij gebruiken vaak dit boek. Puik boek.

oompaloompa

donderdag 12 mei 2011 @ 11:17

quote:
Op donderdag 12 mei 2011 08:30 schreef Coacheling het volgende:
Hmm, vaag.... Ik moet sommige toetsen juist non-parametrisch doen omdat ik een kleine n heb uit een populatiesteekproef omdat ze anders niet betrouwbaar zouden zijn :-S Ga vanmiddag eerst op school eens even de oren van het hoofd zeuren. Dit is echt ontmoedigend. Laat wel weten wat ze daar zeggen.

@dutchie, natuurlijk durf je volgende keer nog!

Nou, parametrische toetsen hebben een lagere power, gevolg is dus dat je vooral bij lage n minder snel significante resultaten zult vinden, ook al zijn die er wel als je een non-parametrische toets doet.

Wat wel zo is, is dat je moet voldoen aan alle assumpties om een parametrische toets te kunnen doen. Het kan zijn dat je door de lage n niet voldoet aan de assumpties van een parametrische toets en daardoor een non-parametrische gaat gebruiken ondanks de lage power. Maar als dat zo is hadden ze dat wel duidelijker uit mogen leggen

Dutchie11

vrijdag 13 mei 2011 @ 17:36

quote:
Op woensdag 11 mei 2011 21:05 schreef oompaloompa het volgende:

[..]

Maar waarom zou je een non-parametrische toets doen als je gewoon een parametrische kunt gebruiken?
Non-parametrische zijn "slechtere" toetsen die je doet wanneer je data niet aan de assumpties van b.v. anova's voldoen...

(Overigens zijn non-parametrische testen juist niet geschikt bij een kleine n omdat ze veel minder power hebben)

Ik heb 2x nominal (schooltype, instructie type) en 1 ratio variable (test scores), en de boeken die ik gebruik geven aan dat je dan een non-parametrische test moet doen. Dus daar ben ik maar op afgegaan, aangezien mijn statistische kennis (heel wat) te wensen overlaat

Maakt dat dan niet zoveel uit als de data wél aan de assumpties voldoet?

_{Net terug uit het ziekenhuis na operatie, dus ik snap het nog minder dan als ik wel helder ben...}

oompaloompa

vrijdag 13 mei 2011 @ 17:54

quote:
Op vrijdag 13 mei 2011 17:36 schreef Dutchie11 het volgende:

[..]

Ik heb 2x nominal (schooltype, instructie type) en 1 ratio variable (test scores), en de boeken die ik gebruik geven aan dat je dan een non-parametrische test moet doen. Dus daar ben ik maar op afgegaan, aangezien mijn statistische kennis (heel wat) te wensen overlaat

Maakt dat dan niet zoveel uit als de data wél aan de assumpties voldoet?

_{Net terug uit het ziekenhuis na operatie, dus ik snap het nog minder dan als ik wel helder ben...}

Dan heb je een heel erg verkeerd boek (of misschien niet zo goed gelezen?).

Als de data wel aan de assumpties voldoet, is de kans vrij groot dat je sterkere resultaten zult krijgen uit b.v. een regressie omdat je met minder ruis rekening hoeft te houden.

& beterschap / herstel ze!

Dutchie11

vrijdag 13 mei 2011 @ 18:02

quote:
Op vrijdag 13 mei 2011 17:54 schreef oompaloompa het volgende:

[..]

Dan heb je een heel erg verkeerd boek (of misschien niet zo goed gelezen?).

Als de data wel aan de assumpties voldoet, is de kans vrij groot dat je sterkere resultaten zult krijgen uit b.v. een regressie omdat je met minder ruis rekening hoeft te houden.

& beterschap / herstel ze!

Dan ga ik dat nog eens goed nakijken. Bedankt!
Nu eerst herstellen, valt toch altijd vies tegen, zo'n operatie pffff.

[ Bericht 0% gewijzigd door Dutchie11 op 13-05-2011 18:03:09 (Typo...fijn narcose ;)) ]

Coacheling

zaterdag 14 mei 2011 @ 16:30

En daar zijn we weer, dit keer met de Kruskal-wallistoets.

Dit komt eruit:
Gemiddelde deskundigheid
N Mean rank
School 1 11 23.32
School 2 15 19.23
School 3 11 14.36

Chi2 = 3.817
df = 2
Asymp.Sig. = 0.148

Ik begrijp dus dat de uitkomst niet significant is, er is 15% kans dat de uitkomst niet klopt.
Maar, wat zegt die Chi2, die 3.817 ? Ik kan er niet op komen en ik kan het ook niet makkelijk terug vinden.

Dutchie11

zaterdag 14 mei 2011 @ 17:20

quote:
Op zaterdag 14 mei 2011 16:30 schreef Coacheling het volgende:
En daar zijn we weer, dit keer met de Kruskal-wallistoets.

Dit komt eruit:
Gemiddelde deskundigheid
N Mean rank
School 1 11 23.32
School 2 15 19.23
School 3 11 14.36

Chi2 = 3.817
df = 2
Asymp.Sig. = 0.148

Ik begrijp dus dat de uitkomst niet significant is, er is 15% kans dat de uitkomst niet klopt.
Maar, wat zegt die Chi2, die 3.817 ? Ik kan er niet op komen en ik kan het ook niet makkelijk terug vinden.

Die Chi2 snap ik ook niet, ik weet alleen dat df staat voor 'degrees of freedom'. Heb Kruskal Wallis ook gedaan, maar idd heel lastig te vinden wat de uitkomst nou betekent.

Coacheling

zaterdag 14 mei 2011 @ 17:29

Wat het totaal betekend weet ik wel, hoe het zo komt begrijp ik ook inmiddels (die rank valt nog niet helemaal maar wel ver) en significantie en df is ook geen probleem, alleen die Chi2 kan ik niet plaatsen

mies1983

zaterdag 14 mei 2011 @ 17:58

quote:
Op zaterdag 14 mei 2011 17:29 schreef Coacheling het volgende:
Wat het totaal betekend weet ik wel, hoe het zo komt begrijp ik ook inmiddels (die rank valt nog niet helemaal maar wel ver) en significantie en df is ook geen probleem, alleen die Chi2 kan ik niet plaatsen

3.817 is de waarde van de toetsingsgrootheid die blijkbaar onder de nulhypothese een chi-kwadraat verdeling volgt met 2 vrijheidsgraden.

Coacheling

zaterdag 14 mei 2011 @ 18:07

Dankjewel Mies, maar heeft dat getal een bepaalde waarde die 'goed' of 'slecht' is, wat zegt het?

oompaloompa

zaterdag 14 mei 2011 @ 19:44

quote:
Op zaterdag 14 mei 2011 16:30 schreef Coacheling het volgende:
En daar zijn we weer, dit keer met de Kruskal-wallistoets.

Dit komt eruit:
Gemiddelde deskundigheid
N Mean rank
School 1 11 23.32
School 2 15 19.23
School 3 11 14.36

Chi2 = 3.817
df = 2
Asymp.Sig. = 0.148

Ik begrijp dus dat de uitkomst niet significant is, er is 15% kans dat de uitkomst niet klopt.
Maar, wat zegt die Chi2, die 3.817 ? Ik kan er niet op komen en ik kan het ook niet makkelijk terug vinden.

de chi-square is gewoon een verdelingsmaat. Hetzelfde als een F bij een anova of een T bij een t-toets. De combinatie toets-waarde (in dit geval chi-square) en df leidt tot de sig.

Ik snap alleen nog steeds niet waarom je een kruskal wallis zou doen

Coacheling

zaterdag 14 mei 2011 @ 20:00

Tja, methodologiedocent.. Verschilvraag, kleine steekproef, ordinaal niveau, 3 variabelen... Ik ben op het moment de weg kwijt dus ik doe gewoon wat er gezegd is.
Wat zou jij aanraden dan?

oompaloompa

zaterdag 14 mei 2011 @ 20:37

maar je afhankelijke is toch niet ordinaal verdeeld?
Je hebt toch gewoon een likert-schaaltje (helemaal oneens -- helemaal eens o.i.d.) die kun je gewoon als interval gebruiken.
Dan gewoon anova

in spss: univariate, school & je andere onafhankelijke als independents toevoegen, test ie main-effects en interactie.

Coacheling

zaterdag 14 mei 2011 @ 20:39

Dat dacht ik dus ook, maar helaas.

oompaloompa

zaterdag 14 mei 2011 @ 20:44

op welke school / uni zit je?
Ik weet niet of je hier precies getypt hebt wat de situatie met je data is, maar je statistiek docent lijkt me een beetje een mongool als ik dat allemaal zo hoor

Coacheling

zaterdag 14 mei 2011 @ 20:48

Fontys, maar het zal wel aan mijn verwoording van de situatie liggen. Zij heeft ervoor gestudeerd, ik niet...

oompaloompa

zaterdag 14 mei 2011 @ 20:52

quote:
Op zaterdag 14 mei 2011 20:48 schreef Coacheling het volgende:
Fontys, maar het zal wel aan mijn verwoording van de situatie liggen. Zij heeft ervoor gestudeerd, ik niet...

Nou ja ik ook

Ik weet niet of het voor iets belangrijks is of slechts een opdracht, maar als het b.v. voor je scriptie is zou ik voor de gein toch even een anova doen. Zou dat wel significant zijn, is et misschien de moeite waard toch even precies na te gaan hoe het zit. Als je wilt kun je me ook je data-set & vragen sturen, kijk ik er even naar.

Ook nog een vraagje van mezelf:
Ik heb 4 condities.
In 2 van die 4 condities verwacht ik een effect van conditie op mijn uiteindelijke variabele Y.
Ik verwacht mediatie van M, maar natuurlijk alleen in die twee condities.

Nou lopen die 2 condities significant van conditie naar M, de 2 controle condities niet.
Ook zit er een sig verband tussen M en Y.

Maar Sobel kan alleen met 2 condities (afaik). Weet iemand een toets / macro die ik voor mediatie in meer dan 1 conditie kan gebruiken?
Of kan ik gewoon twee losse Sobel-testen doen ten opzichte van de 2 controle condities samen genomen?

Coacheling

zaterdag 14 mei 2011 @ 21:30

Ik zat net te kijken bij de voorwaarden voor een ANOVA. Een van de voorwaarden is per niet gekoppelde steekproef minimaal 25 proefpersonen, die heb ik niet dus dan houdt het op...

Het was niet mijn bedoeling je voor het hoofd te stoten hoor, ik ben ontzettend blij met je hulp!
Het is inderdaad voor mijn scriptie...

Met jouw vraag kan ik je absoluut niet helpen, het klinkt wel heel logisch, maar ik ken echt een minimaal aantal testen

Wat doe je voor onderzoek? Ben verder niet nieuwsgierig hoor

oompaloompa

dinsdag 17 mei 2011 @ 12:41

quote:
Op zaterdag 14 mei 2011 21:30 schreef Coacheling het volgende:
Ik zat net te kijken bij de voorwaarden voor een ANOVA. Een van de voorwaarden is per niet gekoppelde steekproef minimaal 25 proefpersonen, die heb ik niet dus dan houdt het op...

Het was niet mijn bedoeling je voor het hoofd te stoten hoor, ik ben ontzettend blij met je hulp!
Het is inderdaad voor mijn scriptie...

Met jouw vraag kan ik je absoluut niet helpen, het klinkt wel heel logisch, maar ik ken echt een minimaal aantal testen Wat doe je voor onderzoek? Ben verder niet nieuwsgierig hoor

Dat post ik liever niet zo op het internet, kan je wel pm-en als je wilt?

Mijn aanbod over de data blijft ook staan trouwens, die 25 is ook maar een arbitrair nummer en afhankelijk van veel andere zaken. Weet alleen niet of moeilijk er over doen je wat oplevert of alleen maar veel moeite zal kosten.

Pinklady89

dinsdag 17 mei 2011 @ 20:02

Oke, ik maak wss een hele domme fout, maar is er iemand die me vertelt wat ik verkeerd doe en nog belangrijker: hoe ik het goed doe?

Ik wil een x aantal vragen ompolen. Nu heb ik de volgende "handleiding" opgevolgd:

quote:
Als voorbeeld wordt gebruik gemaakt van een 7-puntsschaal. Ompolen doe je bij Transform/Recode/Into Different Variables. Je selecteert de om te polen variabelen, geeft hen een iets gewijzigde naam bij Output Variable (afstand wordt bijvoorbeeld afstand1) en vult bij old en new values de volgende transformaties in: 1 wordt 7, 2 wordt 6, 3 wordt 5, 4 wordt 4, 5 wordt 3, 6 wordt 2 en 7 wordt 1. Nadat je op OK hebt gedrukt, moet je nog een keer op Change drukken, en dan nog een keer op OK. In je dataset zie je dat er aan de rechterkant een kolom is
bijgekomen met je nieuwe variabele.

(Bron: http://www.gmw.rug.nl/~methodologiewinkel/index?id=265)

Dat gaat tot op zekere hoogte goed, want ik krijg een nieuwe kolom erbij.

quote:
Nadat je op OK hebt gedrukt, moet je nog een keer op Change drukken, en dan nog een keer op OK

Nog een keer op "change" drukken kan niet. Op OK klikken kan wel.

Maar dan het resultaat: in mijn 'variable view' staat dan 'values' en 'missing' niet ingevuld. Bij 'columns' staan "vreemde" getallen (10, 12, 20, etc.; bij de andere variabelen staat 8). Het meest aparte is dus: als ik dan iets bij de oorspronkelijke variabele invul, dan staat er dus niets bij de omgepoolde variant.
Ik heb versie 17.0 (maakt dat iets uit?).

Begrijpt iemand hier wat er verkeerd gaat?

oompaloompa

dinsdag 17 mei 2011 @ 20:21

quote:
Op dinsdag 17 mei 2011 20:02 schreef Pinklady89 het volgende:
Oke, ik maak wss een hele domme fout, maar is er iemand die me vertelt wat ik verkeerd doe en nog belangrijker: hoe ik het goed doe?

Ik wil een x aantal vragen ompolen. Nu heb ik de volgende "handleiding" opgevolgd:

[..]

(Bron: http://www.gmw.rug.nl/~methodologiewinkel/index?id=265)

Dat gaat tot op zekere hoogte goed, want ik krijg een nieuwe kolom erbij.

[..]

Nog een keer op "change" drukken kan niet. Op OK klikken kan wel.

Maar dan het resultaat: in mijn 'variable view' staat dan 'values' en 'missing' niet ingevuld. Bij 'columns' staan "vreemde" getallen (10, 12, 20, etc.; bij de andere variabelen staat 8). Het meest aparte is dus: als ik dan iets bij de oorspronkelijke variabele invul, dan staat er dus niets bij de omgepoolde variant.
Ik heb versie 17.0 (maakt dat iets uit?).

Begrijpt iemand hier wat er verkeerd gaat?

Kun je je syntax posten?
(nog een keer doen, i.p.v. ok op "paste" drukken en dan de tekst uit je syntax hierheen kopieren)

crossover

dinsdag 17 mei 2011 @ 22:13

Syntax zou er zo ongeveer uit moeten zien:

1 2	RECODE variabelenaam1 variabelenaam2 (1=5) (2=4) (3=3) (4=2) (5=1) INTO Rvariabelenaam1 Rvariabelenaam2 .

oompaloompa

dinsdag 17 mei 2011 @ 22:22

quote:
Op dinsdag 17 mei 2011 22:13 schreef crossover het volgende:
Syntax zou er zo ongeveer uit moeten zien:

[ code verwijderd ]

God heb ik me dus echt kapot lopen staren op hoe dat fout heeft kunnen gaan

Ananajasje

woensdag 18 mei 2011 @ 12:44

Ook ik kom er even niet uit...

Het gaat om ouderlijke betrokkenheid bij het kind en het verschil tussen vader en moeder uit gescheiden gezinnen.
Ik heb een variabele familiestructuur (codes: 1 = intacte gezin, 2 = gescheiden gezin). Een variabele 'betrokkenheid van moeder' (gemiddelde score per respondent) en een 'betrokkenheid van vader'. Nu wil ik alle 'gescheiden moeders' apart en alle 'gescheiden vaders' apart. Zodat ik later deze met een t-test kan vergelijken.

Hoe maak ik nou die nieuwe variabelen?

oompaloompa

woensdag 18 mei 2011 @ 12:51

quote:
Op woensdag 18 mei 2011 12:44 schreef Ananajasje het volgende:
Ook ik kom er even niet uit...

Het gaat om ouderlijke betrokkenheid bij het kind en het verschil tussen vader en moeder uit gescheiden gezinnen.
Ik heb een variabele familiestructuur (codes: 1 = intacte gezin, 2 = gescheiden gezin). Een variabele 'betrokkenheid van moeder' (gemiddelde score per respondent) en een 'betrokkenheid van vader'. Nu wil ik alle 'gescheiden moeders' apart en alle 'gescheiden vaders' apart. Zodat ik later deze met een t-test kan vergelijken.

Hoe maak ik nou die nieuwe variabelen?

betrokkeheid moeder - betrokkenheid vader

split file op familistructuur, daarna binnen gescheiden gezinnen alles met hogere betrokkenheid moeder dan vader = 1, lager = 2?

Ananajasje

woensdag 18 mei 2011 @ 13:19

quote:
Op woensdag 18 mei 2011 12:51 schreef oompaloompa het volgende:

[..]

betrokkeheid moeder - betrokkenheid vader

split file op familistructuur, daarna binnen gescheiden gezinnen alles met hogere betrokkenheid moeder dan vader = 1, lager = 2?

Die snap ik niet helemaal... Ik heb het nu zo gedaan: select cases en alleen de cases geselecteerd die een 2 hadden bij familiestructuur (dus gescheiden). Daarna een test gedaan waarbij ik betrokkenheid moeder en vader met elkaar vergelijk, dus dan pakt ie alleen de gescheiden ouders..

Maar die test. Is dat dan een one sample t-test, of een paired..? Ik weet niet of je hiermee rekening mee moet houden maar 1 respondent heeft een score gegeven voor de betrokkenheid van moeder en voor die van vader.. Ik dacht altijd dat je daar dan rekening mee moet houden en dat het dan een paired t-test is. Maar dan is het niet significant, bij de one sample t-test wel.

Iemand idee?