Ik zal kort uitleggen hoe ik het heb gedaan. In mijn enquete heb ik gevraagd naar de 'hoogst genoten opleiding'. Men kon kiezen uit Lagere school, VMBO, MBO, HAVO, VWO, HBO & WO. Aan de hand van mijn theorie kon ik dit reduceren naar laagopgeleid, middelbaar opgeleid en hoogopgeleid. Zodoende kreeg ik een nieuwe variabele onderverdeeld in 3 categorieën. Wat mijn begeleider zei is dat ik naast de eerdere toets die ik had uitgevoerd ook nog een ANOVA kon doen om meer uit mijn data te halen. Daar ben ik nu dus mee bezig. Door middel van een Post-Hoc test kan ik dan ook zien welke groepen van elkaar verschillen, alleen doordat middelbaar opgeleid uit 'maar' 18 mensen bestaat weet ik niet zeker of dit wel mag.quote:Op dinsdag 19 januari 2016 12:28 schreef Zith het volgende:
In studies zie ik eigenlijk altijd het aantal studiejaren staan, niet een BSc/MSc.. kan je niet het volgende doen om een enkele variabele te creeren?
VMBO: 4 (jaar)
MBO: 7 (VMBO+3)
HAVO: 5
HBO: 9 (HAVO+4)
VWO: 6
WO: 10 (VWO + 4)
Ik ben sowieso niet dol op SPSS inderdaad, maar het punt is ook dat ik voor mijn these afgezien van factoranalyse en IRT waarschijnlijk veel ga hebben aan zelfgeschreven control structures en functies, bovenop het feit dat een bepaalde analysemethode die ik moet gebruiken een R package is die geschreven is door mijn begeleider. Voor mijn scriptie heb ik sowieso functionaliteit van R nodig die SPSS niet biedt. Plus uitdaging natuurlijk. Vorig jaar heb ik al een vrij uitgebreide factoranalyse gedaan in SPSS voor een onderzoeksvak, dus dat is de moeite niet en ik begrijp prima wat het inhoudt. Ik weet alleen uit ervaring dat soms de meest simpele dingen in R voor een vastloper zorgen bij mij omdat ik dan net de verkeerde functie gebruik ofzo. Dus ik dacht, dan kan ik alvast even een notitie maken van wie hier ervaring heeft met dat soort analyses in R, dat ik weet waar ik terecht kan (wie ik een lok-quote moet sturen) met dat soort korte vragen.quote:Op dinsdag 19 januari 2016 12:37 schreef MCH het volgende:
Ik had volgens mij al gelezen dat je niet dol bent op SPSS maar Factoranalyse kun je toch heel makkelijk uitvoeren met dat programma?
Nog even naar jou: als je opleidingsniveau gesplitst hebt in drie dichotome variabelen is dat een beetje omslachtig, als je ze dummy codeert, houd je maar twee variabelen over. Dat is netter. (ik kan adhv wat je vertelt niet goed achterhalen hoe je die nu precies gecodeerd hebt) Je groepen zijn idioot scheef, dus de kans dat je een betrouwbaar significant resultaat vindt lijken me sowieso al klein. Of het mag of niet, tja. Heel eerlijk gezegd is het voor jou niet zo van belang of het 'mag' of niet. Als je nu een wetenschappelijk onderzoek met beurzen en publicaties zou uitvoeren, ja, dan moet je je daar wel echt even mee bezig houden. Maar jij schrijft een scriptie en dat betekent eigenlijk dat je begeleider bepaalt wat 'mag' en niet. Als hij zegt: doe een ANOVA, dan doe jij een ANOVA. Noem er dan wel even duidelijk bij in je methodesectie van je verslag dat de data eigenlijk hier en daar wat tegenwerpingen bevat (welke en waar en welk effect dat wellicht gaat hebben op je resultaten), maar dat je toch hebt gekozen de analyse uit te voeren. Ook in je discussie dan even naar terugkoppelen.quote:Op dinsdag 19 januari 2016 12:38 schreef fetX het volgende:
[..]
Ik zal kort uitleggen hoe ik het heb gedaan. In mijn enquete heb ik gevraagd naar de 'hoogst genoten opleiding'. Men kon kiezen uit Lagere school, VMBO, MBO, HAVO, VWO, HBO & WO. Aan de hand van mijn theorie kon ik dit reduceren naar laagopgeleid, middelbaar opgeleid en hoogopgeleid. Zodoende kreeg ik een nieuwe variabele onderverdeeld in 3 categorieën. Wat mijn begeleider zei is dat ik naast de eerdere toets die ik had uitgevoerd ook nog een ANOVA kon doen om meer uit mijn data te halen. Daar ben ik nu dus mee bezig. Door middel van een Post-Hoc test kan ik dan ook zien welke groepen van elkaar verschillen, alleen doordat middelbaar opgeleid uit 'maar' 18 mensen bestaat weet ik niet zeker of dit wel mag.
Omg dit is het! Ik ga even klooien. Thanks voor het in de goede richting duwen!quote:Op donderdag 21 januari 2016 16:30 schreef Z het volgende:
In R zo gepiept. Ik heb nu geen beschikking over SPSS maar het zou wel moeten kunnen in een syntax. Kan je niet eerst de geagregeerde gemiddelden uitrekenen in een aparte variabele en die waarden dan onder voorwaarde imputeren? Per rij krijgt iedereen dan eerst in een aparte variabele die je dan onder voorwaarde imputeert.
1 2 3 4 5 6 7 8 | 1 - 0,647 0,839 2 - 0,484 0,378 3 - 0,887 0,903 4 - 0,835 0,934 5 - 0,592 0,538 6 - 0,940 0,700 7 - 0,892 0,766 8 - 0,931 0,931 |
Ervan uitgaande dat je dataset groot genoeg is kun je een factoranalyse uitvoeren, of een PCA, om te zien of je geen echte multivariate afhankelijke variabele hebt. Het kan zijn dat land * jaar een heel goed fittend model geeft.quote:Op zaterdag 30 januari 2016 10:26 schreef Serinde het volgende:
Goedemorgen
Ik heb twee datasets, beide van een ander jaar. In de sets zitten gegevens van ondernemingen in 8 landen. In mijn onderzoek kijk ik naar de verklarende kracht van het model, de adjusted R2. De verwachting is dat de adj R2 in het tweede jaar hoger is dan in het eerste jaar. Het resultaat voldoet (totaal) niet aan verwachting: het eerste jaar is de uitkomst 0,662 en het tweede jaar 0,388 . Om te onderzoeken waardoor dit ontstaat, heb ik de lineaire regressie gedraaid voor alle afzonderlijke landen (1 t/m 8), per jaar. Dat geeft het volgende beeld:
[ code verwijderd ]
Ik weet niet welke stappen ik nu moet zetten. Als ik er zo naar kijk, dan lijkt het alsof beide jaren hetzelfde beeld laten zien. Maar als ik de regressie draai voor de gehele dataset ineens, komt het tweede jaar een stuk lager uit ... Dat vind ik erg raar. Maar misschien wel te verklaren? Twee jaar geleden heb ik wel een cursus statistiek gehad op de opleiding maar dit soort dingen zijn we daar niet tegengekomen en de kennis is helaas ook al behoorlijk weggezakt....
Het is logsich dat je grootste land een grote invloed heeft op de total r2. Maar belangrijk is ook of er per land een apart patroon is. Vooral landen waar het effect tegengesteld is aan anderen geeft een slechter model. Een grote variatie in effectsize ook.quote:Op maandag 1 februari 2016 21:05 schreef Serinde het volgende:
Er is in dat jaar een wezenlijke verandering doorgevoerd.
Maar door mijn vraag te stellen en het er met mijn vriend over te hebben, die niks weet van mijn vakgebied maar wel fijn logisch kan redeneren etc, denk ik dat ik weet wat er gebeurt. Cijfermatig vat ik het nog niet maar meer dan een derde van mijn dataset bestaat uit 1 land en in dat land is de r2 gedaald (#2 in het overzicht). Dit heeft een grote invloed op het totaalbeeld.
Overigens heeft deze methode zich in de literatuur uitgebreid bewezen, het ligt niet aan het model maar aan mij(n input). Dat is zeker
Ik droom hier niet over maar ik heb zo'n beetje nachtmerries geloof wel dat ik eerst weer verder kan.
Je hebt data van meerdere landen, over 2 jaar, waarvan er in 1 een beleidsverandering is doorgevoerd?quote:Op maandag 1 februari 2016 21:05 schreef Serinde het volgende:
Er is in dat jaar een wezenlijke verandering doorgevoerd.
Maar door mijn vraag te stellen en het er met mijn vriend over te hebben, die niks weet van mijn vakgebied maar wel fijn logisch kan redeneren etc, denk ik dat ik weet wat er gebeurt. Cijfermatig vat ik het nog niet maar meer dan een derde van mijn dataset bestaat uit 1 land en in dat land is de r2 gedaald (#2 in het overzicht). Dit heeft een grote invloed op het totaalbeeld.
Overigens heeft deze methode zich in de literatuur uitgebreid bewezen, het ligt niet aan het model maar aan mij(n input). Dat is zeker
Ik droom hier niet over maar ik heb zo'n beetje nachtmerries geloof wel dat ik eerst weer verder kan.
Als je 8 landen hebt moet je wel 1 land als ref. categorie gebruiken, dus 7 dummies.quote:Op maandag 1 februari 2016 22:14 schreef Serinde het volgende:
Bedankt voor jullie opmerkingen! Ik ga de suggesties nakijken (met het boek van Field erbij )
Ik had wat weinig informatie gegeven, ik heb 2 onafhankelijke variabelen met meetschaal ratio, een dummy voor het rechtssysteem in een land (0 of 1) en een dummy voor het land (1 tm 8, om ook per land iets te kunnen zeggen, al zijn voor sommige landen de waarnemingen beperkt). In alle landen heeft dezelfde wijziging plaatsgevonden, het effect wordt in alle landen positief verwacht, alleen het zal sterker zijn afhankelijk van het rechtssysteem.
Ik zie dat ook mijn begeleidster mijn mail beantwoord heeft. Ik heb eerst voldoende input om de komende dagen door te komen.
Toevoeging: ik heb ongeveer 750 cases per jaar.
De difference in difference komt me bekend voor uit een van de colleges van anderhalf jaar geleden.... Als ik die toepas (indien mogelijk, ik moet zoals gezegd e.e.a. uitzoeken) dan moet ik ook mijn eerste drie hoofdstukken aan gaan passen. Daar zit ik niet op te wachten. Maar wellicht een goede aanvulling en/of als robustnesscheck?! Ik zoek mijn bed op en ga morgen aan de slag. Nogmaals dank voor zover
Dan mis je dus ook nog een interactie (moderator) variabele in je regressiemodel!quote:Op maandag 1 februari 2016 22:14 schreef Serinde het volgende:
Bedankt voor jullie opmerkingen! Ik ga de suggesties nakijken (met het boek van Field erbij )
alleen het zal sterker zijn afhankelijk van het rechtssysteem.
Zijn er statistische pakketen die niet automatisch 1 van de dummies omit?quote:Op maandag 1 februari 2016 23:44 schreef MCH het volgende:
[..]
Als je 8 landen hebt moet je wel 1 land als ref. categorie gebruiken, dus 7 dummies.
Ik geloof dat SPSS dit niet doet want je moet sowieso handmatig die dummies toevoegen aan je dataset. Daarnaast moet Serinde dmv een Chow-Test eerst checken of ze de data van alle landen uberhaupt wel op 1 hoop mag gooien (poolen).quote:Op dinsdag 2 februari 2016 00:32 schreef Zith het volgende:
[..]
Zijn er statistische pakketen die niet automatisch 1 van de dummies omit?
quote:the Chow test is often used to determine whether the independent variables have different impacts on different subgroups of the population.
Chi-square:quote:Op maandag 15 februari 2016 15:23 schreef Mishu het volgende:
Welke test zou ik moeten uitvoeren om de percentages van 2 groepen op een categorische variabele (wel/niet financiële druk) te toetsen op een significant verschil?
En kan ik dezelfde toets vervolgens gebruiken om de groepen wel/niet financiële druk te testen op positieve/negatieve beleving van beleid?
En hoe voer ik dit uit in SPSS?
Ik ben niet zo scherp vandaag, maar wat bedoel je precies met confronteren?quote:Op woensdag 24 februari 2016 12:12 schreef joepp12 het volgende:
Hoera jongens en meisjes ik doe gezellig even mee!
Bezig met het verwerken van de vragenlijsten voor mijn afstudeerscriptie, nu is het zo dat ik nogal wat meerkeuzevragen heb die ik wil confronteren met vragen waarbij 1 antwoord mogelijk is.
Bijvoorbeeld:
(Meerkeuzevraag) In wat voor type organisatie bent u werkzaam?
- Optie 1
- Optie 2
- etc.
Confronteren met
(1 antwoord mogelijk) Is er binnen uw organisatie een inkoopafdeling aanwezig?
- Ja
- Nee
--------------------------------------------------------------------------------------------------------------
Ik zoek mij momenteel vrij scheel op het internet en tussen de opties, bij multiple response analyses kan ik wel multiple respons vragen met elkaar confronteren, maar niet met een vraag waar een antwoord mogelijk is.
Wanneer ik een grafiek wil maken, dan lukt dit ook niet met de multiple respons vraag. Heb de variabelen zo ingedeeld dat wanneer 1 is ingegeven in data view het antwoord aangevinkt is en 0 betekent dat het antwoord niet aangevinkt is.
Logischerwijs zou ik zeggen dat het mogelijk zou moeten zijn om alle 1'tjes (vinkjes) in een pie chart te zetten, ik kom hier echter niet helemaal uit.
De antwoorden op vraag twee vergelijken met 1 keuzemogelijkheid van vraag 1. Bijvoorbeeld:quote:Op woensdag 24 februari 2016 14:12 schreef Operc het volgende:
[..]
Ik ben niet zo scherp vandaag, maar wat bedoel je precies met confronteren?
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |