Centraal Statistiektopic (SPSS, R, excel, etc.) #9

dinsdag 19 januari 2016 @ 12:38:53 #2

fetX

Al bezig met volgend seizoen

quote:
Op dinsdag 19 januari 2016 12:28 schreef Zith het volgende:
In studies zie ik eigenlijk altijd het aantal studiejaren staan, niet een BSc/MSc.. kan je niet het volgende doen om een enkele variabele te creeren?

VMBO: 4 (jaar)
MBO: 7 (VMBO+3)
HAVO: 5
HBO: 9 (HAVO+4)
VWO: 6
WO: 10 (VWO + 4)

Ik zal kort uitleggen hoe ik het heb gedaan. In mijn enquete heb ik gevraagd naar de 'hoogst genoten opleiding'. Men kon kiezen uit Lagere school, VMBO, MBO, HAVO, VWO, HBO & WO. Aan de hand van mijn theorie kon ik dit reduceren naar laagopgeleid, middelbaar opgeleid en hoogopgeleid. Zodoende kreeg ik een nieuwe variabele onderverdeeld in 3 categorieën. Wat mijn begeleider zei is dat ik naast de eerdere toets die ik had uitgevoerd ook nog een ANOVA kon doen om meer uit mijn data te halen. Daar ben ik nu dus mee bezig. Door middel van een Post-Hoc test kan ik dan ook zien welke groepen van elkaar verschillen, alleen doordat middelbaar opgeleid uit 'maar' 18 mensen bestaat weet ik niet zeker of dit wel mag.

dinsdag 19 januari 2016 @ 13:21:33 #3

Sarasi

Quack.

quote:
Op dinsdag 19 januari 2016 12:37 schreef MCH het volgende:
Ik had volgens mij al gelezen dat je niet dol bent op SPSS maar Factoranalyse kun je toch heel makkelijk uitvoeren met dat programma?

Ik ben sowieso niet dol op SPSS inderdaad, maar het punt is ook dat ik voor mijn these afgezien van factoranalyse en IRT waarschijnlijk veel ga hebben aan zelfgeschreven control structures en functies, bovenop het feit dat een bepaalde analysemethode die ik moet gebruiken een R package is die geschreven is door mijn begeleider. Voor mijn scriptie heb ik sowieso functionaliteit van R nodig die SPSS niet biedt. Plus uitdaging natuurlijk.

Vorig jaar heb ik al een vrij uitgebreide factoranalyse gedaan in SPSS voor een onderzoeksvak, dus dat is de moeite niet en ik begrijp prima wat het inhoudt. Ik weet alleen uit ervaring dat soms de meest simpele dingen in R voor een vastloper zorgen bij mij omdat ik dan net de verkeerde functie gebruik ofzo.

Dus ik dacht, dan kan ik alvast even een notitie maken van wie hier ervaring heeft met dat soort analyses in R, dat ik weet waar ik terecht kan (wie ik een lok-quote moet sturen) met dat soort korte vragen.

(en ik vind stiekem dat R sowieso de betere keuze is omdat het de gebruiker dwingt te begrijpen wat er nu precies gebeurt)

Your opinion of me is none of my business.

dinsdag 19 januari 2016 @ 13:32:54 #4

Sarasi

Quack.

quote:
Op dinsdag 19 januari 2016 12:38 schreef fetX het volgende:

[..]

Ik zal kort uitleggen hoe ik het heb gedaan. In mijn enquete heb ik gevraagd naar de 'hoogst genoten opleiding'. Men kon kiezen uit Lagere school, VMBO, MBO, HAVO, VWO, HBO & WO. Aan de hand van mijn theorie kon ik dit reduceren naar laagopgeleid, middelbaar opgeleid en hoogopgeleid. Zodoende kreeg ik een nieuwe variabele onderverdeeld in 3 categorieën. Wat mijn begeleider zei is dat ik naast de eerdere toets die ik had uitgevoerd ook nog een ANOVA kon doen om meer uit mijn data te halen. Daar ben ik nu dus mee bezig. Door middel van een Post-Hoc test kan ik dan ook zien welke groepen van elkaar verschillen, alleen doordat middelbaar opgeleid uit 'maar' 18 mensen bestaat weet ik niet zeker of dit wel mag.

Nog even naar jou: als je opleidingsniveau gesplitst hebt in drie dichotome variabelen is dat een beetje omslachtig, als je ze dummy codeert, houd je maar twee variabelen over. Dat is netter. (ik kan adhv wat je vertelt niet goed achterhalen hoe je die nu precies gecodeerd hebt) Je groepen zijn idioot scheef, dus de kans dat je een betrouwbaar significant resultaat vindt lijken me sowieso al klein. Of het mag of niet, tja. Heel eerlijk gezegd is het voor jou niet zo van belang of het 'mag' of niet. Als je nu een wetenschappelijk onderzoek met beurzen en publicaties zou uitvoeren, ja, dan moet je je daar wel echt even mee bezig houden. Maar jij schrijft een scriptie en dat betekent eigenlijk dat je begeleider bepaalt wat 'mag' en niet. Als hij zegt: doe een ANOVA, dan doe jij een ANOVA. Noem er dan wel even duidelijk bij in je methodesectie van je verslag dat de data eigenlijk hier en daar wat tegenwerpingen bevat (welke en waar en welk effect dat wellicht gaat hebben op je resultaten), maar dat je toch hebt gekozen de analyse uit te voeren. Ook in je discussie dan even naar terugkoppelen.

Your opinion of me is none of my business.

dinsdag 19 januari 2016 @ 13:40:44 #5

wimjongil

Harde man

fetX: heb je al gekeken naar effect-coding van je opleidingsvariabele? Kan soms problemen oplossen die je met dummy-coding hebt.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

donderdag 21 januari 2016 @ 16:04:06 #6

yozd

FR1908 Vakkie R

Is het mogelijk om in SPSS missing values te vervangen door gemiddelde scores berekend over een bepaalde selectie?
Ik weet dat er een optie is om missing values te vervangen door het gemiddelde van een hele variabele, maar ik wil dat die bij cases A, B en C een andere selectie maakt waar die het gemiddelde van berekent dan bij cases X,Y en Z. Die selectie is dan gebaseerd op een bepaalde variabele (type_case) in de dataset.

Beetje ingewikkeld uitgelegd misschien, maar dat dus!

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

donderdag 21 januari 2016 @ 16:30:37 #7

In R zo gepiept. Ik heb nu geen beschikking over SPSS maar het zou wel moeten kunnen in een syntax. Kan je niet eerst de geagregeerde gemiddelden uitrekenen in een aparte variabele en die waarden dan onder voorwaarde imputeren? Per rij krijgt iedereen dan eerst in een aparte variabele die je dan onder voorwaarde imputeert.

Aldus.

donderdag 21 januari 2016 @ 17:10:55 #8

yozd

FR1908 Vakkie R

quote:
Op donderdag 21 januari 2016 16:30 schreef Z het volgende:
In R zo gepiept. Ik heb nu geen beschikking over SPSS maar het zou wel moeten kunnen in een syntax. Kan je niet eerst de geagregeerde gemiddelden uitrekenen in een aparte variabele en die waarden dan onder voorwaarde imputeren? Per rij krijgt iedereen dan eerst in een aparte variabele die je dan onder voorwaarde imputeert.

Omg dit is het! Ik ga even klooien. Thanks voor het in de goede richting duwen!

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

zaterdag 30 januari 2016 @ 10:26:15 #9

Serinde

Goedemorgen

Ik heb twee datasets, beide van een ander jaar. In de sets zitten gegevens van ondernemingen in 8 landen. In mijn onderzoek kijk ik naar de verklarende kracht van het model, de adjusted R². De verwachting is dat de adj R² in het tweede jaar hoger is dan in het eerste jaar. Het resultaat voldoet (totaal) niet aan verwachting: het eerste jaar is de uitkomst 0,662 en het tweede jaar 0,388

. Om te onderzoeken waardoor dit ontstaat, heb ik de lineaire regressie gedraaid voor alle afzonderlijke landen (1 t/m 8), per jaar. Dat geeft het volgende beeld:

1
2
3
4
5
6
7
8

1 - 0,647     0,839
2 - 0,484     0,378
3 - 0,887     0,903
4 - 0,835     0,934
5 - 0,592     0,538
6 - 0,940     0,700
7 - 0,892     0,766
8 - 0,931     0,931

Ik weet niet welke stappen ik nu moet zetten. Als ik er zo naar kijk, dan lijkt het alsof beide jaren hetzelfde beeld laten zien. Maar als ik de regressie draai voor de gehele dataset ineens, komt het tweede jaar een stuk lager uit ... Dat vind ik erg raar. Maar misschien wel te verklaren? Twee jaar geleden heb ik wel een cursus statistiek gehad op de opleiding maar dit soort dingen zijn we daar niet tegengekomen en de kennis is helaas ook al behoorlijk weggezakt....

maandag 1 februari 2016 @ 13:59:54 #10

Waarom zou je verwachten dan in een tweede jaar de verklaarde variantie groter zou zijn? Verschillen de scores op de variabelen in het model misschien veel per land? Is de r² in dit geval wel een goede parameter om het model op te beoordelen? Ik droom vooral over modellen met een r² van 0,66, maar dat terzijde.

Aldus.

maandag 1 februari 2016 @ 21:05:03 #11

Serinde

Er is in dat jaar een wezenlijke verandering doorgevoerd.
Maar door mijn vraag te stellen en het er met mijn vriend over te hebben, die niks weet van mijn vakgebied maar wel fijn logisch kan redeneren etc, denk ik dat ik weet wat er gebeurt. Cijfermatig vat ik het nog niet maar meer dan een derde van mijn dataset bestaat uit 1 land en in dat land is de r2 gedaald (#2 in het overzicht). Dit heeft een grote invloed op het totaalbeeld.
Overigens heeft deze methode zich in de literatuur uitgebreid bewezen, het ligt niet aan het model maar aan mij(n input). Dat is zeker

Ik droom hier niet over maar ik heb zo'n beetje nachtmerries

geloof wel dat ik eerst weer verder kan.

maandag 1 februari 2016 @ 21:17:56 #12

Spanky78

quote:
Op zaterdag 30 januari 2016 10:26 schreef Serinde het volgende:
Goedemorgen

Ik heb twee datasets, beide van een ander jaar. In de sets zitten gegevens van ondernemingen in 8 landen. In mijn onderzoek kijk ik naar de verklarende kracht van het model, de adjusted R². De verwachting is dat de adj R² in het tweede jaar hoger is dan in het eerste jaar. Het resultaat voldoet (totaal) niet aan verwachting: het eerste jaar is de uitkomst 0,662 en het tweede jaar 0,388 . Om te onderzoeken waardoor dit ontstaat, heb ik de lineaire regressie gedraaid voor alle afzonderlijke landen (1 t/m 8), per jaar. Dat geeft het volgende beeld:
[ code verwijderd ]

Ik weet niet welke stappen ik nu moet zetten. Als ik er zo naar kijk, dan lijkt het alsof beide jaren hetzelfde beeld laten zien. Maar als ik de regressie draai voor de gehele dataset ineens, komt het tweede jaar een stuk lager uit ... Dat vind ik erg raar. Maar misschien wel te verklaren? Twee jaar geleden heb ik wel een cursus statistiek gehad op de opleiding maar dit soort dingen zijn we daar niet tegengekomen en de kennis is helaas ook al behoorlijk weggezakt....

Ervan uitgaande dat je dataset groot genoeg is kun je een factoranalyse uitvoeren, of een PCA, om te zien of je geen echte multivariate afhankelijke variabele hebt. Het kan zijn dat land * jaar een heel goed fittend model geeft.

Overigens kun je met multiple regressie je model ook maken, krijg je ook r-kwadraten en de ANOVA laat dan zien welke factor significant zijn om je model te fitten. Moet je wel wat kwaliteitschecks doen, maar dat voert te ver op maandagavond...

http://onlinestatbook.com/2/regression/multiple_regression.html

Whatever...

maandag 1 februari 2016 @ 21:20:45 #13

Spanky78

quote:
Op maandag 1 februari 2016 21:05 schreef Serinde het volgende:
Er is in dat jaar een wezenlijke verandering doorgevoerd.
Maar door mijn vraag te stellen en het er met mijn vriend over te hebben, die niks weet van mijn vakgebied maar wel fijn logisch kan redeneren etc, denk ik dat ik weet wat er gebeurt. Cijfermatig vat ik het nog niet maar meer dan een derde van mijn dataset bestaat uit 1 land en in dat land is de r2 gedaald (#2 in het overzicht). Dit heeft een grote invloed op het totaalbeeld.
Overigens heeft deze methode zich in de literatuur uitgebreid bewezen, het ligt niet aan het model maar aan mij(n input). Dat is zeker

Ik droom hier niet over maar ik heb zo'n beetje nachtmerries geloof wel dat ik eerst weer verder kan.

Het is logsich dat je grootste land een grote invloed heeft op de total r2. Maar belangrijk is ook of er per land een apart patroon is. Vooral landen waar het effect tegengesteld is aan anderen geeft een slechter model. Een grote variatie in effectsize ook.

Heb je nog andere factoren behalve 2 inputvariabelen en 1 output?

Zoals eerder gezegd moet je eigenlijk met wat multivariate methoden de dataset even bekijken om te zien of er onderliggende factoren zijn.

Whatever...

† In Memoriam † maandag 1 februari 2016 @ 21:56:29 #14

Zith

pls tip

quote:
Op maandag 1 februari 2016 21:05 schreef Serinde het volgende:
Er is in dat jaar een wezenlijke verandering doorgevoerd.
Maar door mijn vraag te stellen en het er met mijn vriend over te hebben, die niks weet van mijn vakgebied maar wel fijn logisch kan redeneren etc, denk ik dat ik weet wat er gebeurt. Cijfermatig vat ik het nog niet maar meer dan een derde van mijn dataset bestaat uit 1 land en in dat land is de r2 gedaald (#2 in het overzicht). Dit heeft een grote invloed op het totaalbeeld.
Overigens heeft deze methode zich in de literatuur uitgebreid bewezen, het ligt niet aan het model maar aan mij(n input). Dat is zeker

Ik droom hier niet over maar ik heb zo'n beetje nachtmerries geloof wel dat ik eerst weer verder kan.

Je hebt data van meerdere landen, over 2 jaar, waarvan er in 1 een beleidsverandering is doorgevoerd?

Zo ja dan kan je een difference-in-differences regressie doen. Wat in principe niet meer inhoudt dan twee dummies toevoegen:

Dummy 1: land-met-verandering: 1 en land(en)-zonder-verandering: 0.
Dummy 2: Periode voor verandering: 0, Periode na verandering: 1
En een interactie maken (dummy1 * dummy2).

Regressie: Y = b0 + b1*Dummy1 + b2*Dummy2 + b3*Interactie + bk*(de andere variablen die belangrijk kunnen zijn)

Je wilt dan dat b3 (de interactie) significant is. Als deze significant is dan kan je stellen dat de beleidswijziging positief/negatief effect heeft gehad.

Zet je data hiervoor zo in elkaar

.......Maar een analyse van 8 observaties over 2 jaar is wel erg summier....

[ Bericht 5% gewijzigd door Zith op 01-02-2016 22:12:50 ]

I am a Chinese college students, I have a loving father, but I can not help him, he needs to do heart bypass surgery, I can not help him, because the cost of 100,000 or so needed, please help me, lifelong You pray Thank you!

maandag 1 februari 2016 @ 22:14:28 #15

Serinde

Bedankt voor jullie opmerkingen! Ik ga de suggesties nakijken (met het boek van Field erbij

)

_{Ik had wat weinig informatie gegeven, ik heb 2 onafhankelijke variabelen met meetschaal ratio, een dummy voor het rechtssysteem in een land (0 of 1) en een dummy voor het land (1 tm 8, om ook per land iets te kunnen zeggen, al zijn voor sommige landen de waarnemingen beperkt). In alle landen heeft dezelfde wijziging plaatsgevonden, het effect wordt in alle landen positief verwacht, alleen het zal sterker zijn afhankelijk van het rechtssysteem.}

Ik zie dat ook mijn begeleidster mijn mail beantwoord heeft. Ik heb eerst voldoende input om de komende dagen door te komen.

Toevoeging: ik heb ongeveer 750 cases per jaar.
De difference in difference komt me bekend voor uit een van de colleges van anderhalf jaar geleden.... Als ik die toepas (indien mogelijk, ik moet zoals gezegd e.e.a. uitzoeken) dan moet ik ook mijn eerste drie hoofdstukken aan gaan passen. Daar zit ik niet op te wachten. Maar wellicht een goede aanvulling en/of als robustnesscheck?! Ik zoek mijn bed op en ga morgen aan de slag. Nogmaals dank voor zover

maandag 1 februari 2016 @ 23:44:18 #16

#ANONIEM

quote:
Op maandag 1 februari 2016 22:14 schreef Serinde het volgende:
Bedankt voor jullie opmerkingen! Ik ga de suggesties nakijken (met het boek van Field erbij )

_{Ik had wat weinig informatie gegeven, ik heb 2 onafhankelijke variabelen met meetschaal ratio, een dummy voor het rechtssysteem in een land (0 of 1) en een dummy voor het land (1 tm 8, om ook per land iets te kunnen zeggen, al zijn voor sommige landen de waarnemingen beperkt). In alle landen heeft dezelfde wijziging plaatsgevonden, het effect wordt in alle landen positief verwacht, alleen het zal sterker zijn afhankelijk van het rechtssysteem.}

Ik zie dat ook mijn begeleidster mijn mail beantwoord heeft. Ik heb eerst voldoende input om de komende dagen door te komen.

Toevoeging: ik heb ongeveer 750 cases per jaar.
De difference in difference komt me bekend voor uit een van de colleges van anderhalf jaar geleden.... Als ik die toepas (indien mogelijk, ik moet zoals gezegd e.e.a. uitzoeken) dan moet ik ook mijn eerste drie hoofdstukken aan gaan passen. Daar zit ik niet op te wachten. Maar wellicht een goede aanvulling en/of als robustnesscheck?! Ik zoek mijn bed op en ga morgen aan de slag. Nogmaals dank voor zover

Als je 8 landen hebt moet je wel 1 land als ref. categorie gebruiken, dus 7 dummies.

maandag 1 februari 2016 @ 23:47:07 #17

#ANONIEM

quote:
Op maandag 1 februari 2016 22:14 schreef Serinde het volgende:
Bedankt voor jullie opmerkingen! Ik ga de suggesties nakijken (met het boek van Field erbij )

_{alleen het zal sterker zijn afhankelijk van het rechtssysteem.}

Dan mis je dus ook nog een interactie (moderator) variabele in je regressiemodel!

† In Memoriam † dinsdag 2 februari 2016 @ 00:30:30 #18

Zith

pls tip

Vanaf de mobiel...

Als in alle landen in dezelfde periode dezelfde beleidsverandering heeft plaatsgevonden dan zal diff in diffs die ik voorstelde niet werken: de interactie periode en treatment (beleidsverandering) is dan 1 in alle periode 2 observaties.

Wat je wel kan doen is dummy rechtssysteem en dummy beleidsverandering (jaar 2) beiden in de regressie en een interactie rechtssysteem*beleidsverandering. Dat, plus je andere onafhankelijke variabelen.

In principe kan je alleen zo zien welk rechtssysteem in het nieuwe beleid het beste werkt (even alle nuances en kwaliteitscontroles achter wegen latend)... Nogmaals wil je weten of de interactie significant is en of de coefficient positief of negatief is.

Bedenk ook dat een hoger R2 niet aangeeft of iets beter is, het geeft alleen aan wat de voorspellende waarde van je model is. Als ik een model maak met dummy : eet snoep / eet geen snoep, en de Dependent is of er gaatjes in de tanden ontstaan en de R2 is 0.8... Is snoep eten dan goed of slecht? Het voorspelt alleen - basic uitgelegd - dat het effect op je tanden voor 80% uitgelegd kan worden door wel of geen snoep te eten (maar niet of het eten van snoep goed of slecht is).

Om te kijken welk rechtssysteem beter is zul je moeten kijken naar de p waarde en of de coefficient positief of negatief is.

† In Memoriam † dinsdag 2 februari 2016 @ 00:32:13 #19

Zith

pls tip

quote:
Op maandag 1 februari 2016 23:44 schreef MCH het volgende:

[..]

Als je 8 landen hebt moet je wel 1 land als ref. categorie gebruiken, dus 7 dummies.

Zijn er statistische pakketen die niet automatisch 1 van de dummies omit?

dinsdag 2 februari 2016 @ 00:36:31 #20

#ANONIEM

quote:
Op dinsdag 2 februari 2016 00:32 schreef Zith het volgende:

[..]

Zijn er statistische pakketen die niet automatisch 1 van de dummies omit?

Ik geloof dat SPSS dit niet doet want je moet sowieso handmatig die dummies toevoegen aan je dataset. Daarnaast moet Serinde dmv een Chow-Test eerst checken of ze de data van alle landen uberhaupt wel op 1 hoop mag gooien (poolen).

quote:
the Chow test is often used to determine whether the independent variables have different impacts on different subgroups of the population.

[ Bericht 10% gewijzigd door #ANONIEM op 02-02-2016 00:38:36 ]

maandag 15 februari 2016 @ 15:23:20 #21

Mishu

Fok verslaafde

Welke test zou ik moeten uitvoeren om de percentages van 2 groepen op een categorische variabele (wel/niet financiële druk) te toetsen op een significant verschil?

En kan ik dezelfde toets vervolgens gebruiken om de groepen wel/niet financiële druk te testen op positieve/negatieve beleving van beleid?

En hoe voer ik dit uit in SPSS?

donderdag 18 februari 2016 @ 20:28:36 #22

crossover

quote:
Op maandag 15 februari 2016 15:23 schreef Mishu het volgende:
Welke test zou ik moeten uitvoeren om de percentages van 2 groepen op een categorische variabele (wel/niet financiële druk) te toetsen op een significant verschil?

En kan ik dezelfde toets vervolgens gebruiken om de groepen wel/niet financiële druk te testen op positieve/negatieve beleving van beleid?

En hoe voer ik dit uit in SPSS?

Chi-square:

CROSSTABS
/TABLES=var1 BY var2
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT ROW
/COUNT ROUND CELL

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

woensdag 24 februari 2016 @ 12:12:13 #23

joepp12

Hoera jongens en meisjes ik doe gezellig even mee!

Bezig met het verwerken van de vragenlijsten voor mijn afstudeerscriptie, nu is het zo dat ik nogal wat meerkeuzevragen heb die ik wil confronteren met vragen waarbij 1 antwoord mogelijk is.

Bijvoorbeeld:

(Meerkeuzevraag) In wat voor type organisatie bent u werkzaam?
- Optie 1
- Optie 2
- etc.

Confronteren met

(1 antwoord mogelijk) Is er binnen uw organisatie een inkoopafdeling aanwezig?
- Ja
- Nee

--------------------------------------------------------------------------------------------------------------

Ik zoek mij momenteel vrij scheel op het internet en tussen de opties, bij multiple response analyses kan ik wel multiple respons vragen met elkaar confronteren, maar niet met een vraag waar een antwoord mogelijk is.

Wanneer ik een grafiek wil maken, dan lukt dit ook niet met de multiple respons vraag. Heb de variabelen zo ingedeeld dat wanneer 1 is ingegeven in data view het antwoord aangevinkt is en 0 betekent dat het antwoord niet aangevinkt is.

Logischerwijs zou ik zeggen dat het mogelijk zou moeten zijn om alle 1'tjes (vinkjes) in een pie chart te zetten, ik kom hier echter niet helemaal uit.

"Victoria Concordia Crescit"

woensdag 24 februari 2016 @ 14:12:32 #24

Operc

Nr. 40

quote:
Op woensdag 24 februari 2016 12:12 schreef joepp12 het volgende:
Hoera jongens en meisjes ik doe gezellig even mee!

Bezig met het verwerken van de vragenlijsten voor mijn afstudeerscriptie, nu is het zo dat ik nogal wat meerkeuzevragen heb die ik wil confronteren met vragen waarbij 1 antwoord mogelijk is.

Bijvoorbeeld:

(Meerkeuzevraag) In wat voor type organisatie bent u werkzaam?
- Optie 1
- Optie 2
- etc.

Confronteren met

(1 antwoord mogelijk) Is er binnen uw organisatie een inkoopafdeling aanwezig?
- Ja
- Nee

--------------------------------------------------------------------------------------------------------------

Ik zoek mij momenteel vrij scheel op het internet en tussen de opties, bij multiple response analyses kan ik wel multiple respons vragen met elkaar confronteren, maar niet met een vraag waar een antwoord mogelijk is.

Wanneer ik een grafiek wil maken, dan lukt dit ook niet met de multiple respons vraag. Heb de variabelen zo ingedeeld dat wanneer 1 is ingegeven in data view het antwoord aangevinkt is en 0 betekent dat het antwoord niet aangevinkt is.

Logischerwijs zou ik zeggen dat het mogelijk zou moeten zijn om alle 1'tjes (vinkjes) in een pie chart te zetten, ik kom hier echter niet helemaal uit.

Ik ben niet zo scherp vandaag, maar wat bedoel je precies met confronteren?

donderdag 25 februari 2016 @ 10:01:23 #25

joepp12

quote:
Op woensdag 24 februari 2016 14:12 schreef Operc het volgende:

[..]

Ik ben niet zo scherp vandaag, maar wat bedoel je precies met confronteren?

De antwoorden op vraag twee vergelijken met 1 keuzemogelijkheid van vraag 1. Bijvoorbeeld:

Het antwoord op vraag 1 is = Huisartsenpraktijk
Het antwoord op vraag 2 is = Nee

Nu is het zo dat vraag 1 een multiple response vraag is, terwijl vraag 2 dit niet is.

"Victoria Concordia Crescit"

donderdag 25 februari 2016 @ 10:23:09 #26

#ANONIEM

Chi-square toch gewoon?

donderdag 25 februari 2016 @ 10:35:50 #27

Operc

Nr. 40

quote:
Op donderdag 25 februari 2016 10:23 schreef MCH het volgende:
Chi-square toch gewoon?

Dit dus. Vraag 1 als groepsvariabele en vraag 2 als uitkomst.

donderdag 25 februari 2016 @ 10:52:09 #28

Maar het lukt hem niet om een $multiple af te zetten tegen een single geloof ik.

Aldus.

donderdag 25 februari 2016 @ 10:58:14 #29

#ANONIEM

Descriptives dan.

donderdag 25 februari 2016 @ 11:33:46 #30

Operc

Nr. 40

Oh wacht, de data moet anders worden gestructureerd voor mijn oplossing. Nu heeft elke optie een ja/nee antwoord in plaats van dat er één variabele is waar elke optie zijn eigen waarde heeft. Dus, hercoderen naar een enkele variabele en daarna de chi-square doen.

Linkje voor het hercoderen:
http://www.spsslog.com/2007/04/10/combine-two-variables-into-one/

woensdag 2 maart 2016 @ 18:24:28 #31

Sokz

Livin' the life

quote:
Are people that have a characteristic A, more likely to do X when X has the condition Y .

A = ofwel continuous ofwel verdeelt in 2 groepen (groep met mensen die veel A hebben en groep met mensen die weinig A hebben)

X = ja/nee (wel/niet) e.g. likelihood dat hij wel X

Y = conditie dat ook weer continuous kan zijn (undervalued --> overvalued) ofwel een vaste conditie (overvalued)

Hoe modelleer ik dit?

maw andere modellen vinden een positief effect van A op X. Ik wil kijken of dit effect er ook is als X de conditie Y heeft.

woensdag 2 maart 2016 @ 19:06:26 #32

KaBuf

#teamfriet

Oké, sorry als ik een stomme vraag stel, maar ik ben nog maar een paar weken bezig in SPSS.

Ben nu bezig met een opdracht voor studie. We hebben een vooraf aangeleverde dataset.
Hiervan heb ik net sales over boekjaar 2014 als te verklaren variabele.
Vooraf wil ik dus kijken of deze normaal is verdeeld. Nee dus, ook niet als Ln-functie.
Maar in de boxplot zie ik 3 uitschieters, ook vanuit de dataset lijken deze vreemd (bijvoorbeeld opmerkelijk hoge omzet i.v.m. aantal medewerkers).

Als ik de net sales van die drie uitschieters uit mijn dataset verwijder, is de Ln-functie normaal verdeeld (volgens de Kolomogorov-Smirnov methode).

Maar, kan ik nu zomaar die uitschieters verwijderen? Wanneer ik dan toelicht in m'n paper waarom ik dit heb gedaan.
Voor deze uitschieters: als ik ze verwijderd, moet dan de gehele waarneming of enkel de net sales? Mijn gevoel zegt de gehele waarneming, want anders heb ik wel gegevens in een waarneming zitten maar geen te verklaren variabele.

Please consider the environment before printing this post.
Op zaterdag 27 mei 2017 00:36 schreef d4v1d het volgende:
Kabuf is af en toe best een prima kerel.

woensdag 2 maart 2016 @ 19:25:41 #33

oompaloompa

doompadeedee

quote:
Op woensdag 2 maart 2016 19:06 schreef KaBuf het volgende:
Oké, sorry als ik een stomme vraag stel, maar ik ben nog maar een paar weken bezig in SPSS.

Ben nu bezig met een opdracht voor studie. We hebben een vooraf aangeleverde dataset.
Hiervan heb ik net sales over boekjaar 2014 als te verklaren variabele.
Vooraf wil ik dus kijken of deze normaal is verdeeld. Nee dus, ook niet als Ln-functie.
Maar in de boxplot zie ik 3 uitschieters, ook vanuit de dataset lijken deze vreemd (bijvoorbeeld opmerkelijk hoge omzet i.v.m. aantal medewerkers).

Als ik de net sales van die drie uitschieters uit mijn dataset verwijder, is de Ln-functie normaal verdeeld (volgens de Kolomogorov-Smirnov methode).

Maar, kan ik nu zomaar die uitschieters verwijderen? Wanneer ik dan toelicht in m'n paper waarom ik dit heb gedaan.
Voor deze uitschieters: als ik ze verwijderd, moet dan de gehele waarneming of enkel de net sales? Mijn gevoel zegt de gehele waarneming, want anders heb ik wel gegevens in een waarneming zitten maar geen te verklaren variabele.

Er zijn verschillende methodes om outliers te quantificeren. Eigenlijk zou je wel van te voren moeten plannen wat je doet, aangezien je nu gaat "vissen" wat je foutmarge kan beinvloeden.

De meest standaard versies zijn om te bepalden dat je datapunten verwijdert die, x sd van de mean van de groep afliggen (bijvoorbeeld 3 sd), in een lineare regressie die een cooks distance van meer dan x hebben, of je data te trimmen door bv de hoogste en laagste x percent te droppen.

Sowieso wat je doet altijd vermelden, en ik rapporteer zelf ook altijd de effecten voor de hele dataset om zo open mogelijk naar de lezer te zijn.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 2 maart 2016 @ 19:26:39 #34

oompaloompa

doompadeedee

quote:
Op woensdag 2 maart 2016 18:24 schreef Sokz het volgende:

[..]

Hoe modelleer ik dit?

maw andere modellen vinden een positief effect van A op X. Ik wil kijken of dit effect er ook is als X de conditie Y heeft.

Moderated mediation in een logistische regressie?

(denk ik op basis van vrij summiere informatie

)

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 2 maart 2016 @ 20:28:51 #35

#ANONIEM

quote:
Op woensdag 2 maart 2016 19:06 schreef KaBuf het volgende:
Oké, sorry als ik een stomme vraag stel, maar ik ben nog maar een paar weken bezig in SPSS.

Ben nu bezig met een opdracht voor studie. We hebben een vooraf aangeleverde dataset.
Hiervan heb ik net sales over boekjaar 2014 als te verklaren variabele.
Vooraf wil ik dus kijken of deze normaal is verdeeld. Nee dus, ook niet als Ln-functie.
Maar in de boxplot zie ik 3 uitschieters, ook vanuit de dataset lijken deze vreemd (bijvoorbeeld opmerkelijk hoge omzet i.v.m. aantal medewerkers).

Als ik de net sales van die drie uitschieters uit mijn dataset verwijder, is de Ln-functie normaal verdeeld (volgens de Kolomogorov-Smirnov methode).

Maar, kan ik nu zomaar die uitschieters verwijderen? Wanneer ik dan toelicht in m'n paper waarom ik dit heb gedaan.
Voor deze uitschieters: als ik ze verwijderd, moet dan de gehele waarneming of enkel de net sales? Mijn gevoel zegt de gehele waarneming, want anders heb ik wel gegevens in een waarneming zitten maar geen te verklaren variabele.

Je kijkt dan ook niet of de variabele normaal verdeeld is, je moet kijken of de residuals van de variabelen normaal verdeeld zijn.

[ Bericht 0% gewijzigd door #ANONIEM op 02-03-2016 20:29:47 ]

woensdag 2 maart 2016 @ 20:30:30 #36

KaBuf

#teamfriet

quote:
Op woensdag 2 maart 2016 19:25 schreef oompaloompa het volgende:

[..]

Er zijn verschillende methodes om outliers te quantificeren. Eigenlijk zou je wel van te voren moeten plannen wat je doet, aangezien je nu gaat "vissen" wat je foutmarge kan beinvloeden.

De meest standaard versies zijn om te bepalden dat je datapunten verwijdert die, x sd van de mean van de groep afliggen (bijvoorbeeld 3 sd), in een lineare regressie die een cooks distance van meer dan x hebben, of je data te trimmen door bv de hoogste en laagste x percent te droppen.

Sowieso wat je doet altijd vermelden, en ik rapporteer zelf ook altijd de effecten voor de hele dataset om zo open mogelijk naar de lezer te zijn.

Thanks

quote:
Op woensdag 2 maart 2016 20:28 schreef MCH het volgende:

[..]

Je kijkt dan ook niet of de variabele normaal verdeeld is, je moet kijken of de residuals van de variabelen normaal verdeeld is.

Ja maar ons is geleerd dat in het begin van je onderzoek een normaal verdeelde te verklaren variabele een goede indicatie is voor een normale verdeling van je residuals.

Please consider the environment before printing this post.
Op zaterdag 27 mei 2017 00:36 schreef d4v1d het volgende:
Kabuf is af en toe best een prima kerel.

woensdag 2 maart 2016 @ 20:30:40 #37

#ANONIEM

quote:
Op woensdag 2 maart 2016 19:26 schreef oompaloompa het volgende:

[..]

Moderated mediation in een logistische regressie?

(denk ik op basis van vrij summiere informatie )

Gewoon een logistische regressie met 1 moderator.

woensdag 2 maart 2016 @ 20:37:48 #38

#ANONIEM

quote:
Op woensdag 2 maart 2016 20:30 schreef KaBuf het volgende:

[..]

Thanks

[..]

Ja maar ons is geleerd dat in het begin van je onderzoek een normaal verdeelde te verklaren variabele een goede indicatie is voor een normale verdeling van je residuals.

Dan doe je het zoals je geleerd is. Ik denk ook niet dat je docent van je verlangt dat je dan allerlei extra dingen gaat testen die je toch niet onderwezen zijn.

woensdag 2 maart 2016 @ 20:40:03 #39

KaBuf

#teamfriet

quote:
Op woensdag 2 maart 2016 20:37 schreef MCH het volgende:

[..]

Dan doe je het zoals je geleerd is. Ik denk ook niet dat je docent van je verlangt dat je dan allerlei extra dingen gaat testen die je toch niet onderwezen zijn.

Nou ja, uiteindelijk check ik wel of de residuals normaal verdeeld zijn uiteraard. Maar betekent het dan niks voor mijn onderzoek als mijn te verklaren variabele niet normaal verdeeld is?

Please consider the environment before printing this post.
Op zaterdag 27 mei 2017 00:36 schreef d4v1d het volgende:
Kabuf is af en toe best een prima kerel.

woensdag 2 maart 2016 @ 20:41:16 #40

#ANONIEM

quote:
Op woensdag 2 maart 2016 20:40 schreef KaBuf het volgende:

[..]

Nou ja, uiteindelijk check ik wel of de residuals normaal verdeeld zijn uiteraard. Maar betekent het dan niks voor mijn onderzoek als mijn te verklaren variabele niet normaal verdeeld is?

Dan zou het kunnen zijn dat je p-values onbetrouwbaar zijn.

woensdag 2 maart 2016 @ 20:46:32 #41

#ANONIEM

Je kan ook nog een dummy in je regressie mee laten draaien. Geef al je cases een 0 voor de niet outliers en de cases met outliers een 1. Dan test je daarna opnieuw op normaliteit.

woensdag 2 maart 2016 @ 21:06:17 #42

oompaloompa

doompadeedee

quote:
Op woensdag 2 maart 2016 20:30 schreef MCH het volgende:

[..]

Gewoon een logistische regressie met 1 moderator.

Nee want het effect van Y is continuous (dacht ik op basis van de uitleg)

quote:
Op woensdag 2 maart 2016 18:24 schreef Sokz het volgende:

[..]

Hoe modelleer ik dit?

maw andere modellen vinden een positief effect van A op X. Ik wil kijken of dit effect er ook is als X de conditie Y heeft.

Op basis van verdere info:
Originele effect: hoger op A (continuous) --> Hogere probability X (dv, dichotoom)

De vraag nu is of hetzelfde effect geldt voor een specifieke vorm van X (dv, nog steeds dichotoom maar nu op 2 attributes)

Dus de vergelijking is:

Hoger A --> hogere probability X1 (x-overvalued)
Hoger A --> ook hogere probability X2 (x-undervalued)

Heb ik het zo goed begrepen?

En zo ja, hoeveel metingen per DV heb je per observatie?
Geldt voor elk individu dat ze alleen een beslissing maken voor 1 X (die ofwel overvalued is ofwel undervalued)
Of maakt elk individu meerdere beslissingen voor meerdere X-en?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 2 maart 2016 @ 21:08:57 #43

#ANONIEM

quote:
Op woensdag 2 maart 2016 21:06 schreef oompaloompa het volgende:

[..]

Nee want het effect van Y is continuous (dacht ik op basis van de uitleg)

[..]

Op basis van verdere info:
Originele effect: hoger op A (continuous) --> Hogere probability X (dv, dichotoom)

De vraag nu is of hetzelfde effect geldt voor een specifieke vorm van X (dv, nog steeds dichotoom maar nu op 2 attributes)

Dus de vergelijking is:

Hoger A --> hogere probability X1 (x-overvalued)
Hoger A --> ook hogere probability X2 (x-undervalued)

Heb ik het zo goed begrepen?

En zo ja, hoeveel metingen per DV heb je per observatie?
Geldt voor elk individu dat ze alleen een beslissing maken voor 1 X (die ofwel overvalued is ofwel undervalued)
Of maakt elk individu meerdere beslissingen voor meerdere X-en?

Een moderator kan prima continuous zijn.

woensdag 2 maart 2016 @ 21:12:51 #44

oompaloompa

doompadeedee

quote:
Op woensdag 2 maart 2016 21:08 schreef MCH het volgende:

[..]

Een moderator kan prima continuous zijn.

Je hebt gelijk ik verzon dingen erbij die helemaal niet gezegd werden

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

donderdag 3 maart 2016 @ 09:19:57 #45

Sokz

Livin' the life

quote:
Op woensdag 2 maart 2016 21:12 schreef oompaloompa het volgende:

[..]

Je hebt gelijk ik verzon dingen erbij die helemaal niet gezegd werden

Vanochtend met professor overlegt en denk dat ik nu verder kom. Bedankt voor de reacties!

donderdag 3 maart 2016 @ 11:22:58 #46

#ANONIEM

quote:
Op donderdag 3 maart 2016 09:19 schreef Sokz het volgende:

[..]

Vanochtend met professor overlegt en denk dat ik nu verder kom. Bedankt voor de reacties!

Wat moet je nu doen dan?

donderdag 3 maart 2016 @ 17:02:10 #47

Sokz

Livin' the life

quote:
Op donderdag 3 maart 2016 11:22 schreef MCH het volgende:

[..]

Wat moet je nu doen dan?

Hij vond het verstandiger om mijn dataset te cutten zodat ik alleen obs met voorwaarde Y heb/include en dan simpel een logit van X op A. Voor mijn gevoel gaat nu wel redelijk wat info verloren maar c'est ca.

donderdag 3 maart 2016 @ 17:09:21 #48

wimjongil

Harde man

quote:
Op donderdag 3 maart 2016 17:02 schreef Sokz het volgende:

[..]

Hij vond het verstandiger om mijn dataset te cutten zodat ik alleen obs met voorwaarde Y heb/include en dan simpel een logit van X op A. Voor mijn gevoel gaat nu wel redelijk wat info verloren maar c'est ca.

Dat kun je toch gaan vergelijken met exact hetzelfde model op de overige observaties?

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

maandag 7 maart 2016 @ 11:24:55 #49

truedestiny

Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?

maandag 7 maart 2016 @ 11:28:04 #50

ralfie

!Yvan eht nioj

quote:
Op maandag 7 maart 2016 11:24 schreef truedestiny het volgende:
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?

ligt eraan wat je wil analyseren

maandag 7 maart 2016 @ 11:55:27 #51

truedestiny

quote:
Op maandag 7 maart 2016 11:28 schreef ralfie het volgende:

[..]

ligt eraan wat je wil analyseren

Het is een meningsinventarisatie. Ik wil graag uit de resultaten halen wat de meest voorkomende redenen zijn om een actie niet te ondernemen.

maandag 7 maart 2016 @ 12:10:29 #52

ralfie

!Yvan eht nioj

quote:
Op maandag 7 maart 2016 11:55 schreef truedestiny het volgende:

[..]

Het is een meningsinventarisatie. Ik wil graag uit de resultaten halen wat de meest voorkomende redenen zijn om een actie niet te ondernemen.

Kijk, als je alleen wil weten hoe vaak optie 1-11 gebruikt zijn, heb je 11 variabelen nodig.
Als je ook nog eens wil kijken naar combinaties (bijv 1+3+7) moet je deze ook apart analyseren. Dit kan allemaal alleen in één variabele als je je resultaten wil reduceren tot één antwoord (bijv vrouwen tikken vaker hogere opties aan dan mannen).

Praktisch alle statistische pakketten hebben overigens methoden om automatisch dummy variabelen te maken wanneer je dit soort vragen als nominaal markeert.

maandag 7 maart 2016 @ 12:13:55 #53

#ANONIEM

quote:
Op maandag 7 maart 2016 11:24 schreef truedestiny het volgende:
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?

Kan Qualtrics dit niet voor je doen?

maandag 7 maart 2016 @ 12:40:43 #54

truedestiny

quote:
Op maandag 7 maart 2016 12:10 schreef ralfie het volgende:

[..]

Kijk, als je alleen wil weten hoe vaak optie 1-11 gebruikt zijn, heb je 11 variabelen nodig.
Als je ook nog eens wil kijken naar combinaties (bijv 1+3+7) moet je deze ook apart analyseren. Dit kan allemaal alleen in één variabele als je je resultaten wil reduceren tot één antwoord (bijv vrouwen tikken vaker hogere opties aan dan mannen).

Praktisch alle statistische pakketten hebben overigens methoden om automatisch dummy variabelen te maken wanneer je dit soort vragen als nominaal markeert.

Thanks!

quote:
Op maandag 7 maart 2016 12:13 schreef MCH het volgende:

[..]

Kan Qualtrics dit niet voor je doen?

Niet bekend mee. Ik zal eens kijken

maandag 7 maart 2016 @ 13:09:30 #55

Operc

Nr. 40

quote:
Op maandag 7 maart 2016 11:24 schreef truedestiny het volgende:
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?

Zoals anderen zeggen, ligt er een beetje aan wat je wil analyseren etc.
Als het geprinte vragenlijsten zijn en iemand moet ze invoeren in de computer, dan lijkt het me handiger om 3 variabelen (keuze 1, 2 3) aan te maken met 11 opties, dan 11 variabelen met ja/nee. Dat maakt het invoeren een stuk makkelijker.

zaterdag 12 maart 2016 @ 20:15:35 #56

Sarasi

Quack.

Vraag!

Ik heb drie testen die ik analyseer, allemaal gemaakt door dezelfde groep personen, en ik wil onderzoeken of er verschil te vinden is tussen twee subgroepen van mijn totale groep proefpersonen. Verdeling is ruwweg 85/15. Nu heb ik daarvoor drie K-S testen uitgevoerd. Geen enkele nulhypothese verworpen, maar voor de test A die ik vooraf al op het oog had wel een p van ~0.11 (ik test tweezijdig en mijn cutoff is op 0.05). Nu is dit ook de enige test waarvoor groep X beter scoort dan groep Y. Op de andere twee tests B&C scoort groep Y beter dan X (p 0.33 en 0.49 oid). Nou kan ik er zo al meer dan zat over vertellen natuurlijk, maar het zou wel leuk zijn om daar nog wat verder in te duiken.

Mijn vraag: is er een manier om die drie analyses te combineren en de richting van het verschil tussen groepen mee te nemen? Ik zat oorspronkelijk te denken aan het vergelijken van rangscores (als iedereen uit X op zichzelf een hogere rangscore heeft in test A dan de hoogste van B,C, is daar in ieder geval consistentie van richting van een effect mee aangetoond). Iemand nog een beter idee?

Noot: ik gebruik R

Your opinion of me is none of my business.

zondag 13 maart 2016 @ 21:25:40 #57

#ANONIEM

quote:
Op zaterdag 12 maart 2016 20:15 schreef Sarasi het volgende:
Op de andere twee tests B&C scoort groep Y beter dan X (p 0.33 en 0.49 oid). Nou kan ik er zo al meer dan zat over vertellen natuurlijk,

Hier kun je niet zat over vertellen natuurlijk. Het ene niet significante resultaat is niet beter dan het andere n.s. resultaat.

zondag 13 maart 2016 @ 22:30:32 #58

Sarasi

Quack.

quote:
Op zondag 13 maart 2016 21:25 schreef MCH het volgende:

[..]

Hier kun je niet zat over vertellen natuurlijk. Het ene niet significante resultaat is niet beter dan het andere n.s. resultaat.

Je kunt wat zeggen over de richting van een effect, over de resultaten in relatie tot de verwachting, over de betrouwbaarheidsintervallen, over de effectgrootte... Er is zat te vertellen zonder significante resultaten.

Your opinion of me is none of my business.

zondag 13 maart 2016 @ 22:31:40 #59

#ANONIEM

quote:
Op zondag 13 maart 2016 22:30 schreef Sarasi het volgende:

[..]

Je kunt wat zeggen over de richting van een effect, over de resultaten in relatie tot de verwachting, over de betrouwbaarheidsintervallen, over de effectgrootte... Er is zat te vertellen zonder significante resultaten.

Allemaal nee, want het is niet significant. Je zou hooguit een verklaring kunnen verzinnen, eigenlijk moeten geven waarom jouw data niet significant is.

[ Bericht 0% gewijzigd door #ANONIEM op 13-03-2016 22:32:22 ]

zondag 13 maart 2016 @ 22:37:41 #60

Sarasi

Quack.

quote:
Op zondag 13 maart 2016 22:31 schreef MCH het volgende:

[..]

Allemaal nee, want het is niet significant. Je zou hooguit een verklaring kunnen verzinnen, eigenlijk moeten geven waarom jouw data niet significant is.

Het effect is er nog steeds hoor, ook al is het niet significant. Het effect heeft een richting, een effectgrootte, je kunt voor verschillende verdelingen een betrouwbaarheidsinterval opstellen en dat bekijken... Geen significant resultaat betekent niet dat je alles net zo goed de prullenbak in kunt flikkeren. Het betekent alleen dat je de nulhypothese niet mag verwerpen, niet dat je de alternatieve hypothese MOET verwerpen.

Your opinion of me is none of my business.

zondag 13 maart 2016 @ 22:48:24 #61

#ANONIEM

quote:
Op zondag 13 maart 2016 22:37 schreef Sarasi het volgende:

[..]

Het effect is er nog steeds hoor, ook al is het niet significant. Het effect heeft een richting, een effectgrootte, je kunt voor verschillende verdelingen een betrouwbaarheidsinterval opstellen en dat bekijken... Geen significant resultaat betekent niet dat je alles net zo goed de prullenbak in kunt flikkeren. Het betekent alleen dat je de nulhypothese niet mag verwerpen, niet dat je de alternatieve hypothese MOET verwerpen.

Ja, dan zeg je zoiets van: although the result is in the expected direction, it is not significant. En dan stop je. Zo lees ik dat altijd in artikelen of jij niet? Achja, scripties met niet significante resultaten zijn meer regel dan uitzondering.

zondag 13 maart 2016 @ 22:53:52 #62

Sarasi

Quack.

quote:
Op zondag 13 maart 2016 22:48 schreef MCH het volgende:

[..]

Ja, dan zeg je zoiets van: although the result is in the expected direction, it is not significant. En dan stop je. Zo lees ik dat altijd in artikelen of jij niet? Achja, scripties met niet significante resultaten zijn meer regel dan uitzondering.

En hopelijk vertaal je dat dan naar implicaties voor vervolgonderzoek etc ja. Dat zijn nog steeds meer woorden dan als je wel een significant resultaat had. Maar concluderend heb je dus geen antwoord op mijn vraag?

Your opinion of me is none of my business.

zondag 13 maart 2016 @ 22:55:00 #63

oompaloompa

doompadeedee

quote:
Op zondag 13 maart 2016 22:37 schreef Sarasi het volgende:

[..]

Het effect is er nog steeds hoor, ook al is het niet significant. Het effect heeft een richting, een effectgrootte, je kunt voor verschillende verdelingen een betrouwbaarheidsinterval opstellen en dat bekijken... Geen significant resultaat betekent niet dat je alles net zo goed de prullenbak in kunt flikkeren. Het betekent alleen dat je de nulhypothese niet mag verwerpen, niet dat je de alternatieve hypothese MOET verwerpen.

Een p van .5 is vrijwel de minst inzichtelijke uitkomst die je kunt hebben. Als de H0 waar is, heb je een kans van 50-50 om zo'n verschil of een groter verschil te vinden.

Al,s het within is, kun je (zou je) een repeated measures test kunnen doen.

Sowieso met een n van 15 wordt het moeilijk iets significants te vinden.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 13 maart 2016 @ 23:02:19 #64

Sarasi

Quack.

quote:
Op zondag 13 maart 2016 22:55 schreef oompaloompa het volgende:

[..]

Een p van .5 is vrijwel de minst inzichtelijke uitkomst die je kunt hebben. Als de H0 waar is, heb je een kans van 50-50 om zo'n verschil of een groter verschil te vinden.

Al,s het within is, kun je (zou je) een repeated measures test kunnen doen.

Sowieso met een n van 15 wordt het moeilijk iets significants te vinden.

Oh nee dat begrijp je verkeerd. De n is 850 ofzo, 15/85 is de verdeling van de twee groepen. En ik heb dus bij de meest interessante test een p van 0.11, dat vind ik nog niet zo oninteressant.

Maar het is geen repeated measures want het zijn alle drie afzonderlijke testen met eigen items die iets heel anders meten.

Thanks voor het idee wel!

Your opinion of me is none of my business.

zondag 13 maart 2016 @ 23:06:21 #65

oompaloompa

doompadeedee

quote:
Op zondag 13 maart 2016 23:02 schreef Sarasi het volgende:

[..]

Oh nee dat begrijp je verkeerd. De n is 850 ofzo, 15/85 is de verdeling van de twee groepen. En ik heb dus bij de meest interessante test een p van 0.11, dat vind ik nog niet zo oninteressant. Maar het is geen repeated measures want het zijn alle drie afzonderlijke testen met eigen items die iets heel anders meten. Thanks voor het idee wel!

De drie testen zijn niet per persoon?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 13 maart 2016 @ 23:07:34 #66

Sarasi

Quack.

quote:
Op zondag 13 maart 2016 23:06 schreef oompaloompa het volgende:

[..]

De drie testen zijn niet per persoon?

Dat wel, maar niet op verschillende tijdstippen afgenomen en ze meten alle drie iets heel anders. Gewoon een testbatterij, zeg maar.

Your opinion of me is none of my business.

zondag 13 maart 2016 @ 23:12:53 #67

oompaloompa

doompadeedee

quote:
Op zondag 13 maart 2016 23:07 schreef Sarasi het volgende:

[..]

Dat wel, maar niet op verschillende tijdstippen afgenomen en ze meten alle drie iets heel anders. Gewoon een testbatterij, zeg maar.

Dan ben ik bang dat je er niet heel erg veel mee kunt doen

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 14 maart 2016 @ 01:42:27 #68

Crack_

En je snapt 0.11 niet.. Je kunt niet zeggen ik zet mn cut off op 0.05 en mn uitkomst was 0.11 maar vind ik wel wat.

Nee, als je voor 0.05 kiest dan betekent dat je alles hoger dan dat als GEEN resultaat ziet. Dus 0.11 is zoals eerder gezegd, niks. Je kunt zoals ook al eerder gezegd, een richting aan geven maar dat houdt dus op bij 'maar dit was enkel bij deze studie en het resultaat bij andere studies kan anders zijn, want het resultaat was niet significant'.

Baby darling doll face honey

maandag 14 maart 2016 @ 01:55:51 #69

Sarasi

Quack.

quote:
Op maandag 14 maart 2016 01:42 schreef Crack_ het volgende:
En je snapt 0.11 niet.. Je kunt niet zeggen ik zet mn cut off op 0.05 en mn uitkomst was 0.11 maar vind ik wel wat.

Nee, als je voor 0.05 kiest dan betekent dat je alles hoger dan dat als GEEN resultaat ziet. Dus 0.11 is zoals eerder gezegd, niks. Je kunt zoals ook al eerder gezegd, een richting aan geven maar dat houdt dus op bij 'maar dit was enkel bij deze studie en het resultaat bij andere studies kan anders zijn, want het resultaat was niet significant'.

Ik snap het prima. Het betekent dat er een kans is van 11% dat ik mijn huidige resultaten vindt onder de assumptie van de nulhypothese. Omdat ik mijn cutoff op 5% heb gezet, heb ik a priori besloten dat 11% dus niet voldoende bewijs is om de alternatieve hypothese aan te nemen en de nulhypothese te verwerpen. Dat betekent, nogmaals, niet dat ik bij een p van 11% de nulhypothese aanneem. Je kunt nooit iets bevestigen, alleen ontkrachten. Ik test de nulhypothese, dus die kan ik niet bevestigen. Bij een significant resultaat kan het resultaat bij een volgende studie net zo goed anders zijn, want de p waarde differentieert niet tussen een echt bewijs voor de alternatieve hypothese in de populatie en gewoon een zeer onwaarschijnlijke steekproef. Sorry dat ik geen significantiefapper ben.

Verder boeit deze test niet eens zo heel veel want het is maar een zijweggetje van mijn tweede hoofdvraag. Ik vroeg me alleen af of ik, gezien de richting van de ene test de andere kant op gaat, de rangscores nog op een andere manier tegen elkaar uit kon zetten.

Your opinion of me is none of my business.

maandag 14 maart 2016 @ 03:24:42 #70

Crack_

quote:
Op maandag 14 maart 2016 01:55 schreef Sarasi het volgende:

[..]

Ik snap het prima. Het betekent dat er een kans is van 11% dat ik mijn huidige resultaten vindt onder de assumptie van de nulhypothese. Omdat ik mijn cutoff op 5% heb gezet, heb ik a priori besloten dat 11% dus niet voldoende bewijs is om de alternatieve hypothese aan te nemen en de nulhypothese te verwerpen. Dat betekent, nogmaals, niet dat ik bij een p van 11% de nulhypothese aanneem. Je kunt nooit iets bevestigen, alleen ontkrachten. Ik test de nulhypothese, dus die kan ik niet bevestigen. Bij een significant resultaat kan het resultaat bij een volgende studie net zo goed anders zijn, want de p waarde differentieert niet tussen een echt bewijs voor de alternatieve hypothese in de populatie en gewoon een zeer onwaarschijnlijke steekproef. Sorry dat ik geen significantiefapper ben.

Verder boeit deze test niet eens zo heel veel want het is maar een zijweggetje van mijn tweede hoofdvraag. Ik vroeg me alleen af of ik, gezien de richting van de ene test de andere kant op gaat, de rangscores nog op een andere manier tegen elkaar uit kon zetten.

Mooi, en sorry dat ik dat wel ben

Verder kan ik je helaas niet helpen, succes nog verder. Hopelijk kun je er nog iets mee.

Baby darling doll face honey

maandag 14 maart 2016 @ 10:06:52 #71

#ANONIEM

Plaat voor de kop

maandag 14 maart 2016 @ 12:16:47 #72

Zijn waarden van snijpunten tussen groepen te toetsen? Dus bij de ene groep is het snijpunt 2,53 en bij de andere groep 2,89. Is dit verschil significant? Ik kan er geen toets bij bedenken.

Aldus.

maandag 14 maart 2016 @ 17:05:42 #73

Silverdigger2

2+2=5

quote:
Op maandag 14 maart 2016 01:55 schreef Sarasi het volgende:

[..]

Omdat ik mijn cutoff op 5% heb gezet, heb ik a priori besloten dat 11% dus niet voldoende bewijs is om de alternatieve hypothese aan te nemen en de nulhypothese te verwerpen.

[..]

Sorry dat ik geen significantiefapper ben.

[..]

En ik heb dus bij de meest interessante test een p van 0.11, dat vind ik nog niet zo oninteressant.

dan heb je dus geen verschil op je meest interessante test. aangezien de cutoff op .05 zit

een p van .0500000001 was ook niet significant geweest.
Heb je nagedacht waarom die .05 gekozen wordt? en niet bijvoorbeeld .01?
Als je bepaalt dat de cutoff ergens is, kan je niet achteraf de regels nog aanpassen! waarom onderzoek doen als je je niet aan je eigen regels houdt?

maandag 14 maart 2016 @ 17:10:46 #74

oompaloompa

doompadeedee

Surely god loves the .06 nearly as much as the .05

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 14 maart 2016 @ 17:11:35 #75

oompaloompa

doompadeedee

quote:
Op maandag 14 maart 2016 12:16 schreef Z het volgende:
Zijn waarden van snijpunten tussen groepen te toetsen? Dus bij de ene groep is het snijpunt 2,53 en bij de andere groep 2,89. Is dit verschil significant? Ik kan er geen toets bij bedenken.

Kun je iets meer uitleg geven? Snijpunt van wat met wat? Zou iig te toetsen moeten zijn.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

† In Memoriam † maandag 14 maart 2016 @ 17:50:30 #76

Zith

pls tip

quote:
Op maandag 14 maart 2016 17:05 schreef Silverdigger2 het volgende:

[..]

Als je bepaalt dat de cutoff ergens is, kan je niet achteraf de regels nog aanpassen! waarom onderzoek doen als je je niet aan je eigen regels houdt?

Dat kan prima. er moet immers ook brood op de plank komen. Zolang hij geen cijfers gaat vervalsen mogen anderen er van vinden wat ze willen (ie. geen hoge significantie, maar een knipoog naar een bepaalde richting).

Niemand zal hem serieus nemen als hij zegt dat 0.11 significant is, maar het is prima wetenschap om resultaten te laten zien met 0.11 p-values en aan te geven dat het niet significant is maar dat het eventueel in een bepaalde richting kan wijzen.

[ Bericht 8% gewijzigd door Zith op 14-03-2016 17:56:43 ]

maandag 14 maart 2016 @ 18:09:01 #77

Sarasi

Quack.

quote:
Op maandag 14 maart 2016 17:50 schreef Zith het volgende:

[..]

Dat kan prima. er moet immers ook brood op de plank komen. Zolang hij geen cijfers gaat vervalsen mogen anderen er van vinden wat ze willen (ie. geen hoge significantie, maar een knipoog naar een bepaalde richting).

Niemand zal hem serieus nemen als hij zegt dat 0.11 significant is, maar het is prima wetenschap om resultaten te laten zien met 0.11 p-values en aan te geven dat het niet significant is maar dat het eventueel in een bepaalde richting kan wijzen.

Zij, maar verder ongeveer dit ja. Ik ga echt niet zeggen dat het bijna significant is, helemaal significant, whatever. Maar als een resultaat niet significant is, kan het nog steeds wel interessant zijn. Als je een bepaald effect verwacht en je krijgt een p van 0.98 is dat ook ontiegelijk interessant. En dat een verschil niet significant is, betekent niet dat er helemaal geen verschil (in de steekproef) is. Of is een gemiddelde van 23 opeens gelijk aan een gemiddelde van 28 omdat de p waarde niet onder de Alpha zit?

Your opinion of me is none of my business.

maandag 14 maart 2016 @ 19:45:59 #78

oompaloompa

doompadeedee

quote:
Op maandag 14 maart 2016 18:09 schreef Sarasi het volgende:

[..]

Zij, maar verder ongeveer dit ja. Ik ga echt niet zeggen dat het bijna significant is, helemaal significant, whatever. Maar als een resultaat niet significant is, kan het nog steeds wel interessant zijn. Als je een bepaald effect verwacht en je krijgt een p van 0.98 is dat ook ontiegelijk interessant. En dat een verschil niet significant is, betekent niet dat er helemaal geen verschil (in de steekproef) is. Of is een gemiddelde van 23 opeens gelijk aan een gemiddelde van 28 omdat de p waarde niet onder de Alpha zit?

Je kan alleen eigenlijk niets zeggen over of dat verschil ruis is of niet.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 14 maart 2016 @ 20:52:47 #79

Silverdigger2

2+2=5

quote:
Op maandag 14 maart 2016 18:09 schreef Sarasi het volgende:
Of is een gemiddelde van 23 opeens gelijk aan een gemiddelde van 28 omdat de p waarde niet onder de Alpha zit?

er is geen bewijs dat het verschil verklaard kan worden door de in jouw model opgenomen variabelen, dat kan je er zeker over zeggen als de gemiddelden van de groepen die je in jouw test vergeleek 23 en 28 zijn.

quote:
Op maandag 14 maart 2016 17:50 schreef Zith het volgende:

[..]

Niemand zal hem serieus nemen als hij zegt dat 0.11 significant is, maar het is prima wetenschap om resultaten te laten zien met 0.11 p-values en aan te geven dat het niet significant is maar dat het eventueel in een bepaalde richting kan wijzen.

Dit kan zeker, maar de tendens had je ook kunnen baseren op eerder onderzoek.
"en je probeert dit goed te praten onder een confirmation bias."

Als je zegt dat je tevreden bent met een p<.05 dan is bij een p>.05 je 0-hypothese niet verworpen.

quote:
Dat kan prima. er moet immers ook brood op de plank komen.

Een niet significant verschil is ook een significante bijdrage aan de wetenschap

maandag 14 maart 2016 @ 21:11:53 #80

carmiie

Wat moet ik doen als ik bij mijn chi-square teveel cellen heb met een expected count less than five? Ik las dat bij meer dan 20% de resultaten niet valide zijn? Bij sommige variabelen is het bij mij 60%.

maandag 14 maart 2016 @ 21:21:32 #81

oompaloompa

doompadeedee

quote:
Op maandag 14 maart 2016 21:11 schreef carmiie het volgende:
Wat moet ik doen als ik bij mijn chi-square teveel cellen heb met een expected count less than five? Ik las dat bij meer dan 20% de resultaten niet valide zijn? Bij sommige variabelen is het bij mij 60%.

Cellen samenvoegen als dat kan, anders houdt het op.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 14 maart 2016 @ 21:33:37 #82

carmiie

quote:
Op maandag 14 maart 2016 21:21 schreef oompaloompa het volgende:

[..]

Cellen samenvoegen als dat kan, anders houdt het op.

Hoe doe ik dat?

maandag 14 maart 2016 @ 21:44:09 #83

oompaloompa

doompadeedee

quote:
Op maandag 14 maart 2016 21:33 schreef carmiie het volgende:

[..]

Hoe doe ik dat?

Als je bv geinteresseerd bent in verschil man-vrouw en schrijfkleur rood-blauw op een bepaalde uitkomst, je test beperken tot verschil kleur (of verschil gender).
Verder valt er helaas weinig te doen. (nou lijkt het me ook dat of dezelfde rij erg laag is in je experiment dus 98% - 2% voor groep 1 en 97% - 3% voor groep 2, en dan kun je zelfs zonder test wel zien dat er geen effect is, of juist het tegenovergestelde 99-1 voor groep 1 en 1-99 voor groep 2 en dan heb je eigenlijk ook niet echt een test meer nodig).

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 14 maart 2016 @ 21:53:19 #84

carmiie

quote:
Op maandag 14 maart 2016 21:44 schreef oompaloompa het volgende:

[..]

Als je bv geinteresseerd bent in verschil man-vrouw en schrijfkleur rood-blauw op een bepaalde uitkomst, je test beperken tot verschil kleur (of verschil gender).
Verder valt er helaas weinig te doen. (nou lijkt het me ook dat of dezelfde rij erg laag is in je experiment dus 98% - 2% voor groep 1 en 97% - 3% voor groep 2, en dan kun je zelfs zonder test wel zien dat er geen effect is, of juist het tegenovergestelde 99-1 voor groep 1 en 1-99 voor groep 2 en dan heb je eigenlijk ook niet echt een test meer nodig).

Aahh zo, ik snap het, thanks!

Wel jammer dat er weinig aan te doen valt

maandag 14 maart 2016 @ 21:56:58 #85

oompaloompa

doompadeedee

quote:
Op maandag 14 maart 2016 21:53 schreef carmiie het volgende:

[..]

Aahh zo, ik snap het, thanks! Wel jammer dat er weinig aan te doen valt

Bijdraaien? :p

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 15 maart 2016 @ 08:59:28 #86

quote:
Op maandag 14 maart 2016 17:11 schreef oompaloompa het volgende:

[..]

Kun je iets meer uitleg geven? Snijpunt van wat met wat? Zou iig te toetsen moeten zijn.

Ik heb een prijsmeter-analyse gedaan voor verschillende versies van producten.

De snijpunten, prijs in euro's, wil ik toetsen.

Aldus.

dinsdag 15 maart 2016 @ 10:17:19 #87

#ANONIEM

quote:
Op maandag 14 maart 2016 21:11 schreef carmiie het volgende:
Wat moet ik doen als ik bij mijn chi-square teveel cellen heb met een expected count less than five? Ik las dat bij meer dan 20% de resultaten niet valide zijn? Bij sommige variabelen is het bij mij 60%.

Meer data verzamelen.

maandag 21 maart 2016 @ 10:58:42 #88

Paprikachipjes

Ik ben een dataset aan het maken met SPSS. Niet super moeilijk, maar ik loop echter tegen één probleem aan. Het gaat hier om een patiëntenbestand met verschillende parameters. Deze patiënten hebben een bepaalde operatie ondergaan en sommige patiënten hebben hier naderhand complicaties van ondervonden. Ik heb echter de grootste moeite om deze complicaties op een efficiëntie manier in SPSS te zetten. Sommige patiënten hebben namelijk meerdere complicaties gehad.

Ik heb de volgende dingen al geprobeerd:
1) Één variabele Complicaties aanmaken, alle verschillende complicaties labelen. Dit werkt dus niet omdat sommige patiënten bijv. zowel een fistel als een abces kunnen hebben. Ik kan complicaties combineren onder één label (0 = fistel, 1 = abces, 2 = fistel en abces bijv.), maar dan krijg ik dubbel zoveel labels als dat ik complicaties heb en dat gaat echt een gigantische lijst worden.
2) Voor elke complicatie een variabele aanmaken. Dit werkt op zich wel, maar ik heb nu al 17 complicaties in mijn dataset staan (er staan nu 25 patiënten in, het worden er waarschijnlijk honderden). Ik verwacht dat dit aantal nog enigszins zal groeien. Er moet toch een andere manier zijn om te voorkomen dat ik met een monster van een dataset eindig, haha.
3) Complicaties groeperen binnen variabelen. Ik heb eerst geprobeerd om te groeperen naar een variabele maag-darmkanaal complicaties, cardiale complicaties, pulmonale complicaties en etc. Echter, zoals ik hierboven al heb beschreven, sommige mensen hebben bijv. zowel een fistel als een abces (beide maag-darmkanaal complicaties), ik loop op deze manier weer tegen probleem 1 aan. Vervolgens heb ik 4 variabelen aangemaakt, Complicaties 1 t/m 4 met allemaal dezelfde labels. Dit werkt niet, als ik een statistische analyse wil doen dan krijg ik vier verschillende tabellen met dezelfde complicaties in groepjes verspreid over al deze tabellen. Dit is prima voor frequenties, maar niet als ik er meer geavanceerde dingen mee wil doen.

Kortom, is er een manier om deze complicaties op een efficiënte manier in SPSS te krijgen of moet ik toch echt losse variabelen maken?

maandag 21 maart 2016 @ 11:12:51 #89

Wat is het maximale aantal complicaties bij een patiënt? Stel dat dat er 10 zijn, dan maak je tien variabelen aan met alle complicaties per variabele zoals je bij (1) gedaan hebt. De vorm die je kiest hangt mogelijk samen met de analyses die je wil doen, iets om rekening mee te houden.

Aldus.

maandag 21 maart 2016 @ 11:56:48 #90

Paprikachipjes

Ik zat te denken aan logistic regression en ik heb n.a.v. jouw post zojuist het halve internet ondersteboven gekeerd en ik kom er dus achter dat je a) één dependent variable kunt aangeven, b) deze variable maar twee catagorieën kan hebben, wat dus waarschijnlijk betekent dat ik mijn complicaties als losse variabelen in SPSS moet zetten wil ik er wat mee kunnen, haha. Dus volgens mij ben ik er zo wel uit.

maandag 21 maart 2016 @ 12:58:56 #91

Je kan, ten behoeve van de logistische regressie, categoriale variabelen hercoderen naar dummies. Dat kan SPSS automatisch geloof ik. Tip: lees je ook nog even in over vrijheidsgraden.

Aldus.

maandag 21 maart 2016 @ 13:46:56 #92

#ANONIEM

quote:
Op maandag 21 maart 2016 11:56 schreef Paprikachipjes het volgende:
Ik zat te denken aan logistic regression en ik heb n.a.v. jouw post zojuist het halve internet ondersteboven gekeerd en ik kom er dus achter dat je a) één dependent variable kunt aangeven, b) deze variable maar twee catagorieën kan hebben, wat dus waarschijnlijk betekent dat ik mijn complicaties als losse variabelen in SPSS moet zetten wil ik er wat mee kunnen, haha. Dus volgens mij ben ik er zo wel uit.

Het is mij niet helemaal duidelijk wat nou precies je dependent variabele moet worden. Kun je dat nog eens toelichten?

[ Bericht 24% gewijzigd door #ANONIEM op 21-03-2016 22:10:40 ]

maandag 21 maart 2016 @ 14:48:40 #93

Paprikachipjes

De complicaties worden de dependent variables. Dus wat ik zou kunnen doen is kijken wat de invloed is van bijv. roken op het ontwikkelen van een abces postoperatief (= complicatie). Roken zou dan mijn independent variable worden (0 = nooit, 1 = ja, 2 = gestopt), het ontwikkelen van een abces mijn dependent variable (0 = nee, 1 = ja).

Dat hercoderen ziet er inderdaad wel interessant uit. Ik zal me er eens in verdiepen.

maandag 21 maart 2016 @ 20:27:16 #94

Super-B

Ik heb een dataset met een aantal dummy variabelen (STATA) en ik vraag mij af hoe je uit een regressie output kunt afleiden of het handig is om bepaalde dummy variabelen met elkaar te combineren. En als er dummy variabelen gecombineerd worden welke restricties er getest moeten worden. Weet iemand dit toevallig? Wat betreft het testen van restricties dacht ik aan een joint restrictie.. maar ik kan het fout hebben.

Alvast bedankt.

maandag 21 maart 2016 @ 22:18:07 #95

#ANONIEM

quote:
Op maandag 21 maart 2016 14:48 schreef Paprikachipjes het volgende:
De complicaties worden de dependent variables. Dus wat ik zou kunnen doen is kijken wat de invloed is van bijv. roken op het ontwikkelen van een abces postoperatief (= complicatie). Roken zou dan mijn independent variable worden (0 = nooit, 1 = ja, 2 = gestopt), het ontwikkelen van een abces mijn dependent variable (0 = nee, 1 = ja).

Dat hercoderen ziet er inderdaad wel interessant uit. Ik zal me er eens in verdiepen.

Wow, dan krijg je dus een ontelbare hoeveelheid dv's als je een lange lijst met complicaties hebt. Ik weet niet of het relevant is maar je zou ook nog een Poisson regression kunnen uitvoeren om te kijken welke factoren een invloed hebben op het aantal bijwerkingen dat iemand krijgt.

zaterdag 2 april 2016 @ 23:32:17 #96

ulq

qlu.

Weet iemand hoe ik een bepaalde excel data file het beste in eviews kan importeren?

Ik heb op de y-as de verschillende identifiers (in mijn geval bedrijven) en op de x-as de datum (in mijn geval een periode van ongeveer 300 dagen) en voor de rest een variabele per worksheet (6 variabelen en dus 6 worksheets totaal). Normaal moet je bij eviews (volgensmij) op de y-as zowel de datum als de identifiers zetten om het correct te kunnen importeren, maar in mijn geval was het niet mogelijk het op deze manier te downloaden en dan zou het bovendien redelijk onleesbaar worden vanwege het grote aantal datums en bedrijven.

Als iemand me een linkje kunnen sturen die ongeveer beschrijft hoe ik dit het beste kan aanpakken zou ik dit ook erg op prijs stellen uiteraard! Volgensmij betreft mijn dataset 'unstacked panel data', maar dat weet ik niet zeker. Heb uiteraard al op google gezocht maar vind geen relevante resultaten.

Bij voorbaat dank!

vrijdag 8 april 2016 @ 16:31:06 #97

jufsaar

Ik ga voor mijn scriptie kijken naar het volgende onderwerp:
Scoren leerlingen die op een basisschool 8 jaar Frans hebben gehad beter op Frans in de 1e klas dan leerlingen die de taal niet hebben gehad, rekening houdend met de algemene cognitie?
Er zijn 5 leerlingen die Frans hebben gehad in verschillende klassen. Van alle leerlingen uit deze klassen heb ik het gemiddelde van Frans en van Nederlands, geschiedenis en wiskunde (voor de algemene cognitie) om te kunnen vergelijken.
Ik dacht dat ik een independent t-test moest doen, maar dan kan ik niet controleren op algemene cognitie. En ik kan toch niet zomaar de gegevens van alle klassen samenvoegen zonder te kijken naar het gemiddelde van elke specifieke klas?
Wie kan mij helpen?

vrijdag 8 april 2016 @ 16:44:10 #98

Operc

Nr. 40

quote:
Op zaterdag 2 april 2016 23:32 schreef ulq het volgende:
Weet iemand hoe ik een bepaalde excel data file het beste in eviews kan importeren?

Ik heb op de y-as de verschillende identifiers (in mijn geval bedrijven) en op de x-as de datum (in mijn geval een periode van ongeveer 300 dagen) en voor de rest een variabele per worksheet (6 variabelen en dus 6 worksheets totaal). Normaal moet je bij eviews (volgensmij) op de y-as zowel de datum als de identifiers zetten om het correct te kunnen importeren, maar in mijn geval was het niet mogelijk het op deze manier te downloaden en dan zou het bovendien redelijk onleesbaar worden vanwege het grote aantal datums en bedrijven.

Als iemand me een linkje kunnen sturen die ongeveer beschrijft hoe ik dit het beste kan aanpakken zou ik dit ook erg op prijs stellen uiteraard! Volgensmij betreft mijn dataset 'unstacked panel data', maar dat weet ik niet zeker. Heb uiteraard al op google gezocht maar vind geen relevante resultaten.

Bij voorbaat dank!

Omdat het zo lomp is als niemand op je vraag reageert: Sorry, ik had voor je post nog nooit van eviews gehoord, dus geen flauw idee hoe je daar kunt importeren. Misschien eens kijken naar of er online wat te vinden is over .csv bestanden importeren? (Je kunt een Excel bestand heel makkelijk opslaan als .csv en soms geeft dat wat meer opties.)

vrijdag 8 april 2016 @ 16:48:24 #99

Operc

Nr. 40

quote:
Op vrijdag 8 april 2016 16:31 schreef jufsaar het volgende:
Ik ga voor mijn scriptie kijken naar het volgende onderwerp:
Scoren leerlingen die op een basisschool 8 jaar Frans hebben gehad beter op Frans in de 1e klas dan leerlingen die de taal niet hebben gehad, rekening houdend met de algemene cognitie?
Er zijn 5 leerlingen die Frans hebben gehad in verschillende klassen. Van alle leerlingen uit deze klassen heb ik het gemiddelde van Frans en van Nederlands, geschiedenis en wiskunde (voor de algemene cognitie) om te kunnen vergelijken.
Ik dacht dat ik een independent t-test moest doen, maar dan kan ik niet controleren op algemene cognitie. En ik kan toch niet zomaar de gegevens van alle klassen samenvoegen zonder te kijken naar het gemiddelde van elke specifieke klas?
Wie kan mij helpen?

Dus als ik het goed begrijp heb je twee groepen:
1. 5 leerlingen die Frans hebben gehad.
2. Gruwelijke veel leerlingen (meerdere klassen) die geen Frans hebben gehad.

Klopt dat?

In dat geval is je grootste probleem dat je slechts 5 leerlingen hebt die Frans hebben gehad. Die groep is te klein om iets zinvols over te kunnen zeggen.

Als je de klas waartoe iemand behoort wil analyseren dan kom je al snel uit op multilevel analyses, maar ik zou me kunnen voorstellen dat, gezien de rest van je project, dat dermate hooggegrepen is dat je begeleider je dat niet aan wil doen.

vrijdag 8 april 2016 @ 17:16:41 #100

oompaloompa

doompadeedee

Operc heeft gelijk, wat je wilt doen valt abstract / technisch te doen, maar niet met de data die je hebt.

Een simpelere, minder juiste versie valt ook niet echt te doen, maar kun je in ieder geval wel runnen (zou de resultaten alleen niet vertrouwen) en dat is gewoon opdelen in wel of niet frans als groepen. Andere scores meenemen als covariaat in Anova en dat gebruiken.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» school, studie en onderwijs

» school, studie en onderwijs