Centraal Statistiektopic (SPSS, R, excel, etc.) #9

zaterdag 9 april 2016 @ 15:15:44 #101

Kaas-

Mensen, ik vul data in in STATA.

Heb nu twee variabelen gemaakt, maar als ik vervolgens "summarize" in tik dan geeft STATA aan dat er voor beide variabelen 0 observaties zijn terwijl ze er toch echt staan. Bijvoorbeeld de variabele "Year" aangemaakt en vervolgens staat daaronder (in de data editor) 1950 t/m 2010.

Dit is de eerste keer dat ik zelf data in het programma gooi. Wat kan ik verkeerd doen? Hulp is zeer welkom.

zaterdag 9 april 2016 @ 15:23:08 #102

Operc

Nr. 40

quote:
Op zaterdag 9 april 2016 15:15 schreef Kaas- het volgende:
Mensen, ik vul data in in STATA.

Heb nu twee variabelen gemaakt, maar als ik vervolgens "summarize" in tik dan geeft STATA aan dat er voor beide variabelen 0 observaties zijn terwijl ze er toch echt staan. Bijvoorbeeld de variabele "Year" aangemaakt en vervolgens staat daaronder (in de data editor) 1950 t/m 2010.

Dit is de eerste keer dat ik zelf data in het programma gooi. Wat kan ik verkeerd doen? Hulp is zeer welkom.

Ik gebruik geen STATA dus het is een wilde gok, maar zijn de variabelen nog hoofdlettergevoelig misschien? En is het type variabele juist? (Dat je niet stiekem string hebt terwijl het integer moet zijn.)

zaterdag 9 april 2016 @ 16:52:52 #103

Spanky78

quote:
Op zaterdag 9 april 2016 15:15 schreef Kaas- het volgende:
Mensen, ik vul data in in STATA.

Heb nu twee variabelen gemaakt, maar als ik vervolgens "summarize" in tik dan geeft STATA aan dat er voor beide variabelen 0 observaties zijn terwijl ze er toch echt staan. Bijvoorbeeld de variabele "Year" aangemaakt en vervolgens staat daaronder (in de data editor) 1950 t/m 2010.

Dit is de eerste keer dat ik zelf data in het programma gooi. Wat kan ik verkeerd doen? Hulp is zeer welkom.

Ook ik ken srata niet, maar heb wel eens gehad dat de vorm van de data in de kolommen verkeerd ingesteld was een p die manier gaf de software dan aan dat er geen observaties waren...

Whatever...

zondag 10 april 2016 @ 14:26:20 #104

Eefje_

Ik heb een vraag omtrent een schaal (SPSS).

Ik onderzoek de relatie tussen Facebookgebruik, zelfbeeld en eetgedrag. Nu onderzoek ik eetgedrag met behulp van de Eating Attitudes Test 26 (EAT-26). Deze bestaat uit drie delen:
(A) Gewicht en lengte (waar ik BMI van heb gemaakt),
(B) 26 vragen
(C) 4 gedragsvragen variërend van (nooit, 1x per maand of minder, 2-3x per maand, 1x per week, 2-6x per week en 1x per dag of meer) en 2 extra (heftige) vragen waar alleen (ja of nee) kan worden beantwoord.
De scoring voor die 26 vragen heb ik al verwerkt via Transform - Recode zodat ik op een totaal van 20 of meer kom wat problematisch eetgedrag blijkt. Dit staat op: http://www.eat-26.com/scoring.php. Maar er staat verder geen score bij de overige delen, behalve dan kruisjes bij wat problematisch gedrag is. Hoe kan ik (A) BMI en (C) de vragen waarbij een andere score wordt gehanteerd, dan samenvoegen met de 26 vragen? Ik moet toch uiteindelijk op een schaal komen, namelijk eetgedrag.

Mijn dank zal groot zijn.

zondag 10 april 2016 @ 14:45:00 #105

#ANONIEM

quote:
Op zondag 10 april 2016 14:26 schreef Eefje_ het volgende:
Ik heb een vraag omtrent een schaal (SPSS).

Ik onderzoek de relatie tussen Facebookgebruik, zelfbeeld en eetgedrag. Nu onderzoek ik eetgedrag met behulp van de Eating Attitudes Test 26 (EAT-26). Deze bestaat uit drie delen:
(A) Gewicht en lengte (waar ik BMI van heb gemaakt),
(B) 26 vragen
(C) 4 gedragsvragen variërend van (nooit, 1x per maand of minder, 2-3x per maand, 1x per week, 2-6x per week en 1x per dag of meer) en 2 extra (heftige) vragen waar alleen (ja of nee) kan worden beantwoord.
De scoring voor die 26 vragen heb ik al verwerkt via Transform - Recode zodat ik op een totaal van 20 of meer kom wat problematisch eetgedrag blijkt. Dit staat op: http://www.eat-26.com/scoring.php. Maar er staat verder geen score bij de overige delen, behalve dan kruisjes bij wat problematisch gedrag is. Hoe kan ik (A) BMI en (C) de vragen waarbij een andere score wordt gehanteerd, dan samenvoegen met de 26 vragen? Ik moet toch uiteindelijk op een schaal komen, namelijk eetgedrag.

Mijn dank zal groot zijn.

Kun je vraag C niet als robustnesscheck inbouwen. Dus je doet eerst je onderzoek op basis van B. Dan doe je het nogmaals met C. Of ik zou BMI als moderator beschouwen. Ik denk namelijk niet dat een BMI alles zegt over problematisch eetgedrag. Een skinny bitch kan toch net zo goed een problematische eter zijn.

[ Bericht 8% gewijzigd door #ANONIEM op 10-04-2016 14:54:40 ]

maandag 11 april 2016 @ 21:20:34 #106

crossover

quote:
Op zaterdag 9 april 2016 15:15 schreef Kaas- het volgende:
Mensen, ik vul data in in STATA.

Heb nu twee variabelen gemaakt, maar als ik vervolgens "summarize" in tik dan geeft STATA aan dat er voor beide variabelen 0 observaties zijn terwijl ze er toch echt staan. Bijvoorbeeld de variabele "Year" aangemaakt en vervolgens staat daaronder (in de data editor) 1950 t/m 2010.

Dit is de eerste keer dat ik zelf data in het programma gooi. Wat kan ik verkeerd doen? Hulp is zeer welkom.

Probeer de volgende dingen/commando's:

-count.

-inspect [variabele namen]

Zoals hierboven ook al gezegd wordt, kijk of je geen hoofdletters hebt gebruikt en of het wel numerieke variabelen zijn. Alle commando's zijn hoofdlettergevoelig.

Kopieer de data naar excel en importeer het dan als nieuwe dataset.

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

woensdag 4 mei 2016 @ 15:09:27 #107

Lyrebird

Mijn kennis van statistiek is uitermate belabberd, maar toch durf ik wat vraagtekens bij het volgende experiment te zetten. Gaarne jullie input.

Men doet 22 operaties op patienten, en na die operatie voert men een meting met een speciaal instrument uit op de wond. Die meting wordt na een week herhaald, en na een maand na de operatie, twee maanden na de operatie, drie maanden na de operatie en vier maanden na de operatie. Tijdens ieder meetpunt kijkt de dokter mee, en geeft een oordeel over de kwaliteit van de wond. Of de wond netjes geheeld is ("good"), of dat er een lelijk litteken is ("moderate"), of dat er complicaties zijn ("poor").

Op basis van die metingen worden ROC curves gemaakt. Wat men namelijk wil weten, is of de metingen met dat speciale instrument in een vroeg stadium kunnen voorspellen of er later complicaties zullen zijn.

Die ROC curves blijken erg onbetrouwbaar te zijn voor data die direct na de operatie is verzameld, of die een week na de operatie is verzameld.

Maar na 1 maand blijkt dat in 6 van de 9 gevallen dat het apparaat een rood sein gaf, er tussen maand 1 en 4 idd. een complicatie is opgetreden. In 1 van de 13 gevallen dat het apparaat aangaf dat alles ok was, is er in die periode ook een complicatie opgetreden.

Kun je op basis van zo weinig metingen uberhaupt ROC curves maken, en zo ja, hoe betrouwbaar is zo'n curve dan?

[ Bericht 1% gewijzigd door Lyrebird op 04-05-2016 15:18:43 ]

Good intentions and tender feelings may do credit to those who possess them, but they often lead to ineffective — or positively destructive — policies ... Kevin D. Williamson

maandag 16 mei 2016 @ 16:10:30 #108

Plausibel

Écht waar!

Hallo mensen!
Ik hoop dat iemand hier mij kan helpen met mijn vraag.

Ik doe een onderzoekje met een dataset waarin respondenten uit vier landen zitten.
Er is een variabele die ik heb bewerkt, en uiteindelijk omgezet naar een dichotome variabele. Dit heb ik per land gedaan, omdat de oorspronkelijke categorieen in de verschillende landen niet met elkaar te vergelijken waren.
Ik heb nu dus vier dichotome variabelen, per land. Elke respondent komt dus ook maar één keer voor in al deze vier variabelen.
Nu wil ik er eigenlijk weer één variabele van maken. Iedereen heeft nu eenzelfde score (1 of 0), dus ik denk dat dit wel mogelijk is.
Maar hoe moet ik dit doen?

Ik werk trouwens met SPSS Syntax, dus als iemand er ook nog eens een syntax code voor zou weten zou ik helemaal gelukkig zijn....

Regenboog, regenboog
gelukkig ben je krom,
anders heette je regenstreep,
en dat klinkt toch wel zo stom

maandag 16 mei 2016 @ 16:28:21 #109

oompaloompa

doompadeedee

quote:
Op maandag 16 mei 2016 16:10 schreef Plausibel het volgende:
Hallo mensen!
Ik hoop dat iemand hier mij kan helpen met mijn vraag.

Ik doe een onderzoekje met een dataset waarin respondenten uit vier landen zitten.
Er is een variabele die ik heb bewerkt, en uiteindelijk omgezet naar een dichotome variabele. Dit heb ik per land gedaan, omdat de oorspronkelijke categorieen in de verschillende landen niet met elkaar te vergelijken waren.
Ik heb nu dus vier dichotome variabelen, per land. Elke respondent komt dus ook maar één keer voor in al deze vier variabelen.
Nu wil ik er eigenlijk weer één variabele van maken. Iedereen heeft nu eenzelfde score (1 of 0), dus ik denk dat dit wel mogelijk is.
Maar hoe moet ik dit doen?

Ik werk trouwens met SPSS Syntax, dus als iemand er ook nog eens een syntax code voor zou weten zou ik helemaal gelukkig zijn....

recode naar 1-2 op de dv van het land, geef ze 0 op de dv's die ze niet hebben en tel dan de 4 kolommen op voor de overkoepelende dv?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 17 mei 2016 @ 15:50:56 #110

Bravoo

Mijn statistiekkennis is nogal weggezakt, dus vandaar de volgende vraag:

Ik wil het effect van de verandering van een variabele onderzoeken. Ik heb in principe twee tijdsperiodes: zeg maar bijvoorbeeld oktober - december 2011 - 2013 (dus 3 tijdsperiodes) en 2012 en 2013 helemaal (dus 2 tijdsperiodes). Je moet dit onderzoek zien als een experiment.

Tussentijds is (dit is een voorbeeldje) 3x het loon gestegen. Stel ik zou willen onderzoeken of dit effect heeft op de arbeidsproductiviteit, hoe pak ik dit dan aan? Voor een panel analysis is de tijdsperiode te kort. Hoe kan ik het beste het effect van deze variabele over de tijd onderzoeken? En als ik wil weten of er verschil is tussen mannen en vrouwen?

Bedankt!

dinsdag 17 mei 2016 @ 15:53:51 #111

#ANONIEM

quote:
Op dinsdag 17 mei 2016 15:50 schreef Bravoo het volgende:
Mijn statistiekkennis is nogal weggezakt, dus vandaar de volgende vraag:

Ik wil het effect van de verandering van een variabele onderzoeken. Ik heb in principe twee tijdsperiodes: zeg maar bijvoorbeeld oktober - december 2011 - 2013 (dus 3 tijdsperiodes) en 2012 en 2013 helemaal (dus 2 tijdsperiodes). Je moet dit onderzoek zien als een experiment.

Tussentijds is (dit is een voorbeeldje) 3x het loon gestegen. Stel ik zou willen onderzoeken of dit effect heeft op de arbeidsproductiviteit, hoe pak ik dit dan aan? Voor een panel analysis is de tijdsperiode te kort. Hoe kan ik het beste het effect van deze variabele over de tijd onderzoeken? En als ik wil weten of er verschil is tussen mannen en vrouwen?

Bedankt!

Begrijp ik het goed dat je hoogstens 3 periodes hebt met verschillende lonen?

[ Bericht 0% gewijzigd door #ANONIEM op 17-05-2016 15:54:31 ]

dinsdag 17 mei 2016 @ 15:56:43 #112

Bravoo

Ja dat klopt inderdaad.

dinsdag 17 mei 2016 @ 16:00:43 #113

#ANONIEM

quote:
Op dinsdag 17 mei 2016 15:56 schreef Bravoo het volgende:
Ja dat klopt inderdaad.

Maar wel genoeg observaties per tijdsperiode?

dinsdag 17 mei 2016 @ 16:01:50 #114

Bravoo

Oh sorry, dat was ik vergeten te vermelden. Ik heb rond de 1300 bruikbare observaties (totaal circa 1600).

dinsdag 17 mei 2016 @ 16:03:36 #115

#ANONIEM

quote:
Op dinsdag 17 mei 2016 16:01 schreef Bravoo het volgende:
Oh sorry, dat was ik vergeten te vermelden. Ik heb rond de 1300 bruikbare observaties (totaal circa 1600).

Heb je al gewoon een regressie gedraaid met als moderator geslacht?

dinsdag 17 mei 2016 @ 16:05:46 #116

Bravoo

Nee, ik heb nog niets uitgevoerd. Voor het scriptievoorstel moet ik de methode beschrijven, dus ik probeer erachter te komen welke statistische analyse ik precies moet uitvoeren.

† In Memoriam † dinsdag 17 mei 2016 @ 19:32:17 #117

Zith

pls tip

Drukke dag gehad dus misschien zeg ik domme dingen, MCH zal dat dan wel laten weten.

Fixed effects? Elk persoon telt dan 2x als observatie met de verschillen tussen 2011-2012 en 2012-2013 als input. Al kan je dan niet dingen als geslacht doen omdat deze niet veranderen.

Heb je ook personen die geen opslag kregen? Dan Difference in differeces? Groepen 2011-2012 en 2012-2013,maak een dummy (periode) waarbij het eerst jaar 0 is en het tweede 1, maak een dummy voor opslag of niet tussen periode 0 en 1. Zet dit allemaal onder elkaar, dus elke persoon twee keer. Doe de regressie op output = periode, opslag, periode*opslag, (ln)salaris (en andere variabelen die je hebt). De interactie is waar je dan naar kijkt. Is die significant en positief dan heeft het krijgen van een opslag een positie effect op de output van de komende periode.

___

Maar wellicht is er een reden waarom mensen opslag krijgen, bijvoorbeeld omdat ze de periode ervoor heel erg productief waren? Dan zou je bijvoorbeeld de productiviteit van de periode ervoor als lag kunnen toevoegen.

[ Bericht 9% gewijzigd door Zith op 17-05-2016 19:41:10 ]

I am a Chinese college students, I have a loving father, but I can not help him, he needs to do heart bypass surgery, I can not help him, because the cost of 100,000 or so needed, please help me, lifelong You pray Thank you!

woensdag 18 mei 2016 @ 14:01:37 #118

V-for-Vendetta

V for

Hi,

Ik ben momenteel bezig met analyse van robuustheid resultaten. Nu wil ik outliers eruit filteren/ervoor controllen, maar zie ik door de bomen het bos niet meer.

Ik heb daarom een aantal vragen

1. Wat is het verschil tussen outliers en influential factors, en waar kan ik me beter op focussen?

2. Mahalanobis concentreert zich alleen op multivariate outliers. Moet ik nog iets doen met dependent variable?

3. Winsorizen: er wordt vaak gesproken over winsorizen op 5% level aan beide kanten. Moet dit worden gedaan voor zowel X als Y variabele?

4. Welke outlier detection/removal technique gebruiken jullie altijd. Ik zie bijv ook nog: Leverage, Cook's, Trimming, Hat's, Likelihood, etc.

5. Hoe zit het met outliers van indicator variables/dummies. Bijv Mahalanobis haalt 1 hele variabele weg die 4x voorkomt. Is dit wel juist? Of moet ik alleen outliers checken op niet-dummies?

Thanks in advance!

woensdag 18 mei 2016 @ 14:16:47 #119

#ANONIEM

Hoezo ga je na je uitkomsten en tijdens je robustness checks pas kijken naar je outliers?

woensdag 18 mei 2016 @ 20:10:49 #120

V-for-Vendetta

V for

quote:
Op woensdag 18 mei 2016 14:16 schreef MCH het volgende:
Hoezo ga je na je uitkomsten en tijdens je robustness checks pas kijken naar je outliers?

Omdat het geen psychologisch onderzoek is, maar waargebeurde financial events. Dan kan ikk niet zeggen: oh die is me wat te hoog, dan negeer/corrigeer ik die.

woensdag 18 mei 2016 @ 20:24:27 #121

oompaloompa

doompadeedee

quote:
Op woensdag 18 mei 2016 20:10 schreef V-for-Vendetta het volgende:

[..]

Omdat het geen psychologisch onderzoek is, maar waargebeurde financial events. Dan kan ikk niet zeggen: oh die is me wat te hoog, dan negeer/corrigeer ik die.

Is dit voor een scriptie oid of moet het echt een paper worden uiteindelijk? In dat tweede geval zou ik, als het niet al te laat is, eerst je plan opstellen, dit vastleggen en dan pas naar de data kijken. Nu loop je het risico (on)bewust je uitkomsten te beinvloeden.

Wat je moet gebruiken ligt heel erg aan het type data en kan ik weinig over zeggen op basis van de beperkte informatie.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 18 mei 2016 @ 20:49:07 #122

V-for-Vendetta

V for

quote:
Op woensdag 18 mei 2016 20:24 schreef oompaloompa het volgende:

[..]

Is dit voor een scriptie oid of moet het echt een paper worden uiteindelijk? In dat tweede geval zou ik, als het niet al te laat is, eerst je plan opstellen, dit vastleggen en dan pas naar de data kijken. Nu loop je het risico (on)bewust je uitkomsten te beinvloeden.

Wat je moet gebruiken ligt heel erg aan het type data en kan ik weinig over zeggen op basis van de beperkte informatie.

Ik beinvloed niet.

Cook's Distance <1 voor alle observations
Winsorizing 5% geeft tevens geen verandering in results.

woensdag 18 mei 2016 @ 20:53:49 #123

oompaloompa

doompadeedee

quote:
Op woensdag 18 mei 2016 20:49 schreef V-for-Vendetta het volgende:

[..]

Ik beinvloed niet.

Cook's Distance <1 voor alle observations
Winsorizing 5% geeft tevens geen verandering in results.

Wat had je gedaan als het wel een verschil zou maken?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 18 mei 2016 @ 21:02:50 #124

V-for-Vendetta

V for

quote:
Op woensdag 18 mei 2016 20:53 schreef oompaloompa het volgende:

[..]

Wat had je gedaan als het wel een verschil zou maken?

Ook gerapporteerd. Mn initiele event window geeft ook insignificantie.

Mn p-value neemt wel af van <0.05 naar <0.10 na winsorizen, de ander blijft constant.

woensdag 18 mei 2016 @ 21:19:28 #125

oompaloompa

doompadeedee

quote:
Op woensdag 18 mei 2016 21:02 schreef V-for-Vendetta het volgende:

[..]

Ook gerapporteerd. Mn initiele event window geeft ook insignificantie.

Mn p-value neemt wel af van <0.05 naar <0.10 na winsorizen, de ander blijft constant.

Ja dan moet je nu dus beslissen wat je hoofdconclusie is / wat de beste methode is (met of zonder winsor) terwijl je al weet wat dat voor je uitkomsten doet...

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» school, studie en onderwijs

» school, studie en onderwijs