abonnement Unibet Coolblue Bitvavo
  woensdag 2 maart 2016 @ 18:24:28 #31
256829 Sokz
Livin' the life
pi_160372301
quote:
Are people that have a characteristic A, more likely to do X when X has the condition Y .

A = ofwel continuous ofwel verdeelt in 2 groepen (groep met mensen die veel A hebben en groep met mensen die weinig A hebben)

X = ja/nee (wel/niet) e.g. likelihood dat hij wel X

Y = conditie dat ook weer continuous kan zijn (undervalued --> overvalued) ofwel een vaste conditie (overvalued)
Hoe modelleer ik dit? :P

maw andere modellen vinden een positief effect van A op X. Ik wil kijken of dit effect er ook is als X de conditie Y heeft.
  woensdag 2 maart 2016 @ 19:06:26 #32
304004 KaBuf
#teamfriet
pi_160373193
Oké, sorry als ik een stomme vraag stel, maar ik ben nog maar een paar weken bezig in SPSS. :@ :P

Ben nu bezig met een opdracht voor studie. We hebben een vooraf aangeleverde dataset.
Hiervan heb ik net sales over boekjaar 2014 als te verklaren variabele.
Vooraf wil ik dus kijken of deze normaal is verdeeld. Nee dus, ook niet als Ln-functie.
Maar in de boxplot zie ik 3 uitschieters, ook vanuit de dataset lijken deze vreemd (bijvoorbeeld opmerkelijk hoge omzet i.v.m. aantal medewerkers).

Als ik de net sales van die drie uitschieters uit mijn dataset verwijder, is de Ln-functie normaal verdeeld (volgens de Kolomogorov-Smirnov methode).

Maar, kan ik nu zomaar die uitschieters verwijderen? Wanneer ik dan toelicht in m'n paper waarom ik dit heb gedaan.
Voor deze uitschieters: als ik ze verwijderd, moet dan de gehele waarneming of enkel de net sales? Mijn gevoel zegt de gehele waarneming, want anders heb ik wel gegevens in een waarneming zitten maar geen te verklaren variabele.
Please consider the environment before printing this post.
Op zaterdag 27 mei 2017 00:36 schreef d4v1d het volgende:
Kabuf is af en toe best een prima kerel.
pi_160373696
quote:
2s.gif Op woensdag 2 maart 2016 19:06 schreef KaBuf het volgende:
Oké, sorry als ik een stomme vraag stel, maar ik ben nog maar een paar weken bezig in SPSS. :@ :P

Ben nu bezig met een opdracht voor studie. We hebben een vooraf aangeleverde dataset.
Hiervan heb ik net sales over boekjaar 2014 als te verklaren variabele.
Vooraf wil ik dus kijken of deze normaal is verdeeld. Nee dus, ook niet als Ln-functie.
Maar in de boxplot zie ik 3 uitschieters, ook vanuit de dataset lijken deze vreemd (bijvoorbeeld opmerkelijk hoge omzet i.v.m. aantal medewerkers).

Als ik de net sales van die drie uitschieters uit mijn dataset verwijder, is de Ln-functie normaal verdeeld (volgens de Kolomogorov-Smirnov methode).

Maar, kan ik nu zomaar die uitschieters verwijderen? Wanneer ik dan toelicht in m'n paper waarom ik dit heb gedaan.
Voor deze uitschieters: als ik ze verwijderd, moet dan de gehele waarneming of enkel de net sales? Mijn gevoel zegt de gehele waarneming, want anders heb ik wel gegevens in een waarneming zitten maar geen te verklaren variabele.
Er zijn verschillende methodes om outliers te quantificeren. Eigenlijk zou je wel van te voren moeten plannen wat je doet, aangezien je nu gaat "vissen" wat je foutmarge kan beinvloeden.

De meest standaard versies zijn om te bepalden dat je datapunten verwijdert die, x sd van de mean van de groep afliggen (bijvoorbeeld 3 sd), in een lineare regressie die een cooks distance van meer dan x hebben, of je data te trimmen door bv de hoogste en laagste x percent te droppen.

Sowieso wat je doet altijd vermelden, en ik rapporteer zelf ook altijd de effecten voor de hele dataset om zo open mogelijk naar de lezer te zijn.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_160373722
quote:
99s.gif Op woensdag 2 maart 2016 18:24 schreef Sokz het volgende:

[..]

Hoe modelleer ik dit? :P

maw andere modellen vinden een positief effect van A op X. Ik wil kijken of dit effect er ook is als X de conditie Y heeft.
Moderated mediation in een logistische regressie?

(denk ik op basis van vrij summiere informatie :P )
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_160375628
quote:
2s.gif Op woensdag 2 maart 2016 19:06 schreef KaBuf het volgende:
Oké, sorry als ik een stomme vraag stel, maar ik ben nog maar een paar weken bezig in SPSS. :@ :P

Ben nu bezig met een opdracht voor studie. We hebben een vooraf aangeleverde dataset.
Hiervan heb ik net sales over boekjaar 2014 als te verklaren variabele.
Vooraf wil ik dus kijken of deze normaal is verdeeld. Nee dus, ook niet als Ln-functie.
Maar in de boxplot zie ik 3 uitschieters, ook vanuit de dataset lijken deze vreemd (bijvoorbeeld opmerkelijk hoge omzet i.v.m. aantal medewerkers).

Als ik de net sales van die drie uitschieters uit mijn dataset verwijder, is de Ln-functie normaal verdeeld (volgens de Kolomogorov-Smirnov methode).

Maar, kan ik nu zomaar die uitschieters verwijderen? Wanneer ik dan toelicht in m'n paper waarom ik dit heb gedaan.
Voor deze uitschieters: als ik ze verwijderd, moet dan de gehele waarneming of enkel de net sales? Mijn gevoel zegt de gehele waarneming, want anders heb ik wel gegevens in een waarneming zitten maar geen te verklaren variabele.
Je kijkt dan ook niet of de variabele normaal verdeeld is, je moet kijken of de residuals van de variabelen normaal verdeeld zijn.

[ Bericht 0% gewijzigd door #ANONIEM op 02-03-2016 20:29:47 ]
  woensdag 2 maart 2016 @ 20:30:30 #36
304004 KaBuf
#teamfriet
pi_160375690
quote:
0s.gif Op woensdag 2 maart 2016 19:25 schreef oompaloompa het volgende:

[..]

Er zijn verschillende methodes om outliers te quantificeren. Eigenlijk zou je wel van te voren moeten plannen wat je doet, aangezien je nu gaat "vissen" wat je foutmarge kan beinvloeden.

De meest standaard versies zijn om te bepalden dat je datapunten verwijdert die, x sd van de mean van de groep afliggen (bijvoorbeeld 3 sd), in een lineare regressie die een cooks distance van meer dan x hebben, of je data te trimmen door bv de hoogste en laagste x percent te droppen.

Sowieso wat je doet altijd vermelden, en ik rapporteer zelf ook altijd de effecten voor de hele dataset om zo open mogelijk naar de lezer te zijn.
Thanks :)
quote:
0s.gif Op woensdag 2 maart 2016 20:28 schreef MCH het volgende:

[..]

Je kijkt dan ook niet of de variabele normaal verdeeld is, je moet kijken of de residuals van de variabelen normaal verdeeld is.
Ja maar ons is geleerd dat in het begin van je onderzoek een normaal verdeelde te verklaren variabele een goede indicatie is voor een normale verdeling van je residuals.
Please consider the environment before printing this post.
Op zaterdag 27 mei 2017 00:36 schreef d4v1d het volgende:
Kabuf is af en toe best een prima kerel.
pi_160375694
quote:
0s.gif Op woensdag 2 maart 2016 19:26 schreef oompaloompa het volgende:

[..]

Moderated mediation in een logistische regressie?

(denk ik op basis van vrij summiere informatie :P )
Gewoon een logistische regressie met 1 moderator.
pi_160375921
quote:
2s.gif Op woensdag 2 maart 2016 20:30 schreef KaBuf het volgende:

[..]

Thanks :)

[..]

Ja maar ons is geleerd dat in het begin van je onderzoek een normaal verdeelde te verklaren variabele een goede indicatie is voor een normale verdeling van je residuals.
Dan doe je het zoals je geleerd is. Ik denk ook niet dat je docent van je verlangt dat je dan allerlei extra dingen gaat testen die je toch niet onderwezen zijn.
  woensdag 2 maart 2016 @ 20:40:03 #39
304004 KaBuf
#teamfriet
pi_160375996
quote:
0s.gif Op woensdag 2 maart 2016 20:37 schreef MCH het volgende:

[..]

Dan doe je het zoals je geleerd is. Ik denk ook niet dat je docent van je verlangt dat je dan allerlei extra dingen gaat testen die je toch niet onderwezen zijn.
Nou ja, uiteindelijk check ik wel of de residuals normaal verdeeld zijn uiteraard. Maar betekent het dan niks voor mijn onderzoek als mijn te verklaren variabele niet normaal verdeeld is?
Please consider the environment before printing this post.
Op zaterdag 27 mei 2017 00:36 schreef d4v1d het volgende:
Kabuf is af en toe best een prima kerel.
pi_160376050
quote:
2s.gif Op woensdag 2 maart 2016 20:40 schreef KaBuf het volgende:

[..]

Nou ja, uiteindelijk check ik wel of de residuals normaal verdeeld zijn uiteraard. Maar betekent het dan niks voor mijn onderzoek als mijn te verklaren variabele niet normaal verdeeld is?
Dan zou het kunnen zijn dat je p-values onbetrouwbaar zijn.
pi_160376251
Je kan ook nog een dummy in je regressie mee laten draaien. Geef al je cases een 0 voor de niet outliers en de cases met outliers een 1. Dan test je daarna opnieuw op normaliteit.
pi_160376883
quote:
0s.gif Op woensdag 2 maart 2016 20:30 schreef MCH het volgende:

[..]

Gewoon een logistische regressie met 1 moderator.
Nee want het effect van Y is continuous (dacht ik op basis van de uitleg)

quote:
99s.gif Op woensdag 2 maart 2016 18:24 schreef Sokz het volgende:

[..]

Hoe modelleer ik dit? :P

maw andere modellen vinden een positief effect van A op X. Ik wil kijken of dit effect er ook is als X de conditie Y heeft.
Op basis van verdere info:
Originele effect: hoger op A (continuous) --> Hogere probability X (dv, dichotoom)

De vraag nu is of hetzelfde effect geldt voor een specifieke vorm van X (dv, nog steeds dichotoom maar nu op 2 attributes)

Dus de vergelijking is:

Hoger A --> hogere probability X1 (x-overvalued)
Hoger A --> ook hogere probability X2 (x-undervalued)

Heb ik het zo goed begrepen?

En zo ja, hoeveel metingen per DV heb je per observatie?
Geldt voor elk individu dat ze alleen een beslissing maken voor 1 X (die ofwel overvalued is ofwel undervalued)
Of maakt elk individu meerdere beslissingen voor meerdere X-en?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_160376945
quote:
0s.gif Op woensdag 2 maart 2016 21:06 schreef oompaloompa het volgende:

[..]

Nee want het effect van Y is continuous (dacht ik op basis van de uitleg)

[..]

Op basis van verdere info:
Originele effect: hoger op A (continuous) --> Hogere probability X (dv, dichotoom)

De vraag nu is of hetzelfde effect geldt voor een specifieke vorm van X (dv, nog steeds dichotoom maar nu op 2 attributes)

Dus de vergelijking is:

Hoger A --> hogere probability X1 (x-overvalued)
Hoger A --> ook hogere probability X2 (x-undervalued)

Heb ik het zo goed begrepen?

En zo ja, hoeveel metingen per DV heb je per observatie?
Geldt voor elk individu dat ze alleen een beslissing maken voor 1 X (die ofwel overvalued is ofwel undervalued)
Of maakt elk individu meerdere beslissingen voor meerdere X-en?
Een moderator kan prima continuous zijn.
pi_160377051
quote:
4s.gif Op woensdag 2 maart 2016 21:08 schreef MCH het volgende:

[..]

Een moderator kan prima continuous zijn.
Je hebt gelijk ik verzon dingen erbij die helemaal niet gezegd werden :P
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  donderdag 3 maart 2016 @ 09:19:57 #45
256829 Sokz
Livin' the life
pi_160384851
quote:
0s.gif Op woensdag 2 maart 2016 21:12 schreef oompaloompa het volgende:

[..]

Je hebt gelijk ik verzon dingen erbij die helemaal niet gezegd werden :P
;)

Vanochtend met professor overlegt en denk dat ik nu verder kom. Bedankt voor de reacties!
pi_160386846
quote:
99s.gif Op donderdag 3 maart 2016 09:19 schreef Sokz het volgende:

[..]

;)

Vanochtend met professor overlegt en denk dat ik nu verder kom. Bedankt voor de reacties!
Wat moet je nu doen dan?
  donderdag 3 maart 2016 @ 17:02:10 #47
256829 Sokz
Livin' the life
pi_160394046
quote:
0s.gif Op donderdag 3 maart 2016 11:22 schreef MCH het volgende:

[..]

Wat moet je nu doen dan?
Hij vond het verstandiger om mijn dataset te cutten zodat ik alleen obs met voorwaarde Y heb/include en dan simpel een logit van X op A. Voor mijn gevoel gaat nu wel redelijk wat info verloren maar c'est ca. :P
pi_160394146
quote:
99s.gif Op donderdag 3 maart 2016 17:02 schreef Sokz het volgende:

[..]

Hij vond het verstandiger om mijn dataset te cutten zodat ik alleen obs met voorwaarde Y heb/include en dan simpel een logit van X op A. Voor mijn gevoel gaat nu wel redelijk wat info verloren maar c'est ca. :P
Dat kun je toch gaan vergelijken met exact hetzelfde model op de overige observaties?
Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.
pi_160485170
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?
  maandag 7 maart 2016 @ 11:28:04 #50
85514 ralfie
!Yvan eht nioj
pi_160485221
quote:
7s.gif Op maandag 7 maart 2016 11:24 schreef truedestiny het volgende:
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?
ligt eraan wat je wil analyseren
pi_160485721
quote:
0s.gif Op maandag 7 maart 2016 11:28 schreef ralfie het volgende:

[..]

ligt eraan wat je wil analyseren
Het is een meningsinventarisatie. Ik wil graag uit de resultaten halen wat de meest voorkomende redenen zijn om een actie niet te ondernemen.
  maandag 7 maart 2016 @ 12:10:29 #52
85514 ralfie
!Yvan eht nioj
pi_160486014
quote:
0s.gif Op maandag 7 maart 2016 11:55 schreef truedestiny het volgende:

[..]

Het is een meningsinventarisatie. Ik wil graag uit de resultaten halen wat de meest voorkomende redenen zijn om een actie niet te ondernemen.
Kijk, als je alleen wil weten hoe vaak optie 1-11 gebruikt zijn, heb je 11 variabelen nodig.
Als je ook nog eens wil kijken naar combinaties (bijv 1+3+7) moet je deze ook apart analyseren. Dit kan allemaal alleen in één variabele als je je resultaten wil reduceren tot één antwoord (bijv vrouwen tikken vaker hogere opties aan dan mannen).

Praktisch alle statistische pakketten hebben overigens methoden om automatisch dummy variabelen te maken wanneer je dit soort vragen als nominaal markeert.
pi_160486073
quote:
7s.gif Op maandag 7 maart 2016 11:24 schreef truedestiny het volgende:
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?
Kan Qualtrics dit niet voor je doen?
pi_160486620
quote:
0s.gif Op maandag 7 maart 2016 12:10 schreef ralfie het volgende:

[..]

Kijk, als je alleen wil weten hoe vaak optie 1-11 gebruikt zijn, heb je 11 variabelen nodig.
Als je ook nog eens wil kijken naar combinaties (bijv 1+3+7) moet je deze ook apart analyseren. Dit kan allemaal alleen in één variabele als je je resultaten wil reduceren tot één antwoord (bijv vrouwen tikken vaker hogere opties aan dan mannen).

Praktisch alle statistische pakketten hebben overigens methoden om automatisch dummy variabelen te maken wanneer je dit soort vragen als nominaal markeert.
Thanks!
quote:
0s.gif Op maandag 7 maart 2016 12:13 schreef MCH het volgende:

[..]

Kan Qualtrics dit niet voor je doen?
Niet bekend mee. Ik zal eens kijken
pi_160487233
quote:
7s.gif Op maandag 7 maart 2016 11:24 schreef truedestiny het volgende:
Ik ben nu bezig met een codeboek schrijven van een bestaande enquête. Hierin zit een vraag waarin de respondent er maximaal drie mag aankruisen(van de 11). Betekent dit dat ik 11 variabelen moet maken of is er een eenvoudigere manier beschikbaar?
Zoals anderen zeggen, ligt er een beetje aan wat je wil analyseren etc.
Als het geprinte vragenlijsten zijn en iemand moet ze invoeren in de computer, dan lijkt het me handiger om 3 variabelen (keuze 1, 2 3) aan te maken met 11 opties, dan 11 variabelen met ja/nee. Dat maakt het invoeren een stuk makkelijker.
pi_160619579
Vraag! *O*

Ik heb drie testen die ik analyseer, allemaal gemaakt door dezelfde groep personen, en ik wil onderzoeken of er verschil te vinden is tussen twee subgroepen van mijn totale groep proefpersonen. Verdeling is ruwweg 85/15. Nu heb ik daarvoor drie K-S testen uitgevoerd. Geen enkele nulhypothese verworpen, maar voor de test A die ik vooraf al op het oog had wel een p van ~0.11 (ik test tweezijdig en mijn cutoff is op 0.05). Nu is dit ook de enige test waarvoor groep X beter scoort dan groep Y. Op de andere twee tests B&C scoort groep Y beter dan X (p 0.33 en 0.49 oid). Nou kan ik er zo al meer dan zat over vertellen natuurlijk, maar het zou wel leuk zijn om daar nog wat verder in te duiken.

Mijn vraag: is er een manier om die drie analyses te combineren en de richting van het verschil tussen groepen mee te nemen? Ik zat oorspronkelijk te denken aan het vergelijken van rangscores (als iedereen uit X op zichzelf een hogere rangscore heeft in test A dan de hoogste van B,C, is daar in ieder geval consistentie van richting van een effect mee aangetoond). Iemand nog een beter idee? :)

Noot: ik gebruik R
Your opinion of me is none of my business.
pi_160647438
quote:
0s.gif Op zaterdag 12 maart 2016 20:15 schreef Sarasi het volgende:
Op de andere twee tests B&C scoort groep Y beter dan X (p 0.33 en 0.49 oid). Nou kan ik er zo al meer dan zat over vertellen natuurlijk,
Hier kun je niet zat over vertellen natuurlijk. Het ene niet significante resultaat is niet beter dan het andere n.s. resultaat.
pi_160649947
quote:
0s.gif Op zondag 13 maart 2016 21:25 schreef MCH het volgende:

[..]

Hier kun je niet zat over vertellen natuurlijk. Het ene niet significante resultaat is niet beter dan het andere n.s. resultaat.
Je kunt wat zeggen over de richting van een effect, over de resultaten in relatie tot de verwachting, over de betrouwbaarheidsintervallen, over de effectgrootte... Er is zat te vertellen zonder significante resultaten. :')
Your opinion of me is none of my business.
pi_160649996
quote:
1s.gif Op zondag 13 maart 2016 22:30 schreef Sarasi het volgende:

[..]

Je kunt wat zeggen over de richting van een effect, over de resultaten in relatie tot de verwachting, over de betrouwbaarheidsintervallen, over de effectgrootte... Er is zat te vertellen zonder significante resultaten. :')
Allemaal nee, want het is niet significant. Je zou hooguit een verklaring kunnen verzinnen, eigenlijk moeten geven waarom jouw data niet significant is.

[ Bericht 0% gewijzigd door #ANONIEM op 13-03-2016 22:32:22 ]
pi_160650229
quote:
0s.gif Op zondag 13 maart 2016 22:31 schreef MCH het volgende:

[..]

Allemaal nee, want het is niet significant. Je zou hooguit een verklaring kunnen verzinnen, eigenlijk moeten geven waarom jouw data niet significant is.
Het effect is er nog steeds hoor, ook al is het niet significant. Het effect heeft een richting, een effectgrootte, je kunt voor verschillende verdelingen een betrouwbaarheidsinterval opstellen en dat bekijken... Geen significant resultaat betekent niet dat je alles net zo goed de prullenbak in kunt flikkeren. Het betekent alleen dat je de nulhypothese niet mag verwerpen, niet dat je de alternatieve hypothese MOET verwerpen.
Your opinion of me is none of my business.
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')