Centraal Statistiektopic (SPSS, R, excel, etc.) #8

woensdag 3 juni 2015 @ 14:12:45 #76

oompaloompa

doompadeedee

quote:
Op woensdag 3 juni 2015 13:45 schreef Tobi-wan het volgende:
Ben nu druk bezig met mijn bijlage in orde te maken. Aanstaande maandag mijn scriptie inleveren

Heb bijna alleen gebruik gemaakt van schalen waardoor ik ordinale variabelen heb. Is het dan interessant om de standaarddeviatie er bij te zetten of kan ik dat beter weg laten. Ze zitten allemaal tussen den 0,8 en 1 wat volgens mij komt omdat de antwoorden altijd 1, 2, 3, 4 of 5 zijn.

Daarnaast heb ik niet een hele grote populatie. Volgens mij verteld de standaarddeviatie mij niet zoveel...

Edit: volgens mij moet std. dev. er altijd bij als je met gemiddeldes werkt.

De standaard deviatie geeft iets aan over de spreiding. Zo zou je een gemiddelde van 1.8 kunnen hebben op je schaal met een SD van bijna 0 (iedereen zegt 2 een paar zeggen 1) of een enorme hoge SD (veel mensen zeggen 4 of 5, meeste zeggen 1 of 2). Ik zou hem dus altijd rapporteren

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 3 juni 2015 @ 14:49:03 #77

Tobi-wan

quote:
Op woensdag 3 juni 2015 14:12 schreef oompaloompa het volgende:

[..]

De standaard deviatie geeft iets aan over de spreiding. Zo zou je een gemiddelde van 1.8 kunnen hebben op je schaal met een SD van bijna 0 (iedereen zegt 2 een paar zeggen 1) of een enorme hoge SD (veel mensen zeggen 4 of 5, meeste zeggen 1 of 2). Ik zou hem dus altijd rapporteren

Bedankt! Het is inderdaad wel nuttige informatie. Van al die cijfers wordt ik af een toe een beetje duizelig en dan ontgaat het logisch nadenken mij enigszins.

donderdag 4 juni 2015 @ 08:04:39 #78

Banaanensuiker

synergy

Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

vrijdag 5 juni 2015 @ 14:25:46 #79

Sarasi

Quack.

quote:
Op donderdag 4 juni 2015 08:04 schreef Banaanensuiker het volgende:
Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni.

Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 14:50:36 #80

VacaLoca

Bleh, zit even vast.

Ik onderzoek hoe een zestal antecedenten in relatie staat tot een afhankelijke variabele. De afhankelijke variabele is Organizational Identification - hoe mensen zich identificeren met een organisatie. Komt uiteindelijk dus een regressie analyse aan te pas, en een standaard regressie analyse heb ik ook al wel gehad in de studie.

Maar zitten wat haken en ogen aan bij mij:

- Ik richt mij op alle betaald voetbalclubs *Eredivisie en Jupiler)
- Ik maak een vergelijking tussen 3 stakeholder groepen (supporters, sponsoren en lokale politiek)

Van supporters heb ik van 33 clubs respondenten. Maar van PSV heb ik er bijvoorbeeld 380, van Ajax 140, van Vitesse 120 en van NEC 110... maar van kleine clubs als een Helmond Sport maar 1 bijvoorbeeld. In totaal heb ik er 1132

Van sponsoren heb ik er een stuk of 40 van Heerenveen, 30 van Willem II, 15 van FC Twente en voor aantal andere clubs rond de 10 elk. In totaal 323 sponsoren als respondent. Maar ik heb er 0 voor PSV en Ajax, die bij supporters het gros van de respondenten vormen.

Lokale politiek in de vorm van gemeenteraadsleden heb ik 10 a 15 respondenten voor elke gemeente, in totaal 417 respondenten.

Origineel was het idee om voor 1 club het onderzoek te doen. Maar omdat je van sponsoren en gemeenteraadsleden maar een tiental respondenten zou krijgen besloten om meer clubs bijeen te pakken en 'een betaald voetbalclub' het onderwerp te maken ipv bijvoorbeeld 'Vitesse' of 'Ajax'. Want voor multiple regression liefst 20 respondenten per onafhankelijke variabele, in mijn geval dus 120.

Nu zit ik dus met de volgende dingen:

- Mbt poolen van de data: kan je het zomaar allemaal bij elkaar gooien of zijn daar methodes voor en moet je gewichten er aan hangen oid? Kan via google niet echt vinden.
- Ik vergelijk dus 3 stakeholder groepen; als ik items ga verwijderen op basis van Reliability test (Cronbach alpha) en Discriminant validity (Factor analyse, dubbelladers en structuur) moet ik dan hetzelfde verwijderen bij elke groep? Dus als item X een dubbellader is bij de Supporters, maar niet bij de Sponsoren, dan wel bij beiden weghalen zodat beide modellen gelijk zijn aan elkaar als je gaat vergelijken, of wel op maat maken per groep?

- Supporters identificeren zich sws al vrij snel met hun club, en het is dus enigszins skewed. Is hier voor dit specifieke geval een goed remedie voor? Zou ik ook bijvoorbeeld gezien de grote sample de cases zodanig selecteren dat de afhankelijke variabele normaal verdeeld is?

- Als ik de drie groepen met elkaar vergelijk dan pak ik nu bijvoorbeeld voor lokale politiek Willem II, Vitesse, AZ, Twente en Heerenveen samen zodat ik er voldoende voor regression analyse heb én ik voor deze clubs ook voldoende sponsoren en fans heb. Maar de verhoudingen zijn wel totaal anders per stakeholder groep voor deze clubs. Waar het voor lokale politiek ongeveer 20,20,20,20,20 is, is het voor sponsoren iets van 35, 25, 15, 15, 10 en voor fans soortgelijke verdeling als sponsoren maar dan andere volgorde. Moeten deze verhoudingen gelijk zijn?

Moeten misschien zelfs de absolute aantallen gelijk zijn? Ik vergelijk uiteindelijk de standardized B van de onafhankelijke variabelen in de groepen. Daarnaast heb ik al wel variabele gemaakt die grootte van de club weergeeft waarvoor dus gecontroleerd kan worden.

Bleh, warrig verhaal aan het worden. In kort: ik zit met multiple regression met pooled data en met drie samples die vergeleken moeten worden; best practice?

vrijdag 5 juni 2015 @ 15:03:49 #81

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Dat ziet er best nice uit! Hoe kom je daar terecht? Lijkt mij als econometriestudent wel een leuk bijbaantje.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 15:15:06 #82

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 15:03 schreef wimjongil het volgende:

[..]

Dat ziet er best nice uit! Hoe kom je daar terecht? Lijkt mij als econometriestudent wel een leuk bijbaantje.

Is hier alleen voor psychologie en sociologie, via de vacaturebank in BlackBoard.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 16:27:43 #83

oompaloompa

doompadeedee

quote:
Op donderdag 4 juni 2015 08:04 schreef Banaanensuiker het volgende:
Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

Ik heb alleen kennis van R in een aantal specifieke domeinen. Heb wel thuis op mn HD een aantal goede tutorials/courses staan, weet niet of je er iets aan hebt maar deel ze graag met je.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 16:32:29 #84

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Gefeliciteerd!

quote:
Op vrijdag 5 juni 2015 14:50 schreef VacaLoca het volgende:
Bleh, zit even vast.

Ik onderzoek hoe een zestal antecedenten in relatie staat tot een afhankelijke variabele. De afhankelijke variabele is Organizational Identification - hoe mensen zich identificeren met een organisatie. Komt uiteindelijk dus een regressie analyse aan te pas, en een standaard regressie analyse heb ik ook al wel gehad in de studie.

Maar zitten wat haken en ogen aan bij mij:

- Ik richt mij op alle betaald voetbalclubs *Eredivisie en Jupiler)
- Ik maak een vergelijking tussen 3 stakeholder groepen (supporters, sponsoren en lokale politiek)

Van supporters heb ik van 33 clubs respondenten. Maar van PSV heb ik er bijvoorbeeld 380, van Ajax 140, van Vitesse 120 en van NEC 110... maar van kleine clubs als een Helmond Sport maar 1 bijvoorbeeld. In totaal heb ik er 1132

Van sponsoren heb ik er een stuk of 40 van Heerenveen, 30 van Willem II, 15 van FC Twente en voor aantal andere clubs rond de 10 elk. In totaal 323 sponsoren als respondent. Maar ik heb er 0 voor PSV en Ajax, die bij supporters het gros van de respondenten vormen.

Lokale politiek in de vorm van gemeenteraadsleden heb ik 10 a 15 respondenten voor elke gemeente, in totaal 417 respondenten.

Origineel was het idee om voor 1 club het onderzoek te doen. Maar omdat je van sponsoren en gemeenteraadsleden maar een tiental respondenten zou krijgen besloten om meer clubs bijeen te pakken en 'een betaald voetbalclub' het onderwerp te maken ipv bijvoorbeeld 'Vitesse' of 'Ajax'. Want voor multiple regression liefst 20 respondenten per onafhankelijke variabele, in mijn geval dus 120.

Nu zit ik dus met de volgende dingen:

- Mbt poolen van de data: kan je het zomaar allemaal bij elkaar gooien of zijn daar methodes voor en moet je gewichten er aan hangen oid? Kan via google niet echt vinden.
- Ik vergelijk dus 3 stakeholder groepen; als ik items ga verwijderen op basis van Reliability test (Cronbach alpha) en Discriminant validity (Factor analyse, dubbelladers en structuur) moet ik dan hetzelfde verwijderen bij elke groep? Dus als item X een dubbellader is bij de Supporters, maar niet bij de Sponsoren, dan wel bij beiden weghalen zodat beide modellen gelijk zijn aan elkaar als je gaat vergelijken, of wel op maat maken per groep?

- Supporters identificeren zich sws al vrij snel met hun club, en het is dus enigszins skewed. Is hier voor dit specifieke geval een goed remedie voor? Zou ik ook bijvoorbeeld gezien de grote sample de cases zodanig selecteren dat de afhankelijke variabele normaal verdeeld is?

- Als ik de drie groepen met elkaar vergelijk dan pak ik nu bijvoorbeeld voor lokale politiek Willem II, Vitesse, AZ, Twente en Heerenveen samen zodat ik er voldoende voor regression analyse heb én ik voor deze clubs ook voldoende sponsoren en fans heb. Maar de verhoudingen zijn wel totaal anders per stakeholder groep voor deze clubs. Waar het voor lokale politiek ongeveer 20,20,20,20,20 is, is het voor sponsoren iets van 35, 25, 15, 15, 10 en voor fans soortgelijke verdeling als sponsoren maar dan andere volgorde. Moeten deze verhoudingen gelijk zijn?

Moeten misschien zelfs de absolute aantallen gelijk zijn? Ik vergelijk uiteindelijk de standardized B van de onafhankelijke variabelen in de groepen. Daarnaast heb ik al wel variabele gemaakt die grootte van de club weergeeft waarvoor dus gecontroleerd kan worden.

Bleh, warrig verhaal aan het worden. In kort: ik zit met multiple regression met pooled data en met drie samples die vergeleken moeten worden; best practice?

Klinkt als een multilevel model.
Is essentie komt het er op neer dat je je data een soort van trapsgewijs bekijkt.
Dus al je datapunt splits je eerst op over de verschillende clubs (waarbij je het effect van club berekent), daarna kun je binnen de clubs het effect van supporter / sponsor / etc. bekijken.

Het is niet heel ingewikkeld om te doen, maar ook niet het allergemakkelijkste.

Kijk anders even met google of zo of je denkt dat dit voor je kan werken, en kom dan terug?

Tegen de skewness zou je een logtransformatie kunnen gebruiken, maar de meeste toetsen zijn vrij robust zolang je n hoger dan 30 is, als het je uitkomst al beinvloedt zal dat enorm in de marge zijn dus ik zou me daar denk ik niet te druk om maken.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 16:35:23 #85

VacaLoca

Ik ga googelen, thanks!

vrijdag 5 juni 2015 @ 16:58:18 #86

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 15:15 schreef Sarasi het volgende:

[..]

Is hier alleen voor psychologie en sociologie, via de vacaturebank in BlackBoard.

Niet helemaal waar:

quote:
Omdat de Methodologiewinkel een dienst is van de GMW faculteit krijgen GMW studenten in drukke periodes voorrang op studenten van andere faculteiten.

Maargoed, Nestor maar in de gaten houden dus.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 16:59:42 #87

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 16:58 schreef wimjongil het volgende:

[..]

Niet helemaal waar:

[..]

Maargoed, Nestor maar in de gaten houden dus.

Dat is voor hulp, niet voor sollicitanten.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 17:34:14 #88

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 16:59 schreef Sarasi het volgende:

[..]

Dat is voor hulp, niet voor sollicitanten.

Aha, op die fiets. Je zin was dubbelzinnig.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 17:34:22 #89

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 16:27 schreef oompaloompa het volgende:

[..]

Ik heb alleen kennis van R in een aantal specifieke domeinen. Heb wel thuis op mn HD een aantal goede tutorials/courses staan, weet niet of je er iets aan hebt maar deel ze graag met je.

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

vrijdag 5 juni 2015 @ 18:21:03 #90

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 17:34 schreef wimjongil het volgende:

[..]

Aha, op die fiets. Je zin was dubbelzinnig.

Sorry voor de onduidelijkheid.

quote:
Op vrijdag 5 juni 2015 17:34 schreef Banaanensuiker het volgende:

[..]

[..]

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

Nee, sorry.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 18:26:24 #91

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 17:34 schreef Banaanensuiker het volgende:

[..]

[..]

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

Ja maar alleen in het abstracte / als concept, verder alleen gebruik gemaakt bij mediatie-analyses.

In principe komt het gewoon neer op data genereren van een bestaande dataset, analyse op uitvoeren, en dit 100.000 (of hoeveel je wilt) keer doen om een betrouwbaardere statistic te krijgen toch? Ik weet niet of jij het voor hetzelfde wilt gebruiken als hoe ik het ken, heb geen ervaring met het gebruik bij een Wald-test maar als het conceptueel een beetje vergelijkbaar is kan ik misschien nog iets nuttigs zeggen

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 19:11:02 #92

VacaLoca

quote:
Op vrijdag 5 juni 2015 16:32 schreef oompaloompa het volgende:

[..]

Gefeliciteerd!

[..]

Klinkt als een multilevel model.
Is essentie komt het er op neer dat je je data een soort van trapsgewijs bekijkt.
Dus al je datapunt splits je eerst op over de verschillende clubs (waarbij je het effect van club berekent), daarna kun je binnen de clubs het effect van supporter / sponsor / etc. bekijken.

Het is niet heel ingewikkeld om te doen, maar ook niet het allergemakkelijkste.

Kijk anders even met google of zo of je denkt dat dit voor je kan werken, en kom dan terug?

Tegen de skewness zou je een logtransformatie kunnen gebruiken, maar de meeste toetsen zijn vrij robust zolang je n hoger dan 30 is, als het je uitkomst al beinvloedt zal dat enorm in de marge zijn dus ik zou me daar denk ik niet te druk om maken.

Nou, nu verschillende dingen gekeken en gelezen er over. Steeds maakte begin uitleg me enthousiast aangezien het leek te behandelen wat ik nodig heb, maar dan gaat het al snel voorbij wat ik ooit geleerd heb met syntax en andere statistiek tools etc.

Ook lijkt het vooral te concentreren op longitudinaal onderzoek waar bijvoorbeeld leeftijd als variabele gemeten is om de 2 jaar. Daar is wel voorbeeld van voor SPSS met Mixed Models maar daar heb je dan bv age1 age2 age3 als variabelen.. lijkt niet te zijn wat ik moet hebben.

/lost

vrijdag 5 juni 2015 @ 21:00:04 #93

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 18:26 schreef oompaloompa het volgende:

[..]

Ja maar alleen in het abstracte / als concept, verder alleen gebruik gemaakt bij mediatie-analyses.

In principe komt het gewoon neer op data genereren van een bestaande dataset, analyse op uitvoeren, en dit 100.000 (of hoeveel je wilt) keer doen om een betrouwbaardere statistic te krijgen toch? Ik weet niet of jij het voor hetzelfde wilt gebruiken als hoe ik het ken, heb geen ervaring met het gebruik bij een Wald-test maar als het conceptueel een beetje vergelijkbaar is kan ik misschien nog iets nuttigs zeggen

Qua concept is het inderdaad wat ik wil doen. Ik quote even een eerdere post van mij zodat je direct kan zien of je er wat mee kan:

quote:
Op vrijdag 29 mei 2015 11:30 schreef Banaanensuiker het volgende:
Heeft iemand hier verstand van bootstrapping met doel het ontwikkelen van observatie specifieke kritieke Wald scores? Ik probeer dit in combinatie met een SUR.
Deze procedure probeer ik na te bootsen:
[ afbeelding ]
[ afbeelding ]

Met dit systeem:
[ afbeelding ]

vrijdag 5 juni 2015 @ 23:09:21 #94

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 19:11 schreef VacaLoca het volgende:

[..]

Nou, nu verschillende dingen gekeken en gelezen er over. Steeds maakte begin uitleg me enthousiast aangezien het leek te behandelen wat ik nodig heb, maar dan gaat het al snel voorbij wat ik ooit geleerd heb met syntax en andere statistiek tools etc.

Ook lijkt het vooral te concentreren op longitudinaal onderzoek waar bijvoorbeeld leeftijd als variabele gemeten is om de 2 jaar. Daar is wel voorbeeld van voor SPSS met Mixed Models maar daar heb je dan bv age1 age2 age3 als variabelen.. lijkt niet te zijn wat ik moet hebben.

/lost

De voorbeelden die vaak gebruikt worden is idd longitudinaal onderzoek, daar zijn de jaren meetpunten, en is de "groep" het individu. Dus per individu heb je x-aantal meetpunten. Bij jou zou het individu de club zijn, en heb je per club een aantal meetpunten (binding van sponsoren en binding van supporters).

Het is niet extreem moeilijk, maar misschien wel te moeilijk om duidelijk hier zo op een forum uit te leggen.
Voor welke uni / opleiding / sciptie(?) is het? Misschien kun je er mee wegkomen een gemakkelijker maar minder correct model te gebruiken, of als heel belangrijk zouden ze mensen moeten hebben die je er mee kunnen helpen (lijkt me). Het is, weet ik vrij zeker, de beste oplossing, maar als dit ver buiten wat je geleerd hebt gaat zou het vreemd zijn als ze van je verwachten dit gewoon even te doen.

quote:
Op vrijdag 5 juni 2015 21:00 schreef Banaanensuiker het volgende:

[..]

Qua concept is het inderdaad wat ik wil doen. Ik quote even een eerdere post van mij zodat je direct kan zien of je er wat mee kan:

[..]

Ik kom van psy en ben heel erg slecht in het lezen van wiskundige noteringen (

ik weet het...) dus daar moet ik even voor gaan zitten. Kom je wel tot een bepaald punt of gaat het in het begin al mis?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 23:48:58 #95

VacaLoca

quote:
Op vrijdag 5 juni 2015 23:09 schreef oompaloompa het volgende:

[..]

De voorbeelden die vaak gebruikt worden is idd longitudinaal onderzoek, daar zijn de jaren meetpunten, en is de "groep" het individu. Dus per individu heb je x-aantal meetpunten. Bij jou zou het individu de club zijn, en heb je per club een aantal meetpunten (binding van sponsoren en binding van supporters).

Het is niet extreem moeilijk, maar misschien wel te moeilijk om duidelijk hier zo op een forum uit te leggen.
Voor welke uni / opleiding / sciptie(?) is het? Misschien kun je er mee wegkomen een gemakkelijker maar minder correct model te gebruiken, of als heel belangrijk zouden ze mensen moeten hebben die je er mee kunnen helpen (lijkt me). Het is, weet ik vrij zeker, de beste oplossing, maar als dit ver buiten wat je geleerd hebt gaat zou het vreemd zijn als ze van je verwachten dit gewoon even te doen.

Business Administration aan Radboud, master thesis. Meer dan de meest basic multiple regression hebben we niet gehad. Bespreek de analyse komende week pas voor het eerst met begeleider (in totaal maar 5 contacturen gehad hooguit) maar over 2 weken is deadline scriptie al.

Wat je nu schetst neemt dus al de stakeholder groepen mee. Vergelijking tussen stakeholder groepen is echter aparte hypothese. Ik test ook relaties onafhankelijke variabelen met afhankelijk per stakeholder groep apart.

Even een versimpelde mockup van de data:

(In werkelijkheid 6 onafhankelijke en 1 afhankelijke en dus voor veel clubs)

Met multiple regression dus hypotheses testen

1a: Independent1 has a positive effect on Dependent for Fans
1b: Independent1 has a positive effect on Dependent for Sponsors
1c: Independent1 has a positive effect on Dependent for Local Government (Gemeente)
2a: Independent2 has a positive effect on Dependent for Fans
2b: Independent2 has a positive effect on Dependent for Sponsors
2c: Independent2 has a positive effect on Dependent for Local Government (Gemeente)

En dan aparte hypothese:

The effects of the different antecedents of Dependent differ among stakeholder groups

Waarbij in soortgelijk onderzoek de standardized effect sizes (B) vergeleken werden.

Maar als je mijn geval bekijkt.. in voorbeelden gebruiken ze Age1, Age2, Age3 bijvoorbeeld. Dat is 1 item over 3 metingen. Als ik 1 item had gehad, laten we ook even leeftijd nemen. Dan zou ik dus 3 variabelen moeten hebben; Age_Sponsor, Age_Fan, Age_Gemeente en dan in SPSS met Data > Restructure die variabelen moeten transposen.

Maar in mijn mockup voorbeeld zou ik dan IND1_Item1_Sponsor, IND1_item1_Fan, IND1_Item2_Gemeente etc moeten maken? Of voor de recoded scale? (IND1 met MEAN(item1,item2) en IND2) en dan IND1_Fan, IND1_Sponsor, IND1_Gemeente IND2_Fan etc?

Krijg er nog niet echt vat op omdat ik overal maar de helft van de uitleg lees en de rest in syntax is wat ik nooit gehad heb.

Weet niet hoeveel ze van me verwachten, die vorig jaar zijn afgestudeerd hiermee hadden het wel met simpele multiple regression gedaan maar die hadden geen pooled data. Veel meer dan dat ik het wel op mijn manier kon doen (meerdere clubs om sample te vergroten) dmv poolen heb ik niet meegekregen tot dusver. Maar heb het idee dat ik niet echt statistisch verantwoord bezig ben met gewooon de multiple regression draaien met respondenten van alle clubs op 1 hoop.

Thanks voor antwoorden btw!

zaterdag 6 juni 2015 @ 00:33:29 #96

haha94boem

haha boem

Dag mensen,

Ik ben bezig met mijn scriptie en heb twee vragen. Mijn eerste vraag: ik ga de aandelenprijs proberen te voorspellen aan de hand van onder andere CEO tenure (de variabele waarin ik geinteresseerd ben, wijkt deze significant af van 0?). Ik wil dit doen voor alle S&P500 companies, en later voor alleen technologie bedrijven binnen de S&P500. Als ik deze technologie bedrijven allemaal in een regressie wil stoppen, hoe doe ik dat op een efficiente manier? Ik neem aan dat 1 voor 1 niet de juiste methode is.

Ik hoor het graag van jullie. Vriendelijke groet

zaterdag 6 juni 2015 @ 11:26:30 #97

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 23:09 schreef oompaloompa het volgende:

[..]

Ik kom van psy en ben heel erg slecht in het lezen van wiskundige noteringen ( ik weet het...) dus daar moet ik even voor gaan zitten. Kom je wel tot een bepaald punt of gaat het in het begin al mis?

Ik ga het op een andere manier doen; samen met mijn supervisor besloten dat er in mijn geval efficiëntere tijdsbesteding is. In ieder geval bedankt voor je bereidheid tot helpen.

zaterdag 6 juni 2015 @ 15:29:55 #98

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 23:48 schreef VacaLoca het volgende:

[..]

Business Administration aan Radboud, master thesis. Meer dan de meest basic multiple regression hebben we niet gehad. Bespreek de analyse komende week pas voor het eerst met begeleider (in totaal maar 5 contacturen gehad hooguit) maar over 2 weken is deadline scriptie al.

Wat je nu schetst neemt dus al de stakeholder groepen mee. Vergelijking tussen stakeholder groepen is echter aparte hypothese. Ik test ook relaties onafhankelijke variabelen met afhankelijk per stakeholder groep apart.

Even een versimpelde mockup van de data:

[ afbeelding ]

(In werkelijkheid 6 onafhankelijke en 1 afhankelijke en dus voor veel clubs)

Met multiple regression dus hypotheses testen

1a: Independent1 has a positive effect on Dependent for Fans
1b: Independent1 has a positive effect on Dependent for Sponsors
1c: Independent1 has a positive effect on Dependent for Local Government (Gemeente)
2a: Independent2 has a positive effect on Dependent for Fans
2b: Independent2 has a positive effect on Dependent for Sponsors
2c: Independent2 has a positive effect on Dependent for Local Government (Gemeente)

En dan aparte hypothese:

The effects of the different antecedents of Dependent differ among stakeholder groups

Waarbij in soortgelijk onderzoek de standardized effect sizes (B) vergeleken werden.

Maar als je mijn geval bekijkt.. in voorbeelden gebruiken ze Age1, Age2, Age3 bijvoorbeeld. Dat is 1 item over 3 metingen. Als ik 1 item had gehad, laten we ook even leeftijd nemen. Dan zou ik dus 3 variabelen moeten hebben; Age_Sponsor, Age_Fan, Age_Gemeente en dan in SPSS met Data > Restructure die variabelen moeten transposen.

Maar in mijn mockup voorbeeld zou ik dan IND1_Item1_Sponsor, IND1_item1_Fan, IND1_Item2_Gemeente etc moeten maken? Of voor de recoded scale? (IND1 met MEAN(item1,item2) en IND2) en dan IND1_Fan, IND1_Sponsor, IND1_Gemeente IND2_Fan etc?

Krijg er nog niet echt vat op omdat ik overal maar de helft van de uitleg lees en de rest in syntax is wat ik nooit gehad heb.

Weet niet hoeveel ze van me verwachten, die vorig jaar zijn afgestudeerd hiermee hadden het wel met simpele multiple regression gedaan maar die hadden geen pooled data. Veel meer dan dat ik het wel op mijn manier kon doen (meerdere clubs om sample te vergroten) dmv poolen heb ik niet meegekregen tot dusver. Maar heb het idee dat ik niet echt statistisch verantwoord bezig ben met gewooon de multiple regression draaien met respondenten van alle clubs op 1 hoop.

Thanks voor antwoorden btw!

Hoef je niet te testen of de effecten van de fans / sponsors / local government sig van elkaar verschillen? Dat maakt alles al een heel stuk gemakkelijker.

Een gewone multiple regressie met alles op een hoop is niet per se heel erg fout, maar geeft je minder asccurate schattingen etc. gewoon omdat je het effect van club niet meeneemt, dat filter je er in een multilevel uit.

Ik ben even aan aan het kloten met een voorbeeld dataset, maar moet zo weg. Als het niet op tijd lukt zou ik denk ik een gewone muiltiple regressie doen, dit meenemen naar de meeting (zeker aangezien je maar zo weinig meet, wat slecht eigenlijk :/ ) en dan in de meeting aangeven dat je extre hebt gekeken wat de beste analyse is, dit multilevel lijkt te zijn maar dit ver boven wat je hebt geleerd uitgaat, en niet iets is dat je jezelf gemakkelijk aanleert en dan vragen of je daar support bij kan krijgen.

Dan geef je aan dat je het 1. heel serieus hebt genomen, 2. je ook nog een backup analyse hebt gedaan zoals je hem hebt geleerd, and hopelijk krijg je hulp bij 3. of krijg je te horen dat het niet nodig is, totale win-win situatie lijkt me

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zaterdag 6 juni 2015 @ 15:53:28 #99

VacaLoca

quote:
Op zaterdag 6 juni 2015 15:29 schreef oompaloompa het volgende:

[..]

Hoef je niet te testen of de effecten van de fans / sponsors / local government sig van elkaar verschillen? Dat maakt alles al een heel stuk gemakkelijker.

Dat moet wel, maar de eerste hypotheses meten de relaties per stakeholder groep apart. Kijken of effecten sig verschillen doe ik dus ook maar voor een latere hypothese (maar wat wel de hoofdvraag is zo'n beetje van het onderzoek - of ze sig verschillen)

quote:
Een gewone multiple regressie met alles op een hoop is niet per se heel erg fout, maar geeft je minder asccurate schattingen etc. gewoon omdat je het effect van club niet meeneemt, dat filter je er in een multilevel uit.

Ik ben even aan aan het kloten met een voorbeeld dataset, maar moet zo weg. Als het niet op tijd lukt zou ik denk ik een gewone muiltiple regressie doen, dit meenemen naar de meeting (zeker aangezien je maar zo weinig meet, wat slecht eigenlijk :/ ) en dan in de meeting aangeven dat je extre hebt gekeken wat de beste analyse is, dit multilevel lijkt te zijn maar dit ver boven wat je hebt geleerd uitgaat, en niet iets is dat je jezelf gemakkelijk aanleert en dan vragen of je daar support bij kan krijgen.

Dan geef je aan dat je het 1. heel serieus hebt genomen, 2. je ook nog een backup analyse hebt gedaan zoals je hem hebt geleerd, and hopelijk krijg je hulp bij 3. of krijg je te horen dat het niet nodig is, totale win-win situatie lijkt me

Thanks!!

Ik zorg inderdaad dat ik een uitwerking heb van de methode zoals we die geleerd hebben en zal het zeker behandelen in gesprek. Alleen aardige tijdnood dus helaas. Heel hoofdstuk 4, 5 en 6 in 13 dagen plus nog een herkansing

zaterdag 6 juni 2015 @ 17:59:38 #100

VacaLoca

Even een simplere vraag tussendoor: Als je meerdere groepen in een sample hebt zoals eerder beschreven, doe je dan factor analyse voor discriminant validity controleren voor de hele sample of per groep?

Had per groep gedaan, maar lees nu een paper met soortgelijke situatie (die helaas niet uitweiden over hoe ze de regressieanalyse gedaan hebben) waarin ze voor totale sample hebben gedaan.

zondag 7 juni 2015 @ 15:20:19 #101

VacaLoca

Bleh, shoot me.

Nog wat aan het zoeken en puzzelen geweest.

Is dit enigszins juist?:

Volgende syntax gedraaid:

1
2
3
4
5

mixed OrganizationalIdentification with DomainInvolvement RegionalAffiliation PerceivedCSR OrgPrestige OrgDistinctiveness ContactFrequency
/fixed =
/method = ml
/random = intercept | subject(ClubID)
/print = solution.

Om te beoordelen of Multi Model wel nodig is aan de hand van intraclass correlation (ICC) op basis van de Clubs

Heb dit gedaan per stakeholder groep en volgende output:

Local Government:

0.071456 / (0.071456 + 0.855686) = 0.077 = 7.7%

Sponsors:

0.027478 / (0.027478 + 0.955224) = 0.027 = 2.7%

Fans:

0.031911 / (0.031911+0.795851) = 0.038 = 3.8%

Deze lijken me niet genoeg impact te hebben om over te gaan op Multi Model als ik per stakeholder groep de relaties wil testen met regressieanalyse?

Ook gekeken naar de -2 Log Likelihood van het model met de random component Club en zonder. Het is bij Local Government bijvoorbeeld 1138.8 ten opzichte van 1150.

Nu zag ik het volgende in een voorbeeld:

quote:
Chi square=203 026.467 - 196 165.706 = 6860.76, with 1 df, p=0.000. The outcome is highly significant and indicates that a two-level model is necessary.

Maar daar slaan ze stukje over toch? Chi2 is toch niet puur het verschil tussen de 2 getallen en dan bij df=1 kijken of het hoger is dan 3.84?

Chi2 is toch in mijn geval:

1
2
3

(1150-1138.8)[sup]2[/sup]
---------------------------------- = 0.109
1150

Ofwel niet significant?

Welke is het in dit geval? Bij laatste bevestigd het dat one-level volstaat, maar als de waarde 11.2 is dan is het <0.01 en wijst dat op two-level

Voor hele sample is ICC voor clubs trouwens 15% maar dat lijkt me meer verklaard worden door de stakeholder groepen. Als ik bovenstaande ICC test met de stakeholder groep als random component dan is de ICC 28% dus dat is wel aanzienlijk met een p<0.001 bij Likelihood vergelijking welk getal ik ook pak.

Maar voor clubs dus twijfel

donderdag 11 juni 2015 @ 09:32:23 #102

superkimmi

Hakuna Matata

Ik heb een vraagje. In mijn thesis doe ik onderzoek naar 'gerrymandering' in the USA (het herverdelen van kiesdistricten om een meerderheid te verkrijgen). ik heb zelf de data over gerrymandering verzameld tussen 1961 en nu en heb van mijn begeleider de data gekregen met wie er in welk district de verkiezingen heeft gewonnen en met hoeveel procent vd stemmen. Mijn eigen data werkt helemaal met cijfers (geen gerrymandering is een nul, wel een 1). Maar die van mijn begeleider werkt uiteraard met namen. Nu bestaat zijn data uit meet dan 20.000 records, dus handmatig overzetten in werkbare cijfers gaat een tijd duren. Is er nog een andere manier waarop ik met beide datasets een regressie kan uitvoeren (in eviews of SPSS, want daar heb ik ervaring mee. we hebben op de uni evt ook Stata) zonder dat ik alles handmatig in cijfers hoef te veranderen.

Het gaat dus vooral om het transformeren van de begeleider zijn data in iets wat SPSS of eviews begrijpt. Als ik dat eenmaal heb lukt het uitvoeren van een regressie wel. Ik kan dit ook aan mijn begeleider vragen, maar die is er tot maandag niet meer en maandag heb ik een afspraak met hem waarbij ik eigenlijk hoop al wat resultaten te kunnen overleggen.

life is what happens to you, while you're busy making other plans.

donderdag 11 juni 2015 @ 14:13:08 #103

wimjongil

Harde man

quote:
Op donderdag 11 juni 2015 09:32 schreef superkimmi het volgende:
Ik heb een vraagje. In mijn thesis doe ik onderzoek naar 'gerrymandering' in the USA (het herverdelen van kiesdistricten om een meerderheid te verkrijgen). ik heb zelf de data over gerrymandering verzameld tussen 1961 en nu en heb van mijn begeleider de data gekregen met wie er in welk district de verkiezingen heeft gewonnen en met hoeveel procent vd stemmen. Mijn eigen data werkt helemaal met cijfers (geen gerrymandering is een nul, wel een 1). Maar die van mijn begeleider werkt uiteraard met namen. Nu bestaat zijn data uit meet dan 20.000 records, dus handmatig overzetten in werkbare cijfers gaat een tijd duren. Is er nog een andere manier waarop ik met beide datasets een regressie kan uitvoeren (in eviews of SPSS, want daar heb ik ervaring mee. we hebben op de uni evt ook Stata) zonder dat ik alles handmatig in cijfers hoef te veranderen.

Het gaat dus vooral om het transformeren van de begeleider zijn data in iets wat SPSS of eviews begrijpt. Als ik dat eenmaal heb lukt het uitvoeren van een regressie wel. Ik kan dit ook aan mijn begeleider vragen, maar die is er tot maandag niet meer en maandag heb ik een afspraak met hem waarbij ik eigenlijk hoop al wat resultaten te kunnen overleggen.

Zijn dat 20 000 verschillende namen of maar een paar? Je kunt wel een scriptje schrijven waarin je alle namen een nummer geeft, waarna je met dat nummer gaat rekenen en er na afloop weer die naam aan koppelt. In R is dat niet bijzonder moeilijk weet ik, Stata zou ook wel te doen zijn. SPSS en eviews heb ik niet genoeg kennis van.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

donderdag 11 juni 2015 @ 14:15:53 #104

superkimmi

Hakuna Matata

quote:
Op donderdag 11 juni 2015 14:13 schreef wimjongil het volgende:

[..]

Zijn dat 20 000 verschillende namen of maar een paar? Je kunt wel een scriptje schrijven waarin je alle namen een nummer geeft, waarna je met dat nummer gaat rekenen en er na afloop weer die naam aan koppelt. In R is dat niet bijzonder moeilijk weet ik, Stata zou ook wel te doen zijn. SPSS en eviews heb ik niet genoeg kennis van.

Het zit er qua aantal tussenin. Het gaat om de verkiezingen sinds 1960 tot van alle districten. Een naam komt uiteraard vaker voor, wanneer iemand vaker heeft meegedaan aan verkiezingen, maar het zijn zeker duizenden namen.

life is what happens to you, while you're busy making other plans.

donderdag 11 juni 2015 @ 14:24:07 #105

wimjongil

Harde man

quote:
Op donderdag 11 juni 2015 14:15 schreef superkimmi het volgende:

[..]

Het zit er qua aantal tussenin. Het gaat om de verkiezingen sinds 1960 tot van alle districten. Een naam komt uiteraard vaker voor, wanneer iemand vaker heeft meegedaan aan verkiezingen, maar het zijn zeker duizenden namen.

Ah ja, dat dacht ik al.

Voorbeeld in R pseudocode:

1
2
3
4
5
6
7
8
9
10
11

data$nieuwekolom <- NA
for(i in 1:20000){
for(j in 1:i){
  if(naam[i] == naam[j]{
   data$nieuwekolom[i] = j
  }
  else{
    data$nieuwekolom[i] = i
   }
}
}

Aan zoiets moet je denken. Die if statement moet je even mee opletten want strings vergelijken gaat niet zomaar.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

donderdag 11 juni 2015 @ 14:30:13 #106

superkimmi

Hakuna Matata

Ok dankje

Het is fijn om te weten dat er in ieder geval methodes bestaan om er mee te puzzelen. Alles handmatig leek me een tikkeltje overdreven.

life is what happens to you, while you're busy making other plans.

zondag 14 juni 2015 @ 01:38:19 #107

haha94boem

haha boem

Dag mensen,

kunnen jullie mij helpen? Ik wil (denk ik) een logregressie uitvoeren. Hierbij is de log de dependent variable, oftewel de abnormal return (abnormalret). thirtysix, ninetysix, hundredfiftysix en hunfiftysixPLUS zijn dummy variabelen die gelijk staan aan 1 indien de waardes van tenure respectievelijk 0-35, 36-95, 96-155 en 156+ zijn. Ten slotte is er ook nog de marktcapitalisatie die ik als variabele in wil voeren in het model.

Mijn model moet worden: logabnormalret = b1*thirtysix + b2*ninetysix + b3*hundredfiftysix + b4*hunfiftysixPLUS + b5*marketcap.

Hoe doe ik dit? Ik probeer ten eerste de normale abnormalret in mijn edit tabel te replacen met logabnormalret, maar volgens mij kan logabnormalret niet bestaan zonder abnormalret? Ten tweede wil ik tenure niet in mijn model maar moet ik het volgens mij wel invoeren in de edit tabel omdat de dummyvariabelen anders niet werken?

Ik heb net geprobeerd regressies te doen maar ik kreeg steeds de melding dat er geen observaties waren? Bij die regressie probeerde ik logabnormal ret te regresseren op de 4 dummies en marketcap.

Kunnen jullie mij helpen? Ben een zieke STATA noob en weet niet wat wel en niet kan, en wat ik fout doe. Vriendelijke groet.

http://i.imgur.com/ckQYiow.png

zondag 14 juni 2015 @ 02:55:51 #108

haha94boem

haha boem

Het heeft met multicollinearity te maken maar zelfs als ik dingen verander ervaar ik hetzelfde!!

http://i.imgur.com/RlIKye9.png

Zou de formule: log(abnormal return) = constant + b1*tenure0-3jaar + b2*tenure13+jaar + b3*marketcap dit oplossen? Omdat er dan niet per se een dummy variabele is? Of, omdat de constant dan eigenlijk de waarde van de vorige dummy variabeles die nu zijn verdwenen meeneemt (3-8 jaar en 8-13 jaar) krijg ik nog steeds hetzelfde probleem? Zo niet, verklaart de constante dan in het nieuwe geval het effect van 3-13 jaar tenure?

[ Bericht 52% gewijzigd door haha94boem op 14-06-2015 03:13:54 ]

zondag 14 juni 2015 @ 09:14:52 #109

Banaanensuiker

synergy

Het is bijna altijd slim om de constant er gewoon in te laten. Dit gebeurt automatisch in stata.
Daarnaast is het slim om eerst de dummy variabelen te creëren voordat je je model schat.

Als je abnormalret in je dataset hebt en je wilt de log is dit de syntax:
gen logabnormalret=Log(abnormalret)

zondag 14 juni 2015 @ 09:17:37 #110

Banaanensuiker

synergy

Ik zie je screenshot nu pas, en je probleem zit hem waarschijnlijk in het lage aantal observaties. Daardoor is er geen variantie tussen observatie en kan er niks geschat worden.
In dit geval is dus een regressie geen optie.

zondag 14 juni 2015 @ 14:22:54 #111

crossover

Die foutmelding 'no observations' heeft er waarschijnlijk mee te maken dat stata altijd alleen observaties meeneemt zonder missings. Misschien wil je de missings in een 0 veranderen? Tenminste, als dat dummies zijn.
Overigens kan je ook originele variabelen gebruiken en in er 'ib2.' voor zetten (als de tweede categorie je referentie is, anders ib1. of ib3 of wat dan ook).

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

zondag 14 juni 2015 @ 18:07:40 #112

haha94boem

haha boem

Dag mensen,

Bedankt voor jullie reacties. Ik heb inmiddels geprobeerd om gewoon alle data in te voeren en nu lukte het wel. Weet niet of het dan daadwerkelijk ligt aan een te lage hoeveelheid observaties in het eerste geval.

In ieder geval, ik heb nog een vraag. Ik denk dat ik log(abnormalreturn) wil regressen ipv abnormal return. Echter, als ik gen logabnormalreturn = log(abnormalreturn) doe, worden mijn negatieve waardes 'verwijderd' bij log: http://i.imgur.com/LT5PI8c.png

Hoe kan ik nu een logregressie doen? Ik moet ook de negatieve abnormal returns meenemen voor mijn onderzoek, maar ik weet niet wat ik nu moet doen om dit op te lossen. Heeft iemand tips?

zondag 14 juni 2015 @ 18:44:24 #113

crossover

quote:
Op zondag 14 juni 2015 18:07 schreef haha94boem het volgende:
Dag mensen,

Bedankt voor jullie reacties. Ik heb inmiddels geprobeerd om gewoon alle data in te voeren en nu lukte het wel. Weet niet of het dan daadwerkelijk ligt aan een te lage hoeveelheid observaties in het eerste geval.

In ieder geval, ik heb nog een vraag. Ik denk dat ik log(abnormalreturn) wil regressen ipv abnormal return. Echter, als ik gen logabnormalreturn = log(abnormalreturn) doe, worden mijn negatieve waardes 'verwijderd' bij log: http://i.imgur.com/LT5PI8c.png

Hoe kan ik nu een logregressie doen? Ik moet ook de negatieve abnormal returns meenemen voor mijn onderzoek, maar ik weet niet wat ik nu moet doen om dit op te lossen. Heeft iemand tips?

Probeer gen logabnormalreturn=ln(abnormalreturn)

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

zondag 14 juni 2015 @ 18:46:12 #114

haha94boem

haha boem

quote:
Op zondag 14 juni 2015 18:44 schreef crossover het volgende:

[..]

Probeer gen logabnormalreturn=ln(abnormalreturn)

Gebeurt hetzelfde, helaas.

zondag 14 juni 2015 @ 19:58:05 #115

Banaanensuiker

synergy

quote:
Op zondag 14 juni 2015 18:07 schreef haha94boem het volgende:
Dag mensen,

Bedankt voor jullie reacties. Ik heb inmiddels geprobeerd om gewoon alle data in te voeren en nu lukte het wel. Weet niet of het dan daadwerkelijk ligt aan een te lage hoeveelheid observaties in het eerste geval.

In ieder geval, ik heb nog een vraag. Ik denk dat ik log(abnormalreturn) wil regressen ipv abnormal return. Echter, als ik gen logabnormalreturn = log(abnormalreturn) doe, worden mijn negatieve waardes 'verwijderd' bij log: http://i.imgur.com/LT5PI8c.png

Hoe kan ik nu een logregressie doen? Ik moet ook de negatieve abnormal returns meenemen voor mijn onderzoek, maar ik weet niet wat ik nu moet doen om dit op te lossen. Heeft iemand tips?

Indexeren of een ratio maken. Logaritmes van negatieve getallen is niet mogelijk namelijk.

zondag 14 juni 2015 @ 20:12:49 #116

haha94boem

haha boem

quote:
Op zondag 14 juni 2015 19:58 schreef Banaanensuiker het volgende:

[..]

Indexeren of een ratio maken. Logaritmes van negatieve getallen is niet mogelijk namelijk.

Bedankt.

Weet je misschien het antwoord op de volgende vraag: als ik van mijn dummyvariabelen een log maak, dus b1*log(tenure0-3years) ipv b1*tenure0-3years, krijg ik dan een correcte interpretatie? Als ik ln(1) op mijn rekenmachine intype krijg ik namelijk 0, dus klopt mijn stata model dan wel?

maandag 15 juni 2015 @ 10:20:06 #117

Banaanensuiker

synergy

quote:
Op zondag 14 juni 2015 20:12 schreef haha94boem het volgende:

[..]

Bedankt.

Weet je misschien het antwoord op de volgende vraag: als ik van mijn dummyvariabelen een log maak, dus b1*log(tenure0-3years) ipv b1*tenure0-3years, krijg ik dan een correcte interpretatie? Als ik ln(1) op mijn rekenmachine intype krijg ik namelijk 0, dus klopt mijn stata model dan wel?

Een doube log specificatie betekent dat de beta's geinterpreteerd kunnen worden als point elasticities. Met een dummy variable is dit niet echt logisch, gezien dit discrete waarden zijn, dus 0 of 1. Met waarden die continu zijn is dit een stuk logischer.
Je moet je afvragen waarom je een log log specificatie wilt doen, en of dit thereotisch gezien ergens op slaat.

maandag 15 juni 2015 @ 12:15:27 #118

wimjongil

Harde man

quote:
Op zondag 14 juni 2015 19:58 schreef Banaanensuiker het volgende:

[..]

Indexeren of een ratio maken. Logaritmes van negatieve getallen is niet mogelijk namelijk.

Onjuist, dat is wel mogelijk.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

maandag 15 juni 2015 @ 14:18:48 #119

Banaanensuiker

synergy

quote:
Op maandag 15 juni 2015 12:15 schreef wimjongil het volgende:

[..]

Onjuist, dat is wel mogelijk.

Natuurlijk logaritme van negatief getal is niet gedefinieerd, en daar gaat het in dit geval om. Maar anderzijds heb je gelijk ja.

maandag 15 juni 2015 @ 17:23:27 #120

wimjongil

Harde man

quote:
Op maandag 15 juni 2015 14:18 schreef Banaanensuiker het volgende:

[..]

Natuurlijk logaritme van negatief getal is niet gedefinieerd, en daar gaat het in dit geval om. Maar anderzijds heb je gelijk ja.

Dat is ook niet correct. Het natuurlijk logartime van een negatief is namelijk wel gedefinieerd, te weten als een complex getal.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

maandag 15 juni 2015 @ 23:04:52 #121

fetX

Al bezig met volgend seizoen

Ha iedereen!

Ik loop behoorlijk vast met SPSS. Het gaat om het volgende:

Mijn enquete is (voornamelijk) op Likert-schaal afgenomen. De y = gemiddelde behaalde cijfer op Likert schaal:

1 = <4,
2 = 4,1 t/m 5
3 = 5,1 t/m 6
4 = 6,1-7
etc.

Al onze x'en zijn ook op Likert schaal afgenomen (van 0=helemaal oneens naar 5=helemaal eens)

Volgens mijn docent mag ik gewoon een Likert-schaal op interval/ratio niveau gebruiken.
Ik heb de y en alle x'en op schaalniveau ingesteld en (na SomScores te hebben gemaakt van meerdere variabelen) deze ingevoerd en getest voor lineariteit en normaliteit. De bijlagen geven mijn resultaten weer. Klopt het dat ik iets totaal verkeerd heb gedaan? En zo niet, op welke toets moet ik nu overstappen?

http://nl.tinypic.com/r/b665gj/8
http://nl.tinypic.com/r/1zf78tg/8
http://nl.tinypic.com/r/260er9i/8

dinsdag 16 juni 2015 @ 14:45:22 #122

Rumille

Even een vraagje. Ik heb zo'n 200 respondenten een kennisquiz laten afnemen. Die resultaten heb ik verwerkt en ik wil ze nu verdelen in drie categoriëen. Hoog scorend, laagscorend en gemiddeld scorend.

Nu is mijn vraag: hoe verdeel ik die. Doe ik dat zo gelijk mogelijk (dus 3 ongeveer even grote groepen) of moet ik dan werken met standaarddeviaties. Want ook dat heb ik ergens gelezen in een artikel.

Ter verduidelijking, die tweede methode is als volgt:

LOW 0 tot (median-standaarddeviatie)
MED (median-standaarddeviatie) tot (median+standaarddeviatie)
HIGH (median+standaarddeviatie) tot 10

Die drie groepen wil ik dan constant met elkaar vergelijken met andere resultaten uit mijn enquete.
Ik weet dus wel hoe ik die groepen verdeel, maar wil graag weten wat beter is.

woensdag 17 juni 2015 @ 20:55:55 #123

crossover

quote:
Op dinsdag 16 juni 2015 14:45 schreef Rumille het volgende:
Even een vraagje. Ik heb zo'n 200 respondenten een kennisquiz laten afnemen. Die resultaten heb ik verwerkt en ik wil ze nu verdelen in drie categoriëen. Hoog scorend, laagscorend en gemiddeld scorend.

Nu is mijn vraag: hoe verdeel ik die. Doe ik dat zo gelijk mogelijk (dus 3 ongeveer even grote groepen) of moet ik dan werken met standaarddeviaties. Want ook dat heb ik ergens gelezen in een artikel.

Ter verduidelijking, die tweede methode is als volgt:

LOW 0 tot (median-standaarddeviatie)
MED (median-standaarddeviatie) tot (median+standaarddeviatie)
HIGH (median+standaarddeviatie) tot 10

Die drie groepen wil ik dan constant met elkaar vergelijken met andere resultaten uit mijn enquete.
Ik weet dus wel hoe ik die groepen verdeel, maar wil graag weten wat beter is.

Dan moet je splitsen op het 33ste percentiel en 66e percentiel.

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

donderdag 18 juni 2015 @ 20:17:03 #124

crossover

quote:
Op maandag 15 juni 2015 23:04 schreef fetX het volgende:
Ha iedereen!

Ik loop behoorlijk vast met SPSS. Het gaat om het volgende:

Mijn enquete is (voornamelijk) op Likert-schaal afgenomen. De y = gemiddelde behaalde cijfer op Likert schaal:

1 = <4,
2 = 4,1 t/m 5
3 = 5,1 t/m 6
4 = 6,1-7
etc.

Al onze x'en zijn ook op Likert schaal afgenomen (van 0=helemaal oneens naar 5=helemaal eens)

Volgens mijn docent mag ik gewoon een Likert-schaal op interval/ratio niveau gebruiken.
Ik heb de y en alle x'en op schaalniveau ingesteld en (na SomScores te hebben gemaakt van meerdere variabelen) deze ingevoerd en getest voor lineariteit en normaliteit. De bijlagen geven mijn resultaten weer. Klopt het dat ik iets totaal verkeerd heb gedaan? En zo niet, op welke toets moet ik nu overstappen?

http://nl.tinypic.com/r/b665gj/8
http://nl.tinypic.com/r/1zf78tg/8
http://nl.tinypic.com/r/260er9i/8

In je tweede foto (en trouwens ook je derde) zie je dat je verdeling sterk afwijkt van een normale verdeling. Daarmee schendt je een assumptie van regressie. Je kan eens proberen om alles te hercoderen naar een log schaal

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

dinsdag 23 juni 2015 @ 14:06:49 #125

VacaLoca

Eerdere vragen van mij zijn grotendeels wel besproken met begeleider inmiddels. Nu even een simpele (denk ik) vraag die wat makkelijker beantwoord kan worden gok ik:

In m'n theoretisch framework heb ik 6 predictors/antecedenten. Ik gebruik multiple regression. Er zijn guidelines die zeggen van bv 20 cases per predictor variable nodig. In dit geval dus 120.

Maar als ik nu in SPSS bij de regressie nog bv 3 dummies erbij opneem (waarvan 1 als reference gebruikt zal worden) en 18 interacties (de 6 antecedenten elk keer de 3 dummies) waarvan 6 als reference, en ook nog 3 controle variabelen...

.. Dan geeft SPSS weer dat ik 23 predictors heb (telt reference dus niet mee)

Gaat diezelfde guideline dan op en moet ik dan idealiter 460 cases hebben? Of tellen sommige niet mee zoals bijvoorbeeld interactie termen? Of mss zelfs zo dat ik de reference van de dummies er ook nog bij moet tellen omdat ie daar berekeningen voor maakt en ik 30 x 20 = 600 cases moet hebben?

woensdag 24 juni 2015 @ 14:57:08 #126

phpmystyle

Ordinary guy from Moscow

We nemen 3 ballen zonder teruglegging
De kans op 2 zwarte en 1 witte bal is

In totaal zijn er 14 ballen waarvan 8 zwart en 6 wit. Hoe kan ik deze bewerking uitvoeren op mijn TI-83?

"Fifty years ago the Leningrad street taught me a rule - if a fight is inevitable, you have to throw the first punch."
Vladimir Putin
“To forgive the terrorists is up to God, but to send them there is up to me.”
Vladimir Putin

woensdag 24 juni 2015 @ 15:16:53 #127

wimjongil

Harde man

quote:
Op woensdag 24 juni 2015 14:57 schreef phpmystyle het volgende:
We nemen 3 ballen zonder teruglegging
De kans op 2 zwarte en 1 witte bal is

In totaal zijn er 14 ballen waarvan 8 zwart en 6 wit. Hoe kan ik deze bewerking uitvoeren op mijn TI-83?

Je zit in het verkeerde topic. Wat jij nodig hebt, is het kansrekeningtopic.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

dinsdag 30 juni 2015 @ 15:01:15 #128

superkimmi

Hakuna Matata

Ik zit nog steeds met mjin onderzoek over Gerrymandering (zie paar pagina's terug). Ben inmiddels wel een stuk verder, alles met de data is gelukt. Maar nu wil ik een bepaalde regressie invoeren in stata (ik kan geen ander programma gebruiken, omdat mijn data correct getransformeerd is met stata en niet met andere programma's). De regressie is als volgt:

Probit(gerrymandering_t)=Delta(voteshare_(t-1)-voteshare_t)+e_t

Probit is een stata commando, gerrymandering is een van mijn variabelen (net als voteshare overigens). t staat uiteraard voor tijd en delta voor verandering. Het gene wat hiermee uitgerekend moet worden is de kans dat een verandering in de hoeveelheid stemmen die een winnende partij krijgt dit keer ten opzichte van de vorige keer, (deels) komt door gerrymandering.

De vraag uiteindelijk is: hoe laat je stata deze bewerking uitvoeren? probit is dus een bestaande commando maar ik weet niet hoe je in stata werkt met verandering (delta) en met het deel ' voteshare_(t-1)-voteshare_t'

life is what happens to you, while you're busy making other plans.

dinsdag 30 juni 2015 @ 16:53:38 #129

Super-B

Goedemiddag, weet iemand hoe ik de volgende twee vragen kan maken? Ik loop vast met het feit dat er sprake is van een correlatie in plaats van dat het onafhankelijke variabelen zijn:

Ten slotte een vraag over een opgave :

Waarom kom ik wel op het goede antwoord uit als ik de variantie bereken en vervolgens de wortel hiervan neem, maar kom ik op een fout antwoord uit als ik de standaarddeviatie direct wil berekenen?

woensdag 1 juli 2015 @ 12:34:24 #130

superkimmi

Hakuna Matata

mijn vraag: nvm, het is al gelukt inmiddels

life is what happens to you, while you're busy making other plans.

vrijdag 3 juli 2015 @ 09:25:14 #131

erniee

©

Hoi allen,

Ik ben momenteel hard bezig met mijn masterscriptie. Loop nu alleen tegen een probleempje op. Ik heb een groep respondenten een vragenlijst voorgelegd met daarin (onder andere) drie schalen voor drie soorten leiderschapsstijl.

In dit geval authentiek leiderschap, transformationeel leiderschap en transactioneel leiderschap. Dit heb ik ordinaal gemeten. Een van mijn hypotheses is dat authentiek leiderschap een autonoom concept is en dus gezien kan worden als ''echte leiderschapsstijl''.

Nu wil ik dus gaan controleren of personen die hoog scoren op Authentiek leiderschap laag scoren op de twee andere vormen van leiderschap en vice versa.

Nu weet ik alleen niet precies hoe ik dit kan toetsen.. Heb een hele lijst met data maar weet niet hoe ik de mensen aan de hand van hun score kan categoriseren bij een van de drie stijlen. M'n begeleider gaf aan dat hij het zelf ook niet zo goed wist en dat hij dacht dat ik iets van een betrouwbaarheidsinterval voor ieder van de drie stijlen moest uitvoeren en vervolgens moest kijken of deze overlap hebben... Maar volgens mij moet dit ook anders kunnen toch?

Heeft een van jullie een idee?

Fantasie is belangrijker dan kennis, want kennis is begrensd.

vrijdag 3 juli 2015 @ 10:12:47 #132

Anosmos

Vormloze klont

Heb je al de Likertschalen samengevoegd tot één ratiovariabele (mits de cronbachs alpha goed zit natuurlijk)? Dan kan je wel mikken of ze significant van elkaar verschillen.
Wat je zou kunnen doen, maar dat is maar een hersenscheetje, is vaststellen wat 'hoog' is. Bijvoorbeeld, boven de 3,5 gemiddeld. Dan maak je drie nieuwe dichotome variabelen (stijl 1 hoog of laag, etc). Vergelijk dan de gemiddelden van stijl 2 tussen de twee groepen 'stijl 1 hoog' en 'stijl 1 laag'. Als daar significant verschil in zit, heb je een conclusie.

Maar nogmaals, is maar een hersenscheetje.

Er zat WEL genoeg koriander in.

vrijdag 3 juli 2015 @ 11:02:32 #133

erniee

©

quote:
Op vrijdag 3 juli 2015 10:12 schreef Anosmos het volgende:
Heb je al de Likertschalen samengevoegd tot één ratiovariabele (mits de cronbachs alpha goed zit natuurlijk)? Dan kan je wel mikken of ze significant van elkaar verschillen.
Wat je zou kunnen doen, maar dat is maar een hersenscheetje, is vaststellen wat 'hoog' is. Bijvoorbeeld, boven de 3,5 gemiddeld. Dan maak je drie nieuwe dichotome variabelen (stijl 1 hoog of laag, etc). Vergelijk dan de gemiddelden van stijl 2 tussen de twee groepen 'stijl 1 hoog' en 'stijl 1 laag'. Als daar significant verschil in zit, heb je een conclusie.

Maar nogmaals, is maar een hersenscheetje.

Hoe bedoel je dat precies? In de spoiler is mijn factoranalyse te zien.. hierin moeten de eerste 16 items de eerste leiderschapsstijl meten, de volgende 19 items de 2e leiderschapsstijl en de laatste 10 items de 3e leiderschapsstijl

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.

De cronbach's alphas zijn allemaal boven de 0.6 dus acceptabel. Alleen hoe moet ik nu precies verder? Het lastige is dus dat een stijl uit meerdere dimensies (=factoren?) bestaat.

Fantasie is belangrijker dan kennis, want kennis is begrensd.

vrijdag 3 juli 2015 @ 11:29:27 #134

Anosmos

Vormloze klont

Kan je niet gewoon het gemiddelde nemen van elke stijl? Dus dat je van de eerste zestien items een gemiddelde neemt, waarmee je verder gaat rekenen?
En trouwens, vaak ligt de Cronbach's Alpha-grens op de 0,7 en niet de 0,6, maar dat verschilt nog per studie denk ik.

Er zat WEL genoeg koriander in.

vrijdag 3 juli 2015 @ 13:29:08 #135

erniee

©

quote:
Op vrijdag 3 juli 2015 11:29 schreef Anosmos het volgende:
Kan je niet gewoon het gemiddelde nemen van elke stijl? Dus dat je van de eerste zestien items een gemiddelde neemt, waarmee je verder gaat rekenen?
En trouwens, vaak ligt de Cronbach's Alpha-grens op de 0,7 en niet de 0,6, maar dat verschilt nog per studie denk ik.

Hmm ja dat zou nog wel eens kunnen.. Dan moet ik per respondent zijn gemiddelde score nemen van de eerste 16 items, de volgende items behorende bij de andere leiderschapsstijl en van de laatste items

Fantasie is belangrijker dan kennis, want kennis is begrensd.

vrijdag 3 juli 2015 @ 16:57:48 #136

Anosmos

Vormloze klont

quote:
Op vrijdag 3 juli 2015 13:29 schreef erniee het volgende:

[..]

Hmm ja dat zou nog wel eens kunnen.. Dan moet ik per respondent zijn gemiddelde score nemen van de eerste 16 items, de volgende items behorende bij de andere leiderschapsstijl en van de laatste items

Dat is volgens mij wel het idee van een Likertschaal, dat je het gemiddelde daarvan als ratiovariabele kan beschouwen. Is het een soort Likertschaal?

Er zat WEL genoeg koriander in.

zaterdag 4 juli 2015 @ 06:15:51 #137

erniee

©

quote:
Op vrijdag 3 juli 2015 16:57 schreef Anosmos het volgende:

[..]

Dat is volgens mij wel het idee van een Likertschaal, dat je het gemiddelde daarvan als ratiovariabele kan beschouwen. Is het een soort Likertschaal?

Yes! 7 punts likertschalen inderdaad. Heb via compute nu voor iedere leiderschapsstijl een nieuwe variabele gemaakt met het gemiddelde van alle bijbehorende itemscores. Dus nu drie nieuwe variabelen. Eens kijken wat ik nu moet gaan doen om dit te vergelijken

In ieder geval al hartstikke bedankt!

Fantasie is belangrijker dan kennis, want kennis is begrensd.

zaterdag 4 juli 2015 @ 09:41:52 #138

Anosmos

Vormloze klont

No prob

Wel vreemd trouwens dat je begeleider dit niet wist

Er zat WEL genoeg koriander in.

zondag 5 juli 2015 @ 16:04:51 #139

Super-B

[ Bericht 34% gewijzigd door Super-B op 07-07-2015 10:28:05 ]

zondag 5 juli 2015 @ 18:21:30 #140

oompaloompa

doompadeedee

quote:
Op zondag 5 juli 2015 16:04 schreef Super-B het volgende:
Goedemiddag! Ik zit met een kleine vraag waar ik momenteel geen antwoord op weet, vandaar dat ik het hier kom vragen:

Bij het antwoord op het volgende vraagstuk wordt een z-score gebruikt van 1.960 (bijbehorend bij een betrouwbaarheidsinterval van 95% en een one-sided P van 0,025). Waarom wordt daarentegen geen z-score van 1.645 gebruikt (bijbehorend bij een one-sided P van 0,05 en een betrouwbaarheidsinterval van 90%). Het is immers een eenzijdige hypothese test?:

[ afbeelding ]

[ afbeelding ]

Bij deze vraag, ook een eenzijdige hypothese test, wordt wel een z-score van 1.645 genomen (one-sided p van 0,05 en een betrouwbaarheidsinterval van 90%).

Zo ver ik weet kijk je naar de rij van betrouwbaarheidsintervallen bij tweezijdige hypothese testen, waartegen je kijkt naar de rij van one-sided p bij eenzijdige hypothese testen (?).

Heeft iemand enig idee?

Er wordt geen hypothese getest en wordt slechts om een betrouwbaarheidsinterval gevraagd

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 5 juli 2015 @ 18:55:18 #141

Super-B

[ Bericht 100% gewijzigd door Super-B op 07-07-2015 10:28:00 ]

woensdag 8 juli 2015 @ 19:23:49 #142

GeschiktX

Ik heb een vraag mbt de standaarddeviatie:

Hoe moet vraag 14 berekend worden?

Het antwoord is het volgende:

Ik begrijp er alleen niks van.

maandag 13 juli 2015 @ 17:56:29 #143

GeschiktX

Weet iemand hoe ik vraag 19 kan berekenen?

[ Bericht 82% gewijzigd door GeschiktX op 13-07-2015 18:14:24 ]

zondag 19 juli 2015 @ 11:37:26 #144

-Strawberry-

Hoi!

Stel ik krijg de vraag op een tentamen om onderstaand te ordenen op basis van de kans waarop de nulhypothese wordt verworpen (van klein naar groot).

Je zou dan met tabel B.11 en de niet-centraliteitsparameter voor elke apart kunnen berekenen wat het onderscheidend vermorgen is en het op die manier ordenen, maar volgens mij moet je deze vraag ook zonder kunnen beantwoorden. Weet iemand een handige manier om dat te kunnen doen/benaderen? De vorige keer hadden ze die tabel en formule er nml niet bij gegeven.

zondag 19 juli 2015 @ 17:01:08 #145

oompaloompa

doompadeedee

quote:
Op zondag 19 juli 2015 11:37 schreef -Strawberry- het volgende:
Hoi!

Stel ik krijg de vraag op een tentamen om onderstaand te ordenen op basis van de kans waarop de nulhypothese wordt verworpen (van klein naar groot).

[ afbeelding ]

Je zou dan met tabel B.11 en de niet-centraliteitsparameter voor elke apart kunnen berekenen wat het onderscheidend vermorgen is en het op die manier ordenen, maar volgens mij moet je deze vraag ook zonder kunnen beantwoorden. Weet iemand een handige manier om dat te kunnen doen/benaderen? De vorige keer hadden ze die tabel en formule er nml niet bij gegeven.

Dat is een beetje een vreemde vraag want de nulhypothese wordt wel of niet verworpen, daar zit geen "kans" in. Met de informatie die je hebt kun je een t-value uitrekenen (verschil in means gedeeld door standaard-deviatie gedeeld door wortel n). Om van de t-value naar een p-waarde te gaan of om op tezoeken of dat extremer dan de alpha is heb je een tabel of grafische rekenmachine of internet / spss nodig. Als de alphas overal hetzelfde waren geweest had je het op t-waarde kunnen rangschikken.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 19 juli 2015 @ 17:12:27 #146

-Strawberry-

quote:
Op zondag 19 juli 2015 17:01 schreef oompaloompa het volgende:

[..]

Dat is een beetje een vreemde vraag want de nulhypothese wordt wel of niet verworpen, daar zit geen "kans" in. Met de informatie die je hebt kun je een t-value uitrekenen (verschil in means gedeeld door standaard-deviatie gedeeld door wortel n). Om van de t-value naar een p-waarde te gaan of om op tezoeken of dat extremer dan de alpha is heb je een tabel of grafische rekenmachine of internet / spss nodig. Als de alphas overal hetzelfde waren geweest had je het op t-waarde kunnen rangschikken.

Klopt, maar het onderscheidend vermogen is natuurlijk niet overal even hoog.

Grafische rekenmachine en SPSS/internet zijn geen optie helaas. Het moet echt uit het hoofd door de steekproefgroottes, standaardafwijkingen en significanties te vergelijken. Dat de kans bij C bijvoorbeeld kleiner is dan D is logisch, aangezien de nulhypothese bij een significantie van 0.05 eerder zal worden verworpen dan bij een significantie van 0.02. Als ik zo het antwoord zie 'snap' ik het wel. Maar om dat onderling allemaal te ordenen bij verschillende steekproefgroottes en dergelijke vind ik op een tentamen niet te doen.

Het beroerde is dat ik gewoon vrij zeker weet dat die vraag gaat komen en dat ik hem niet precies goed ga ordenen.

zondag 19 juli 2015 @ 17:51:53 #147

Operc

Nr. 40

quote:
Op zondag 19 juli 2015 17:12 schreef -Strawberry- het volgende:

[..]

Klopt, maar het onderscheidend vermogen is natuurlijk niet overal even hoog.

[ afbeelding ]

Grafische rekenmachine en SPSS/internet zijn geen optie helaas. Het moet echt uit het hoofd door de steekproefgroottes, standaardafwijkingen en significanties te vergelijken. Dat de kans bij C bijvoorbeeld kleiner is dan D is logisch, aangezien de nulhypothese bij een significantie van 0.05 eerder zal worden verworpen dan bij een significantie van 0.02. Als ik zo het antwoord zie 'snap' ik het wel. Maar om dat onderling allemaal te ordenen bij verschillende steekproefgroottes en dergelijke vind ik op een tentamen niet te doen.

Het beroerde is dat ik gewoon vrij zeker weet dat die vraag gaat komen en dat ik hem niet precies goed ga ordenen.

Ik gok dat je statistiekdocent wil dat je inzicht hebt in hoe statistische toetsen werken. Als je dan eerst kijkt naar de gemiddelden, dan zie je dat in twee gevallen de drie gemiddeldes hetzelfde zijn. Daarnaast zie je dat bij A-D de verschillen in principe hetzelfde zijn. A-D zullen dan een hogere "kans" op significantie hebben (tussen aanhalingstekens wegens oompa's terechte post). Vervolgens kun je bij die verschillende varianten gaan kijken naar de andere gegevens en op basis van de formules die doorgaans gebruikt worden schatten wat het meeste de "kans" beïnvloed etc.

zondag 19 juli 2015 @ 18:17:09 #148

oompaloompa

doompadeedee

quote:
Op zondag 19 juli 2015 17:12 schreef -Strawberry- het volgende:

[..]

Klopt, maar het onderscheidend vermogen is natuurlijk niet overal even hoog.

[ afbeelding ]

Grafische rekenmachine en SPSS/internet zijn geen optie helaas. Het moet echt uit het hoofd door de steekproefgroottes, standaardafwijkingen en significanties te vergelijken. Dat de kans bij C bijvoorbeeld kleiner is dan D is logisch, aangezien de nulhypothese bij een significantie van 0.05 eerder zal worden verworpen dan bij een significantie van 0.02. Als ik zo het antwoord zie 'snap' ik het wel. Maar om dat onderling allemaal te ordenen bij verschillende steekproefgroottes en dergelijke vind ik op een tentamen niet te doen.

Het beroerde is dat ik gewoon vrij zeker weet dat die vraag gaat komen en dat ik hem niet precies goed ga ordenen.

Ik hoop niet dat de vraag gaat komen, want de vraag klopt niet

Bij welke opleiding hoort dit?

Je kunt met berederen redelijk ver komen. Bv E en F hebben identieke gemiddeldes, daar zit dus zeker geen verschil tussen.
G en A zijn in essentie hetzelfde, de ene heeft een verschil van 10 met een sd van 10, de andere een verschil van 20 met een sd van 20. Als je die in de formule zou stoppen zou er (aangezien de n bij allebei 100 is) exact dezelfde t waarde uit moeten komen, etc.
B is hetzelfde als A maar met een grotere sd, dus B zal minder sig zijn dan A.
D is hetzelfde als B, maar met een lagere n, als je dat in de formule zou stoppen zou er dus een lagere t uitkomen dus is nog minder sig.
C is als D maar met een strengere alfa die is dus nog minder significant.

Kom je uit op:

E&F, C, D, B, A&G
Het antwoord dat gegeven wordt klopt niet, E&F zouden de laagste plaats moeten delen.

[ Bericht 6% gewijzigd door oompaloompa op 19-07-2015 18:25:47 ]

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 19 juli 2015 @ 18:42:58 #149

-Strawberry-

quote:
Op zondag 19 juli 2015 18:17 schreef oompaloompa het volgende:

[..]

Ik hoop niet dat de vraag gaat komen, want de vraag klopt niet

Bij welke opleiding hoort dit?

Je kunt met berederen redelijk ver komen. Bv E en F hebben identieke gemiddeldes, daar zit dus zeker geen verschil tussen.
G en A zijn in essentie hetzelfde, de ene heeft een verschil van 10 met een sd van 10, de andere een verschil van 20 met een sd van 20. Als je die in de formule zou stoppen zou er (aangezien de n bij allebei 100 is) exact dezelfde t waarde uit moeten komen, etc.
B is hetzelfde als A maar met een grotere sd, dus B zal minder sig zijn dan A.
D is hetzelfde als B, maar met een lagere n, als je dat in de formule zou stoppen zou er dus een lagere t uitkomen dus is nog minder sig.
C is als D maar met een strengere alfa die is dus nog minder significant.

Kom je uit op:

E&F, C, D, B, A&G
Het antwoord dat gegeven wordt klopt niet, E&F zouden de laagste plaats moeten delen.

Klopt wel, tussen de gemiddeldes van E en F zit namelijk geen verschil (alle drie 100). De nulhypothese dat de gemiddeldes van elkaar verschillen zal dus niet verworpen worden bij een hoog onderscheidend vermogen. Gezien de steekproeven van n=500 en n=1000 zal het onderscheidend vermogen hoog zijn, waardoor de kans van E & F om verworpen te worden kleiner is dan bij de rest.

Bedankt voor je reactie iig.

Ik zie het morgen wel.

zondag 19 juli 2015 @ 18:49:09 #150

oompaloompa

doompadeedee

quote:
Op zondag 19 juli 2015 18:42 schreef -Strawberry- het volgende:

[..]

Klopt wel, tussen de gemiddeldes van E en F zit namelijk geen verschil (alle drie 100). De nulhypothese dat de gemiddeldes van elkaar verschillen zal dus niet verworpen worden bij een hoog onderscheidend vermogen. Gezien de steekproeven van n=500 en n=1000 zal het onderscheidend vermogen hoog zijn, waardoor de kans van E & F om verworpen te worden kleiner is dan bij de rest.

Bedankt voor je reactie iig. Ik zie het morgen wel.

Dat is niet waar, de formule is:

verschil in means / vanalles.

Het verschil in means is in beide gevallen 0, 0/whatever is 0. de "kans" dat het verworpen wordt is voor beide situaties 0
Het is echt een extreem slechte opgave van de docent, de vraag slaat nergens op en het leert de studenten gewoon een verkeerde interpretstie van statistiek aan.

edit: sorry dit frustreert me maar het is niet richting jou. Ik geef workshops etc. statistiek en mensen interpreteren het al zo vaak verkeerd dat het zien dat docenten het verkeerd aanleren me nogal opgefokt maakt.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» school, studie en onderwijs

» school, studie en onderwijs