Centraal Statistiektopic (SPSS, R, excel, etc.) #8

maandag 1 juni 2015 @ 22:04:16 #52

Super-B

[ Bericht 100% gewijzigd door Super-B op 01-06-2015 22:12:05 ]

maandag 1 juni 2015 @ 22:06:46 #53

oompaloompa

doompadeedee

quote:
Op maandag 1 juni 2015 22:04 schreef Super-B het volgende:

[..]

Ik heb de data in SPSS zo ingevoerd dat er sprake is van drie bedrijven:

Bedrijf 1 is een fusiebedrijf
Bedrijf 2 is één van de twee bedrijven ontstaan door de opsplitsing van bedrijf 1.
Bedrijf 3 is één van de twee bedrijven ontstaan door de opsplitsing van bedrijf 1.

Wat ik wil aantonen, via SPSS, is dat de kosten van zowel bedrijf 2 als 3 gedaald zijn na opsplitsing van bedrijf 1.

Dat hoef je niet met statistiek aan te tonen, dat is zo, of dat is niet zo. Je hoeft alleen statistiek te gebruiken als je het wilt generaliseren naar bedrijven in het algemeen, maar dan zul je meer dan 1 case nodig hebben.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 1 juni 2015 @ 22:08:44 #54

Super-B

quote:
Op maandag 1 juni 2015 22:06 schreef oompaloompa het volgende:

[..]

Dat hoef je niet met statistiek aan te tonen, dat is zo, of dat is niet zo. Je hoeft alleen statistiek te gebruiken als je het wilt generaliseren naar bedrijven in het algemeen, maar dan zul je meer dan 1 case nodig hebben.

Dat ik daar geen statistiek voor nodig heb, is mij duidelijk. Dat gaf ik al in mijn eerste post betreffende deze vraag aan. Desondanks vind ik het altijd leuk om statistiek te gebruiken, hoe simpel de vraag ook mag zijn.

maandag 1 juni 2015 @ 22:11:10 #55

oompaloompa

doompadeedee

quote:
Op maandag 1 juni 2015 22:08 schreef Super-B het volgende:

[..]

Dat ik daar geen statistiek voor nodig heb, is mij duidelijk. Dat gaf ik al in mijn eerste post betreffende deze vraag aan. Desondanks vind ik het altijd leuk om statistiek te gebruiken, hoe simpel de vraag ook mag zijn.

Echt niet lullig bedoeld, maar ik weet gewoon niet hoe ik hier op moet antwoorden, je vraag slaat nergens op.

Het is een beetje alsof je vraagt hoe je kaas bij voetbal moet gebruiken.

betere metafoor; het is alsof je vraagt hoe je de wet van Newton toe moet passen om te weten wanneer de Tweede wereldoorlog begon, ja wikipedia is idd gemakkelijker maar ik vind het leuker om d.m.v. natuurkundige formules tot een antwoord te komen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 14:38:36 #56

Super-B

Hallo,

Ik heb een model gemaakt via een regressie-analyse met de volgende variabelen:

-Onafhankelijke variabele: output
-Afhankelijke variabele: gemiddelde bedrijfskosten

De resultaten zijn het volgende, waarbij b = gemiddelde bedrijfskosten en c = output:

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.

In de laatste figuur staan er twee significanties.. Naar welke zou ik moeten kijken en wat zou ik kunnen concluderen? Is er een negatief, geen of een positief verband?

[ Bericht 0% gewijzigd door Super-B op 02-06-2015 14:57:49 ]

Moderator dinsdag 2 juni 2015 @ 14:48:51 #57

Bosbeetle

terminaal verdwaald

Zitten hier ook R specialisten... Ik heb een R package geschreven en heb een import voor mijn dependencies in de NAMESPACE gezet maar als ik hem nu in een lege R installeert gaat hij de pakketten niet instaleren, ook komt één pakket niet van CRAN maar van bioconductor dus moet ik de repository wijzigen, ik heb geen idee waar ik dat moet aangeven... Of moet dat gewoon hard in de DESCRIPTION of NAMESPACE gezet worden (en hoe)...

Een ander ding waar ik nog wel eens tegen aan loop en hier ook gelijk wel eens kan vragen als je een apply (of variant daarvan lapply mapply vapply) doet is het dan ook mogelijk om daar het iteratie nummer uit te halen, zeg maar welk deel van de loop hij daadwerkelijk mee bezig is.

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 14:50:38 #58

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 14:38 schreef Super-B het volgende:
Hallo,

Ik heb een model gemaakt via een regressie-analyse met de volgende variabelen:

-Onafhankelijke variabele: output
-Afhankelijke variabele: bedrijfskosten

De resultaten zijn het volgende, waarbij b = bedrijfskosten en c = output:

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
In de laatste figuur staan er twee significanties.. Naar welke zou ik moeten kijken en wat zou ik kunnen concluderen? Is er een negatief, geen of een positief verband?

Niet dat je gaat luisteren, maar je kunt vrij weinig concluderen aangezien standard-error 0 is en je dus op basis van 1 observatie lijkt te werken? (gokje, kan ook iets anders zijn eventueel maar een SE van 0 verpest je analyses)

quote:
Op dinsdag 2 juni 2015 14:48 schreef Bosbeetle het volgende:
Zitten hier ook R specialisten... Ik heb een R package geschreven en heb een import voor mijn dependencies in de NAMESPACE gezet maar als ik hem nu in een lege R installeert gaat hij de pakketten niet instaleren, ook komt één pakket niet van CRAN maar van bioconductor dus moet ik de repository wijzigen, ik heb geen idee waar ik dat moet aangeven... Of moet dat gewoon hard in de DESCRIPTION of NAMESPACE gezet worden (en hoe)...

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator dinsdag 2 juni 2015 @ 14:53:06 #59

Bosbeetle

terminaal verdwaald

quote:
Op dinsdag 2 juni 2015 14:50 schreef oompaloompa het volgende:

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Jawel maar ik wil dat pakket gaan distribueren onder mensen met wie ik samenwerk en ik wil hun graag een pakketje leveren dat werkt en dus zelf al de dependencies gaat installeren. Ik ben redelijk op weg en heb nu fatsoenlijke robuste S3methodes voor image analyse lopen maar het blijft een geetter om het even snel op een andere computer te zetten.

Ik zit nu heel hard te twijfelen of ik moet investeren in Rcpp om de boel nog sneller te krijgen.

eerst had ik nog vrij veel for loops die heb ik nu voor het grootste gedeelte verapplied om uit te vinden dat Rcpp eigenlijk nog veel sneller is

maar het voelt zo slordig om 2 talen door elkaar heen te gebruiken.

Ben ook bezig om een shiny interface er bij te maken maar dat heeft ook nogal wat voeten in de aarde....

[ Bericht 15% gewijzigd door Bosbeetle op 02-06-2015 14:58:21 ]

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 14:53:10 #60

Super-B

quote:
Op dinsdag 2 juni 2015 14:50 schreef oompaloompa het volgende:

[..]

Niet dat je gaat luisteren, maar je kunt vrij weinig concluderen aangezien standard-error 0 is en je dus op basis van 1 observatie lijkt te werken? (gokje, kan ook iets anders zijn eventueel maar een SE van 0 verpest je analyses)

[..]

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Wat is handig om toe te voegen als observatie? De winst?

Ik werk met y = gemiddelde bedrijfskosten (afhankelijke) en x = output (onafhankelijke).

dinsdag 2 juni 2015 @ 14:58:11 #61

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 14:53 schreef Bosbeetle het volgende:

[..]

Jawel maar ik wil dat pakket gaan distribueren onder mensen met wie ik samenwerk en ik wil hun graag een pakketje leveren dat werkt en dus zelf al de dependencies gaat installeren. Ik ben redelijk op weg en heb nu fatsoenlijke robuste S3methodes voor image analyse lopen maar het blijft een geetter om het even snel op een andere computer te zetten.

En gewoon als eerste een blokje schrijven dat get & installt wat dus redundant is als ze de packages al hebben en anders gewoon runt? Niet de meest charmante oplossing, maar zou wel moeten werken toch?

Sorry gebruik R heel weinig, ed scripts die ik gebruik doen het meestal op de slordige get manier.

quote:
Op dinsdag 2 juni 2015 14:53 schreef Super-B het volgende:

[..]

Wat is handig om toe te voegen als observatie? De winst?

Ik werk met y = bedrijfskosten (afhankelijke) en x = output (onafhankelijke).

Je hebt 5 onafhankelijke datapunten toch?
Dus van 5 random bedrijven de kosten en de output, zo niet, wat zijn precies je observaties?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 14:58:37 #62

Super-B

quote:
Op dinsdag 2 juni 2015 14:50 schreef oompaloompa het volgende:

[..]

Niet dat je gaat luisteren, maar je kunt vrij weinig concluderen aangezien standard-error 0 is en je dus op basis van 1 observatie lijkt te werken? (gokje, kan ook iets anders zijn eventueel maar een SE van 0 verpest je analyses)

[..]

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Ik heb de afhankelijke variabele veranderd: van gemiddelde bedrijfskosten naar totale bedrijfskosten en er blijkt nu wél een standaard error te zijn.

dinsdag 2 juni 2015 @ 14:59:40 #63

Super-B

quote:
Op dinsdag 2 juni 2015 14:58 schreef oompaloompa het volgende:

[..]

En gewoon als eerste een blokje schrijven dat get & installt wat dus redundant is als ze de packages al hebben en anders gewoon runt? Niet de meest charmante oplossing, maar zou wel moeten werken toch?

Sorry gebruik R heel weinig, ed scripts die ik gebruik doen het meestal op de slordige get manier.

[..]

Je hebt 5 onafhankelijke datapunten toch?
Dus van 5 random bedrijven de kosten en de output, zo niet, wat zijn precies je observaties?

Ik heb de kosten en de output van de afgelopen vier jaren op een rij gezet in SPSS van drie bedrijven, maar ik observeer de relatie tussen de kosten en output van één bedrijf.

Moderator dinsdag 2 juni 2015 @ 15:00:13 #64

Bosbeetle

terminaal verdwaald

quote:
Op dinsdag 2 juni 2015 14:58 schreef oompaloompa het volgende:
En gewoon als eerste een blokje schrijven dat get & installt wat dus redundant is als ze de packages al hebben en anders gewoon runt? Niet de meest charmante oplossing, maar zou wel moeten werken toch?

Sorry gebruik R heel weinig, ed scripts die ik gebruik doen het meestal op de slordige get manier.

Tja maar ik weet dus niet waar ik een stukje code neer moet zetten zodat hij het runt als je het package installeert... het installeren van het package gaat prima en als je de dependencies al hebt geinstalleert dan doet hij de library() stapjes wel automagisch maar het installeren dus niet...

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 15:07:04 #65

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 14:59 schreef Super-B het volgende:

[..]

Ik heb de kosten en de output van de afgelopen vier jaren op een rij gezet in SPSS van drie bedrijven, maar ik observeer de relatie tussen de kosten en output van één bedrijf.

Ok, het is sowieso waarschijnlijk incorrect, maar als je in de regressie output kijken staat daar ergens links een B-waarde in de tweede colom, dat is het effect van X op Y. als de B bijvoorbeeld 0.5 is, is het effect van X een stapje hoger maken een toename van Y van 0.5.
De sig-waarde zegt (kort door de bocht) hoe groot de kans zou zijn zo'n B-waarde of een hogere te vinden als er in de populatie eigenlijk geen effect van X op Y is.

quote:
Op dinsdag 2 juni 2015 15:00 schreef Bosbeetle het volgende:

[..]

Tja maar ik weet dus niet waar ik een stukje code neer moet zetten zodat hij het runt als je het package installeert... het installeren van het package gaat prima en als je de dependencies al hebt geinstalleert dan doet hij de library() stapjes wel automagisch maar het installeren dus niet...

Sorry dude, dit is way beyond me dan

Veel succes!

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator dinsdag 2 juni 2015 @ 15:10:16 #66

Bosbeetle

terminaal verdwaald

quote:
Op dinsdag 2 juni 2015 15:07 schreef oompaloompa het volgende:
Sorry dude, dit is way beyond me dan
Veel succes!

sowieso die NAMESPACE en DESCRIPTION files zijn erg slecht gedocumenteerd

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 15:12:13 #67

Super-B

quote:
Op dinsdag 2 juni 2015 15:07 schreef oompaloompa het volgende:

[..]

Ok, het is sowieso waarschijnlijk incorrect, maar als je in de regressie output kijken staat daar ergens links een B-waarde in de tweede colom, dat is het effect van X op Y. als de B bijvoorbeeld 0.5 is, is het effect van X een stapje hoger maken een toename van Y van 0.5.
De sig-waarde zegt (kort door de bocht) hoe groot de kans zou zijn zo'n B-waarde of een hogere te vinden als er in de populatie eigenlijk geen effect van X op Y is.

[..]

Sorry dude, dit is way beyond me dan
Veel succes!

Naar welke sig zou ik moeten kijken? Naar de sig in de eerste of de tweede rij?

dinsdag 2 juni 2015 @ 15:31:26 #68

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 15:12 schreef Super-B het volgende:

[..]

Naar welke sig zou ik moeten kijken? Naar de sig in de eerste of de tweede rij?

Naar de rij die bij je variabele hoort. Links (precies het vakje dat je af gesneden hebt in je foto) staat als het goed is de veriabele naam. De eerste is je intercept, die kun je negeren, de tweede zou iets van kosten moeten zijn.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 17:47:22 #69

Banaanensuiker

synergy

Je hebt echt 0,0 aan een regressie als je zo weinig observaties hebt. Je steekproef moet echt veel groter zijn om er nuttige conclusies uit te trekken.

dinsdag 2 juni 2015 @ 20:45:36 #70

Operc

Nr. 40

quote:
Op dinsdag 2 juni 2015 14:48 schreef Bosbeetle het volgende:
Zitten hier ook R specialisten... Ik heb een R package geschreven en heb een import voor mijn dependencies in de NAMESPACE gezet maar als ik hem nu in een lege R installeert gaat hij de pakketten niet instaleren, ook komt één pakket niet van CRAN maar van bioconductor dus moet ik de repository wijzigen, ik heb geen idee waar ik dat moet aangeven... Of moet dat gewoon hard in de DESCRIPTION of NAMESPACE gezet worden (en hoe)...

Een ander ding waar ik nog wel eens tegen aan loop en hier ook gelijk wel eens kan vragen als je een apply (of variant daarvan lapply mapply vapply) doet is het dan ook mogelijk om daar het iteratie nummer uit te halen, zeg maar welk deel van de loop hij daadwerkelijk mee bezig is.

Zo diep gaat mijn R kennis helaas ook niet.
Misschien de R-package-devel of R-devel mailinglist eens proberen?
http://www.r-project.org/mail.html

quote:
Op dinsdag 2 juni 2015 17:47 schreef Banaanensuiker het volgende:
Je hebt echt 0,0 aan een regressie als je zo weinig observaties hebt. Je steekproef moet echt veel groter zijn om er nuttige conclusies uit te trekken.

Daar is iedereen het hier over eens, maar om de een of andere reden wil Super-B het toch proberen omdat hij het leuk vindt om iets nutteloos te doen geloof ik.

dinsdag 2 juni 2015 @ 21:34:17 #71

Annema21

Beste FOKkers,

Nu mijn vorige kwestie is opgelost, een nieuwe vraag:

(Ja, dit is de eerste keer dat ik met SPSS werk, nee ik ben er totaal niet handig mee en ja, ik heb een erg strakke deadline

, bij deze dus mijn excuses)

Ik heb een dataset met daarin per case informatie over hulp bij de bevalling en met 5 somscores van een persoonlijkheidstest (NEO-FFI voor de liefhebber). Ik wil in een tabel het gemiddelde aantal spontane geboortes en kunstverlossingen uitzetten tegen de verschillende persoonlijkheidstypes.

Kan iemand mij vertellen hoe ik in SPSS deze tabel het beste kan maken? Ik heb Crosstabs geprobeerd maar krijg dan per persoonlijkheidstype een tabel met alle mogelijke somscores en per somscore het aantal kunst/spontane geboortes.

Sorry voor de onduidelijke uitleg, krijg mijn printscreen van de tabel niet in het bericht gevoegd.

dinsdag 2 juni 2015 @ 21:40:30 #72

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 21:34 schreef Annema21 het volgende:
Beste FOKkers,

Nu mijn vorige kwestie is opgelost, een nieuwe vraag:

(Ja, dit is de eerste keer dat ik met SPSS werk, nee ik ben er totaal niet handig mee en ja, ik heb een erg strakke deadline , bij deze dus mijn excuses)

Ik heb een dataset met daarin per case informatie over hulp bij de bevalling en met 5 somscores van een persoonlijkheidstest (NEO-FFI voor de liefhebber). Ik wil in een tabel het gemiddelde aantal spontane geboortes en kunstverlossingen uitzetten tegen de verschillende persoonlijkheidstypes.

Kan iemand mij vertellen hoe ik in SPSS deze tabel het beste kan maken? Ik heb Crosstabs geprobeerd maar krijg dan per persoonlijkheidstype een tabel met alle mogelijke somscores en per somscore het aantal kunst/spontane geboortes.

Sorry voor de onduidelijke uitleg, krijg mijn printscreen van de tabel niet in het bericht gevoegd.

Als je wilt weten wat de invloed is van de persoonlijkheidstypes op aantal kunstverlossingen / spontane geboortes zou ik een regressie doen, dit omdat persoonlijkheid een schaal is. Wat die regressie kort door de bocht test is bv hoe neurotischer iemand is, hoe groter de kans op x.
Omdat je afhankelijke dichotoom is (ja of nee) zul je een logistische regressie moeten doen. Speel daar anders even mee en kijk hoe ver je komt. Als je de output post kunnen wij in de thread je met de interpretatie helpen, maar dat gaat fijner met behulp van de output.

Een andere optie is om je data juist te splitsen op kunstgeboorte vs spontane geboorte en dan kijken of de gemiddelden op de persoonlijkheidsschalen tussen die twee groepen verschillen. Dat is een stuk gemakkelijker om te doen maar dat geeft je niet echt een antwoord op hoe groot het effect is van persoonlijkheid op die kans, alleen of er een verschil is. (het geeft je wel iets van grootte maar die is moeilijk interpreteerbaar).

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 22:03:09 #73

Annema21

Ok, misschien een stomme vraag maar hoe kan ik de output hier posten?

woensdag 3 juni 2015 @ 01:09:42 #74

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 22:03 schreef Annema21 het volgende:
Ok, misschien een stomme vraag maar hoe kan ik de output hier posten?

printscreen of zo maken (of rechtermuisknop save as jpg kan volgens mij ook, en dan uploaden op bv imgur.com. Dan krijg je een linkje dat je hier kunt posten

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 3 juni 2015 @ 13:45:13 #75

Tobi-wan

Ben nu druk bezig met mijn bijlage in orde te maken. Aanstaande maandag mijn scriptie inleveren

Heb bijna alleen gebruik gemaakt van schalen waardoor ik ordinale variabelen heb. Is het dan interessant om de standaarddeviatie er bij te zetten of kan ik dat beter weg laten. Ze zitten allemaal tussen den 0,8 en 1 wat volgens mij komt omdat de antwoorden altijd 1, 2, 3, 4 of 5 zijn.

Daarnaast heb ik niet een hele grote populatie. Volgens mij verteld de standaarddeviatie mij niet zoveel...

Edit: volgens mij moet std. dev. er altijd bij als je met gemiddeldes werkt.

[ Bericht 7% gewijzigd door Tobi-wan op 03-06-2015 14:03:32 ]

woensdag 3 juni 2015 @ 14:12:45 #76

oompaloompa

doompadeedee

quote:
Op woensdag 3 juni 2015 13:45 schreef Tobi-wan het volgende:
Ben nu druk bezig met mijn bijlage in orde te maken. Aanstaande maandag mijn scriptie inleveren

Heb bijna alleen gebruik gemaakt van schalen waardoor ik ordinale variabelen heb. Is het dan interessant om de standaarddeviatie er bij te zetten of kan ik dat beter weg laten. Ze zitten allemaal tussen den 0,8 en 1 wat volgens mij komt omdat de antwoorden altijd 1, 2, 3, 4 of 5 zijn.

Daarnaast heb ik niet een hele grote populatie. Volgens mij verteld de standaarddeviatie mij niet zoveel...

Edit: volgens mij moet std. dev. er altijd bij als je met gemiddeldes werkt.

De standaard deviatie geeft iets aan over de spreiding. Zo zou je een gemiddelde van 1.8 kunnen hebben op je schaal met een SD van bijna 0 (iedereen zegt 2 een paar zeggen 1) of een enorme hoge SD (veel mensen zeggen 4 of 5, meeste zeggen 1 of 2). Ik zou hem dus altijd rapporteren

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 3 juni 2015 @ 14:49:03 #77

Tobi-wan

quote:
Op woensdag 3 juni 2015 14:12 schreef oompaloompa het volgende:

[..]

De standaard deviatie geeft iets aan over de spreiding. Zo zou je een gemiddelde van 1.8 kunnen hebben op je schaal met een SD van bijna 0 (iedereen zegt 2 een paar zeggen 1) of een enorme hoge SD (veel mensen zeggen 4 of 5, meeste zeggen 1 of 2). Ik zou hem dus altijd rapporteren

Bedankt! Het is inderdaad wel nuttige informatie. Van al die cijfers wordt ik af een toe een beetje duizelig en dan ontgaat het logisch nadenken mij enigszins.

donderdag 4 juni 2015 @ 08:04:39 #78

Banaanensuiker

synergy

Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

vrijdag 5 juni 2015 @ 14:25:46 #79

Sarasi

Quack.

quote:
Op donderdag 4 juni 2015 08:04 schreef Banaanensuiker het volgende:
Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni.

Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 14:50:36 #80

VacaLoca

Bleh, zit even vast.

Ik onderzoek hoe een zestal antecedenten in relatie staat tot een afhankelijke variabele. De afhankelijke variabele is Organizational Identification - hoe mensen zich identificeren met een organisatie. Komt uiteindelijk dus een regressie analyse aan te pas, en een standaard regressie analyse heb ik ook al wel gehad in de studie.

Maar zitten wat haken en ogen aan bij mij:

- Ik richt mij op alle betaald voetbalclubs *Eredivisie en Jupiler)
- Ik maak een vergelijking tussen 3 stakeholder groepen (supporters, sponsoren en lokale politiek)

Van supporters heb ik van 33 clubs respondenten. Maar van PSV heb ik er bijvoorbeeld 380, van Ajax 140, van Vitesse 120 en van NEC 110... maar van kleine clubs als een Helmond Sport maar 1 bijvoorbeeld. In totaal heb ik er 1132

Van sponsoren heb ik er een stuk of 40 van Heerenveen, 30 van Willem II, 15 van FC Twente en voor aantal andere clubs rond de 10 elk. In totaal 323 sponsoren als respondent. Maar ik heb er 0 voor PSV en Ajax, die bij supporters het gros van de respondenten vormen.

Lokale politiek in de vorm van gemeenteraadsleden heb ik 10 a 15 respondenten voor elke gemeente, in totaal 417 respondenten.

Origineel was het idee om voor 1 club het onderzoek te doen. Maar omdat je van sponsoren en gemeenteraadsleden maar een tiental respondenten zou krijgen besloten om meer clubs bijeen te pakken en 'een betaald voetbalclub' het onderwerp te maken ipv bijvoorbeeld 'Vitesse' of 'Ajax'. Want voor multiple regression liefst 20 respondenten per onafhankelijke variabele, in mijn geval dus 120.

Nu zit ik dus met de volgende dingen:

- Mbt poolen van de data: kan je het zomaar allemaal bij elkaar gooien of zijn daar methodes voor en moet je gewichten er aan hangen oid? Kan via google niet echt vinden.
- Ik vergelijk dus 3 stakeholder groepen; als ik items ga verwijderen op basis van Reliability test (Cronbach alpha) en Discriminant validity (Factor analyse, dubbelladers en structuur) moet ik dan hetzelfde verwijderen bij elke groep? Dus als item X een dubbellader is bij de Supporters, maar niet bij de Sponsoren, dan wel bij beiden weghalen zodat beide modellen gelijk zijn aan elkaar als je gaat vergelijken, of wel op maat maken per groep?

- Supporters identificeren zich sws al vrij snel met hun club, en het is dus enigszins skewed. Is hier voor dit specifieke geval een goed remedie voor? Zou ik ook bijvoorbeeld gezien de grote sample de cases zodanig selecteren dat de afhankelijke variabele normaal verdeeld is?

- Als ik de drie groepen met elkaar vergelijk dan pak ik nu bijvoorbeeld voor lokale politiek Willem II, Vitesse, AZ, Twente en Heerenveen samen zodat ik er voldoende voor regression analyse heb én ik voor deze clubs ook voldoende sponsoren en fans heb. Maar de verhoudingen zijn wel totaal anders per stakeholder groep voor deze clubs. Waar het voor lokale politiek ongeveer 20,20,20,20,20 is, is het voor sponsoren iets van 35, 25, 15, 15, 10 en voor fans soortgelijke verdeling als sponsoren maar dan andere volgorde. Moeten deze verhoudingen gelijk zijn?

Moeten misschien zelfs de absolute aantallen gelijk zijn? Ik vergelijk uiteindelijk de standardized B van de onafhankelijke variabelen in de groepen. Daarnaast heb ik al wel variabele gemaakt die grootte van de club weergeeft waarvoor dus gecontroleerd kan worden.

Bleh, warrig verhaal aan het worden. In kort: ik zit met multiple regression met pooled data en met drie samples die vergeleken moeten worden; best practice?

vrijdag 5 juni 2015 @ 15:03:49 #81

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Dat ziet er best nice uit! Hoe kom je daar terecht? Lijkt mij als econometriestudent wel een leuk bijbaantje.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 15:15:06 #82

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 15:03 schreef wimjongil het volgende:

[..]

Dat ziet er best nice uit! Hoe kom je daar terecht? Lijkt mij als econometriestudent wel een leuk bijbaantje.

Is hier alleen voor psychologie en sociologie, via de vacaturebank in BlackBoard.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 16:27:43 #83

oompaloompa

doompadeedee

quote:
Op donderdag 4 juni 2015 08:04 schreef Banaanensuiker het volgende:
Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

Ik heb alleen kennis van R in een aantal specifieke domeinen. Heb wel thuis op mn HD een aantal goede tutorials/courses staan, weet niet of je er iets aan hebt maar deel ze graag met je.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 16:32:29 #84

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Gefeliciteerd!

quote:
Op vrijdag 5 juni 2015 14:50 schreef VacaLoca het volgende:
Bleh, zit even vast.

Ik onderzoek hoe een zestal antecedenten in relatie staat tot een afhankelijke variabele. De afhankelijke variabele is Organizational Identification - hoe mensen zich identificeren met een organisatie. Komt uiteindelijk dus een regressie analyse aan te pas, en een standaard regressie analyse heb ik ook al wel gehad in de studie.

Maar zitten wat haken en ogen aan bij mij:

- Ik richt mij op alle betaald voetbalclubs *Eredivisie en Jupiler)
- Ik maak een vergelijking tussen 3 stakeholder groepen (supporters, sponsoren en lokale politiek)

Van supporters heb ik van 33 clubs respondenten. Maar van PSV heb ik er bijvoorbeeld 380, van Ajax 140, van Vitesse 120 en van NEC 110... maar van kleine clubs als een Helmond Sport maar 1 bijvoorbeeld. In totaal heb ik er 1132

Van sponsoren heb ik er een stuk of 40 van Heerenveen, 30 van Willem II, 15 van FC Twente en voor aantal andere clubs rond de 10 elk. In totaal 323 sponsoren als respondent. Maar ik heb er 0 voor PSV en Ajax, die bij supporters het gros van de respondenten vormen.

Lokale politiek in de vorm van gemeenteraadsleden heb ik 10 a 15 respondenten voor elke gemeente, in totaal 417 respondenten.

Origineel was het idee om voor 1 club het onderzoek te doen. Maar omdat je van sponsoren en gemeenteraadsleden maar een tiental respondenten zou krijgen besloten om meer clubs bijeen te pakken en 'een betaald voetbalclub' het onderwerp te maken ipv bijvoorbeeld 'Vitesse' of 'Ajax'. Want voor multiple regression liefst 20 respondenten per onafhankelijke variabele, in mijn geval dus 120.

Nu zit ik dus met de volgende dingen:

- Mbt poolen van de data: kan je het zomaar allemaal bij elkaar gooien of zijn daar methodes voor en moet je gewichten er aan hangen oid? Kan via google niet echt vinden.
- Ik vergelijk dus 3 stakeholder groepen; als ik items ga verwijderen op basis van Reliability test (Cronbach alpha) en Discriminant validity (Factor analyse, dubbelladers en structuur) moet ik dan hetzelfde verwijderen bij elke groep? Dus als item X een dubbellader is bij de Supporters, maar niet bij de Sponsoren, dan wel bij beiden weghalen zodat beide modellen gelijk zijn aan elkaar als je gaat vergelijken, of wel op maat maken per groep?

- Supporters identificeren zich sws al vrij snel met hun club, en het is dus enigszins skewed. Is hier voor dit specifieke geval een goed remedie voor? Zou ik ook bijvoorbeeld gezien de grote sample de cases zodanig selecteren dat de afhankelijke variabele normaal verdeeld is?

- Als ik de drie groepen met elkaar vergelijk dan pak ik nu bijvoorbeeld voor lokale politiek Willem II, Vitesse, AZ, Twente en Heerenveen samen zodat ik er voldoende voor regression analyse heb én ik voor deze clubs ook voldoende sponsoren en fans heb. Maar de verhoudingen zijn wel totaal anders per stakeholder groep voor deze clubs. Waar het voor lokale politiek ongeveer 20,20,20,20,20 is, is het voor sponsoren iets van 35, 25, 15, 15, 10 en voor fans soortgelijke verdeling als sponsoren maar dan andere volgorde. Moeten deze verhoudingen gelijk zijn?

Moeten misschien zelfs de absolute aantallen gelijk zijn? Ik vergelijk uiteindelijk de standardized B van de onafhankelijke variabelen in de groepen. Daarnaast heb ik al wel variabele gemaakt die grootte van de club weergeeft waarvoor dus gecontroleerd kan worden.

Bleh, warrig verhaal aan het worden. In kort: ik zit met multiple regression met pooled data en met drie samples die vergeleken moeten worden; best practice?

Klinkt als een multilevel model.
Is essentie komt het er op neer dat je je data een soort van trapsgewijs bekijkt.
Dus al je datapunt splits je eerst op over de verschillende clubs (waarbij je het effect van club berekent), daarna kun je binnen de clubs het effect van supporter / sponsor / etc. bekijken.

Het is niet heel ingewikkeld om te doen, maar ook niet het allergemakkelijkste.

Kijk anders even met google of zo of je denkt dat dit voor je kan werken, en kom dan terug?

Tegen de skewness zou je een logtransformatie kunnen gebruiken, maar de meeste toetsen zijn vrij robust zolang je n hoger dan 30 is, als het je uitkomst al beinvloedt zal dat enorm in de marge zijn dus ik zou me daar denk ik niet te druk om maken.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 16:35:23 #85

VacaLoca

Ik ga googelen, thanks!

vrijdag 5 juni 2015 @ 16:58:18 #86

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 15:15 schreef Sarasi het volgende:

[..]

Is hier alleen voor psychologie en sociologie, via de vacaturebank in BlackBoard.

Niet helemaal waar:

quote:
Omdat de Methodologiewinkel een dienst is van de GMW faculteit krijgen GMW studenten in drukke periodes voorrang op studenten van andere faculteiten.

Maargoed, Nestor maar in de gaten houden dus.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 16:59:42 #87

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 16:58 schreef wimjongil het volgende:

[..]

Niet helemaal waar:

[..]

Maargoed, Nestor maar in de gaten houden dus.

Dat is voor hulp, niet voor sollicitanten.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 17:34:14 #88

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 16:59 schreef Sarasi het volgende:

[..]

Dat is voor hulp, niet voor sollicitanten.

Aha, op die fiets. Je zin was dubbelzinnig.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 17:34:22 #89

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 16:27 schreef oompaloompa het volgende:

[..]

Ik heb alleen kennis van R in een aantal specifieke domeinen. Heb wel thuis op mn HD een aantal goede tutorials/courses staan, weet niet of je er iets aan hebt maar deel ze graag met je.

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

vrijdag 5 juni 2015 @ 18:21:03 #90

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 17:34 schreef wimjongil het volgende:

[..]

Aha, op die fiets. Je zin was dubbelzinnig.

Sorry voor de onduidelijkheid.

quote:
Op vrijdag 5 juni 2015 17:34 schreef Banaanensuiker het volgende:

[..]

[..]

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

Nee, sorry.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 18:26:24 #91

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 17:34 schreef Banaanensuiker het volgende:

[..]

[..]

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

Ja maar alleen in het abstracte / als concept, verder alleen gebruik gemaakt bij mediatie-analyses.

In principe komt het gewoon neer op data genereren van een bestaande dataset, analyse op uitvoeren, en dit 100.000 (of hoeveel je wilt) keer doen om een betrouwbaardere statistic te krijgen toch? Ik weet niet of jij het voor hetzelfde wilt gebruiken als hoe ik het ken, heb geen ervaring met het gebruik bij een Wald-test maar als het conceptueel een beetje vergelijkbaar is kan ik misschien nog iets nuttigs zeggen

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 19:11:02 #92

VacaLoca

quote:
Op vrijdag 5 juni 2015 16:32 schreef oompaloompa het volgende:

[..]

Gefeliciteerd!

[..]

Klinkt als een multilevel model.
Is essentie komt het er op neer dat je je data een soort van trapsgewijs bekijkt.
Dus al je datapunt splits je eerst op over de verschillende clubs (waarbij je het effect van club berekent), daarna kun je binnen de clubs het effect van supporter / sponsor / etc. bekijken.

Het is niet heel ingewikkeld om te doen, maar ook niet het allergemakkelijkste.

Kijk anders even met google of zo of je denkt dat dit voor je kan werken, en kom dan terug?

Tegen de skewness zou je een logtransformatie kunnen gebruiken, maar de meeste toetsen zijn vrij robust zolang je n hoger dan 30 is, als het je uitkomst al beinvloedt zal dat enorm in de marge zijn dus ik zou me daar denk ik niet te druk om maken.

Nou, nu verschillende dingen gekeken en gelezen er over. Steeds maakte begin uitleg me enthousiast aangezien het leek te behandelen wat ik nodig heb, maar dan gaat het al snel voorbij wat ik ooit geleerd heb met syntax en andere statistiek tools etc.

Ook lijkt het vooral te concentreren op longitudinaal onderzoek waar bijvoorbeeld leeftijd als variabele gemeten is om de 2 jaar. Daar is wel voorbeeld van voor SPSS met Mixed Models maar daar heb je dan bv age1 age2 age3 als variabelen.. lijkt niet te zijn wat ik moet hebben.

/lost

vrijdag 5 juni 2015 @ 21:00:04 #93

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 18:26 schreef oompaloompa het volgende:

[..]

Ja maar alleen in het abstracte / als concept, verder alleen gebruik gemaakt bij mediatie-analyses.

In principe komt het gewoon neer op data genereren van een bestaande dataset, analyse op uitvoeren, en dit 100.000 (of hoeveel je wilt) keer doen om een betrouwbaardere statistic te krijgen toch? Ik weet niet of jij het voor hetzelfde wilt gebruiken als hoe ik het ken, heb geen ervaring met het gebruik bij een Wald-test maar als het conceptueel een beetje vergelijkbaar is kan ik misschien nog iets nuttigs zeggen

Qua concept is het inderdaad wat ik wil doen. Ik quote even een eerdere post van mij zodat je direct kan zien of je er wat mee kan:

quote:
Op vrijdag 29 mei 2015 11:30 schreef Banaanensuiker het volgende:
Heeft iemand hier verstand van bootstrapping met doel het ontwikkelen van observatie specifieke kritieke Wald scores? Ik probeer dit in combinatie met een SUR.
Deze procedure probeer ik na te bootsen:
[ afbeelding ]
[ afbeelding ]

Met dit systeem:
[ afbeelding ]

vrijdag 5 juni 2015 @ 23:09:21 #94

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 19:11 schreef VacaLoca het volgende:

[..]

Nou, nu verschillende dingen gekeken en gelezen er over. Steeds maakte begin uitleg me enthousiast aangezien het leek te behandelen wat ik nodig heb, maar dan gaat het al snel voorbij wat ik ooit geleerd heb met syntax en andere statistiek tools etc.

Ook lijkt het vooral te concentreren op longitudinaal onderzoek waar bijvoorbeeld leeftijd als variabele gemeten is om de 2 jaar. Daar is wel voorbeeld van voor SPSS met Mixed Models maar daar heb je dan bv age1 age2 age3 als variabelen.. lijkt niet te zijn wat ik moet hebben.

/lost

De voorbeelden die vaak gebruikt worden is idd longitudinaal onderzoek, daar zijn de jaren meetpunten, en is de "groep" het individu. Dus per individu heb je x-aantal meetpunten. Bij jou zou het individu de club zijn, en heb je per club een aantal meetpunten (binding van sponsoren en binding van supporters).

Het is niet extreem moeilijk, maar misschien wel te moeilijk om duidelijk hier zo op een forum uit te leggen.
Voor welke uni / opleiding / sciptie(?) is het? Misschien kun je er mee wegkomen een gemakkelijker maar minder correct model te gebruiken, of als heel belangrijk zouden ze mensen moeten hebben die je er mee kunnen helpen (lijkt me). Het is, weet ik vrij zeker, de beste oplossing, maar als dit ver buiten wat je geleerd hebt gaat zou het vreemd zijn als ze van je verwachten dit gewoon even te doen.

quote:
Op vrijdag 5 juni 2015 21:00 schreef Banaanensuiker het volgende:

[..]

Qua concept is het inderdaad wat ik wil doen. Ik quote even een eerdere post van mij zodat je direct kan zien of je er wat mee kan:

[..]

Ik kom van psy en ben heel erg slecht in het lezen van wiskundige noteringen (

ik weet het...) dus daar moet ik even voor gaan zitten. Kom je wel tot een bepaald punt of gaat het in het begin al mis?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 23:48:58 #95

VacaLoca

quote:
Op vrijdag 5 juni 2015 23:09 schreef oompaloompa het volgende:

[..]

De voorbeelden die vaak gebruikt worden is idd longitudinaal onderzoek, daar zijn de jaren meetpunten, en is de "groep" het individu. Dus per individu heb je x-aantal meetpunten. Bij jou zou het individu de club zijn, en heb je per club een aantal meetpunten (binding van sponsoren en binding van supporters).

Het is niet extreem moeilijk, maar misschien wel te moeilijk om duidelijk hier zo op een forum uit te leggen.
Voor welke uni / opleiding / sciptie(?) is het? Misschien kun je er mee wegkomen een gemakkelijker maar minder correct model te gebruiken, of als heel belangrijk zouden ze mensen moeten hebben die je er mee kunnen helpen (lijkt me). Het is, weet ik vrij zeker, de beste oplossing, maar als dit ver buiten wat je geleerd hebt gaat zou het vreemd zijn als ze van je verwachten dit gewoon even te doen.

Business Administration aan Radboud, master thesis. Meer dan de meest basic multiple regression hebben we niet gehad. Bespreek de analyse komende week pas voor het eerst met begeleider (in totaal maar 5 contacturen gehad hooguit) maar over 2 weken is deadline scriptie al.

Wat je nu schetst neemt dus al de stakeholder groepen mee. Vergelijking tussen stakeholder groepen is echter aparte hypothese. Ik test ook relaties onafhankelijke variabelen met afhankelijk per stakeholder groep apart.

Even een versimpelde mockup van de data:

(In werkelijkheid 6 onafhankelijke en 1 afhankelijke en dus voor veel clubs)

Met multiple regression dus hypotheses testen

1a: Independent1 has a positive effect on Dependent for Fans
1b: Independent1 has a positive effect on Dependent for Sponsors
1c: Independent1 has a positive effect on Dependent for Local Government (Gemeente)
2a: Independent2 has a positive effect on Dependent for Fans
2b: Independent2 has a positive effect on Dependent for Sponsors
2c: Independent2 has a positive effect on Dependent for Local Government (Gemeente)

En dan aparte hypothese:

The effects of the different antecedents of Dependent differ among stakeholder groups

Waarbij in soortgelijk onderzoek de standardized effect sizes (B) vergeleken werden.

Maar als je mijn geval bekijkt.. in voorbeelden gebruiken ze Age1, Age2, Age3 bijvoorbeeld. Dat is 1 item over 3 metingen. Als ik 1 item had gehad, laten we ook even leeftijd nemen. Dan zou ik dus 3 variabelen moeten hebben; Age_Sponsor, Age_Fan, Age_Gemeente en dan in SPSS met Data > Restructure die variabelen moeten transposen.

Maar in mijn mockup voorbeeld zou ik dan IND1_Item1_Sponsor, IND1_item1_Fan, IND1_Item2_Gemeente etc moeten maken? Of voor de recoded scale? (IND1 met MEAN(item1,item2) en IND2) en dan IND1_Fan, IND1_Sponsor, IND1_Gemeente IND2_Fan etc?

Krijg er nog niet echt vat op omdat ik overal maar de helft van de uitleg lees en de rest in syntax is wat ik nooit gehad heb.

Weet niet hoeveel ze van me verwachten, die vorig jaar zijn afgestudeerd hiermee hadden het wel met simpele multiple regression gedaan maar die hadden geen pooled data. Veel meer dan dat ik het wel op mijn manier kon doen (meerdere clubs om sample te vergroten) dmv poolen heb ik niet meegekregen tot dusver. Maar heb het idee dat ik niet echt statistisch verantwoord bezig ben met gewooon de multiple regression draaien met respondenten van alle clubs op 1 hoop.

Thanks voor antwoorden btw!

zaterdag 6 juni 2015 @ 00:33:29 #96

haha94boem

haha boem

Dag mensen,

Ik ben bezig met mijn scriptie en heb twee vragen. Mijn eerste vraag: ik ga de aandelenprijs proberen te voorspellen aan de hand van onder andere CEO tenure (de variabele waarin ik geinteresseerd ben, wijkt deze significant af van 0?). Ik wil dit doen voor alle S&P500 companies, en later voor alleen technologie bedrijven binnen de S&P500. Als ik deze technologie bedrijven allemaal in een regressie wil stoppen, hoe doe ik dat op een efficiente manier? Ik neem aan dat 1 voor 1 niet de juiste methode is.

Ik hoor het graag van jullie. Vriendelijke groet

zaterdag 6 juni 2015 @ 11:26:30 #97

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 23:09 schreef oompaloompa het volgende:

[..]

Ik kom van psy en ben heel erg slecht in het lezen van wiskundige noteringen ( ik weet het...) dus daar moet ik even voor gaan zitten. Kom je wel tot een bepaald punt of gaat het in het begin al mis?

Ik ga het op een andere manier doen; samen met mijn supervisor besloten dat er in mijn geval efficiëntere tijdsbesteding is. In ieder geval bedankt voor je bereidheid tot helpen.

zaterdag 6 juni 2015 @ 15:29:55 #98

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 23:48 schreef VacaLoca het volgende:

[..]

Business Administration aan Radboud, master thesis. Meer dan de meest basic multiple regression hebben we niet gehad. Bespreek de analyse komende week pas voor het eerst met begeleider (in totaal maar 5 contacturen gehad hooguit) maar over 2 weken is deadline scriptie al.

Wat je nu schetst neemt dus al de stakeholder groepen mee. Vergelijking tussen stakeholder groepen is echter aparte hypothese. Ik test ook relaties onafhankelijke variabelen met afhankelijk per stakeholder groep apart.

Even een versimpelde mockup van de data:

[ afbeelding ]

(In werkelijkheid 6 onafhankelijke en 1 afhankelijke en dus voor veel clubs)

Met multiple regression dus hypotheses testen

1a: Independent1 has a positive effect on Dependent for Fans
1b: Independent1 has a positive effect on Dependent for Sponsors
1c: Independent1 has a positive effect on Dependent for Local Government (Gemeente)
2a: Independent2 has a positive effect on Dependent for Fans
2b: Independent2 has a positive effect on Dependent for Sponsors
2c: Independent2 has a positive effect on Dependent for Local Government (Gemeente)

En dan aparte hypothese:

The effects of the different antecedents of Dependent differ among stakeholder groups

Waarbij in soortgelijk onderzoek de standardized effect sizes (B) vergeleken werden.

Maar als je mijn geval bekijkt.. in voorbeelden gebruiken ze Age1, Age2, Age3 bijvoorbeeld. Dat is 1 item over 3 metingen. Als ik 1 item had gehad, laten we ook even leeftijd nemen. Dan zou ik dus 3 variabelen moeten hebben; Age_Sponsor, Age_Fan, Age_Gemeente en dan in SPSS met Data > Restructure die variabelen moeten transposen.

Maar in mijn mockup voorbeeld zou ik dan IND1_Item1_Sponsor, IND1_item1_Fan, IND1_Item2_Gemeente etc moeten maken? Of voor de recoded scale? (IND1 met MEAN(item1,item2) en IND2) en dan IND1_Fan, IND1_Sponsor, IND1_Gemeente IND2_Fan etc?

Krijg er nog niet echt vat op omdat ik overal maar de helft van de uitleg lees en de rest in syntax is wat ik nooit gehad heb.

Weet niet hoeveel ze van me verwachten, die vorig jaar zijn afgestudeerd hiermee hadden het wel met simpele multiple regression gedaan maar die hadden geen pooled data. Veel meer dan dat ik het wel op mijn manier kon doen (meerdere clubs om sample te vergroten) dmv poolen heb ik niet meegekregen tot dusver. Maar heb het idee dat ik niet echt statistisch verantwoord bezig ben met gewooon de multiple regression draaien met respondenten van alle clubs op 1 hoop.

Thanks voor antwoorden btw!

Hoef je niet te testen of de effecten van de fans / sponsors / local government sig van elkaar verschillen? Dat maakt alles al een heel stuk gemakkelijker.

Een gewone multiple regressie met alles op een hoop is niet per se heel erg fout, maar geeft je minder asccurate schattingen etc. gewoon omdat je het effect van club niet meeneemt, dat filter je er in een multilevel uit.

Ik ben even aan aan het kloten met een voorbeeld dataset, maar moet zo weg. Als het niet op tijd lukt zou ik denk ik een gewone muiltiple regressie doen, dit meenemen naar de meeting (zeker aangezien je maar zo weinig meet, wat slecht eigenlijk :/ ) en dan in de meeting aangeven dat je extre hebt gekeken wat de beste analyse is, dit multilevel lijkt te zijn maar dit ver boven wat je hebt geleerd uitgaat, en niet iets is dat je jezelf gemakkelijk aanleert en dan vragen of je daar support bij kan krijgen.

Dan geef je aan dat je het 1. heel serieus hebt genomen, 2. je ook nog een backup analyse hebt gedaan zoals je hem hebt geleerd, and hopelijk krijg je hulp bij 3. of krijg je te horen dat het niet nodig is, totale win-win situatie lijkt me

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zaterdag 6 juni 2015 @ 15:53:28 #99

VacaLoca

quote:
Op zaterdag 6 juni 2015 15:29 schreef oompaloompa het volgende:

[..]

Hoef je niet te testen of de effecten van de fans / sponsors / local government sig van elkaar verschillen? Dat maakt alles al een heel stuk gemakkelijker.

Dat moet wel, maar de eerste hypotheses meten de relaties per stakeholder groep apart. Kijken of effecten sig verschillen doe ik dus ook maar voor een latere hypothese (maar wat wel de hoofdvraag is zo'n beetje van het onderzoek - of ze sig verschillen)

quote:
Een gewone multiple regressie met alles op een hoop is niet per se heel erg fout, maar geeft je minder asccurate schattingen etc. gewoon omdat je het effect van club niet meeneemt, dat filter je er in een multilevel uit.

Ik ben even aan aan het kloten met een voorbeeld dataset, maar moet zo weg. Als het niet op tijd lukt zou ik denk ik een gewone muiltiple regressie doen, dit meenemen naar de meeting (zeker aangezien je maar zo weinig meet, wat slecht eigenlijk :/ ) en dan in de meeting aangeven dat je extre hebt gekeken wat de beste analyse is, dit multilevel lijkt te zijn maar dit ver boven wat je hebt geleerd uitgaat, en niet iets is dat je jezelf gemakkelijk aanleert en dan vragen of je daar support bij kan krijgen.

Dan geef je aan dat je het 1. heel serieus hebt genomen, 2. je ook nog een backup analyse hebt gedaan zoals je hem hebt geleerd, and hopelijk krijg je hulp bij 3. of krijg je te horen dat het niet nodig is, totale win-win situatie lijkt me

Thanks!!

Ik zorg inderdaad dat ik een uitwerking heb van de methode zoals we die geleerd hebben en zal het zeker behandelen in gesprek. Alleen aardige tijdnood dus helaas. Heel hoofdstuk 4, 5 en 6 in 13 dagen plus nog een herkansing

zaterdag 6 juni 2015 @ 17:59:38 #100

VacaLoca

Even een simplere vraag tussendoor: Als je meerdere groepen in een sample hebt zoals eerder beschreven, doe je dan factor analyse voor discriminant validity controleren voor de hele sample of per groep?

Had per groep gedaan, maar lees nu een paper met soortgelijke situatie (die helaas niet uitweiden over hoe ze de regressieanalyse gedaan hebben) waarin ze voor totale sample hebben gedaan.

zondag 7 juni 2015 @ 15:20:19 #101

VacaLoca

Bleh, shoot me.

Nog wat aan het zoeken en puzzelen geweest.

Is dit enigszins juist?:

Volgende syntax gedraaid:

1
2
3
4
5

mixed OrganizationalIdentification with DomainInvolvement RegionalAffiliation PerceivedCSR OrgPrestige OrgDistinctiveness ContactFrequency
/fixed =
/method = ml
/random = intercept | subject(ClubID)
/print = solution.

Om te beoordelen of Multi Model wel nodig is aan de hand van intraclass correlation (ICC) op basis van de Clubs

Heb dit gedaan per stakeholder groep en volgende output:

Local Government:

0.071456 / (0.071456 + 0.855686) = 0.077 = 7.7%

Sponsors:

0.027478 / (0.027478 + 0.955224) = 0.027 = 2.7%

Fans:

0.031911 / (0.031911+0.795851) = 0.038 = 3.8%

Deze lijken me niet genoeg impact te hebben om over te gaan op Multi Model als ik per stakeholder groep de relaties wil testen met regressieanalyse?

Ook gekeken naar de -2 Log Likelihood van het model met de random component Club en zonder. Het is bij Local Government bijvoorbeeld 1138.8 ten opzichte van 1150.

Nu zag ik het volgende in een voorbeeld:

quote:
Chi square=203 026.467 - 196 165.706 = 6860.76, with 1 df, p=0.000. The outcome is highly significant and indicates that a two-level model is necessary.

Maar daar slaan ze stukje over toch? Chi2 is toch niet puur het verschil tussen de 2 getallen en dan bij df=1 kijken of het hoger is dan 3.84?

Chi2 is toch in mijn geval:

1
2
3

(1150-1138.8)[sup]2[/sup]
---------------------------------- = 0.109
1150

Ofwel niet significant?

Welke is het in dit geval? Bij laatste bevestigd het dat one-level volstaat, maar als de waarde 11.2 is dan is het <0.01 en wijst dat op two-level

Voor hele sample is ICC voor clubs trouwens 15% maar dat lijkt me meer verklaard worden door de stakeholder groepen. Als ik bovenstaande ICC test met de stakeholder groep als random component dan is de ICC 28% dus dat is wel aanzienlijk met een p<0.001 bij Likelihood vergelijking welk getal ik ook pak.

Maar voor clubs dus twijfel

donderdag 11 juni 2015 @ 09:32:23 #102

superkimmi

Hakuna Matata

Ik heb een vraagje. In mijn thesis doe ik onderzoek naar 'gerrymandering' in the USA (het herverdelen van kiesdistricten om een meerderheid te verkrijgen). ik heb zelf de data over gerrymandering verzameld tussen 1961 en nu en heb van mijn begeleider de data gekregen met wie er in welk district de verkiezingen heeft gewonnen en met hoeveel procent vd stemmen. Mijn eigen data werkt helemaal met cijfers (geen gerrymandering is een nul, wel een 1). Maar die van mijn begeleider werkt uiteraard met namen. Nu bestaat zijn data uit meet dan 20.000 records, dus handmatig overzetten in werkbare cijfers gaat een tijd duren. Is er nog een andere manier waarop ik met beide datasets een regressie kan uitvoeren (in eviews of SPSS, want daar heb ik ervaring mee. we hebben op de uni evt ook Stata) zonder dat ik alles handmatig in cijfers hoef te veranderen.

Het gaat dus vooral om het transformeren van de begeleider zijn data in iets wat SPSS of eviews begrijpt. Als ik dat eenmaal heb lukt het uitvoeren van een regressie wel. Ik kan dit ook aan mijn begeleider vragen, maar die is er tot maandag niet meer en maandag heb ik een afspraak met hem waarbij ik eigenlijk hoop al wat resultaten te kunnen overleggen.

life is what happens to you, while you're busy making other plans.

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» school, studie en onderwijs

» school, studie en onderwijs