Centraal Statistiektopic (SPSS, R, excel, etc.) #8

dinsdag 19 mei 2015 @ 13:12:54 #1

Operc

Nr. 40

Ooit komt hier vast een mooie OP, maar voor nu:

Dit is een topic voor alle vragen die je hebt over statistiek, SPSS, R, Excel etcetera.

dinsdag 19 mei 2015 @ 13:13:18 #2

Operc

Nr. 40

Laatste post:

quote:
Op dinsdag 19 mei 2015 12:12 schreef Tobi-wan het volgende:

[..]

Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?

Aangezien het om een correlatie gaat, kun je de nulhypothese dat er geen correlatie is tussen de twee variabelen verwerken. 0.000 is immers lager dan 0.05. Zeggen dat er een effect is (wat ik deed in de eerste post, excuses), zou ik achterwege laten, omdat dat zou kunnen worden gelezen als "Variabele 1 beïnvloed Variabele 2" en die conclusie kun je bij correlaties niet trekken. Er is een samenhang en je kunt beoordelen of deze positief of negatief is en sterk of zwak.

quote:
[ afbeelding ]

Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?

De uitleg uit mijn vorige past en wat ik hierboven zeg gelden ook voor deze variabelen ja. Zoals je zelf zegt is dit resultaat te verwachten omdat je in beide vragen min of meer hetzelfde meet.

quote:
Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?

De correlatie is er, maar zoals oompaloompa al zei, het hoeft niet perse een lineair verband te zijn. De scatterplots kunnen helpen om daar wat meer inzicht in te krijgen.

dinsdag 19 mei 2015 @ 13:41:53 #3

Tobi-wan

quote:
Op dinsdag 19 mei 2015 13:13 schreef Operc het volgende:
Laatste post:

[..]

Aangezien het om een correlatie gaat, kun je de nulhypothese dat er geen correlatie is tussen de twee variabelen verwerken. 0.000 is immers lager dan 0.05. Zeggen dat er een effect is (wat ik deed in de eerste post, excuses), zou ik achterwege laten, omdat dat zou kunnen worden gelezen als "Variabele 1 beïnvloed Variabele 2" en die conclusie kun je bij correlaties niet trekken. Er is een samenhang en je kunt beoordelen of deze positief of negatief is en sterk of zwak.

[..]

De uitleg uit mijn vorige past en wat ik hierboven zeg gelden ook voor deze variabelen ja. Zoals je zelf zegt is dit resultaat te verwachten omdat je in beide vragen min of meer hetzelfde meet.

[..]

De correlatie is er, maar zoals oompaloompa al zei, het hoeft niet perse een lineair verband te zijn. De scatterplots kunnen helpen om daar wat meer inzicht in te krijgen.

Ik kom er wel! Nogmaals bedankt! Je krijgt een eervolle vermelding in mijn voorwoord

dinsdag 19 mei 2015 @ 14:25:35 #4

Operc

Nr. 40

quote:
Op dinsdag 19 mei 2015 13:41 schreef Tobi-wan het volgende:

[..]

Ik kom er wel! Nogmaals bedankt! Je krijgt een eervolle vermelding in mijn voorwoord

Graag gedaan.

dinsdag 19 mei 2015 @ 19:17:28 #5

ralfie

!Yvan eht nioj

quote:
Op dinsdag 19 mei 2015 07:42 schreef GoobyPls het volgende:

[..]

Deze pakt die niet als die de waarde uit de cel moet halen, dus:

vert.zoeken("*B1*";A1:A100;1;ONWAAR)

Hoe werken wildcards in deze combinatie?

vert.zoeken("*" & B1 & "*"; etc)

of, indien je cel met B1 moet beginnen zoals je later schrijft:

vert.zoeken(B1 & " *"; etc)

quote:
Op dinsdag 19 mei 2015 12:12 schreef Tobi-wan het volgende:

[..]

Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?

[ afbeelding ]

Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?

[..]

Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?

Sowieso moet je hier Spearman correlatie gebruiken, geen Pearson. Je hebt immers ordinale data. Zal niet veel uitmaken, is wel netter.

donderdag 21 mei 2015 @ 14:28:44 #6

Tobi-wan

quote:
Op dinsdag 19 mei 2015 19:17 schreef ralfie het volgende:

[..]

Sowieso moet je hier Spearman correlatie gebruiken, geen Pearson. Je hebt immers ordinale data. Zal niet veel uitmaken, is wel netter.

Bedankt voor de tip. Scatter plots zijn ook niet echt een optie met ordinale data of wel? Is er een andere manier waarop ik kan aantonen of er een lineair verband is tussen twee variabelen?

donderdag 21 mei 2015 @ 14:51:27 #7

ralfie

!Yvan eht nioj

quote:
Op donderdag 21 mei 2015 14:28 schreef Tobi-wan het volgende:

[..]

Bedankt voor de tip. Scatter plots zijn ook niet echt een optie met ordinale data of wel? Is er een andere manier waarop ik kan aantonen of er een lineair verband is tussen twee variabelen?

ordinale data bij ordinale data is nauwelijks goed weer te geven, nee. Tabellen zijn eigenlijk de enige optie (al dan niet met een X*Y Chi-kwadraat toets).

Met ordinale variabelen is een lineair verband per definitie niet mogelijk. Je moet ordinale data dan eigenlijk eerst transformeren naar een continue varabele, waarvoor je aannames moet gaan doen (bijvoorbeeld dat de 'waarde' van elke categorie gelijk is). Dit is nog enigzins goed te praten als je bijv. leeftijdscategorieen hebt die even groot zijn (bijv 0-10, 11-20, 21-30, etc), anders wordt het vervelender. Waneer je een Pearson correlatie gebruikt, doe je dit impliciet, en dat is dus niet netjes. Spearman correlatie kijkt naar de orde van observaties, en doet dit dus niet.

donderdag 21 mei 2015 @ 15:21:00 #8

Tobi-wan

quote:
Op donderdag 21 mei 2015 14:51 schreef ralfie het volgende:

[..]

ordinale data bij ordinale data is nauwelijks goed weer te geven, nee. Tabellen zijn eigenlijk de enige optie (al dan niet met een X*Y Chi-kwadraat toets).

Met ordinale variabelen is een lineair verband per definitie niet mogelijk. Je moet ordinale data dan eigenlijk eerst transformeren naar een continue varabele, waarvoor je aannames moet gaan doen (bijvoorbeeld dat de 'waarde' van elke categorie gelijk is). Dit is nog enigzins goed te praten als je bijv. leeftijdscategorieen hebt die even groot zijn (bijv 0-10, 11-20, 21-30, etc), anders wordt het vervelender. Waneer je een Pearson correlatie gebruikt, doe je dit impliciet, en dat is dus niet netjes. Spearman correlatie kijkt naar de orde van observaties, en doet dit dus niet.

Oké duidelijk. Ik denk dat ik ook niet te ver hiermee moet gaan. Volgens mij is het relatief veilig om aan te nemen dat iemand die meer tijd doorbrengt op Facebook ook meer vrienden heeft en meer pagina's volgt. Ik hoop een dezer dagen het hoofdstuk resultaten af te sluiten, net nu ik het eindelijk een beetje begin te begrijpen...

maandag 25 mei 2015 @ 16:50:15 #9

Eijsselstein

Helaas ben ik ook vastgelopen bij de statistische analyse! Zou iemand misschien even kunnen kijken of dit de juiste methode is voor mijn onderzoek? :

Ik onderzoek het effect van één onafhankelijke variabele (Dit gaat om 3 categorieën, namelijk de sector waarin een bedrijf actief is) op één afhankelijke variabele (een percentage, continue variabele dus). Als controlevariabele gebruik ik vier verschillende firma's, ook een categorie dus.

Ik dacht zelf aan een Two-Way ANOVA omdat het in principe gaat om twee onafhankelijke, categoriale variabelen en slechts één continue afhankelijke variabele.

Ik heb ook maar 150 bedrijven in mijn onderzoek betrokken, dus ik hou er rond de 150/(3*3) = 17 over per cel.

Excuus voor de domme vragen maar ik heb nog nooit eerder met SPSS gewerkt voor mijn masterscriptie!

maandag 25 mei 2015 @ 16:58:51 #10

oompaloompa

doompadeedee

quote:
Op maandag 25 mei 2015 16:50 schreef Eijsselstein het volgende:
Helaas ben ik ook vastgelopen bij de statistische analyse! Zou iemand misschien even kunnen kijken of dit de juiste methode is voor mijn onderzoek? :

Ik onderzoek het effect van één onafhankelijke variabele (Dit gaat om 3 categorieën, namelijk de sector waarin een bedrijf actief is) op één afhankelijke variabele (een percentage, continue variabele dus). Als controlevariabele gebruik ik vier verschillende firma's, ook een categorie dus.

Ik dacht zelf aan een Two-Way ANOVA omdat het in principe gaat om twee onafhankelijke, categoriale variabelen en slechts één continue afhankelijke variabele.

Ik heb ook maar 150 bedrijven in mijn onderzoek betrokken, dus ik hou er rond de 150/(3*3) = 17 over per cel.

Excuus voor de domme vragen maar ik heb nog nooit eerder met SPSS gewerkt voor mijn masterscriptie!

Op basis van je eerste stukje lijkt een Anova mij het beste (let wel op, anova kijkt of er verschillen tussen de drie groepen zijn, maar zegt niet waar die verschillen zitten, daar moet je contrasten voor gebruiken). Ik begrijp alleen niet zo goed wat je bedoelt met je "controlevariabele", is het een controle variabele of een andere groep?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 25 mei 2015 @ 17:05:42 #11

Eijsselstein

quote:
Op maandag 25 mei 2015 16:58 schreef oompaloompa het volgende:

[..]

Op basis van je eerste stukje lijkt een Anova mij het beste (let wel op, anova kijkt of er verschillen tussen de drie groepen zijn, maar zegt niet waar die verschillen zitten, daar moet je contrasten voor gebruiken). Ik begrijp alleen niet zo goed wat je bedoelt met je "controlevariabele", is het een controle variabele of een andere groep?

Allereerst bedankt voor deze snelle reactie! Dat eerste klopt, er is over dit onderwerp nog bijna geen onderzoek gedaan. Ik wil dus in eerste instantie gewoon bekijken óf er überhaupt verschillen zijn in de gehanteerde percentages (afhankelijke variabele) in de 3 sectoren (onafhankelijke variabele). En niet zozeer waar die verschillen door veroorzaakt worden.

Wat betreft de controlevariabele, ik heb geen controlegroep oid. Ik denk alleen dat het gehanteerde percentage niet alleen afhankelijk is van de sector, maar ook van iets anders. Daarom wil ik mijn resultaten zuiverder maken door deze variabele ook op te nemen als een onafhankelijke variabele.

Ik weet alleen of een Two-way ANOVA hier geschikt voor is.

Ik hoop dat het zo iets duidelijker is

maandag 25 mei 2015 @ 17:16:23 #12

oompaloompa

doompadeedee

quote:
Op maandag 25 mei 2015 17:05 schreef Eijsselstein het volgende:

[..]

Allereerst bedankt voor deze snelle reactie! Dat eerste klopt, er is over dit onderwerp nog bijna geen onderzoek gedaan. Ik wil dus in eerste instantie gewoon bekijken óf er überhaupt verschillen zijn in de gehanteerde percentages (afhankelijke variabele) in de 3 sectoren (onafhankelijke variabele). En niet zozeer waar die verschillen door veroorzaakt worden.

Ik weet niet zeker of we hier hetzelfde bedoelen. Anova geeft alleen aan of er een verschil tussen de groepen is. Dus [2,2,8] geeft hetzelfde resultaat als [2,8,2] of [8,2,2].

quote:
Wat betreft de controlevariabele, ik heb geen controlegroep oid. Ik denk alleen dat het gehanteerde percentage niet alleen afhankelijk is van de sector, maar ook van iets anders. Daarom wil ik mijn resultaten zuiverder maken door deze variabele ook op te nemen als een onafhankelijke variabele.

Ik weet alleen of een Two-way ANOVA hier geschikt voor is.

Ik hoop dat het zo iets duidelijker is

Die kun je toevoegen als een covariaat in een AnCova

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 25 mei 2015 @ 22:05:33 #13

Eijsselstein

quote:
Op maandag 25 mei 2015 17:16 schreef oompaloompa het volgende:

[..]

Ik weet niet zeker of we hier hetzelfde bedoelen. Anova geeft alleen aan of er een verschil tussen de groepen is. Dus [2,2,8] geeft hetzelfde resultaat als [2,8,2] of [8,2,2].

[..]

Die kun je toevoegen als een covariaat in een AnCova

Hmm, ik hoop wel dat we hetzelfde bedoelen haha! Ik wil gewoon onderzoeken óf er een verschil is tussen de sectoren handel, productie & dienstverlening tov de continue DV (een percentage). Als ik jou voorbeeld neem: als die 8 toe te wijzen is aan een van de sectoren, en de andere sectoren zijn beide 2, dan is voor mij dat verschil toch al bewezen?

Wat betreft de covariantie in een AnCova, die moet continu zijn toch? In mijn geval is het een categorie.

Even heel iets anders: Stel ik maak er geen controlevariabele van maar een modererende variabele,dan kan een Two-way Anova wel weer toch? Dan heb ik twee IV,beide categorieën, en 1 DV, een continue.

Bedankt voor je tips trouwens! Dit helpt me weer de goede kant op

maandag 25 mei 2015 @ 22:10:12 #14

oompaloompa

doompadeedee

quote:
Op maandag 25 mei 2015 22:05 schreef Eijsselstein het volgende:

[..]

Hmm, ik hoop wel dat we hetzelfde bedoelen haha! Ik wil gewoon onderzoeken óf er een verschil is tussen de sectoren handel, productie & dienstverlening tov de continue DV (een percentage). Als ik jou voorbeeld neem: als die 8 toe te wijzen is aan een van de sectoren, en de andere sectoren zijn beide 2, dan is voor mij dat verschil toch al bewezen?

Maar stel nou dat de uitslag 45%, 55% en 90% is. Dan weet je alleen dat er ergens een significant verschil is, maar bv niet of de 55% nog van de 45% verschilt, en of de 90% van de 55% verschilt. Misschien verschilt alleen de 90% van de 45%.. daar kun je contrasten voor gebruiken.

quote:
Wat betreft de covariantie in een AnCova, die moet continu zijn toch? In mijn geval is het een categorie.

Even heel iets anders: Stel ik maak er geen controlevariabele van maar een modererende variabele,dan kan een Two-way Anova wel weer toch? Dan heb ik twee IV,beide categorieën, en 1 DV, een continue.

Bedankt voor je tips trouwens! Dit helpt me weer de goede kant op

Ah dat had ik niet door, dan kun je ze allebei als een losse factor in een enova gooien, en heb je dus een 3 (sector) bij 2 (controle) design en vergelijk je 6 groepen met elkaar. Met je vrij lage sample-size heb je dan wel erg weinig power maar daar valt nu niet meer zo veel aan te doen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 26 mei 2015 @ 10:35:02 #15

raptorix

Leuk topic, als je veel met statistiek bezig bent, kijk dan eens op het Microsoft Azure platform

https://studio.azureml.net/

🕰️₿🕰️₿🕰️₿🕰️₿🕰️₿🕰️ TikTok next Block

dinsdag 26 mei 2015 @ 15:10:30 #16

Boarderzip

Mensen hier bekend met Qualtrics? Ik heb een vraag waarbij mensen een cijfer moesten geven en daarvoor een puntje op een balk konden verschuiven. Als basispositie heb ik alle puntjes op 5 gezet, echter is het nu zo dat als iemand niet met het puntje heeft geschoven en dus de 5 adequaat vond dit niet geregistreerd is als zijnde cijfer 5 ingegeven. Iemand die mij kan vertellen hoe ik dit kan corrigeren?

dinsdag 26 mei 2015 @ 15:23:37 #17

oompaloompa

doompadeedee

quote:
Op dinsdag 26 mei 2015 15:10 schreef Boarderzip het volgende:
Mensen hier bekend met Qualtrics? Ik heb een vraag waarbij mensen een cijfer moesten geven en daarvoor een puntje op een balk konden verschuiven. Als basispositie heb ik alle puntjes op 5 gezet, echter is het nu zo dat als iemand niet met het puntje heeft geschoven en dus de 5 adequaat vond dit niet geregistreerd is als zijnde cijfer 5 ingegeven. Iemand die mij kan vertellen hoe ik dit kan corrigeren?

Als je "request response" aanzet moeten mensen verplicht iig de balk aanklikken.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 26 mei 2015 @ 15:25:06 #18

Boarderzip

quote:
Op dinsdag 26 mei 2015 15:23 schreef oompaloompa het volgende:

[..]

Als je "request response" aanzet moeten mensen verplicht iig de balk aanklikken.

Ik weet het, alleen is het kwaad nu al geschied. In SPSS had ik de mogelijkheid om zelf het getal in te vullen als het vakje leeg was, ik zie dit in Qualtrics alleen nergens.

dinsdag 26 mei 2015 @ 15:30:54 #19

oompaloompa

doompadeedee

quote:
Op dinsdag 26 mei 2015 15:25 schreef Boarderzip het volgende:

[..]

Ik weet het, alleen is het kwaad nu al geschied. In SPSS had ik de mogelijkheid om zelf het getal in te vullen als het vakje leeg was, ik zie dit in Qualtrics alleen nergens.

Ik zou dat ook niet doen aangezien je niet weet of die mensen echt 5 wilden zeggen of gewoon lui doorgeklikt hebben.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 26 mei 2015 @ 15:32:37 #20

Boarderzip

quote:
Op dinsdag 26 mei 2015 15:30 schreef oompaloompa het volgende:

[..]

Ik zou dat ook niet doen aangezien je niet weet of die mensen echt 5 wilden zeggen of gewoon lui doorgeklikt hebben.

Zit inderdaad wel een kern van waarheid in maar het waren 5 onderdelen opgenomen in 1 tabel zeg maar. Als mensen dan slechts 1 punt niet beoordeeld hebben, neem ik aan dat zij de 5 daar het geschikte cijfer vonden. Als ik dit niet meeneem in mijn analyse ben ik bang dat je een vertekend gemiddelde krijgt.

dinsdag 26 mei 2015 @ 15:38:48 #21

oompaloompa

doompadeedee

quote:
Op dinsdag 26 mei 2015 15:32 schreef Boarderzip het volgende:

[..]

Zit inderdaad wel een kern van waarheid in maar het waren 5 onderdelen opgenomen in 1 tabel zeg maar. Als mensen dan slechts 1 punt niet beoordeeld hebben, neem ik aan dat zij de 5 daar het geschikte cijfer vonden. Als ik dit niet meeneem in mijn analyse ben ik bang dat je een vertekend gemiddelde krijgt.

Als je de data zelf toevoegt zou ik daar heel heel heel expliciet over zijn. Zowel dat je het hebt gedaan, als bij de interpretatie aangeven in hoeverre de interpretatie daardoor beinvloedt wordt. En zelfs als je dat doet ligt het nog best op het randje, een randje waar je zeker niet overheen wilt gaan.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 26 mei 2015 @ 15:40:50 #22

Boarderzip

quote:
Op dinsdag 26 mei 2015 15:38 schreef oompaloompa het volgende:

[..]

Als je de data zelf toevoegt zou ik daar heel heel heel expliciet over zijn. Zowel dat je het hebt gedaan, als bij de interpretatie aangeven in hoeverre de interpretatie daardoor beinvloedt wordt. En zelfs als je dat doet ligt het nog best op het randje, een randje waar je zeker niet overheen wilt gaan.

Ik zal het verschil eens uitrekenen, maar dan komen we eerst weer terug bij mijn oorspronkelijke vraag: hoe voeg ik de opengelaten data toe?

dinsdag 26 mei 2015 @ 15:43:05 #23

oompaloompa

doompadeedee

quote:
Op dinsdag 26 mei 2015 15:40 schreef Boarderzip het volgende:

[..]

Ik zal het verschil eens uitrekenen, maar dan komen we eerst weer terug bij mijn oorspronkelijke vraag: hoe voeg ik de opengelaten data toe?

Dat zou ik dus ook in spss/excel doen, niet in qualtrics, je wilt niet handmatig dingen veranderen in je originele, ruwe, data.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 26 mei 2015 @ 15:45:30 #24

Boarderzip

quote:
Op dinsdag 26 mei 2015 15:43 schreef oompaloompa het volgende:

[..]

Dat zou ik dus ook in spss/excel doen, niet in qualtrics, je wilt niet handmatig dingen veranderen in je originele, ruwe, data.

Ik kan in Qualtrics gewoon meerdere rapporten uitdraaien dus de ruwe data blijft altijd behouden. Ook heb ik gemerkt dat Qualtrics makkelijker werkt dan SPSS en ook een visueel meer aantrekkelijke weergave heeft.

dinsdag 26 mei 2015 @ 15:59:25 #25

oompaloompa

doompadeedee

quote:
Op dinsdag 26 mei 2015 15:45 schreef Boarderzip het volgende:

[..]

Ik kan in Qualtrics gewoon meerdere rapporten uitdraaien dus de ruwe data blijft altijd behouden. Ook heb ik gemerkt dat Qualtrics makkelijker werkt dan SPSS en ook een visueel meer aantrekkelijke weergave heeft.

Ik denk niet dat het kan, maar je zou dan wel de ruwe data aanpassen (want je voegt gewoon nummers toe aan je datafile) dus het zou ook echt tegen elke ethische code in gaan..
Je zou dit kunnen proberen, weet niet of dat voor missings werkt: http://www.qualtrics.com/(...)anced/recode-values/ afhankelijk van waar het voor is zou je de ethische code misschien kunnen negeren.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 26 mei 2015 @ 16:03:51 #26

Boarderzip

quote:
Op dinsdag 26 mei 2015 15:59 schreef oompaloompa het volgende:

[..]

Ik denk niet dat het kan, maar je zou dan wel de ruwe data aanpassen (want je voegt gewoon nummers toe aan je datafile) dus het zou ook echt tegen elke ethische code in gaan..
Je zou dit kunnen proberen, weet niet of dat voor missings werkt: http://www.qualtrics.com/(...)anced/recode-values/ afhankelijk van waar het voor is zou je de ethische code misschien kunnen negeren.

Bedankt voor je bijdrage, heeft me wel aan het denken gezet of het inderdaad wel ethisch verantwoord is. Ik ga me er nog even over beramen, het is voor een adviesrapport in het bedrijf waar ik stage loop.

dinsdag 26 mei 2015 @ 16:06:39 #27

oompaloompa

doompadeedee

quote:
Op dinsdag 26 mei 2015 16:03 schreef Boarderzip het volgende:

[..]

Bedankt voor je bijdrage, heeft me wel aan het denken gezet of het inderdaad wel ethisch verantwoord is. Ik ga me er nog even over beramen, het is voor een adviesrapport in het bedrijf waar ik stage loop.

De code is voor wetenschap, maar daar is een hooggoed dat je altijd alles helemaal tot de bron moet kunnen herleiden,dusje moet iemand een file kunnen geven met daarin puur alleen wat respondenten aan hebben gegeven zonder inmenging van jezelf, en anderen zouden op basis van die file tot dezelfde conclusies moeten komen als ze jou stappen volgen.

Iemand die ik ken, een wetenschapper, is een keer bijna in de problemen gekomen omdat zijn studenten zomaar iets vergelijkbaars deden zonder het duidelijk aan hem door te geven. Dat werd bijna een cariere-verwoestende fraudezaak, daarom hamerde ik er ook zo op.
Daarom ook mijn suggestie om, ondanks dat qualtrics er mooier uit ziet, die data echt in een onafhankelijk file toe te voegen voor je analyse. Succes er mee iig!

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 27 mei 2015 @ 11:48:41 #28

Davarius

Train=gain

Ik heb een SPSS analyse vraag (laatste analyse van mijn thesis). Ik ben blij dat ik me door de rest heen heb weten te slaan.

Even korte uitleg:

Ik heb het grafisch inzicht en de prestaties op stock-flow taken (2 onafhankelijke variabelen, ratio niveau, parametrisch) onderzocht bij VMBO scholieren. Nu heb ik deze vergeleken met VWO scholieren uit een andere thesis en bleek zoals verwacht dat VWO scholieren op beide variabelen beter scoorden. Echter is er een significant leeftijdsverschil tussen de VMBO groep en VWO groep (VWO groep is gemiddeld 0.85 jaar ouder). Nu wil ik onderzoeken/analyseren of dit leeftijdsverschil een grotere invloed heeft op de 2 variabelen dan het opleidingsniveau (VWO of VMBO). Mijn begeleider heeft me een aanzet gegeven door te zeggen dat ik hiervoor ANCOVA analyse moet gebruiken. Ik heb echter geen idee hoe ik dit via deze analyse kan analyseren in SPSS en hoe ik dit uiteindelijk in mijn thesis moet opschrijven. Dit wil ik namelijk gebruiken in mijn discussie zodat ik hopelijk kan ontkrachten dat het leeftijdsverschil een grotere invloed heeft.

Kan iemand mij hiermee helpen? Ik hoop dat ik het duidelijk heb omschreven. Alvast enorm bedankt!

Davarias gains

woensdag 27 mei 2015 @ 15:11:12 #29

oompaloompa

doompadeedee

quote:
Op woensdag 27 mei 2015 11:48 schreef Davarius het volgende:
Ik heb een SPSS analyse vraag (laatste analyse van mijn thesis). Ik ben blij dat ik me door de rest heen heb weten te slaan.

Even korte uitleg:

Ik heb het grafisch inzicht en de prestaties op stock-flow taken (2 onafhankelijke variabelen, ratio niveau, parametrisch) onderzocht bij VMBO scholieren. Nu heb ik deze vergeleken met VWO scholieren uit een andere thesis en bleek zoals verwacht dat VWO scholieren op beide variabelen beter scoorden. Echter is er een significant leeftijdsverschil tussen de VMBO groep en VWO groep (VWO groep is gemiddeld 0.85 jaar ouder). Nu wil ik onderzoeken/analyseren of dit leeftijdsverschil een grotere invloed heeft op de 2 variabelen dan het opleidingsniveau (VWO of VMBO). Mijn begeleider heeft me een aanzet gegeven door te zeggen dat ik hiervoor ANCOVA analyse moet gebruiken. Ik heb echter geen idee hoe ik dit via deze analyse kan analyseren in SPSS en hoe ik dit uiteindelijk in mijn thesis moet opschrijven. Dit wil ik namelijk gebruiken in mijn discussie zodat ik hopelijk kan ontkrachten dat het leeftijdsverschil een grotere invloed heeft.

Kan iemand mij hiermee helpen? Ik hoop dat ik het duidelijk heb omschreven. Alvast enorm bedankt!

Je kunt idd een Ancova gebruiken, waar je leeftijd als een covariaat toevoegt.
Je vraag is nu nog iets te vaag om te beantwoorden, kijk anders even hoe ver je komt

Voor het idee daarachter zie bijvoorbeeld: http://www.stat.purdue.ed(...)512notes/topic10.pdf

Voor de interpretatie zie bv hier: https://statistics.laerd.(...)pss-statistics-2.php

Ik denk, maar ben net wakker dus neem het met een korreltje zout, dat je nooit helemaal precies accuraat kan schatten welk deel voor hoeveel variantie verantwoordelijk is omdat niveau en leeftijd nou eenmaal heel sterk correleren.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

donderdag 28 mei 2015 @ 15:07:42 #30

Davarius

Train=gain

quote:
Op woensdag 27 mei 2015 15:11 schreef oompaloompa het volgende:

[..]

Je kunt idd een Ancova gebruiken, waar je leeftijd als een covariaat toevoegt.
Je vraag is nu nog iets te vaag om te beantwoorden, kijk anders even hoe ver je komt

Voor het idee daarachter zie bijvoorbeeld: http://www.stat.purdue.ed(...)512notes/topic10.pdf

Voor de interpretatie zie bv hier: https://statistics.laerd.(...)pss-statistics-2.php

Ik denk, maar ben net wakker dus neem het met een korreltje zout, dat je nooit helemaal precies accuraat kan schatten welk deel voor hoeveel variantie verantwoordelijk is omdat niveau en leeftijd nou eenmaal heel sterk correleren.

Heel erg bedankt, ga hier mee aan de slag!

Davarias gains

vrijdag 29 mei 2015 @ 08:52:17 #31

Davarius

Train=gain

Ik heb geprobeerd met behulp van Ancova analyse te onderzoeken of het leeftijdsverschil een grotere invloed heeft op grafisch inzicht dan het opleidingsniveau. Nu krijg ik de volgende resultaten (zie foto):

De covariaat (leeftijd) heeft amper de gemiddelden veranderd, maar het verschil tussen beide opleidingsniveaus is nog steeds significant (p < .001) nadat de covariaat is toegevoegd. Ik begrijp (ook na het bestuderen van Field) niet hoe ik deze data nu precies moet interpreteren en op moet schrijven.

Hopelijk kan iemand mij helpen?

Davarias gains

vrijdag 29 mei 2015 @ 11:30:17 #32

Banaanensuiker

synergy

Heeft iemand hier verstand van bootstrapping met doel het ontwikkelen van observatie specifieke kritieke Wald scores? Ik probeer dit in combinatie met een SUR.
Deze procedure probeer ik na te bootsen:

Met dit systeem:

vrijdag 29 mei 2015 @ 12:07:17 #33

iUsed2bGod

Wie kan me helpen met de volgende vraag.

Voor een onderzoek heb ik een construct dat bestaat uit twee delen: opwinding en angst (het opwinding-angst construct).

Om dit te meten heb ik in een vragenlijst vragen gehad die opwinding meten en vragen die angst meten.

Samen moet deze items één score worden voor het construct opwinding-angst. Dus iemand die zowel hoog scoort op opwinding als angst scoort hoog op dit construct maar iemand die alleen hoog scoort op angst maar niet op opwinding moet niet hoog scoren op dit construct.

Hoe los je dit het beste op, ook met het oog op factor en regressie analyse later in SPSS.

vrijdag 29 mei 2015 @ 13:18:10 #34

oompaloompa

doompadeedee

quote:
Op vrijdag 29 mei 2015 08:52 schreef Davarius het volgende:
Ik heb geprobeerd met behulp van Ancova analyse te onderzoeken of het leeftijdsverschil een grotere invloed heeft op grafisch inzicht dan het opleidingsniveau. Nu krijg ik de volgende resultaten (zie foto):
[ afbeelding ]
De covariaat (leeftijd) heeft amper de gemiddelden veranderd, maar het verschil tussen beide opleidingsniveaus is nog steeds significant (p < .001) nadat de covariaat is toegevoegd. Ik begrijp (ook na het bestuderen van Field) niet hoe ik deze data nu precies moet interpreteren en op moet schrijven.

Hopelijk kan iemand mij helpen?

Ik kan je helpen als je een iets grotere foto post, deze is neit te lezen

quote:
Op vrijdag 29 mei 2015 12:07 schreef iUsed2bGod het volgende:
Wie kan me helpen met de volgende vraag.

Voor een onderzoek heb ik een construct dat bestaat uit twee delen: opwinding en angst (het opwinding-angst construct).

Om dit te meten heb ik in een vragenlijst vragen gehad die opwinding meten en vragen die angst meten.

Samen moet deze items één score worden voor het construct opwinding-angst. Dus iemand die zowel hoog scoort op opwinding als angst scoort hoog op dit construct maar iemand die alleen hoog scoort op angst maar niet op opwinding moet niet hoog scoren op dit construct.

Hoe los je dit het beste op, ook met het oog op factor en regressie analyse later in SPSS.

Ik begrijp niet zo goed wat je wilt doen. Je hebt twee schalen, angst en opwinding, waarom wil je daar 1 construct van maken? Theoretisch gezien kun je er gewoon de sproductscore van nemen, ik kan me alleen moeilijk situaties voorstellen waarin dat nuttig zou zijn.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 29 mei 2015 @ 13:42:16 #35

iUsed2bGod

Uiteindelijk wil ik teams vergelijken die hoog scoren op zowel opwinding als angst met de overige teams om te kijken of in teams die hoger scoren op de combinatie opwinding-angst er meer fouten worden gemaakt.

Daar zit een heel theoretisch verhaal aan vast waarom dat interessant is waarmee ik je niet zal vervelen (of je moet interesse hebben om mijn thesis achteraf te lezen).

Maargoed, je hebt het over productscores, of te wel het vermenigvuldigen van de twee om tot een score te komen. Dat is misschien best wel een goed oplossing!

vrijdag 29 mei 2015 @ 13:52:37 #36

oompaloompa

doompadeedee

quote:
Op vrijdag 29 mei 2015 13:42 schreef iUsed2bGod het volgende:
Uiteindelijk wil ik teams vergelijken die hoog scoren op zowel opwinding als angst met de overige teams om te kijken of in teams die hoger scoren op de combinatie opwinding-angst er meer fouten worden gemaakt.

Daar zit een heel theoretisch verhaal aan vast waarom dat interessant is waarmee ik je niet zal vervelen (of je moet interesse hebben om mijn thesis achteraf te lezen).

Maargoed, je hebt het over productscores, of te wel het vermenigvuldigen van de twee om tot een score te komen. Dat is misschien best wel een goed oplossing!

Dan zou ik ze gewoon toevoegen alstwee losse IV's en de interactie ook toevoegen, dus:

angst + opwinding + angst*opwinding = score

Dan krijg je de invloed van elk onderdeel en test je dus of het puur een additief effect is of dat hoog op beide juist van belang is.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 29 mei 2015 @ 20:16:09 #37

RustCohle

Hallo,

Ik wil graag efficiëntie/productiviteit van een willekeurig bedrijf berekenen aan de hand van bepaalde gegevens uit een jaarverslag .

Weet iemand of statistische berekenen met SPSS kan en welke variabelen e.d. ik hiervoor nodig heb om de efficiëntie en productiviteit te berekenen?

[ Bericht 13% gewijzigd door RustCohle op 29-05-2015 20:28:24 ]

vrijdag 29 mei 2015 @ 20:41:12 #38

oompaloompa

doompadeedee

quote:
Op vrijdag 29 mei 2015 20:16 schreef RustCohle het volgende:
Hallo,

Ik wil graag efficiëntie/productiviteit van een willekeurig bedrijf berekenen aan de hand van bepaalde gegevens uit een jaarverslag .

Weet iemand of statistische berekenen met SPSS kan en welke variabelen e.d. ik hiervoor nodig heb om de efficiëntie en productiviteit te berekenen?

Dat lijkt me niet iets dat je in spss moet doen, aangezien je niets voorspelt maar gewoon met unieke data een unieke berekening maakt?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zaterdag 30 mei 2015 @ 14:27:57 #39

Annema21

Beste forumleden,

Ik als SPSS noob ben bezig met mijn afstudeeronderzoek. Kan iemand mij misschien helpen met onderstaande kwestie?

Het is zo dat ik uit de dataset mensen moet excluderen die van een bepaalde selectie aan vragen er 10 of meer niet ingevuld hebben. Is er in SPSS een functie om dit te doen? Of moet ik echt handmatig selecteren? (het is nogal een grote dataset..)

zaterdag 30 mei 2015 @ 14:57:43 #40

Operc

Nr. 40

quote:
Op zaterdag 30 mei 2015 14:27 schreef Annema21 het volgende:
Beste forumleden,

Ik als SPSS noob ben bezig met mijn afstudeeronderzoek. Kan iemand mij misschien helpen met onderstaande kwestie?

Het is zo dat ik uit de dataset mensen moet excluderen die van een bepaalde selectie aan vragen er 10 of meer niet ingevuld hebben. Is er in SPSS een functie om dit te doen? Of moet ik echt handmatig selecteren? (het is nogal een grote dataset..)

Er zal vast een elegante oplossing zijn, maar wat me zo even te binnen schiet: De missing values coderen als iets heel groots (1000 ofzo). Vervolgens compute variable -> alle variabelen van die selectie optellen. Daarna Select Cases waarbij die variable kleiner is dan 10.000. (Heb even geen SPSS bij de hand, dus een elegantere oplossing zoeken zit er voor mij even niet in.)

zondag 31 mei 2015 @ 15:51:10 #41

Super-B

Goedemiddag,

Momenteel heb ik twee soorten gegevens verzameld: enerzijds de kosten van een bedrijf, anderzijds het aantal geleverde diensten. Ik wil meten in hoeverre de kosten van een bedrijf en het aantal geleverde diensten een verband met elkaar hebben. Daarnaast wil ik een kostencurve schetsen met op de X-as het aantal geleverde diensten (output) en op de Y-as de bedrijfskosten.

Om dit te doen, wil ik gebruik maken van SPSS. Heeft iemand enig idee welke opties/analyses van SPSS geschikt zijn voor het uitvoeren van de gewenste berekeningen/simulaties?

zondag 31 mei 2015 @ 16:04:05 #42

oompaloompa

doompadeedee

quote:
Op zondag 31 mei 2015 15:51 schreef Super-B het volgende:
Goedemiddag,

Momenteel heb ik twee soorten gegevens verzameld: enerzijds de kosten van een bedrijf, anderzijds het aantal geleverde diensten. Ik wil meten in hoeverre de kosten van een bedrijf en het aantal geleverde diensten een verband met elkaar hebben. Daarnaast wil ik een kostencurve schetsen met op de X-as het aantal geleverde diensten (output) en op de Y-as de bedrijfskosten.

Om dit te doen, wil ik gebruik maken van SPSS. Heeft iemand enig idee welke opties/analyses van SPSS geschikt zijn voor het uitvoeren van de gewenste berekeningen/simulaties?

Ik zou een regressie doen van kosten op output en dan verschillende relaties proberen. De standaard-regressie test een linear verband (dus x*kosten = output) maar je kunt verschillende vormen testen, en je kunt zelfs je eigen varianten testen.

Misschien het beste als eerste een scatterplot maken met kosten op k-as en output op y om visueel te kijken wat voor soort verband er lijkt te bestaan?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 31 mei 2015 @ 16:06:09 #43

Super-B

quote:
Op zondag 31 mei 2015 16:04 schreef oompaloompa het volgende:

[..]

Ik zou een regressie doen van kosten op output en dan verschillende relaties proberen. De standaard-regressie test een linear verband (dus x*kosten = output) maar je kunt verschillende vormen testen, en je kunt zelfs je eigen varianten testen.

Misschien het beste als eerste een scatterplot maken met kosten op k-as en output op y om visueel te kijken wat voor soort verband er lijkt te bestaan?

Welke soort regressietest raad jij mij aan? Wat is precies het verschil tussen een scatterplot en een regressietest, aangezien beide testen berekenen/weergeven in hoeverre er een verband is waar te nemen?

zondag 31 mei 2015 @ 16:10:47 #44

oompaloompa

doompadeedee

quote:
Op zondag 31 mei 2015 16:06 schreef Super-B het volgende:

[..]

Welke soort regressietest raad jij mij aan? Wat is precies het verschil tussen een scatterplot en een regressietest, aangezien beide testen berekenen/weergeven in hoeverre er een verband is waar te nemen?

Scatterplot geeft je gewoon een grafiekje, de regressie test het verband.

Welk verband uiteindelijk het beste je data omschrijft weet ik niet, dat ligt aan je data

Daarom ook het beste beginnen met een scatterplot!

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 31 mei 2015 @ 16:16:05 #45

Super-B

quote:
Op zondag 31 mei 2015 16:10 schreef oompaloompa het volgende:

[..]

Scatterplot geeft je gewoon een grafiekje, de regressie test het verband.

Welk verband uiteindelijk het beste je data omschrijft weet ik niet, dat ligt aan je data
Daarom ook het beste beginnen met een scatterplot!

http://nl.wikipedia.org/wiki/Spreidingsdiagram

''Voorbeeld 1

Uit de bevolking is een steekproef van 100 proefpersonen getrokken en van elke proefpersoon is de lengte L en het gewicht G gemeten. De grafiek van de 100 punten (Li,Gi) geeft een puntenwolk, waarin men het "verband" tussen lengte en gewicht kan zien.''

http://www.spsshandboek.nl/regressie_analyse/

''Je gebruikt de regressie analyse om te toetsen of een onafhankelijke variabele invloed heeft op een afhankelijke variabele en of dit een positief of een negatief effect is''

Beide kijken toch in principe naar de correlatie?

zondag 31 mei 2015 @ 16:20:46 #46

oompaloompa

doompadeedee

quote:
Op zondag 31 mei 2015 16:16 schreef Super-B het volgende:

[..]

http://nl.wikipedia.org/wiki/Spreidingsdiagram

''Voorbeeld 1

Uit de bevolking is een steekproef van 100 proefpersonen getrokken en van elke proefpersoon is de lengte L en het gewicht G gemeten. De grafiek van de 100 punten (Li,Gi) geeft een puntenwolk, waarin men het "verband" tussen lengte en gewicht kan zien.''

http://www.spsshandboek.nl/regressie_analyse/

''Je gebruikt de regressie analyse om te toetsen of een onafhankelijke variabele invloed heeft op een afhankelijke variabele en of dit een positief of een negatief effect is''

Beide kijken toch in principe naar de correlatie?

Nee, daar kunnen we in het abstracte over blijven praten, of je kunt het gewoon proberen en dan zul je zien dat het iets anders doet

Zoals ik al eerder zei, een scatterplot laat alleen punten zien, een regressie berekent een verband, dat verband dat je wilt testen kun je zelf aangeven. Je kunt duizenden verbanden testen maar dat kost nogal veel energie, darom kun je het beste eerst naar de data kijken, om uit te zoeken welke verbanden logisch zijn om te testen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zondag 31 mei 2015 @ 16:34:49 #47

Super-B

quote:
Op zondag 31 mei 2015 16:20 schreef oompaloompa het volgende:

[..]

Nee, daar kunnen we in het abstracte over blijven praten, of je kunt het gewoon proberen en dan zul je zien dat het iets anders doet

Zoals ik al eerder zei, een scatterplot laat alleen punten zien, een regressie berekent een verband, dat verband dat je wilt testen kun je zelf aangeven. Je kunt duizenden verbanden testen maar dat kost nogal veel energie, darom kun je het beste eerst naar de data kijken, om uit te zoeken welke verbanden logisch zijn om te testen.

Ik wil kort gezegd een grafiek schetsen met SPSS om te kijken of er een bepaalde vorm is te vinden tussen Y (gemiddelde bedrijfskosten) en X (output, geleverde diensten). Zo ja, dan wordt de hypothese als waar aangenomen. Zo niet, dan wordt de hypothese verworpen.

Echter wil ik daarnaast een test uitvoeren waarbij er een bepaalde grens zit om de hypothese als (on)waar te beschouwen. Het kan wel grafisch gezien een bepaalde vorm hebben, maar er moet wel een 'significantie' test erop uitgevoerd worden om zodoende, statistisch gezien, het visuele te bevestigen/ontkrachten.

zondag 31 mei 2015 @ 16:38:04 #48

oompaloompa

doompadeedee

quote:
Op zondag 31 mei 2015 16:34 schreef Super-B het volgende:

[..]

Ik wil kort gezegd een grafiek schetsen met SPSS om te kijken of er een bepaalde vorm is te vinden tussen Y (gemiddelde bedrijfskosten) en X (output, geleverde diensten). Zo ja, dan wordt de hypothese als waar aangenomen. Zo niet, dan wordt de hypothese verworpen.

Echter wil ik daarnaast een test uitvoeren waarbij er een bepaalde grens zit om de hypothese als (on)waar te beschouwen. Het kan wel grafisch gezien een bepaalde vorm hebben, maar er moet wel een 'significantie' test erop uitgevoerd worden om zodoende, statistisch gezien, het visuele te bevestigen/ontkrachten.

Het legt echt veel gemakkelijker uit als je de data er bij kunt zien. Zodra je een plotje etc post kan ik meer uitleggen over de verschillende mogelijkheden en hoe die werken.

[ Bericht 10% gewijzigd door oompaloompa op 31-05-2015 17:31:53 ]

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 1 juni 2015 @ 16:42:43 #49

Banaanensuiker

synergy

quote:
Op zondag 31 mei 2015 16:34 schreef Super-B het volgende:

[..]

Ik wil kort gezegd een grafiek schetsen met SPSS om te kijken of er een bepaalde vorm is te vinden tussen Y (gemiddelde bedrijfskosten) en X (output, geleverde diensten). Zo ja, dan wordt de hypothese als waar aangenomen. Zo niet, dan wordt de hypothese verworpen.

Echter wil ik daarnaast een test uitvoeren waarbij er een bepaalde grens zit om de hypothese als (on)waar te beschouwen. Het kan wel grafisch gezien een bepaalde vorm hebben, maar er moet wel een 'significantie' test erop uitgevoerd worden om zodoende, statistisch gezien, het visuele te bevestigen/ontkrachten.

Begrijp je zelf wel wat je wilt doen? Het klinkt namelijk erg vaag en abstract.
Als je een hypothese wilt testen, dan moet je over het algemeen een regressie doen. Welke vorm? Dat hangt inderdaad af van de data en jouw kennis. Maar zoals oompaloompa al zegt, nuttig advies is lastig te geven als je niet concreter bent over je dataset.

maandag 1 juni 2015 @ 21:55:13 #50

Super-B

quote:
Op zondag 31 mei 2015 16:38 schreef oompaloompa het volgende:

[..]

Het legt echt veel gemakkelijker uit als je de data er bij kunt zien. Zodra je een plotje etc post kan ik meer uitleggen over de verschillende mogelijkheden en hoe die werken.

quote:
Op maandag 1 juni 2015 16:42 schreef Banaanensuiker het volgende:

[..]

Begrijp je zelf wel wat je wilt doen? Het klinkt namelijk erg vaag en abstract.
Als je een hypothese wilt testen, dan moet je over het algemeen een regressie doen. Welke vorm? Dat hangt inderdaad af van de data en jouw kennis. Maar zoals oompaloompa al zegt, nuttig advies is lastig te geven als je niet concreter bent over je dataset.

Ik ben er al uit! Bedankt in ieder geval. Ik heb uiteindelijk gekozen voor een regressie-analyse en een diagram in plaats van een scatterplot.

Echter heb ik wel een ander vraagje met betrekking tot SPSS. Het is makkelijk aan te tonen, maar heb dit gelieve via SPSS:

Ik wil aantonen dat de kosten in periode 2 gedaald zijn ten opzichte van periode 1. Hoe kan ik dit het beste aantonen via SPSS? Periode 1 bestaat uit vier jaren en periode 2 bestaat uit drie jaren.

maandag 1 juni 2015 @ 21:58:56 #51

oompaloompa

doompadeedee

quote:
Op maandag 1 juni 2015 21:55 schreef Super-B het volgende:

[..]

[..]

Ik ben er al uit! Bedankt in ieder geval. Ik heb uiteindelijk gekozen voor een regressie-analyse en een diagram in plaats van een scatterplot.

Ok dan heb je dus een linear verband getest.

quote:
Echter heb ik wel een ander vraagje met betrekking tot SPSS. Het is makkelijk aan te tonen, maar heb dit gelieve via SPSS:

Ik wil aantonen dat de kosten in periode 2 gedaald zijn ten opzichte van periode 1. Hoe kan ik dit het beste aantonen via SPSS? Periode 1 bestaat uit vier jaren en periode 2 bestaat uit drie jaren.

Als de specifieke kosten gedaald zijn, dan hoef je daar geen toets op uit te voeren, alleen als je het wil generaliseren naar de populatie hoef je een toets te doen. Als je random observaties hebt, 1 per bedrijf, kun je een anova doen of een t-test om het gemiddelde van de twee periodes met elkaar te vergelijken. Als je data binnen bedrijven hebt van meerdere bedrijven zul je een repeated measures toe moeten passen, bv. een Mancova (of bij 2 datapunten per bedrijf, 1 in periode 1, 1 in periode 2) kun je een paired t-test doen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 1 juni 2015 @ 22:04:16 #52

Super-B

[ Bericht 100% gewijzigd door Super-B op 01-06-2015 22:12:05 ]

maandag 1 juni 2015 @ 22:06:46 #53

oompaloompa

doompadeedee

quote:
Op maandag 1 juni 2015 22:04 schreef Super-B het volgende:

[..]

Ik heb de data in SPSS zo ingevoerd dat er sprake is van drie bedrijven:

Bedrijf 1 is een fusiebedrijf
Bedrijf 2 is één van de twee bedrijven ontstaan door de opsplitsing van bedrijf 1.
Bedrijf 3 is één van de twee bedrijven ontstaan door de opsplitsing van bedrijf 1.

Wat ik wil aantonen, via SPSS, is dat de kosten van zowel bedrijf 2 als 3 gedaald zijn na opsplitsing van bedrijf 1.

Dat hoef je niet met statistiek aan te tonen, dat is zo, of dat is niet zo. Je hoeft alleen statistiek te gebruiken als je het wilt generaliseren naar bedrijven in het algemeen, maar dan zul je meer dan 1 case nodig hebben.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

maandag 1 juni 2015 @ 22:08:44 #54

Super-B

quote:
Op maandag 1 juni 2015 22:06 schreef oompaloompa het volgende:

[..]

Dat hoef je niet met statistiek aan te tonen, dat is zo, of dat is niet zo. Je hoeft alleen statistiek te gebruiken als je het wilt generaliseren naar bedrijven in het algemeen, maar dan zul je meer dan 1 case nodig hebben.

Dat ik daar geen statistiek voor nodig heb, is mij duidelijk. Dat gaf ik al in mijn eerste post betreffende deze vraag aan. Desondanks vind ik het altijd leuk om statistiek te gebruiken, hoe simpel de vraag ook mag zijn.

maandag 1 juni 2015 @ 22:11:10 #55

oompaloompa

doompadeedee

quote:
Op maandag 1 juni 2015 22:08 schreef Super-B het volgende:

[..]

Dat ik daar geen statistiek voor nodig heb, is mij duidelijk. Dat gaf ik al in mijn eerste post betreffende deze vraag aan. Desondanks vind ik het altijd leuk om statistiek te gebruiken, hoe simpel de vraag ook mag zijn.

Echt niet lullig bedoeld, maar ik weet gewoon niet hoe ik hier op moet antwoorden, je vraag slaat nergens op.

Het is een beetje alsof je vraagt hoe je kaas bij voetbal moet gebruiken.

betere metafoor; het is alsof je vraagt hoe je de wet van Newton toe moet passen om te weten wanneer de Tweede wereldoorlog begon, ja wikipedia is idd gemakkelijker maar ik vind het leuker om d.m.v. natuurkundige formules tot een antwoord te komen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 14:38:36 #56

Super-B

Hallo,

Ik heb een model gemaakt via een regressie-analyse met de volgende variabelen:

-Onafhankelijke variabele: output
-Afhankelijke variabele: gemiddelde bedrijfskosten

De resultaten zijn het volgende, waarbij b = gemiddelde bedrijfskosten en c = output:

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.

In de laatste figuur staan er twee significanties.. Naar welke zou ik moeten kijken en wat zou ik kunnen concluderen? Is er een negatief, geen of een positief verband?

[ Bericht 0% gewijzigd door Super-B op 02-06-2015 14:57:49 ]

Moderator dinsdag 2 juni 2015 @ 14:48:51 #57

Bosbeetle

terminaal verdwaald

Zitten hier ook R specialisten... Ik heb een R package geschreven en heb een import voor mijn dependencies in de NAMESPACE gezet maar als ik hem nu in een lege R installeert gaat hij de pakketten niet instaleren, ook komt één pakket niet van CRAN maar van bioconductor dus moet ik de repository wijzigen, ik heb geen idee waar ik dat moet aangeven... Of moet dat gewoon hard in de DESCRIPTION of NAMESPACE gezet worden (en hoe)...

Een ander ding waar ik nog wel eens tegen aan loop en hier ook gelijk wel eens kan vragen als je een apply (of variant daarvan lapply mapply vapply) doet is het dan ook mogelijk om daar het iteratie nummer uit te halen, zeg maar welk deel van de loop hij daadwerkelijk mee bezig is.

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 14:50:38 #58

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 14:38 schreef Super-B het volgende:
Hallo,

Ik heb een model gemaakt via een regressie-analyse met de volgende variabelen:

-Onafhankelijke variabele: output
-Afhankelijke variabele: bedrijfskosten

De resultaten zijn het volgende, waarbij b = bedrijfskosten en c = output:

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
In de laatste figuur staan er twee significanties.. Naar welke zou ik moeten kijken en wat zou ik kunnen concluderen? Is er een negatief, geen of een positief verband?

Niet dat je gaat luisteren, maar je kunt vrij weinig concluderen aangezien standard-error 0 is en je dus op basis van 1 observatie lijkt te werken? (gokje, kan ook iets anders zijn eventueel maar een SE van 0 verpest je analyses)

quote:
Op dinsdag 2 juni 2015 14:48 schreef Bosbeetle het volgende:
Zitten hier ook R specialisten... Ik heb een R package geschreven en heb een import voor mijn dependencies in de NAMESPACE gezet maar als ik hem nu in een lege R installeert gaat hij de pakketten niet instaleren, ook komt één pakket niet van CRAN maar van bioconductor dus moet ik de repository wijzigen, ik heb geen idee waar ik dat moet aangeven... Of moet dat gewoon hard in de DESCRIPTION of NAMESPACE gezet worden (en hoe)...

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator dinsdag 2 juni 2015 @ 14:53:06 #59

Bosbeetle

terminaal verdwaald

quote:
Op dinsdag 2 juni 2015 14:50 schreef oompaloompa het volgende:

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Jawel maar ik wil dat pakket gaan distribueren onder mensen met wie ik samenwerk en ik wil hun graag een pakketje leveren dat werkt en dus zelf al de dependencies gaat installeren. Ik ben redelijk op weg en heb nu fatsoenlijke robuste S3methodes voor image analyse lopen maar het blijft een geetter om het even snel op een andere computer te zetten.

Ik zit nu heel hard te twijfelen of ik moet investeren in Rcpp om de boel nog sneller te krijgen.

eerst had ik nog vrij veel for loops die heb ik nu voor het grootste gedeelte verapplied om uit te vinden dat Rcpp eigenlijk nog veel sneller is

maar het voelt zo slordig om 2 talen door elkaar heen te gebruiken.

Ben ook bezig om een shiny interface er bij te maken maar dat heeft ook nogal wat voeten in de aarde....

[ Bericht 15% gewijzigd door Bosbeetle op 02-06-2015 14:58:21 ]

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 14:53:10 #60

Super-B

quote:
Op dinsdag 2 juni 2015 14:50 schreef oompaloompa het volgende:

[..]

Niet dat je gaat luisteren, maar je kunt vrij weinig concluderen aangezien standard-error 0 is en je dus op basis van 1 observatie lijkt te werken? (gokje, kan ook iets anders zijn eventueel maar een SE van 0 verpest je analyses)

[..]

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Wat is handig om toe te voegen als observatie? De winst?

Ik werk met y = gemiddelde bedrijfskosten (afhankelijke) en x = output (onafhankelijke).

dinsdag 2 juni 2015 @ 14:58:11 #61

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 14:53 schreef Bosbeetle het volgende:

[..]

Jawel maar ik wil dat pakket gaan distribueren onder mensen met wie ik samenwerk en ik wil hun graag een pakketje leveren dat werkt en dus zelf al de dependencies gaat installeren. Ik ben redelijk op weg en heb nu fatsoenlijke robuste S3methodes voor image analyse lopen maar het blijft een geetter om het even snel op een andere computer te zetten.

En gewoon als eerste een blokje schrijven dat get & installt wat dus redundant is als ze de packages al hebben en anders gewoon runt? Niet de meest charmante oplossing, maar zou wel moeten werken toch?

Sorry gebruik R heel weinig, ed scripts die ik gebruik doen het meestal op de slordige get manier.

quote:
Op dinsdag 2 juni 2015 14:53 schreef Super-B het volgende:

[..]

Wat is handig om toe te voegen als observatie? De winst?

Ik werk met y = bedrijfskosten (afhankelijke) en x = output (onafhankelijke).

Je hebt 5 onafhankelijke datapunten toch?
Dus van 5 random bedrijven de kosten en de output, zo niet, wat zijn precies je observaties?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 14:58:37 #62

Super-B

quote:
Op dinsdag 2 juni 2015 14:50 schreef oompaloompa het volgende:

[..]

Niet dat je gaat luisteren, maar je kunt vrij weinig concluderen aangezien standard-error 0 is en je dus op basis van 1 observatie lijkt te werken? (gokje, kan ook iets anders zijn eventueel maar een SE van 0 verpest je analyses)

[..]

Geen oplossing, maar kun je ze niet gewoon handmatig permanent in R zetten?

Ik heb de afhankelijke variabele veranderd: van gemiddelde bedrijfskosten naar totale bedrijfskosten en er blijkt nu wél een standaard error te zijn.

dinsdag 2 juni 2015 @ 14:59:40 #63

Super-B

quote:
Op dinsdag 2 juni 2015 14:58 schreef oompaloompa het volgende:

[..]

En gewoon als eerste een blokje schrijven dat get & installt wat dus redundant is als ze de packages al hebben en anders gewoon runt? Niet de meest charmante oplossing, maar zou wel moeten werken toch?

Sorry gebruik R heel weinig, ed scripts die ik gebruik doen het meestal op de slordige get manier.

[..]

Je hebt 5 onafhankelijke datapunten toch?
Dus van 5 random bedrijven de kosten en de output, zo niet, wat zijn precies je observaties?

Ik heb de kosten en de output van de afgelopen vier jaren op een rij gezet in SPSS van drie bedrijven, maar ik observeer de relatie tussen de kosten en output van één bedrijf.

Moderator dinsdag 2 juni 2015 @ 15:00:13 #64

Bosbeetle

terminaal verdwaald

quote:
Op dinsdag 2 juni 2015 14:58 schreef oompaloompa het volgende:
En gewoon als eerste een blokje schrijven dat get & installt wat dus redundant is als ze de packages al hebben en anders gewoon runt? Niet de meest charmante oplossing, maar zou wel moeten werken toch?

Sorry gebruik R heel weinig, ed scripts die ik gebruik doen het meestal op de slordige get manier.

Tja maar ik weet dus niet waar ik een stukje code neer moet zetten zodat hij het runt als je het package installeert... het installeren van het package gaat prima en als je de dependencies al hebt geinstalleert dan doet hij de library() stapjes wel automagisch maar het installeren dus niet...

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 15:07:04 #65

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 14:59 schreef Super-B het volgende:

[..]

Ik heb de kosten en de output van de afgelopen vier jaren op een rij gezet in SPSS van drie bedrijven, maar ik observeer de relatie tussen de kosten en output van één bedrijf.

Ok, het is sowieso waarschijnlijk incorrect, maar als je in de regressie output kijken staat daar ergens links een B-waarde in de tweede colom, dat is het effect van X op Y. als de B bijvoorbeeld 0.5 is, is het effect van X een stapje hoger maken een toename van Y van 0.5.
De sig-waarde zegt (kort door de bocht) hoe groot de kans zou zijn zo'n B-waarde of een hogere te vinden als er in de populatie eigenlijk geen effect van X op Y is.

quote:
Op dinsdag 2 juni 2015 15:00 schreef Bosbeetle het volgende:

[..]

Tja maar ik weet dus niet waar ik een stukje code neer moet zetten zodat hij het runt als je het package installeert... het installeren van het package gaat prima en als je de dependencies al hebt geinstalleert dan doet hij de library() stapjes wel automagisch maar het installeren dus niet...

Sorry dude, dit is way beyond me dan

Veel succes!

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

Moderator dinsdag 2 juni 2015 @ 15:10:16 #66

Bosbeetle

terminaal verdwaald

quote:
Op dinsdag 2 juni 2015 15:07 schreef oompaloompa het volgende:
Sorry dude, dit is way beyond me dan
Veel succes!

sowieso die NAMESPACE en DESCRIPTION files zijn erg slecht gedocumenteerd

En mochten we vallen dan is het omhoog. - Krang (uit: Pantani)
My favourite music is the music I haven't yet heard - John Cage
Water: ijskoud de hardste - Gehenna

dinsdag 2 juni 2015 @ 15:12:13 #67

Super-B

quote:
Op dinsdag 2 juni 2015 15:07 schreef oompaloompa het volgende:

[..]

Ok, het is sowieso waarschijnlijk incorrect, maar als je in de regressie output kijken staat daar ergens links een B-waarde in de tweede colom, dat is het effect van X op Y. als de B bijvoorbeeld 0.5 is, is het effect van X een stapje hoger maken een toename van Y van 0.5.
De sig-waarde zegt (kort door de bocht) hoe groot de kans zou zijn zo'n B-waarde of een hogere te vinden als er in de populatie eigenlijk geen effect van X op Y is.

[..]

Sorry dude, dit is way beyond me dan
Veel succes!

Naar welke sig zou ik moeten kijken? Naar de sig in de eerste of de tweede rij?

dinsdag 2 juni 2015 @ 15:31:26 #68

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 15:12 schreef Super-B het volgende:

[..]

Naar welke sig zou ik moeten kijken? Naar de sig in de eerste of de tweede rij?

Naar de rij die bij je variabele hoort. Links (precies het vakje dat je af gesneden hebt in je foto) staat als het goed is de veriabele naam. De eerste is je intercept, die kun je negeren, de tweede zou iets van kosten moeten zijn.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 17:47:22 #69

Banaanensuiker

synergy

Je hebt echt 0,0 aan een regressie als je zo weinig observaties hebt. Je steekproef moet echt veel groter zijn om er nuttige conclusies uit te trekken.

dinsdag 2 juni 2015 @ 20:45:36 #70

Operc

Nr. 40

quote:
Op dinsdag 2 juni 2015 14:48 schreef Bosbeetle het volgende:
Zitten hier ook R specialisten... Ik heb een R package geschreven en heb een import voor mijn dependencies in de NAMESPACE gezet maar als ik hem nu in een lege R installeert gaat hij de pakketten niet instaleren, ook komt één pakket niet van CRAN maar van bioconductor dus moet ik de repository wijzigen, ik heb geen idee waar ik dat moet aangeven... Of moet dat gewoon hard in de DESCRIPTION of NAMESPACE gezet worden (en hoe)...

Een ander ding waar ik nog wel eens tegen aan loop en hier ook gelijk wel eens kan vragen als je een apply (of variant daarvan lapply mapply vapply) doet is het dan ook mogelijk om daar het iteratie nummer uit te halen, zeg maar welk deel van de loop hij daadwerkelijk mee bezig is.

Zo diep gaat mijn R kennis helaas ook niet.
Misschien de R-package-devel of R-devel mailinglist eens proberen?
http://www.r-project.org/mail.html

quote:
Op dinsdag 2 juni 2015 17:47 schreef Banaanensuiker het volgende:
Je hebt echt 0,0 aan een regressie als je zo weinig observaties hebt. Je steekproef moet echt veel groter zijn om er nuttige conclusies uit te trekken.

Daar is iedereen het hier over eens, maar om de een of andere reden wil Super-B het toch proberen omdat hij het leuk vindt om iets nutteloos te doen geloof ik.

dinsdag 2 juni 2015 @ 21:34:17 #71

Annema21

Beste FOKkers,

Nu mijn vorige kwestie is opgelost, een nieuwe vraag:

(Ja, dit is de eerste keer dat ik met SPSS werk, nee ik ben er totaal niet handig mee en ja, ik heb een erg strakke deadline

, bij deze dus mijn excuses)

Ik heb een dataset met daarin per case informatie over hulp bij de bevalling en met 5 somscores van een persoonlijkheidstest (NEO-FFI voor de liefhebber). Ik wil in een tabel het gemiddelde aantal spontane geboortes en kunstverlossingen uitzetten tegen de verschillende persoonlijkheidstypes.

Kan iemand mij vertellen hoe ik in SPSS deze tabel het beste kan maken? Ik heb Crosstabs geprobeerd maar krijg dan per persoonlijkheidstype een tabel met alle mogelijke somscores en per somscore het aantal kunst/spontane geboortes.

Sorry voor de onduidelijke uitleg, krijg mijn printscreen van de tabel niet in het bericht gevoegd.

dinsdag 2 juni 2015 @ 21:40:30 #72

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 21:34 schreef Annema21 het volgende:
Beste FOKkers,

Nu mijn vorige kwestie is opgelost, een nieuwe vraag:

(Ja, dit is de eerste keer dat ik met SPSS werk, nee ik ben er totaal niet handig mee en ja, ik heb een erg strakke deadline , bij deze dus mijn excuses)

Ik heb een dataset met daarin per case informatie over hulp bij de bevalling en met 5 somscores van een persoonlijkheidstest (NEO-FFI voor de liefhebber). Ik wil in een tabel het gemiddelde aantal spontane geboortes en kunstverlossingen uitzetten tegen de verschillende persoonlijkheidstypes.

Kan iemand mij vertellen hoe ik in SPSS deze tabel het beste kan maken? Ik heb Crosstabs geprobeerd maar krijg dan per persoonlijkheidstype een tabel met alle mogelijke somscores en per somscore het aantal kunst/spontane geboortes.

Sorry voor de onduidelijke uitleg, krijg mijn printscreen van de tabel niet in het bericht gevoegd.

Als je wilt weten wat de invloed is van de persoonlijkheidstypes op aantal kunstverlossingen / spontane geboortes zou ik een regressie doen, dit omdat persoonlijkheid een schaal is. Wat die regressie kort door de bocht test is bv hoe neurotischer iemand is, hoe groter de kans op x.
Omdat je afhankelijke dichotoom is (ja of nee) zul je een logistische regressie moeten doen. Speel daar anders even mee en kijk hoe ver je komt. Als je de output post kunnen wij in de thread je met de interpretatie helpen, maar dat gaat fijner met behulp van de output.

Een andere optie is om je data juist te splitsen op kunstgeboorte vs spontane geboorte en dan kijken of de gemiddelden op de persoonlijkheidsschalen tussen die twee groepen verschillen. Dat is een stuk gemakkelijker om te doen maar dat geeft je niet echt een antwoord op hoe groot het effect is van persoonlijkheid op die kans, alleen of er een verschil is. (het geeft je wel iets van grootte maar die is moeilijk interpreteerbaar).

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 2 juni 2015 @ 22:03:09 #73

Annema21

Ok, misschien een stomme vraag maar hoe kan ik de output hier posten?

woensdag 3 juni 2015 @ 01:09:42 #74

oompaloompa

doompadeedee

quote:
Op dinsdag 2 juni 2015 22:03 schreef Annema21 het volgende:
Ok, misschien een stomme vraag maar hoe kan ik de output hier posten?

printscreen of zo maken (of rechtermuisknop save as jpg kan volgens mij ook, en dan uploaden op bv imgur.com. Dan krijg je een linkje dat je hier kunt posten

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 3 juni 2015 @ 13:45:13 #75

Tobi-wan

Ben nu druk bezig met mijn bijlage in orde te maken. Aanstaande maandag mijn scriptie inleveren

Heb bijna alleen gebruik gemaakt van schalen waardoor ik ordinale variabelen heb. Is het dan interessant om de standaarddeviatie er bij te zetten of kan ik dat beter weg laten. Ze zitten allemaal tussen den 0,8 en 1 wat volgens mij komt omdat de antwoorden altijd 1, 2, 3, 4 of 5 zijn.

Daarnaast heb ik niet een hele grote populatie. Volgens mij verteld de standaarddeviatie mij niet zoveel...

Edit: volgens mij moet std. dev. er altijd bij als je met gemiddeldes werkt.

[ Bericht 7% gewijzigd door Tobi-wan op 03-06-2015 14:03:32 ]

woensdag 3 juni 2015 @ 14:12:45 #76

oompaloompa

doompadeedee

quote:
Op woensdag 3 juni 2015 13:45 schreef Tobi-wan het volgende:
Ben nu druk bezig met mijn bijlage in orde te maken. Aanstaande maandag mijn scriptie inleveren

Heb bijna alleen gebruik gemaakt van schalen waardoor ik ordinale variabelen heb. Is het dan interessant om de standaarddeviatie er bij te zetten of kan ik dat beter weg laten. Ze zitten allemaal tussen den 0,8 en 1 wat volgens mij komt omdat de antwoorden altijd 1, 2, 3, 4 of 5 zijn.

Daarnaast heb ik niet een hele grote populatie. Volgens mij verteld de standaarddeviatie mij niet zoveel...

Edit: volgens mij moet std. dev. er altijd bij als je met gemiddeldes werkt.

De standaard deviatie geeft iets aan over de spreiding. Zo zou je een gemiddelde van 1.8 kunnen hebben op je schaal met een SD van bijna 0 (iedereen zegt 2 een paar zeggen 1) of een enorme hoge SD (veel mensen zeggen 4 of 5, meeste zeggen 1 of 2). Ik zou hem dus altijd rapporteren

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 3 juni 2015 @ 14:49:03 #77

Tobi-wan

quote:
Op woensdag 3 juni 2015 14:12 schreef oompaloompa het volgende:

[..]

De standaard deviatie geeft iets aan over de spreiding. Zo zou je een gemiddelde van 1.8 kunnen hebben op je schaal met een SD van bijna 0 (iedereen zegt 2 een paar zeggen 1) of een enorme hoge SD (veel mensen zeggen 4 of 5, meeste zeggen 1 of 2). Ik zou hem dus altijd rapporteren

Bedankt! Het is inderdaad wel nuttige informatie. Van al die cijfers wordt ik af een toe een beetje duizelig en dan ontgaat het logisch nadenken mij enigszins.

donderdag 4 juni 2015 @ 08:04:39 #78

Banaanensuiker

synergy

Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

vrijdag 5 juni 2015 @ 14:25:46 #79

Sarasi

Quack.

quote:
Op donderdag 4 juni 2015 08:04 schreef Banaanensuiker het volgende:
Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni.

Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 14:50:36 #80

VacaLoca

Bleh, zit even vast.

Ik onderzoek hoe een zestal antecedenten in relatie staat tot een afhankelijke variabele. De afhankelijke variabele is Organizational Identification - hoe mensen zich identificeren met een organisatie. Komt uiteindelijk dus een regressie analyse aan te pas, en een standaard regressie analyse heb ik ook al wel gehad in de studie.

Maar zitten wat haken en ogen aan bij mij:

- Ik richt mij op alle betaald voetbalclubs *Eredivisie en Jupiler)
- Ik maak een vergelijking tussen 3 stakeholder groepen (supporters, sponsoren en lokale politiek)

Van supporters heb ik van 33 clubs respondenten. Maar van PSV heb ik er bijvoorbeeld 380, van Ajax 140, van Vitesse 120 en van NEC 110... maar van kleine clubs als een Helmond Sport maar 1 bijvoorbeeld. In totaal heb ik er 1132

Van sponsoren heb ik er een stuk of 40 van Heerenveen, 30 van Willem II, 15 van FC Twente en voor aantal andere clubs rond de 10 elk. In totaal 323 sponsoren als respondent. Maar ik heb er 0 voor PSV en Ajax, die bij supporters het gros van de respondenten vormen.

Lokale politiek in de vorm van gemeenteraadsleden heb ik 10 a 15 respondenten voor elke gemeente, in totaal 417 respondenten.

Origineel was het idee om voor 1 club het onderzoek te doen. Maar omdat je van sponsoren en gemeenteraadsleden maar een tiental respondenten zou krijgen besloten om meer clubs bijeen te pakken en 'een betaald voetbalclub' het onderwerp te maken ipv bijvoorbeeld 'Vitesse' of 'Ajax'. Want voor multiple regression liefst 20 respondenten per onafhankelijke variabele, in mijn geval dus 120.

Nu zit ik dus met de volgende dingen:

- Mbt poolen van de data: kan je het zomaar allemaal bij elkaar gooien of zijn daar methodes voor en moet je gewichten er aan hangen oid? Kan via google niet echt vinden.
- Ik vergelijk dus 3 stakeholder groepen; als ik items ga verwijderen op basis van Reliability test (Cronbach alpha) en Discriminant validity (Factor analyse, dubbelladers en structuur) moet ik dan hetzelfde verwijderen bij elke groep? Dus als item X een dubbellader is bij de Supporters, maar niet bij de Sponsoren, dan wel bij beiden weghalen zodat beide modellen gelijk zijn aan elkaar als je gaat vergelijken, of wel op maat maken per groep?

- Supporters identificeren zich sws al vrij snel met hun club, en het is dus enigszins skewed. Is hier voor dit specifieke geval een goed remedie voor? Zou ik ook bijvoorbeeld gezien de grote sample de cases zodanig selecteren dat de afhankelijke variabele normaal verdeeld is?

- Als ik de drie groepen met elkaar vergelijk dan pak ik nu bijvoorbeeld voor lokale politiek Willem II, Vitesse, AZ, Twente en Heerenveen samen zodat ik er voldoende voor regression analyse heb én ik voor deze clubs ook voldoende sponsoren en fans heb. Maar de verhoudingen zijn wel totaal anders per stakeholder groep voor deze clubs. Waar het voor lokale politiek ongeveer 20,20,20,20,20 is, is het voor sponsoren iets van 35, 25, 15, 15, 10 en voor fans soortgelijke verdeling als sponsoren maar dan andere volgorde. Moeten deze verhoudingen gelijk zijn?

Moeten misschien zelfs de absolute aantallen gelijk zijn? Ik vergelijk uiteindelijk de standardized B van de onafhankelijke variabelen in de groepen. Daarnaast heb ik al wel variabele gemaakt die grootte van de club weergeeft waarvoor dus gecontroleerd kan worden.

Bleh, warrig verhaal aan het worden. In kort: ik zit met multiple regression met pooled data en met drie samples die vergeleken moeten worden; best practice?

vrijdag 5 juni 2015 @ 15:03:49 #81

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Dat ziet er best nice uit! Hoe kom je daar terecht? Lijkt mij als econometriestudent wel een leuk bijbaantje.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 15:15:06 #82

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 15:03 schreef wimjongil het volgende:

[..]

Dat ziet er best nice uit! Hoe kom je daar terecht? Lijkt mij als econometriestudent wel een leuk bijbaantje.

Is hier alleen voor psychologie en sociologie, via de vacaturebank in BlackBoard.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 16:27:43 #83

oompaloompa

doompadeedee

quote:
Op donderdag 4 juni 2015 08:04 schreef Banaanensuiker het volgende:
Ik heb eerder in dit topic om hulp gevraagd bij het implementeren van een bepaalde procedure en geen hulp gehad, maar ik heb van de originele auteur de code gekregen. Helaas wel in TSP, een gedateerd programma, dus nu is het zaak om deze code om te schrijven naar R of Stata. Heeft iemand kennis van TSP en R/Stata die mij hierbij kan helpen? Of iemand die mij een pb kan sturen met een link naar TSP?

Ik heb alleen kennis van R in een aantal specifieke domeinen. Heb wel thuis op mn HD een aantal goede tutorials/courses staan, weet niet of je er iets aan hebt maar deel ze graag met je.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 16:32:29 #84

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Gefeliciteerd!

quote:
Op vrijdag 5 juni 2015 14:50 schreef VacaLoca het volgende:
Bleh, zit even vast.

Ik onderzoek hoe een zestal antecedenten in relatie staat tot een afhankelijke variabele. De afhankelijke variabele is Organizational Identification - hoe mensen zich identificeren met een organisatie. Komt uiteindelijk dus een regressie analyse aan te pas, en een standaard regressie analyse heb ik ook al wel gehad in de studie.

Maar zitten wat haken en ogen aan bij mij:

- Ik richt mij op alle betaald voetbalclubs *Eredivisie en Jupiler)
- Ik maak een vergelijking tussen 3 stakeholder groepen (supporters, sponsoren en lokale politiek)

Van supporters heb ik van 33 clubs respondenten. Maar van PSV heb ik er bijvoorbeeld 380, van Ajax 140, van Vitesse 120 en van NEC 110... maar van kleine clubs als een Helmond Sport maar 1 bijvoorbeeld. In totaal heb ik er 1132

Van sponsoren heb ik er een stuk of 40 van Heerenveen, 30 van Willem II, 15 van FC Twente en voor aantal andere clubs rond de 10 elk. In totaal 323 sponsoren als respondent. Maar ik heb er 0 voor PSV en Ajax, die bij supporters het gros van de respondenten vormen.

Lokale politiek in de vorm van gemeenteraadsleden heb ik 10 a 15 respondenten voor elke gemeente, in totaal 417 respondenten.

Origineel was het idee om voor 1 club het onderzoek te doen. Maar omdat je van sponsoren en gemeenteraadsleden maar een tiental respondenten zou krijgen besloten om meer clubs bijeen te pakken en 'een betaald voetbalclub' het onderwerp te maken ipv bijvoorbeeld 'Vitesse' of 'Ajax'. Want voor multiple regression liefst 20 respondenten per onafhankelijke variabele, in mijn geval dus 120.

Nu zit ik dus met de volgende dingen:

- Mbt poolen van de data: kan je het zomaar allemaal bij elkaar gooien of zijn daar methodes voor en moet je gewichten er aan hangen oid? Kan via google niet echt vinden.
- Ik vergelijk dus 3 stakeholder groepen; als ik items ga verwijderen op basis van Reliability test (Cronbach alpha) en Discriminant validity (Factor analyse, dubbelladers en structuur) moet ik dan hetzelfde verwijderen bij elke groep? Dus als item X een dubbellader is bij de Supporters, maar niet bij de Sponsoren, dan wel bij beiden weghalen zodat beide modellen gelijk zijn aan elkaar als je gaat vergelijken, of wel op maat maken per groep?

- Supporters identificeren zich sws al vrij snel met hun club, en het is dus enigszins skewed. Is hier voor dit specifieke geval een goed remedie voor? Zou ik ook bijvoorbeeld gezien de grote sample de cases zodanig selecteren dat de afhankelijke variabele normaal verdeeld is?

- Als ik de drie groepen met elkaar vergelijk dan pak ik nu bijvoorbeeld voor lokale politiek Willem II, Vitesse, AZ, Twente en Heerenveen samen zodat ik er voldoende voor regression analyse heb én ik voor deze clubs ook voldoende sponsoren en fans heb. Maar de verhoudingen zijn wel totaal anders per stakeholder groep voor deze clubs. Waar het voor lokale politiek ongeveer 20,20,20,20,20 is, is het voor sponsoren iets van 35, 25, 15, 15, 10 en voor fans soortgelijke verdeling als sponsoren maar dan andere volgorde. Moeten deze verhoudingen gelijk zijn?

Moeten misschien zelfs de absolute aantallen gelijk zijn? Ik vergelijk uiteindelijk de standardized B van de onafhankelijke variabelen in de groepen. Daarnaast heb ik al wel variabele gemaakt die grootte van de club weergeeft waarvoor dus gecontroleerd kan worden.

Bleh, warrig verhaal aan het worden. In kort: ik zit met multiple regression met pooled data en met drie samples die vergeleken moeten worden; best practice?

Klinkt als een multilevel model.
Is essentie komt het er op neer dat je je data een soort van trapsgewijs bekijkt.
Dus al je datapunt splits je eerst op over de verschillende clubs (waarbij je het effect van club berekent), daarna kun je binnen de clubs het effect van supporter / sponsor / etc. bekijken.

Het is niet heel ingewikkeld om te doen, maar ook niet het allergemakkelijkste.

Kijk anders even met google of zo of je denkt dat dit voor je kan werken, en kom dan terug?

Tegen de skewness zou je een logtransformatie kunnen gebruiken, maar de meeste toetsen zijn vrij robust zolang je n hoger dan 30 is, als het je uitkomst al beinvloedt zal dat enorm in de marge zijn dus ik zou me daar denk ik niet te druk om maken.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 16:35:23 #85

VacaLoca

Ik ga googelen, thanks!

vrijdag 5 juni 2015 @ 16:58:18 #86

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 15:15 schreef Sarasi het volgende:

[..]

Is hier alleen voor psychologie en sociologie, via de vacaturebank in BlackBoard.

Niet helemaal waar:

quote:
Omdat de Methodologiewinkel een dienst is van de GMW faculteit krijgen GMW studenten in drukke periodes voorrang op studenten van andere faculteiten.

Maargoed, Nestor maar in de gaten houden dus.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 16:59:42 #87

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 16:58 schreef wimjongil het volgende:

[..]

Niet helemaal waar:

[..]

Maargoed, Nestor maar in de gaten houden dus.

Dat is voor hulp, niet voor sollicitanten.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 17:34:14 #88

wimjongil

Harde man

quote:
Op vrijdag 5 juni 2015 16:59 schreef Sarasi het volgende:

[..]

Dat is voor hulp, niet voor sollicitanten.

Aha, op die fiets. Je zin was dubbelzinnig.

Op dinsdag 23 november 2010 02:22 schreef Braddie het volgende:
Haal van internet af man.

vrijdag 5 juni 2015 @ 17:34:22 #89

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 16:27 schreef oompaloompa het volgende:

[..]

Ik heb alleen kennis van R in een aantal specifieke domeinen. Heb wel thuis op mn HD een aantal goede tutorials/courses staan, weet niet of je er iets aan hebt maar deel ze graag met je.

quote:
Op vrijdag 5 juni 2015 14:25 schreef Sarasi het volgende:

[..]

Ik heb wel wat kennis van R, maar niet zo heel veel/diepgaande. Ik wil wel proberen je te helpen, maar ik kan niks garanderen (ik ben een beetje je long shot). PM/DM mag altijd.

Overigens een aanstelling gekregen bij de methodology shop op de uni. Dus deze zomer even wat extra inlezen en misschien nog wat extra bijleren (Stata bijvoorbeeld) en hopelijk gedurende volgend jaar ook veel bijleren waar ik tijdens m'n eigen scriptie ook veel aan heb.

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

vrijdag 5 juni 2015 @ 18:21:03 #90

Sarasi

Quack.

quote:
Op vrijdag 5 juni 2015 17:34 schreef wimjongil het volgende:

[..]

Aha, op die fiets. Je zin was dubbelzinnig.

Sorry voor de onduidelijkheid.

quote:
Op vrijdag 5 juni 2015 17:34 schreef Banaanensuiker het volgende:

[..]

[..]

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

Nee, sorry.

Your opinion of me is none of my business.

vrijdag 5 juni 2015 @ 18:26:24 #91

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 17:34 schreef Banaanensuiker het volgende:

[..]

[..]

Hebben jullie kennis van bootstrappen? Het gaat om het bootstrappen van een test statistic (Wald test in dit geval).
En gefeliciteerd met je aanstelling, Sarasi.

Ja maar alleen in het abstracte / als concept, verder alleen gebruik gemaakt bij mediatie-analyses.

In principe komt het gewoon neer op data genereren van een bestaande dataset, analyse op uitvoeren, en dit 100.000 (of hoeveel je wilt) keer doen om een betrouwbaardere statistic te krijgen toch? Ik weet niet of jij het voor hetzelfde wilt gebruiken als hoe ik het ken, heb geen ervaring met het gebruik bij een Wald-test maar als het conceptueel een beetje vergelijkbaar is kan ik misschien nog iets nuttigs zeggen

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 19:11:02 #92

VacaLoca

quote:
Op vrijdag 5 juni 2015 16:32 schreef oompaloompa het volgende:

[..]

Gefeliciteerd!

[..]

Klinkt als een multilevel model.
Is essentie komt het er op neer dat je je data een soort van trapsgewijs bekijkt.
Dus al je datapunt splits je eerst op over de verschillende clubs (waarbij je het effect van club berekent), daarna kun je binnen de clubs het effect van supporter / sponsor / etc. bekijken.

Het is niet heel ingewikkeld om te doen, maar ook niet het allergemakkelijkste.

Kijk anders even met google of zo of je denkt dat dit voor je kan werken, en kom dan terug?

Tegen de skewness zou je een logtransformatie kunnen gebruiken, maar de meeste toetsen zijn vrij robust zolang je n hoger dan 30 is, als het je uitkomst al beinvloedt zal dat enorm in de marge zijn dus ik zou me daar denk ik niet te druk om maken.

Nou, nu verschillende dingen gekeken en gelezen er over. Steeds maakte begin uitleg me enthousiast aangezien het leek te behandelen wat ik nodig heb, maar dan gaat het al snel voorbij wat ik ooit geleerd heb met syntax en andere statistiek tools etc.

Ook lijkt het vooral te concentreren op longitudinaal onderzoek waar bijvoorbeeld leeftijd als variabele gemeten is om de 2 jaar. Daar is wel voorbeeld van voor SPSS met Mixed Models maar daar heb je dan bv age1 age2 age3 als variabelen.. lijkt niet te zijn wat ik moet hebben.

/lost

vrijdag 5 juni 2015 @ 21:00:04 #93

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 18:26 schreef oompaloompa het volgende:

[..]

Ja maar alleen in het abstracte / als concept, verder alleen gebruik gemaakt bij mediatie-analyses.

In principe komt het gewoon neer op data genereren van een bestaande dataset, analyse op uitvoeren, en dit 100.000 (of hoeveel je wilt) keer doen om een betrouwbaardere statistic te krijgen toch? Ik weet niet of jij het voor hetzelfde wilt gebruiken als hoe ik het ken, heb geen ervaring met het gebruik bij een Wald-test maar als het conceptueel een beetje vergelijkbaar is kan ik misschien nog iets nuttigs zeggen

Qua concept is het inderdaad wat ik wil doen. Ik quote even een eerdere post van mij zodat je direct kan zien of je er wat mee kan:

quote:
Op vrijdag 29 mei 2015 11:30 schreef Banaanensuiker het volgende:
Heeft iemand hier verstand van bootstrapping met doel het ontwikkelen van observatie specifieke kritieke Wald scores? Ik probeer dit in combinatie met een SUR.
Deze procedure probeer ik na te bootsen:
[ afbeelding ]
[ afbeelding ]

Met dit systeem:
[ afbeelding ]

vrijdag 5 juni 2015 @ 23:09:21 #94

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 19:11 schreef VacaLoca het volgende:

[..]

Nou, nu verschillende dingen gekeken en gelezen er over. Steeds maakte begin uitleg me enthousiast aangezien het leek te behandelen wat ik nodig heb, maar dan gaat het al snel voorbij wat ik ooit geleerd heb met syntax en andere statistiek tools etc.

Ook lijkt het vooral te concentreren op longitudinaal onderzoek waar bijvoorbeeld leeftijd als variabele gemeten is om de 2 jaar. Daar is wel voorbeeld van voor SPSS met Mixed Models maar daar heb je dan bv age1 age2 age3 als variabelen.. lijkt niet te zijn wat ik moet hebben.

/lost

De voorbeelden die vaak gebruikt worden is idd longitudinaal onderzoek, daar zijn de jaren meetpunten, en is de "groep" het individu. Dus per individu heb je x-aantal meetpunten. Bij jou zou het individu de club zijn, en heb je per club een aantal meetpunten (binding van sponsoren en binding van supporters).

Het is niet extreem moeilijk, maar misschien wel te moeilijk om duidelijk hier zo op een forum uit te leggen.
Voor welke uni / opleiding / sciptie(?) is het? Misschien kun je er mee wegkomen een gemakkelijker maar minder correct model te gebruiken, of als heel belangrijk zouden ze mensen moeten hebben die je er mee kunnen helpen (lijkt me). Het is, weet ik vrij zeker, de beste oplossing, maar als dit ver buiten wat je geleerd hebt gaat zou het vreemd zijn als ze van je verwachten dit gewoon even te doen.

quote:
Op vrijdag 5 juni 2015 21:00 schreef Banaanensuiker het volgende:

[..]

Qua concept is het inderdaad wat ik wil doen. Ik quote even een eerdere post van mij zodat je direct kan zien of je er wat mee kan:

[..]

Ik kom van psy en ben heel erg slecht in het lezen van wiskundige noteringen (

ik weet het...) dus daar moet ik even voor gaan zitten. Kom je wel tot een bepaald punt of gaat het in het begin al mis?

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 5 juni 2015 @ 23:48:58 #95

VacaLoca

quote:
Op vrijdag 5 juni 2015 23:09 schreef oompaloompa het volgende:

[..]

De voorbeelden die vaak gebruikt worden is idd longitudinaal onderzoek, daar zijn de jaren meetpunten, en is de "groep" het individu. Dus per individu heb je x-aantal meetpunten. Bij jou zou het individu de club zijn, en heb je per club een aantal meetpunten (binding van sponsoren en binding van supporters).

Het is niet extreem moeilijk, maar misschien wel te moeilijk om duidelijk hier zo op een forum uit te leggen.
Voor welke uni / opleiding / sciptie(?) is het? Misschien kun je er mee wegkomen een gemakkelijker maar minder correct model te gebruiken, of als heel belangrijk zouden ze mensen moeten hebben die je er mee kunnen helpen (lijkt me). Het is, weet ik vrij zeker, de beste oplossing, maar als dit ver buiten wat je geleerd hebt gaat zou het vreemd zijn als ze van je verwachten dit gewoon even te doen.

Business Administration aan Radboud, master thesis. Meer dan de meest basic multiple regression hebben we niet gehad. Bespreek de analyse komende week pas voor het eerst met begeleider (in totaal maar 5 contacturen gehad hooguit) maar over 2 weken is deadline scriptie al.

Wat je nu schetst neemt dus al de stakeholder groepen mee. Vergelijking tussen stakeholder groepen is echter aparte hypothese. Ik test ook relaties onafhankelijke variabelen met afhankelijk per stakeholder groep apart.

Even een versimpelde mockup van de data:

(In werkelijkheid 6 onafhankelijke en 1 afhankelijke en dus voor veel clubs)

Met multiple regression dus hypotheses testen

1a: Independent1 has a positive effect on Dependent for Fans
1b: Independent1 has a positive effect on Dependent for Sponsors
1c: Independent1 has a positive effect on Dependent for Local Government (Gemeente)
2a: Independent2 has a positive effect on Dependent for Fans
2b: Independent2 has a positive effect on Dependent for Sponsors
2c: Independent2 has a positive effect on Dependent for Local Government (Gemeente)

En dan aparte hypothese:

The effects of the different antecedents of Dependent differ among stakeholder groups

Waarbij in soortgelijk onderzoek de standardized effect sizes (B) vergeleken werden.

Maar als je mijn geval bekijkt.. in voorbeelden gebruiken ze Age1, Age2, Age3 bijvoorbeeld. Dat is 1 item over 3 metingen. Als ik 1 item had gehad, laten we ook even leeftijd nemen. Dan zou ik dus 3 variabelen moeten hebben; Age_Sponsor, Age_Fan, Age_Gemeente en dan in SPSS met Data > Restructure die variabelen moeten transposen.

Maar in mijn mockup voorbeeld zou ik dan IND1_Item1_Sponsor, IND1_item1_Fan, IND1_Item2_Gemeente etc moeten maken? Of voor de recoded scale? (IND1 met MEAN(item1,item2) en IND2) en dan IND1_Fan, IND1_Sponsor, IND1_Gemeente IND2_Fan etc?

Krijg er nog niet echt vat op omdat ik overal maar de helft van de uitleg lees en de rest in syntax is wat ik nooit gehad heb.

Weet niet hoeveel ze van me verwachten, die vorig jaar zijn afgestudeerd hiermee hadden het wel met simpele multiple regression gedaan maar die hadden geen pooled data. Veel meer dan dat ik het wel op mijn manier kon doen (meerdere clubs om sample te vergroten) dmv poolen heb ik niet meegekregen tot dusver. Maar heb het idee dat ik niet echt statistisch verantwoord bezig ben met gewooon de multiple regression draaien met respondenten van alle clubs op 1 hoop.

Thanks voor antwoorden btw!

zaterdag 6 juni 2015 @ 00:33:29 #96

haha94boem

haha boem

Dag mensen,

Ik ben bezig met mijn scriptie en heb twee vragen. Mijn eerste vraag: ik ga de aandelenprijs proberen te voorspellen aan de hand van onder andere CEO tenure (de variabele waarin ik geinteresseerd ben, wijkt deze significant af van 0?). Ik wil dit doen voor alle S&P500 companies, en later voor alleen technologie bedrijven binnen de S&P500. Als ik deze technologie bedrijven allemaal in een regressie wil stoppen, hoe doe ik dat op een efficiente manier? Ik neem aan dat 1 voor 1 niet de juiste methode is.

Ik hoor het graag van jullie. Vriendelijke groet

zaterdag 6 juni 2015 @ 11:26:30 #97

Banaanensuiker

synergy

quote:
Op vrijdag 5 juni 2015 23:09 schreef oompaloompa het volgende:

[..]

Ik kom van psy en ben heel erg slecht in het lezen van wiskundige noteringen ( ik weet het...) dus daar moet ik even voor gaan zitten. Kom je wel tot een bepaald punt of gaat het in het begin al mis?

Ik ga het op een andere manier doen; samen met mijn supervisor besloten dat er in mijn geval efficiëntere tijdsbesteding is. In ieder geval bedankt voor je bereidheid tot helpen.

zaterdag 6 juni 2015 @ 15:29:55 #98

oompaloompa

doompadeedee

quote:
Op vrijdag 5 juni 2015 23:48 schreef VacaLoca het volgende:

[..]

Business Administration aan Radboud, master thesis. Meer dan de meest basic multiple regression hebben we niet gehad. Bespreek de analyse komende week pas voor het eerst met begeleider (in totaal maar 5 contacturen gehad hooguit) maar over 2 weken is deadline scriptie al.

Wat je nu schetst neemt dus al de stakeholder groepen mee. Vergelijking tussen stakeholder groepen is echter aparte hypothese. Ik test ook relaties onafhankelijke variabelen met afhankelijk per stakeholder groep apart.

Even een versimpelde mockup van de data:

[ afbeelding ]

(In werkelijkheid 6 onafhankelijke en 1 afhankelijke en dus voor veel clubs)

Met multiple regression dus hypotheses testen

1a: Independent1 has a positive effect on Dependent for Fans
1b: Independent1 has a positive effect on Dependent for Sponsors
1c: Independent1 has a positive effect on Dependent for Local Government (Gemeente)
2a: Independent2 has a positive effect on Dependent for Fans
2b: Independent2 has a positive effect on Dependent for Sponsors
2c: Independent2 has a positive effect on Dependent for Local Government (Gemeente)

En dan aparte hypothese:

The effects of the different antecedents of Dependent differ among stakeholder groups

Waarbij in soortgelijk onderzoek de standardized effect sizes (B) vergeleken werden.

Maar als je mijn geval bekijkt.. in voorbeelden gebruiken ze Age1, Age2, Age3 bijvoorbeeld. Dat is 1 item over 3 metingen. Als ik 1 item had gehad, laten we ook even leeftijd nemen. Dan zou ik dus 3 variabelen moeten hebben; Age_Sponsor, Age_Fan, Age_Gemeente en dan in SPSS met Data > Restructure die variabelen moeten transposen.

Maar in mijn mockup voorbeeld zou ik dan IND1_Item1_Sponsor, IND1_item1_Fan, IND1_Item2_Gemeente etc moeten maken? Of voor de recoded scale? (IND1 met MEAN(item1,item2) en IND2) en dan IND1_Fan, IND1_Sponsor, IND1_Gemeente IND2_Fan etc?

Krijg er nog niet echt vat op omdat ik overal maar de helft van de uitleg lees en de rest in syntax is wat ik nooit gehad heb.

Weet niet hoeveel ze van me verwachten, die vorig jaar zijn afgestudeerd hiermee hadden het wel met simpele multiple regression gedaan maar die hadden geen pooled data. Veel meer dan dat ik het wel op mijn manier kon doen (meerdere clubs om sample te vergroten) dmv poolen heb ik niet meegekregen tot dusver. Maar heb het idee dat ik niet echt statistisch verantwoord bezig ben met gewooon de multiple regression draaien met respondenten van alle clubs op 1 hoop.

Thanks voor antwoorden btw!

Hoef je niet te testen of de effecten van de fans / sponsors / local government sig van elkaar verschillen? Dat maakt alles al een heel stuk gemakkelijker.

Een gewone multiple regressie met alles op een hoop is niet per se heel erg fout, maar geeft je minder asccurate schattingen etc. gewoon omdat je het effect van club niet meeneemt, dat filter je er in een multilevel uit.

Ik ben even aan aan het kloten met een voorbeeld dataset, maar moet zo weg. Als het niet op tijd lukt zou ik denk ik een gewone muiltiple regressie doen, dit meenemen naar de meeting (zeker aangezien je maar zo weinig meet, wat slecht eigenlijk :/ ) en dan in de meeting aangeven dat je extre hebt gekeken wat de beste analyse is, dit multilevel lijkt te zijn maar dit ver boven wat je hebt geleerd uitgaat, en niet iets is dat je jezelf gemakkelijk aanleert en dan vragen of je daar support bij kan krijgen.

Dan geef je aan dat je het 1. heel serieus hebt genomen, 2. je ook nog een backup analyse hebt gedaan zoals je hem hebt geleerd, and hopelijk krijg je hulp bij 3. of krijg je te horen dat het niet nodig is, totale win-win situatie lijkt me

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zaterdag 6 juni 2015 @ 15:53:28 #99

VacaLoca

quote:
Op zaterdag 6 juni 2015 15:29 schreef oompaloompa het volgende:

[..]

Hoef je niet te testen of de effecten van de fans / sponsors / local government sig van elkaar verschillen? Dat maakt alles al een heel stuk gemakkelijker.

Dat moet wel, maar de eerste hypotheses meten de relaties per stakeholder groep apart. Kijken of effecten sig verschillen doe ik dus ook maar voor een latere hypothese (maar wat wel de hoofdvraag is zo'n beetje van het onderzoek - of ze sig verschillen)

quote:
Een gewone multiple regressie met alles op een hoop is niet per se heel erg fout, maar geeft je minder asccurate schattingen etc. gewoon omdat je het effect van club niet meeneemt, dat filter je er in een multilevel uit.

Ik ben even aan aan het kloten met een voorbeeld dataset, maar moet zo weg. Als het niet op tijd lukt zou ik denk ik een gewone muiltiple regressie doen, dit meenemen naar de meeting (zeker aangezien je maar zo weinig meet, wat slecht eigenlijk :/ ) en dan in de meeting aangeven dat je extre hebt gekeken wat de beste analyse is, dit multilevel lijkt te zijn maar dit ver boven wat je hebt geleerd uitgaat, en niet iets is dat je jezelf gemakkelijk aanleert en dan vragen of je daar support bij kan krijgen.

Dan geef je aan dat je het 1. heel serieus hebt genomen, 2. je ook nog een backup analyse hebt gedaan zoals je hem hebt geleerd, and hopelijk krijg je hulp bij 3. of krijg je te horen dat het niet nodig is, totale win-win situatie lijkt me

Thanks!!

Ik zorg inderdaad dat ik een uitwerking heb van de methode zoals we die geleerd hebben en zal het zeker behandelen in gesprek. Alleen aardige tijdnood dus helaas. Heel hoofdstuk 4, 5 en 6 in 13 dagen plus nog een herkansing

zaterdag 6 juni 2015 @ 17:59:38 #100

VacaLoca

Even een simplere vraag tussendoor: Als je meerdere groepen in een sample hebt zoals eerder beschreven, doe je dan factor analyse voor discriminant validity controleren voor de hele sample of per groep?

Had per groep gedaan, maar lees nu een paper met soortgelijke situatie (die helaas niet uitweiden over hoe ze de regressieanalyse gedaan hebben) waarin ze voor totale sample hebben gedaan.

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» school, studie en onderwijs

» school, studie en onderwijs