Aangezien het om een correlatie gaat, kun je de nulhypothese dat er geen correlatie is tussen de twee variabelen verwerken. 0.000 is immers lager dan 0.05. Zeggen dat er een effect is (wat ik deed in de eerste post, excuses), zou ik achterwege laten, omdat dat zou kunnen worden gelezen als "Variabele 1 beïnvloed Variabele 2" en die conclusie kun je bij correlaties niet trekken. Er is een samenhang en je kunt beoordelen of deze positief of negatief is en sterk of zwak.quote:Op dinsdag 19 mei 2015 12:12 schreef Tobi-wan het volgende:
[..]
Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?
De uitleg uit mijn vorige past en wat ik hierboven zeg gelden ook voor deze variabelen ja. Zoals je zelf zegt is dit resultaat te verwachten omdat je in beide vragen min of meer hetzelfde meet.quote:[ afbeelding ]
Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?
De correlatie is er, maar zoals oompaloompa al zei, het hoeft niet perse een lineair verband te zijn. De scatterplots kunnen helpen om daar wat meer inzicht in te krijgen.quote:Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?
Ik kom er wel! Nogmaals bedankt! Je krijgt een eervolle vermelding in mijn voorwoordquote:Op dinsdag 19 mei 2015 13:13 schreef Operc het volgende:
Laatste post:
[..]
Aangezien het om een correlatie gaat, kun je de nulhypothese dat er geen correlatie is tussen de twee variabelen verwerken. 0.000 is immers lager dan 0.05. Zeggen dat er een effect is (wat ik deed in de eerste post, excuses), zou ik achterwege laten, omdat dat zou kunnen worden gelezen als "Variabele 1 beïnvloed Variabele 2" en die conclusie kun je bij correlaties niet trekken. Er is een samenhang en je kunt beoordelen of deze positief of negatief is en sterk of zwak.
[..]
De uitleg uit mijn vorige past en wat ik hierboven zeg gelden ook voor deze variabelen ja. Zoals je zelf zegt is dit resultaat te verwachten omdat je in beide vragen min of meer hetzelfde meet.
[..]
De correlatie is er, maar zoals oompaloompa al zei, het hoeft niet perse een lineair verband te zijn. De scatterplots kunnen helpen om daar wat meer inzicht in te krijgen.
Graag gedaan.quote:Op dinsdag 19 mei 2015 13:41 schreef Tobi-wan het volgende:
[..]
Ik kom er wel! Nogmaals bedankt! Je krijgt een eervolle vermelding in mijn voorwoord
vert.zoeken("*" & B1 & "*"; etc)quote:Op dinsdag 19 mei 2015 07:42 schreef GoobyPls het volgende:
[..]
Deze pakt die niet als die de waarde uit de cel moet halen, dus:
vert.zoeken("*B1*";A1:A100;1;ONWAAR)
Hoe werken wildcards in deze combinatie?
Sowieso moet je hier Spearman correlatie gebruiken, geen Pearson. Je hebt immers ordinale data. Zal niet veel uitmaken, is wel netter.quote:Op dinsdag 19 mei 2015 12:12 schreef Tobi-wan het volgende:
[..]
Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?
[ afbeelding ]
Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?
[..]
Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?
Bedankt voor de tip. Scatter plots zijn ook niet echt een optie met ordinale data of wel? Is er een andere manier waarop ik kan aantonen of er een lineair verband is tussen twee variabelen?quote:Op dinsdag 19 mei 2015 19:17 schreef ralfie het volgende:
[..]
Sowieso moet je hier Spearman correlatie gebruiken, geen Pearson. Je hebt immers ordinale data. Zal niet veel uitmaken, is wel netter.
ordinale data bij ordinale data is nauwelijks goed weer te geven, nee. Tabellen zijn eigenlijk de enige optie (al dan niet met een X*Y Chi-kwadraat toets).quote:Op donderdag 21 mei 2015 14:28 schreef Tobi-wan het volgende:
[..]
Bedankt voor de tip. Scatter plots zijn ook niet echt een optie met ordinale data of wel? Is er een andere manier waarop ik kan aantonen of er een lineair verband is tussen twee variabelen?
Oké duidelijk. Ik denk dat ik ook niet te ver hiermee moet gaan. Volgens mij is het relatief veilig om aan te nemen dat iemand die meer tijd doorbrengt op Facebook ook meer vrienden heeft en meer pagina's volgt. Ik hoop een dezer dagen het hoofdstuk resultaten af te sluiten, net nu ik het eindelijk een beetje begin te begrijpen...quote:Op donderdag 21 mei 2015 14:51 schreef ralfie het volgende:
[..]
ordinale data bij ordinale data is nauwelijks goed weer te geven, nee. Tabellen zijn eigenlijk de enige optie (al dan niet met een X*Y Chi-kwadraat toets).
Met ordinale variabelen is een lineair verband per definitie niet mogelijk. Je moet ordinale data dan eigenlijk eerst transformeren naar een continue varabele, waarvoor je aannames moet gaan doen (bijvoorbeeld dat de 'waarde' van elke categorie gelijk is). Dit is nog enigzins goed te praten als je bijv. leeftijdscategorieen hebt die even groot zijn (bijv 0-10, 11-20, 21-30, etc), anders wordt het vervelender. Waneer je een Pearson correlatie gebruikt, doe je dit impliciet, en dat is dus niet netjes. Spearman correlatie kijkt naar de orde van observaties, en doet dit dus niet.
Op basis van je eerste stukje lijkt een Anova mij het beste (let wel op, anova kijkt of er verschillen tussen de drie groepen zijn, maar zegt niet waar die verschillen zitten, daar moet je contrasten voor gebruiken). Ik begrijp alleen niet zo goed wat je bedoelt met je "controlevariabele", is het een controle variabele of een andere groep?quote:Op maandag 25 mei 2015 16:50 schreef Eijsselstein het volgende:
Helaas ben ik ook vastgelopen bij de statistische analyse! Zou iemand misschien even kunnen kijken of dit de juiste methode is voor mijn onderzoek? :
Ik onderzoek het effect van één onafhankelijke variabele (Dit gaat om 3 categorieën, namelijk de sector waarin een bedrijf actief is) op één afhankelijke variabele (een percentage, continue variabele dus). Als controlevariabele gebruik ik vier verschillende firma's, ook een categorie dus.
Ik dacht zelf aan een Two-Way ANOVA omdat het in principe gaat om twee onafhankelijke, categoriale variabelen en slechts één continue afhankelijke variabele.
Ik heb ook maar 150 bedrijven in mijn onderzoek betrokken, dus ik hou er rond de 150/(3*3) = 17 over per cel.
Excuus voor de domme vragen maar ik heb nog nooit eerder met SPSS gewerkt voor mijn masterscriptie!
Allereerst bedankt voor deze snelle reactie! Dat eerste klopt, er is over dit onderwerp nog bijna geen onderzoek gedaan. Ik wil dus in eerste instantie gewoon bekijken óf er überhaupt verschillen zijn in de gehanteerde percentages (afhankelijke variabele) in de 3 sectoren (onafhankelijke variabele). En niet zozeer waar die verschillen door veroorzaakt worden.quote:Op maandag 25 mei 2015 16:58 schreef oompaloompa het volgende:
[..]
Op basis van je eerste stukje lijkt een Anova mij het beste (let wel op, anova kijkt of er verschillen tussen de drie groepen zijn, maar zegt niet waar die verschillen zitten, daar moet je contrasten voor gebruiken). Ik begrijp alleen niet zo goed wat je bedoelt met je "controlevariabele", is het een controle variabele of een andere groep?
Ik weet niet zeker of we hier hetzelfde bedoelen. Anova geeft alleen aan of er een verschil tussen de groepen is. Dus [2,2,8] geeft hetzelfde resultaat als [2,8,2] of [8,2,2].quote:Op maandag 25 mei 2015 17:05 schreef Eijsselstein het volgende:
[..]
Allereerst bedankt voor deze snelle reactie! Dat eerste klopt, er is over dit onderwerp nog bijna geen onderzoek gedaan. Ik wil dus in eerste instantie gewoon bekijken óf er überhaupt verschillen zijn in de gehanteerde percentages (afhankelijke variabele) in de 3 sectoren (onafhankelijke variabele). En niet zozeer waar die verschillen door veroorzaakt worden.
Die kun je toevoegen als een covariaat in een AnCovaquote:Wat betreft de controlevariabele, ik heb geen controlegroep oid. Ik denk alleen dat het gehanteerde percentage niet alleen afhankelijk is van de sector, maar ook van iets anders. Daarom wil ik mijn resultaten zuiverder maken door deze variabele ook op te nemen als een onafhankelijke variabele.
Ik weet alleen of een Two-way ANOVA hier geschikt voor is.
Ik hoop dat het zo iets duidelijker is
Hmm, ik hoop wel dat we hetzelfde bedoelen haha! Ik wil gewoon onderzoeken óf er een verschil is tussen de sectoren handel, productie & dienstverlening tov de continue DV (een percentage). Als ik jou voorbeeld neem: als die 8 toe te wijzen is aan een van de sectoren, en de andere sectoren zijn beide 2, dan is voor mij dat verschil toch al bewezen?quote:Op maandag 25 mei 2015 17:16 schreef oompaloompa het volgende:
[..]
Ik weet niet zeker of we hier hetzelfde bedoelen. Anova geeft alleen aan of er een verschil tussen de groepen is. Dus [2,2,8] geeft hetzelfde resultaat als [2,8,2] of [8,2,2].
[..]
Die kun je toevoegen als een covariaat in een AnCova
Maar stel nou dat de uitslag 45%, 55% en 90% is. Dan weet je alleen dat er ergens een significant verschil is, maar bv niet of de 55% nog van de 45% verschilt, en of de 90% van de 55% verschilt. Misschien verschilt alleen de 90% van de 45%.. daar kun je contrasten voor gebruiken.quote:Op maandag 25 mei 2015 22:05 schreef Eijsselstein het volgende:
[..]
Hmm, ik hoop wel dat we hetzelfde bedoelen haha! Ik wil gewoon onderzoeken óf er een verschil is tussen de sectoren handel, productie & dienstverlening tov de continue DV (een percentage). Als ik jou voorbeeld neem: als die 8 toe te wijzen is aan een van de sectoren, en de andere sectoren zijn beide 2, dan is voor mij dat verschil toch al bewezen?
Ah dat had ik niet door, dan kun je ze allebei als een losse factor in een enova gooien, en heb je dus een 3 (sector) bij 2 (controle) design en vergelijk je 6 groepen met elkaar. Met je vrij lage sample-size heb je dan wel erg weinig power maar daar valt nu niet meer zo veel aan te doen.quote:Wat betreft de covariantie in een AnCova, die moet continu zijn toch? In mijn geval is het een categorie.
Even heel iets anders: Stel ik maak er geen controlevariabele van maar een modererende variabele,dan kan een Two-way Anova wel weer toch? Dan heb ik twee IV,beide categorieën, en 1 DV, een continue.
Bedankt voor je tips trouwens! Dit helpt me weer de goede kant op
Als je "request response" aanzet moeten mensen verplicht iig de balk aanklikken.quote:Op dinsdag 26 mei 2015 15:10 schreef Boarderzip het volgende:
Mensen hier bekend met Qualtrics? Ik heb een vraag waarbij mensen een cijfer moesten geven en daarvoor een puntje op een balk konden verschuiven. Als basispositie heb ik alle puntjes op 5 gezet, echter is het nu zo dat als iemand niet met het puntje heeft geschoven en dus de 5 adequaat vond dit niet geregistreerd is als zijnde cijfer 5 ingegeven. Iemand die mij kan vertellen hoe ik dit kan corrigeren?
Ik weet het, alleen is het kwaad nu al geschied. In SPSS had ik de mogelijkheid om zelf het getal in te vullen als het vakje leeg was, ik zie dit in Qualtrics alleen nergens.quote:Op dinsdag 26 mei 2015 15:23 schreef oompaloompa het volgende:
[..]
Als je "request response" aanzet moeten mensen verplicht iig de balk aanklikken.
Ik zou dat ook niet doen aangezien je niet weet of die mensen echt 5 wilden zeggen of gewoon lui doorgeklikt hebben.quote:Op dinsdag 26 mei 2015 15:25 schreef Boarderzip het volgende:
[..]
Ik weet het, alleen is het kwaad nu al geschied. In SPSS had ik de mogelijkheid om zelf het getal in te vullen als het vakje leeg was, ik zie dit in Qualtrics alleen nergens.
Zit inderdaad wel een kern van waarheid in maar het waren 5 onderdelen opgenomen in 1 tabel zeg maar. Als mensen dan slechts 1 punt niet beoordeeld hebben, neem ik aan dat zij de 5 daar het geschikte cijfer vonden. Als ik dit niet meeneem in mijn analyse ben ik bang dat je een vertekend gemiddelde krijgt.quote:Op dinsdag 26 mei 2015 15:30 schreef oompaloompa het volgende:
[..]
Ik zou dat ook niet doen aangezien je niet weet of die mensen echt 5 wilden zeggen of gewoon lui doorgeklikt hebben.
Als je de data zelf toevoegt zou ik daar heel heel heel expliciet over zijn. Zowel dat je het hebt gedaan, als bij de interpretatie aangeven in hoeverre de interpretatie daardoor beinvloedt wordt. En zelfs als je dat doet ligt het nog best op het randje, een randje waar je zeker niet overheen wilt gaan.quote:Op dinsdag 26 mei 2015 15:32 schreef Boarderzip het volgende:
[..]
Zit inderdaad wel een kern van waarheid in maar het waren 5 onderdelen opgenomen in 1 tabel zeg maar. Als mensen dan slechts 1 punt niet beoordeeld hebben, neem ik aan dat zij de 5 daar het geschikte cijfer vonden. Als ik dit niet meeneem in mijn analyse ben ik bang dat je een vertekend gemiddelde krijgt.
Ik zal het verschil eens uitrekenen, maar dan komen we eerst weer terug bij mijn oorspronkelijke vraag: hoe voeg ik de opengelaten data toe?quote:Op dinsdag 26 mei 2015 15:38 schreef oompaloompa het volgende:
[..]
Als je de data zelf toevoegt zou ik daar heel heel heel expliciet over zijn. Zowel dat je het hebt gedaan, als bij de interpretatie aangeven in hoeverre de interpretatie daardoor beinvloedt wordt. En zelfs als je dat doet ligt het nog best op het randje, een randje waar je zeker niet overheen wilt gaan.
Dat zou ik dus ook in spss/excel doen, niet in qualtrics, je wilt niet handmatig dingen veranderen in je originele, ruwe, data.quote:Op dinsdag 26 mei 2015 15:40 schreef Boarderzip het volgende:
[..]
Ik zal het verschil eens uitrekenen, maar dan komen we eerst weer terug bij mijn oorspronkelijke vraag: hoe voeg ik de opengelaten data toe?
Ik kan in Qualtrics gewoon meerdere rapporten uitdraaien dus de ruwe data blijft altijd behouden. Ook heb ik gemerkt dat Qualtrics makkelijker werkt dan SPSS en ook een visueel meer aantrekkelijke weergave heeft.quote:Op dinsdag 26 mei 2015 15:43 schreef oompaloompa het volgende:
[..]
Dat zou ik dus ook in spss/excel doen, niet in qualtrics, je wilt niet handmatig dingen veranderen in je originele, ruwe, data.
Ik denk niet dat het kan, maar je zou dan wel de ruwe data aanpassen (want je voegt gewoon nummers toe aan je datafile) dus het zou ook echt tegen elke ethische code in gaan..quote:Op dinsdag 26 mei 2015 15:45 schreef Boarderzip het volgende:
[..]
Ik kan in Qualtrics gewoon meerdere rapporten uitdraaien dus de ruwe data blijft altijd behouden. Ook heb ik gemerkt dat Qualtrics makkelijker werkt dan SPSS en ook een visueel meer aantrekkelijke weergave heeft.
Bedankt voor je bijdrage, heeft me wel aan het denken gezet of het inderdaad wel ethisch verantwoord is. Ik ga me er nog even over beramen, het is voor een adviesrapport in het bedrijf waar ik stage loop.quote:Op dinsdag 26 mei 2015 15:59 schreef oompaloompa het volgende:
[..]
Ik denk niet dat het kan, maar je zou dan wel de ruwe data aanpassen (want je voegt gewoon nummers toe aan je datafile) dus het zou ook echt tegen elke ethische code in gaan..
Je zou dit kunnen proberen, weet niet of dat voor missings werkt: http://www.qualtrics.com/(...)anced/recode-values/ afhankelijk van waar het voor is zou je de ethische code misschien kunnen negeren.
De code is voor wetenschap, maar daar is een hooggoed dat je altijd alles helemaal tot de bron moet kunnen herleiden,dusje moet iemand een file kunnen geven met daarin puur alleen wat respondenten aan hebben gegeven zonder inmenging van jezelf, en anderen zouden op basis van die file tot dezelfde conclusies moeten komen als ze jou stappen volgen.quote:Op dinsdag 26 mei 2015 16:03 schreef Boarderzip het volgende:
[..]
Bedankt voor je bijdrage, heeft me wel aan het denken gezet of het inderdaad wel ethisch verantwoord is. Ik ga me er nog even over beramen, het is voor een adviesrapport in het bedrijf waar ik stage loop.
Je kunt idd een Ancova gebruiken, waar je leeftijd als een covariaat toevoegt.quote:Op woensdag 27 mei 2015 11:48 schreef Davarius het volgende:
Ik heb een SPSS analyse vraag (laatste analyse van mijn thesis). Ik ben blij dat ik me door de rest heen heb weten te slaan.
Even korte uitleg:
Ik heb het grafisch inzicht en de prestaties op stock-flow taken (2 onafhankelijke variabelen, ratio niveau, parametrisch) onderzocht bij VMBO scholieren. Nu heb ik deze vergeleken met VWO scholieren uit een andere thesis en bleek zoals verwacht dat VWO scholieren op beide variabelen beter scoorden. Echter is er een significant leeftijdsverschil tussen de VMBO groep en VWO groep (VWO groep is gemiddeld 0.85 jaar ouder). Nu wil ik onderzoeken/analyseren of dit leeftijdsverschil een grotere invloed heeft op de 2 variabelen dan het opleidingsniveau (VWO of VMBO). Mijn begeleider heeft me een aanzet gegeven door te zeggen dat ik hiervoor ANCOVA analyse moet gebruiken. Ik heb echter geen idee hoe ik dit via deze analyse kan analyseren in SPSS en hoe ik dit uiteindelijk in mijn thesis moet opschrijven. Dit wil ik namelijk gebruiken in mijn discussie zodat ik hopelijk kan ontkrachten dat het leeftijdsverschil een grotere invloed heeft.
Kan iemand mij hiermee helpen? Ik hoop dat ik het duidelijk heb omschreven. Alvast enorm bedankt!
Heel erg bedankt, ga hier mee aan de slag!quote:Op woensdag 27 mei 2015 15:11 schreef oompaloompa het volgende:
[..]
Je kunt idd een Ancova gebruiken, waar je leeftijd als een covariaat toevoegt.
Je vraag is nu nog iets te vaag om te beantwoorden, kijk anders even hoe ver je komt
Voor het idee daarachter zie bijvoorbeeld: http://www.stat.purdue.ed(...)512notes/topic10.pdf
Voor de interpretatie zie bv hier: https://statistics.laerd.(...)pss-statistics-2.php
Ik denk, maar ben net wakker dus neem het met een korreltje zout, dat je nooit helemaal precies accuraat kan schatten welk deel voor hoeveel variantie verantwoordelijk is omdat niveau en leeftijd nou eenmaal heel sterk correleren.
Ik kan je helpen als je een iets grotere foto post, deze is neit te lezenquote:Op vrijdag 29 mei 2015 08:52 schreef Davarius het volgende:
Ik heb geprobeerd met behulp van Ancova analyse te onderzoeken of het leeftijdsverschil een grotere invloed heeft op grafisch inzicht dan het opleidingsniveau. Nu krijg ik de volgende resultaten (zie foto):
[ afbeelding ]
De covariaat (leeftijd) heeft amper de gemiddelden veranderd, maar het verschil tussen beide opleidingsniveaus is nog steeds significant (p < .001) nadat de covariaat is toegevoegd. Ik begrijp (ook na het bestuderen van Field) niet hoe ik deze data nu precies moet interpreteren en op moet schrijven.
Hopelijk kan iemand mij helpen?
Ik begrijp niet zo goed wat je wilt doen. Je hebt twee schalen, angst en opwinding, waarom wil je daar 1 construct van maken? Theoretisch gezien kun je er gewoon de sproductscore van nemen, ik kan me alleen moeilijk situaties voorstellen waarin dat nuttig zou zijn.quote:Op vrijdag 29 mei 2015 12:07 schreef iUsed2bGod het volgende:
Wie kan me helpen met de volgende vraag.
Voor een onderzoek heb ik een construct dat bestaat uit twee delen: opwinding en angst (het opwinding-angst construct).
Om dit te meten heb ik in een vragenlijst vragen gehad die opwinding meten en vragen die angst meten.
Samen moet deze items één score worden voor het construct opwinding-angst. Dus iemand die zowel hoog scoort op opwinding als angst scoort hoog op dit construct maar iemand die alleen hoog scoort op angst maar niet op opwinding moet niet hoog scoren op dit construct.
Hoe los je dit het beste op, ook met het oog op factor en regressie analyse later in SPSS.
Dan zou ik ze gewoon toevoegen alstwee losse IV's en de interactie ook toevoegen, dus:quote:Op vrijdag 29 mei 2015 13:42 schreef iUsed2bGod het volgende:
Uiteindelijk wil ik teams vergelijken die hoog scoren op zowel opwinding als angst met de overige teams om te kijken of in teams die hoger scoren op de combinatie opwinding-angst er meer fouten worden gemaakt.
Daar zit een heel theoretisch verhaal aan vast waarom dat interessant is waarmee ik je niet zal vervelen (of je moet interesse hebben om mijn thesis achteraf te lezen).
Maargoed, je hebt het over productscores, of te wel het vermenigvuldigen van de twee om tot een score te komen. Dat is misschien best wel een goed oplossing!
Dat lijkt me niet iets dat je in spss moet doen, aangezien je niets voorspelt maar gewoon met unieke data een unieke berekening maakt?quote:Op vrijdag 29 mei 2015 20:16 schreef RustCohle het volgende:
Hallo,
Ik wil graag efficiëntie/productiviteit van een willekeurig bedrijf berekenen aan de hand van bepaalde gegevens uit een jaarverslag .
Weet iemand of statistische berekenen met SPSS kan en welke variabelen e.d. ik hiervoor nodig heb om de efficiëntie en productiviteit te berekenen?
Er zal vast een elegante oplossing zijn, maar wat me zo even te binnen schiet: De missing values coderen als iets heel groots (1000 ofzo). Vervolgens compute variable -> alle variabelen van die selectie optellen. Daarna Select Cases waarbij die variable kleiner is dan 10.000. (Heb even geen SPSS bij de hand, dus een elegantere oplossing zoeken zit er voor mij even niet in.)quote:Op zaterdag 30 mei 2015 14:27 schreef Annema21 het volgende:
Beste forumleden,
Ik als SPSS noob ben bezig met mijn afstudeeronderzoek. Kan iemand mij misschien helpen met onderstaande kwestie?
Het is zo dat ik uit de dataset mensen moet excluderen die van een bepaalde selectie aan vragen er 10 of meer niet ingevuld hebben. Is er in SPSS een functie om dit te doen? Of moet ik echt handmatig selecteren? (het is nogal een grote dataset..)
Ik zou een regressie doen van kosten op output en dan verschillende relaties proberen. De standaard-regressie test een linear verband (dus x*kosten = output) maar je kunt verschillende vormen testen, en je kunt zelfs je eigen varianten testen.quote:Op zondag 31 mei 2015 15:51 schreef Super-B het volgende:
Goedemiddag,
Momenteel heb ik twee soorten gegevens verzameld: enerzijds de kosten van een bedrijf, anderzijds het aantal geleverde diensten. Ik wil meten in hoeverre de kosten van een bedrijf en het aantal geleverde diensten een verband met elkaar hebben. Daarnaast wil ik een kostencurve schetsen met op de X-as het aantal geleverde diensten (output) en op de Y-as de bedrijfskosten.
Om dit te doen, wil ik gebruik maken van SPSS. Heeft iemand enig idee welke opties/analyses van SPSS geschikt zijn voor het uitvoeren van de gewenste berekeningen/simulaties?
Welke soort regressietest raad jij mij aan? Wat is precies het verschil tussen een scatterplot en een regressietest, aangezien beide testen berekenen/weergeven in hoeverre er een verband is waar te nemen?quote:Op zondag 31 mei 2015 16:04 schreef oompaloompa het volgende:
[..]
Ik zou een regressie doen van kosten op output en dan verschillende relaties proberen. De standaard-regressie test een linear verband (dus x*kosten = output) maar je kunt verschillende vormen testen, en je kunt zelfs je eigen varianten testen.
Misschien het beste als eerste een scatterplot maken met kosten op k-as en output op y om visueel te kijken wat voor soort verband er lijkt te bestaan?
Scatterplot geeft je gewoon een grafiekje, de regressie test het verband.quote:Op zondag 31 mei 2015 16:06 schreef Super-B het volgende:
[..]
Welke soort regressietest raad jij mij aan? Wat is precies het verschil tussen een scatterplot en een regressietest, aangezien beide testen berekenen/weergeven in hoeverre er een verband is waar te nemen?
http://nl.wikipedia.org/wiki/Spreidingsdiagramquote:Op zondag 31 mei 2015 16:10 schreef oompaloompa het volgende:
[..]
Scatterplot geeft je gewoon een grafiekje, de regressie test het verband.
Welk verband uiteindelijk het beste je data omschrijft weet ik niet, dat ligt aan je data
Daarom ook het beste beginnen met een scatterplot!
Nee, daar kunnen we in het abstracte over blijven praten, of je kunt het gewoon proberen en dan zul je zien dat het iets anders doetquote:Op zondag 31 mei 2015 16:16 schreef Super-B het volgende:
[..]
http://nl.wikipedia.org/wiki/Spreidingsdiagram
''Voorbeeld 1
Uit de bevolking is een steekproef van 100 proefpersonen getrokken en van elke proefpersoon is de lengte L en het gewicht G gemeten. De grafiek van de 100 punten (Li,Gi) geeft een puntenwolk, waarin men het "verband" tussen lengte en gewicht kan zien.''
http://www.spsshandboek.nl/regressie_analyse/
''Je gebruikt de regressie analyse om te toetsen of een onafhankelijke variabele invloed heeft op een afhankelijke variabele en of dit een positief of een negatief effect is''
Beide kijken toch in principe naar de correlatie?
Ik wil kort gezegd een grafiek schetsen met SPSS om te kijken of er een bepaalde vorm is te vinden tussen Y (gemiddelde bedrijfskosten) en X (output, geleverde diensten). Zo ja, dan wordt de hypothese als waar aangenomen. Zo niet, dan wordt de hypothese verworpen.quote:Op zondag 31 mei 2015 16:20 schreef oompaloompa het volgende:
[..]
Nee, daar kunnen we in het abstracte over blijven praten, of je kunt het gewoon proberen en dan zul je zien dat het iets anders doet
Zoals ik al eerder zei, een scatterplot laat alleen punten zien, een regressie berekent een verband, dat verband dat je wilt testen kun je zelf aangeven. Je kunt duizenden verbanden testen maar dat kost nogal veel energie, darom kun je het beste eerst naar de data kijken, om uit te zoeken welke verbanden logisch zijn om te testen.
Het legt echt veel gemakkelijker uit als je de data er bij kunt zien. Zodra je een plotje etc post kan ik meer uitleggen over de verschillende mogelijkheden en hoe die werken.quote:Op zondag 31 mei 2015 16:34 schreef Super-B het volgende:
[..]
Ik wil kort gezegd een grafiek schetsen met SPSS om te kijken of er een bepaalde vorm is te vinden tussen Y (gemiddelde bedrijfskosten) en X (output, geleverde diensten). Zo ja, dan wordt de hypothese als waar aangenomen. Zo niet, dan wordt de hypothese verworpen.
Echter wil ik daarnaast een test uitvoeren waarbij er een bepaalde grens zit om de hypothese als (on)waar te beschouwen. Het kan wel grafisch gezien een bepaalde vorm hebben, maar er moet wel een 'significantie' test erop uitgevoerd worden om zodoende, statistisch gezien, het visuele te bevestigen/ontkrachten.
Begrijp je zelf wel wat je wilt doen? Het klinkt namelijk erg vaag en abstract.quote:Op zondag 31 mei 2015 16:34 schreef Super-B het volgende:
[..]
Ik wil kort gezegd een grafiek schetsen met SPSS om te kijken of er een bepaalde vorm is te vinden tussen Y (gemiddelde bedrijfskosten) en X (output, geleverde diensten). Zo ja, dan wordt de hypothese als waar aangenomen. Zo niet, dan wordt de hypothese verworpen.
Echter wil ik daarnaast een test uitvoeren waarbij er een bepaalde grens zit om de hypothese als (on)waar te beschouwen. Het kan wel grafisch gezien een bepaalde vorm hebben, maar er moet wel een 'significantie' test erop uitgevoerd worden om zodoende, statistisch gezien, het visuele te bevestigen/ontkrachten.
quote:Op zondag 31 mei 2015 16:38 schreef oompaloompa het volgende:
[..]
Het legt echt veel gemakkelijker uit als je de data er bij kunt zien. Zodra je een plotje etc post kan ik meer uitleggen over de verschillende mogelijkheden en hoe die werken.
Ik ben er al uit! Bedankt in ieder geval. Ik heb uiteindelijk gekozen voor een regressie-analyse en een diagram in plaats van een scatterplot.quote:Op maandag 1 juni 2015 16:42 schreef Banaanensuiker het volgende:
[..]
Begrijp je zelf wel wat je wilt doen? Het klinkt namelijk erg vaag en abstract.
Als je een hypothese wilt testen, dan moet je over het algemeen een regressie doen. Welke vorm? Dat hangt inderdaad af van de data en jouw kennis. Maar zoals oompaloompa al zegt, nuttig advies is lastig te geven als je niet concreter bent over je dataset.
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |