Over multicollineariteit als je in het scherm van regressieanalyse zit kan je onder het kopje Stats nog meer testen aanvinken oa. die collinariteit. Als je met tijdreeksen werkt kan je ook Durbin-Watson aanvinken.quote:Op zondag 1 augustus 2010 17:01 schreef pdegroot het volgende:
[..]
Wellicht kun jij mij dan helpen als het niet lastig is
Ik moet met de volgende data werken:
X= computeraankopen per maand van een bedrijf
Y= omzet per maand van het bedrijf
Eerst moet ik een aantal waardes berekenen die niet zo moeilijk zijn, namelijk:
- gemiddelde
- standaardafwijking
- tijdlijn van beide variabelen in 1 figuur
- spreidingsdiagram
- correlatiematrix
- lineaire regressie van Y op X
Hierna moet ik voor X een onderzoek doen naar stationariteit. Daarnaast moet ik een correlatiematrix maken van alle gebruikte variabelen en controleren of er sprake is van multicollineariteit. Vervolgens moet ik hetzelfde doen voor Y.
Hoe doe ik dit in SPSS?
Je interpreteert je getransformeerde data, daarna zou je een interpretatie van je normale data kunnen geven. Maar aangezien je de getransformeerde test doe je daar de uitspraken over.quote:Op woensdag 4 augustus 2010 13:11 schreef de_nachtwacht het volgende:
Hoi,
Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.
Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.
Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?
Data reduceren doe je met een factor analyse. Volgens mij moeten de antwoordcategorien wel gelijk zijn voor deze procedure. Google anders factor analyse zodat je meer over deze techniek te weten komt.quote:Op vrijdag 27 augustus 2010 12:43 schreef gember het volgende:
Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!
Met Kendall's Tau-B ben ik niet zo bekend. De toepassing van Pearson of Spearman Rho om een correlatie tussen variabelen te toetsen is afhankelijk van je data. Bij interval geschaalde data, dat normaal verdeeld is, gebruik je Pearson (product-momentcorrelatiecoëfficiënt). De Spearman Rho wordt ook wel Spearman rangcorrelatiecoeffiecient genoemd. Deze gebruik je als je interval data niet normaal verdeeld is, of als je te maken hebt met ordinaal geschaalde data.quote:Op woensdag 11 augustus 2010 15:24 schreef Hiya het volgende:
Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Uitgereikt formulier:quote:In een experiment worden mannen en vrouwen willekeurig ingedeeld in vier experimentele groepen. De proefpersonen moeten twee taken uitvoeren en de experimentele groep waarin ze zijn ingedeeld bepaalt onder welke condities de taken moeten worden uitgevoerd (groep 1 lichtste condities t/m groep 4 zwaarste condities). In de tabel op het uitgereikte formulier staan de gegevens van 20 personen.
Ik had zelf eerst als 4 variabelen de condities, maar merkte op dat anderen meer in de juiste richting zaten [waarschijnlijk] met 4 variabelen als 'Sekse, Conditie, Taak1, Taak2'. Maar eigenlijk snap ik er niks van, want ook met die variabelen kom ik niet echt verder met wat ik er precies bij moet invullen, . Ook moet ik later in de opgave nog een nieuwe variabele maken die gelijk is aan de som van de beide variabelen.quote:Open SPSS en voer de data in. Zorg ervoor dat er in je dataset vier variabelen zijn. Kies, waar nodig, zelf een codering voor de variabelen.
Het zijn de scores idd. Maar het moeten per se 4 variabelen worden, dus 5 gaat niet lukken.quote:Op maandag 18 oktober 2010 18:45 schreef crossover het volgende:
Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)
Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).
Beetje duidelijker zo?
whoops.quote:Op maandag 18 oktober 2010 19:04 schreef ChipsZak. het volgende:
Maar ze zitten toch juist in beide taken, ? Want ze moeten ze beiden doen?
Ik las ook nog ergens dat ik de cijfers moet opvatten als individuen en dus moest kijken naar hun score op zowel taak1 als taak2 en dan zou mijn spss ding op deze manier goed moeten zijn.quote:Op maandag 18 oktober 2010 19:15 schreef Frith het volgende:
[..]
whoops.
Me smart!
In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.
Moet je dit met eigen data of gegeven data zijn?quote:Op maandag 8 november 2010 19:23 schreef uppie83 het volgende:
Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R2 waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?
We hebben een deel van een data bestand gekregen van een oud onderzoek. Hiermee moesten we voor ons vak een paper schrijven met onder andere de eis dat er een multiple regressie in zou komen. Inmiddels ben ik er achter gekomen dat de eis voor multiple regressie niet zozeer is dat alle factoren een hoge lineaire regressie moeten hebben, maar ze moeten met elkaar correleren. Niet dat dat overal netjes gebeurd, maar dat is nu eenmaal 'the real deal'. Dit is zeg maar een voorbereidingsvak op de masterscriptie.quote:Op dinsdag 9 november 2010 22:15 schreef Hiya het volgende:
[..]
Moet je dit met eigen data of gegeven data zijn?
Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R2 waarden. Weet je zeker dat je alles goed hebt ingevoerd?
Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |