Het SPSS topic #2 - Waar we gezellig verder analyseren | School, Studie en Onderwijs (SES)

woensdag 4 augustus 2010 @ 13:11:19 #151

de_nachtwacht

scatterbrain

Hoi,

Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.

Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.

Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?

woensdag 4 augustus 2010 @ 16:24:34 #152

Hiya

quote:
Op zondag 1 augustus 2010 17:01 schreef pdegroot het volgende:

[..]

Wellicht kun jij mij dan helpen als het niet lastig is

Ik moet met de volgende data werken:
X= computeraankopen per maand van een bedrijf
Y= omzet per maand van het bedrijf

Eerst moet ik een aantal waardes berekenen die niet zo moeilijk zijn, namelijk:
- gemiddelde
- standaardafwijking
- tijdlijn van beide variabelen in 1 figuur
- spreidingsdiagram
- correlatiematrix
- lineaire regressie van Y op X

Hierna moet ik voor X een onderzoek doen naar stationariteit. Daarnaast moet ik een correlatiematrix maken van alle gebruikte variabelen en controleren of er sprake is van multicollineariteit. Vervolgens moet ik hetzelfde doen voor Y.

Hoe doe ik dit in SPSS?

Over multicollineariteit als je in het scherm van regressieanalyse zit kan je onder het kopje Stats nog meer testen aanvinken oa. die collinariteit. Als je met tijdreeksen werkt kan je ook Durbin-Watson aanvinken.

woensdag 4 augustus 2010 @ 16:26:00 #153

Hiya

En ik heb nog een vraagje over regressieanalyse; de standaardafwijking van mijn residuen is nogal groot. Is er een manier om deze te verkleinen?

woensdag 4 augustus 2010 @ 16:47:48 #154

oompaloompa

doompadeedee

quote:
Op woensdag 4 augustus 2010 13:11 schreef de_nachtwacht het volgende:
Hoi,

Ik zit met het volgende probleem. Ik heb verschillende gemiddelden die ik met elkaar wil vergelijken om te zien of de verschillen significant zijn. Het probleem is echter dat de data niet overal normaal verdeeld is en dus wil ik de data normaliseren om zo toetsen te kunnen uitvoeren.

Nu heb ik echter ook een hoofdstuk waarin ik een meer kwalitatieve beschrijving geef van mijn data. Dat gaat ongeveer zo: 'De gemiddelde score op vaardigheid X is 60,5 op een schaal van 0 tot 100'.

Maar als ik de data transformeer, hoef ik dan de getransformeerde data alleen te gebruiken voor de toetsen en kan ik verder gebruik maken van mijn originele (niet-getransformeerde) data? Of moet ik de originele data laten voor wat het is en alleen nog uitgaan van de getransformeerde data bij alles wat ik doe?

Je interpreteert je getransformeerde data, daarna zou je een interpretatie van je normale data kunnen geven. Maar aangezien je de getransformeerde test doe je daar de uitspraken over.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

woensdag 11 augustus 2010 @ 15:24:16 #155

Hiya

Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?

vrijdag 27 augustus 2010 @ 12:43:46 #156

gember

Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!

zaterdag 28 augustus 2010 @ 17:51:20 #157

The_Eye

For his eyes are on the ways o

quote:
Op vrijdag 27 augustus 2010 12:43 schreef gember het volgende:
Wie kan mij helpen?!
Ik ben bezig met mijn scriptie en zit hier al een paar dagen op te kijken, maar ik kom er helemaal niet uit.
Het probleem is als volgt:
Ik heb een aantal vragen die samen een construct volgen. Alleen, niet alle vragen hebben dezelfde antwoordcategorieën. Zo heeft een vraag zes antwoordcategorieën, eentje tien en anderen weer vijf. Ik wil graag een nieuwe variabele aanmaken die het gehele construct meet en iets over het gemiddelde e.d. zeggen. Hoe zorg ik er voor dat je de vragen met elkaar kan vergelijken en er een schaal van te maken? Is hier een functie voor?
Bedankt!

Data reduceren doe je met een factor analyse. Volgens mij moeten de antwoordcategorien wel gelijk zijn voor deze procedure. Google anders factor analyse zodat je meer over deze techniek te weten komt.

zaterdag 28 augustus 2010 @ 18:00:34 #158

The_Eye

For his eyes are on the ways o

quote:
Op woensdag 11 augustus 2010 15:24 schreef Hiya het volgende:
Kan iemand mij uitleggen wat het verschil is tussen Pearson, Kendall's Tau-B en Spearman bij het doen van Bivarate Correlation in SPSS?

Met Kendall's Tau-B ben ik niet zo bekend. De toepassing van Pearson of Spearman Rho om een correlatie tussen variabelen te toetsen is afhankelijk van je data. Bij interval geschaalde data, dat normaal verdeeld is, gebruik je Pearson (product-momentcorrelatiecoëfficiënt). De Spearman Rho wordt ook wel Spearman rangcorrelatiecoeffiecient genoemd. Deze gebruik je als je interval data niet normaal verdeeld is, of als je te maken hebt met ordinaal geschaalde data.

zondag 29 augustus 2010 @ 15:16:51 #159

gember

Bedankt voor de snelle reactie!
Een factoranalyse heb ik al uitgewerkt. Het is niet de bedoeling de data te reduceren, maar tot een soort van "gemiddelde" schaalscore te komen zodat ik deze in mijn regressievergelijking kan opnemen.
Als alle schalen gemeten worden op een vijfpuntschaal doe je bijvoorbeeld bij Compute
(VRAAG1 + VRAAG2 + VRAAG 3) / 3 voor het gemiddelde van het hele concept. Simpel uitgelegt zien mijn vragen er zo uit:
vraag 1: antwoordcategorieen van 1 t/m 5
vraag 2: antwoordcategoieen van 1 t/m 6
vraag 3: antwoordcategorieen van 1 t/m 10
Als je nu via compute (VRAAG1 + VRAAG2 + VRAAG 3) / 3 invoert bij compute, krijg je een gemiddelde dat aangetast is door het feit dat de ene vraag vijf antwoordcategorien heeft en de ander zes.
Er moet (lijkt me) een manier zijn om deze vragen toch vergelijkbaar te maken?

SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.

FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 18:13:46 #160

ChipsZak.

That's hot.

Hey! Ik heb morgen een SPSS toets en ik kom al niet uit de oefenopgave,

.
Kan iemand helpen?

quote:
In een experiment worden mannen en vrouwen willekeurig ingedeeld in vier experimentele groepen. De proefpersonen moeten twee taken uitvoeren en de experimentele groep waarin ze zijn ingedeeld bepaalt onder welke condities de taken moeten worden uitgevoerd (groep 1 lichtste condities t/m groep 4 zwaarste condities). In de tabel op het uitgereikte formulier staan de gegevens van 20 personen.

Uitgereikt formulier:

Ik loop al direct vast bij het makkelijkste gedeelte,

.
De vraag is namelijk.

quote:
Open SPSS en voer de data in. Zorg ervoor dat er in je dataset vier variabelen zijn. Kies, waar nodig, zelf een codering voor de variabelen.

Ik had zelf eerst als 4 variabelen de condities, maar merkte op dat anderen meer in de juiste richting zaten [waarschijnlijk] met 4 variabelen als 'Sekse, Conditie, Taak1, Taak2'. Maar eigenlijk snap ik er niks van, want ook met die variabelen kom ik niet echt verder met wat ik er precies bij moet invullen,

. Ook moet ik later in de opgave nog een nieuwe variabele maken die gelijk is aan de som van de beide variabelen.

Help?

I guess words are a motherfucker.
I kill a bitch with a potato peeler for the skrilla.

maandag 18 oktober 2010 @ 18:45:21 #161

crossover

Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)

Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).

Beetje duidelijker zo?

'Expand my brain, learning juice!'
<a href="http://www.last.fm/user/crossover1" rel="nofollow" target="_blank">Last.fm</a>

FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 18:49:34 #162

ChipsZak.

That's hot.

quote:
Op maandag 18 oktober 2010 18:45 schreef crossover het volgende:
Die gegevens, zijn dat waardes of nummers van proefpersonen? Ik vermoed waardes of de scores die men gehaald heeft aangezien ze niet netjes van 1 naar 20 lopen.
Hoe dan ook, je moet inderdaad vier (of vijf als de gegevens waardes representeren) variabelen maken:
Geslacht
Taak 1
Taak 2
Groep
(Evt score of waarde)

Verzin zelf maar welke soort meetschaal je moet nemen per variabele. Met compute new variable kan je vervolgens die nieuwe variabele aanmaken (som).

Beetje duidelijker zo?

Het zijn de scores idd. Maar het moeten per se 4 variabelen worden, dus 5 gaat niet lukken.
Meetschaal zal wel lukken.

Alleen ik snap niet helemaal hoe en wat ik nu precies moet invullen.
Voorbeeld: Ik wilde eerst onder geslacht voor een man een 0 invullen en voor vrouwen een 1 maar dat liep ergens ineens niet goed omdat er in de groepen van taak1 al niet constant hetzelfde aantal mannen zitten.

I guess words are a motherfucker.
I kill a bitch with a potato peeler for the skrilla.

maandag 18 oktober 2010 @ 19:01:44 #163

Frith

fictief en almachtig

Het enige wat een beetje onder de radar zit is dat je uiteraard "taak" ook maar een enkele variabele maakt.

Wat latere bewerkingen selecteer je gewoon op "1" of "2" onder de variabele 'taak'.

Uiteraard is iedere persoon een aparte case en zijn de twee taken (of meer) mutual exclusive, wat betekent dat iemand óf in 1 zit of in 2, maar nooit in beide.

taak: 1,2
sekse: 1,2
groep: 1,2,3,4
score: 0-99 (interval)

In SPSS levert je dat drie categorische variabelen op (weet de naam even niet) en een enkele scale-variabele, omdat SPSS geen interval meetniveau kent. Dacht ik dan toch.

FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 19:04:48 #164

ChipsZak.

That's hot.

Maar ze zitten toch juist in beide taken,

? Want ze moeten ze beiden doen?

I guess words are a motherfucker.
I kill a bitch with a potato peeler for the skrilla.

maandag 18 oktober 2010 @ 19:15:01 #165

Frith

fictief en almachtig

quote:
Op maandag 18 oktober 2010 19:04 schreef ChipsZak. het volgende:
Maar ze zitten toch juist in beide taken, ? Want ze moeten ze beiden doen?

whoops.

Me smart!

In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.

FOK!Video Chick, PR en FP sportredactie maandag 18 oktober 2010 @ 19:40:11 #166

ChipsZak.

That's hot.

quote:
Op maandag 18 oktober 2010 19:15 schreef Frith het volgende:

[..]

whoops.

Me smart!

In dat geval kun je "taak" helemaal dumpen en gewoon ScoreTaak1 en ScoreTaak2 als variabelen gebruiken. Immers, als iedereen een score heeft bij een taak, dan is een verdeling naar taak overbodig.

Ik las ook nog ergens dat ik de cijfers moet opvatten als individuen en dus moest kijken naar hun score op zowel taak1 als taak2 en dan zou mijn spss ding op deze manier goed moeten zijn.

(man (=0) uit groep 1 heeft op taak1 een score van 65 maar bij taak2 een van 42.

I guess words are a motherfucker.
I kill a bitch with a potato peeler for the skrilla.

maandag 8 november 2010 @ 19:23:47 #167

uppie83

Sousousou

Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R² waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?

ウプピエ八十三 << u-pu-pi-e hachi-ju-san, ik denk ik zeg het er maar ff bij :P

maandag 8 november 2010 @ 19:30:53 #168

Citizen.Erased

7\

TVP. Over een paar weken mag ik ook weer aan de slag met SPSS.

De teloorgang van de PI

dinsdag 9 november 2010 @ 19:47:07 #169

yozd

FR1908 Vakkie R

Even een kort vraagje; als ik een (lineair) regressie run met meerdere variabelen en bij ANOVA is mijn model significant en al die variabelen zijn ook significant, BEHALVE de 'constant'. Wat betekent dit dan concreet?

"On a good day, when I run, the voices in my head get quieter until it’s just me, my breath and my feet on the sand (Dexter, E5x09)."

dinsdag 9 november 2010 @ 22:15:27 #170

Hiya

quote:
Op maandag 8 november 2010 19:23 schreef uppie83 het volgende:
Ik moet voor een paper verplicht een multiple regressie doen. Een van de assumpties van deze toets is dat de variabelen een lineaire relatie met elkaar hebben. Mijn huidige R² waarden zijn echter 0,032, 0,017, 0,087 en 0,06. Lijkt me niet voldoende om verder te mogen. Echte uitbijters zitten er niet tussen. Iemand ideeen hoe ik dit het beste kan aanpakken?

Moet je dit met eigen data of gegeven data zijn?

Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R² waarden. Weet je zeker dat je alles goed hebt ingevoerd?

Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?

donderdag 11 november 2010 @ 22:03:55 #171

uppie83

Sousousou

quote:
Op dinsdag 9 november 2010 22:15 schreef Hiya het volgende:

[..]

Moet je dit met eigen data of gegeven data zijn?

Als de data gegeven is lijkt het me raar dat deze je een regressie laten uitvoeren met zulke lage R² waarden. Weet je zeker dat je alles goed hebt ingevoerd?

Als je het met eigen data moet doen, dan is het wat het is, zover ik het van hier kan beoordelen. Is de bedoeling dat je de regressie in je paper verder gebruikt of is het om aan te tonen dat je het kan uitvoeren en intepreteren?

We hebben een deel van een data bestand gekregen van een oud onderzoek. Hiermee moesten we voor ons vak een paper schrijven met onder andere de eis dat er een multiple regressie in zou komen. Inmiddels ben ik er achter gekomen dat de eis voor multiple regressie niet zozeer is dat alle factoren een hoge lineaire regressie moeten hebben, maar ze moeten met elkaar correleren. Niet dat dat overal netjes gebeurd, maar dat is nu eenmaal 'the real deal'. Dit is zeg maar een voorbereidingsvak op de masterscriptie.

ウプピエ八十三 << u-pu-pi-e hachi-ju-san, ik denk ik zeg het er maar ff bij :P

zaterdag 13 november 2010 @ 16:18:57 #172

Susanna

Whoehoe, een spss-topic!

Mag ik meteen een vraag stellen?

Ik heb een database met onder andere als vraag: hoeveel geeft u uit aan a, b, c, d, e.
Ik wil de antwoorden op deze vragen indelen in drie categorieën, namelijk mensen die bij a iets (maakt niet uit wat) hebben ingevuld, mensen die bij b iets hebben ingevuld en mensen die bij c, d of e iets hebben.
Complicerende factor: ik wil dat alleen weten voor 2009 (of indien niet beschikbaar 2008) terwijl deze vraag voor 2005 tot en met 2009 is beantwoord.

Hoe krijg ik dit voor elkaar?! Ik hóóp dat jullie een antwoord weten, alvast heel erg bedankt!

zaterdag 13 november 2010 @ 16:20:22 #173

Susanna

uppie, mag je zelf je variabelen kiezen? En als je daar nu in varieert?

zaterdag 13 november 2010 @ 17:02:13 #174

Z

Hoe ziet de "jaarvariabele" er uit? En hoe blijkt uit de uitgave variabele of het een uitgave a, b, cde is

Aldus.

zondag 14 november 2010 @ 10:24:53 #175

Susanna

Per deelnemer wordt per jaar al dan niet een waarde ingegeven in de kolommen a t/m e. Dus: ik heb onder elkaar steeds 5 dezelfde deelnemer (dus nr. 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, etc), tweede kolom is 2005,2006,2007,2008,2009,2005,2006,2007 etc. En dan volgen de kolommen a t/m e waar waardes ingegeven kunnen zijn (en ik ben dus niet geïnteresseerd in de waardes, maar of er al dan geen waarde in staat). Is dat hoe je de vraag bedoeld? Ik hoop dat ik zo duidelijk ben.

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

Het SPSS topic #2 - Waar we gezellig verder analyseren

» school, studie en onderwijs

» school, studie en onderwijs