Dank voor je reactie! Mijn opzet was als volgt:quote:Je spreekt over een moderator maar die zie ik niet genoemd worden. Als je twee losse t-toetsen gebruikt, gebruik je niet je volledige data. Het beste is (m.i.) om een anova te doen met 2 planned contrasten: groep 1 t.o.v. groep 3, en groep 2 tov groep 1.
Dat gezegd hebbende, de data zullen niet heel anders zijn als je mijn manier gebruikt.
Bedankt. Dat is inderdaad een optie. Ik ga even kijken of het normaal verdeeld is.quote:Op dinsdag 13 mei 2014 20:07 schreef oompaloompa het volgende:
[..]
Kun je het niet gewoon als continue variabele gebruiken? Als je N hoog genoeg is en de data genoeg spreiding laat zien kun je volgens mij gewoon beiden als continue gebruiken en dat maakt het een heel stuk gemakkelijker.
[..]
Je spreekt over een moderator maar die zie ik niet genoemd worden. Als je twee losse t-toetsen gebruikt, gebruik je niet je volledige data. Het beste is (m.i.) om een anova te doen met 2 planned contrasten: groep 1 t.o.v. groep 3, en groep 2 tov groep 1.
Dat gezegd hebbende, de data zullen niet heel anders zijn als je mijn manier gebruikt.
Ik zou het geen moderator noemen omdat je met deze optie niet weet of dat het gewoon een (main) effect van humor is, of dat er echt iets speciaals is qua humor op de radio.quote:Op woensdag 14 mei 2014 00:18 schreef hanssk het volgende:
[..]
Dank voor je reactie! Mijn opzet was als volgt:
Dependent variable is click-through intention (7 punts schaal).
Independent variable is "synergy between radio en online advertising" met 2 levels: ja of nee. Ja = eerst radio advertentie en dan online advertentie en Nee= twee keer online advertentie.
Nu verwacht ik dat radio-online beter werkt dan online-online. En ik verwacht dat radio-online extra goed werkt als de radio advertentie humor bevat.
In mijn ogen is mijn moderator dus "wel of geen humor in de radio advertentie". Is dit eigenlijk wel een echte moderator? En met welke test maak ik wél gebruik van mijn volledige data?
en met behulp van wat tutorials mijn vragen in spss ingevoerd (na wat moeite!)quote:Op maandag 19 mei 2014 19:12 schreef Probability het volgende:
Deze vraag is vast al heel vaak gesteld,
dus ik ga even het topic doorlezen.........
Hoe zat dat ook al weer met thesistools, excel bestand & SPSS
Volgens mij kon ik dit vorig jaar nog prima invoeren en nu heb ik echt geen idee wat ik moet doen
-edit-
er komt al wat boven drijven! gelukkig
Een directe suggestie voor een goed boek heb ik niet, ik heb zelf het vooral door oefening en voorbeelden op internet geleerd. Er zijn niet verschillende R programma's (wel verschillende versies, maar in principe neem je gewoon de nieuwste). Ik raad je wel aan om een IDE te nemen, waarbij de makkelijkste waarschijnlijk Rstudio is. Een andere mogelijkheid is een plugin in Eclipse. Zo'n IDE maakt het leven een stuk makkelijker met debuggen en programmeren.quote:Op dinsdag 20 mei 2014 13:02 schreef Operc het volgende:
Iemand hier die suggesties heeft voor een basis boek/tutorial voor statistische toetsen met R?
En zijn er verschillende R programma's? (Zo ja, adviezen over welke het beste werkt?)
Die IDE's bedoelde ik inderdaad, kon even niet op de naam komen.quote:Op dinsdag 20 mei 2014 13:18 schreef Felagund het volgende:
[..]
Een directe suggestie voor een goed boek heb ik niet, ik heb zelf het vooral door oefening en voorbeelden op internet geleerd. Er zijn niet verschillende R programma's (wel verschillende versies, maar in principe neem je gewoon de nieuwste). Ik raad je wel aan om een IDE te nemen, waarbij de makkelijkste waarschijnlijk Rstudio is. Een andere mogelijkheid is een plugin in Eclipse. Zo'n IDE maakt het leven een stuk makkelijker met debuggen en programmeren.
Er zijn wel heel veel paketten die je kan installeren buiten de basis-R, maar dat installeren gaat vrij eenvoudig.
Enkele handige sites:
http://www.statmethods.net/ (vrij goed beginnersoverzicht van verschillende mogelijkheden, waaronder statistische tests en plotmogelijkheden. Ook nog handig voor de meer ervarener gebruiker als naslag.)
http://www.cookbook-r.com/ (bijna hetzelfde, plots zijn hier meer gefocused op het pakket ggplot2)
http://www.ats.ucla.edu/stat/r/whatstat/whatstat.htm (concreet overzichtje met statistische tests in R, weet niet of het volledig is).
Iets meer uitleg is nodig. Zijn het vier onafhankelijke condities of is het een 2x2 design? Zijn de rvagen aan elkaar gerelateerd of onafhankelijk? Etc.quote:Op woensdag 28 mei 2014 21:37 schreef nickwillem het volgende:
Beste mensen,
Ik ben bezig met een onderzoek. Het onderzoek gaat over het vergelijken van vragenlijsten. In verschillende vragenlijst worden manipulatie doorgevoerd met betrekking tot bijvoorbeeld aanspreekvorm en likert schalen. Door deze manipulaties zijn er vier verschillende versies van de vragenlijst.
Het is de bedoeling dat deze vier verschillende versies met elkaar worden vergeleken. Er dient dus een zekere significantietoets te worden uitgevoerd om te kijken of de verschillen tussen deze vragnelijsten significant zijn. Mijn vraag is nu welke toets kan ik hiervoor toepassen.
Even een kleine samenvatting: Ik ben dus op zoek naar een test met behulp van SPSS die vier vragenlijsten kan vergelijken, en dat ik zo kan zien of er per vraag sprake is van significante verschillen.
Iemand enig idee? Alvast bedankt!
Kan dat niet door middel van het selecteren van diverse cases. Kijk anders even in deze handleiding, ik weet niet of je er wat aan hebt. Had het net ook al geplaatst bij een andere oproep op dit forum:quote:Op dinsdag 3 juni 2014 10:31 schreef AmerikaanseTopsport het volgende:
Hoi allemaal,
ik heb een onderzoek waarbij ik vijf versies heb van mijn testmateriaal. Eentje als neutrale versie, de anderen hebben op vier plaatsen een verschillende manipulatie gehad, die dus allemaal een keer op verschillende plekken voorkomen, in de vier andere versies. Dus als 1 t/m 5 de verschillende manipulaties zijn, is het zoiets:
Versie 1: 1-1-1-1
Versie 2: 2-3-4-5
Versie 3: 3-4-5-2
Versie 4: 4-5-2-3
Versie 5: 5-2-3-4
Nu wil ik dus van de manipulaties weten of zij 'iets' uitmaken, met betrekking tot de neutrale conditie (1). Hoe de fuck moet dat?Ik studeer echt al eeuwen en het is denk ik zeven jaar geleden dat ik voor het laatst SPSS open had. Dus elke hulp is welkom.
Ik denk overigens dat het in de buurt van de Independant Samples T-Test komt, maar dan kan ik geen vijf verschillende manipulaties testen. Zie dit voorbeeld: http://www.spsshandboek.nl/independent_samples_t-test.html
Iets meer informatie zou handig zijn.quote:Op dinsdag 3 juni 2014 10:31 schreef AmerikaanseTopsport het volgende:
Hoi allemaal,
ik heb een onderzoek waarbij ik vijf versies heb van mijn testmateriaal. Eentje als neutrale versie, de anderen hebben op vier plaatsen een verschillende manipulatie gehad, die dus allemaal een keer op verschillende plekken voorkomen, in de vier andere versies. Dus als 1 t/m 5 de verschillende manipulaties zijn, is het zoiets:
Versie 1: 1-1-1-1
Versie 2: 2-3-4-5
Versie 3: 3-4-5-2
Versie 4: 4-5-2-3
Versie 5: 5-2-3-4
Nu wil ik dus van de manipulaties weten of zij 'iets' uitmaken, met betrekking tot de neutrale conditie (1). Hoe de fuck moet dat?Ik studeer echt al eeuwen en het is denk ik zeven jaar geleden dat ik voor het laatst SPSS open had. Dus elke hulp is welkom.
Ik denk overigens dat het in de buurt van de Independant Samples T-Test komt, maar dan kan ik geen vijf verschillende manipulaties testen. Zie dit voorbeeld: http://www.spsshandboek.nl/independent_samples_t-test.html
Compute variable, percentage = droomslaap/totale slaap? Daarna kun je via descriptives nog het gemiddelde percentage opvragen van de hele groep.quote:Op donderdag 5 juni 2014 09:55 schreef Rubman het volgende:
Ik moet met SPSS de een percentage van 2 variabelen bepalen.
Ik heb 1 variabele totale slaap en een andere variabele dromend over een range van verschillende diersoorten.
Nu moet ik dus het percentage dromend van totale slaap analyseren, maar geen idee hoe dit het beste te doen.
de vraag is letterlijk dit.
[quote]
Definieer ten slotte als variabele het percentage dat droomslaap uitmaakt van de totale slaap
[\]
Dus je hebt een 2(man/vrouw)*3(exp1/exp2/controle) between-subjects design met 2 afhankelijke variabelen(reactietijd/hulp)?quote:Op donderdag 5 juni 2014 00:10 schreef Andyy het volgende:
Ik heb de volgende data:
manipulatievariabele (2 experimentele, 1 controle), man/vrouw, reactietijd en hulp (ja of nee)
Het is zijn allemaal van losse personen (between subjects dus)
Nu wil ik weten of de reactietijd en/of hulpgedrag significant verschillen in de verschillende condities en wellicht ook nog of er man/vrouw verschillen zijn.
Heb zelf al verschillende ANOVAs uitgevoerd, maar wil eigenlijk experimentele conditie vergelijken met de controle (los van elkaar). Moet ik hiervoor dummy variabelen aanmaken oid? Of welke analyses moet ik draaien, ik snap het niet meer
Dit begrijp ik niet helemaal, ben redelijk beginneling met SPSS dus wat meer hulp is welkom.quote:Op donderdag 5 juni 2014 10:02 schreef Operc het volgende:
[..]
Compute variable, percentage = droomslaap/totale slaap? Daarna kun je via descriptives nog het gemiddelde percentage opvragen van de hele groep.
Klik op compute variable, bij Target Variable typ je de naam van de nieuwe variabele in. Bij Numeric Expression, komt de formule te staan. Dubbelklik in de lijst links op de variabele DroomSlaap (afhankelijk van hoe je die hebt genoemd heet die dus anders.) Daarna klik je in het rekenmachientjesstukje op "/" en daarna klik je in de linker lijst dubbel op de variabele totale slaap. Vervolgens klik je op "*" in het rekenmachientje en typ je daarna 100. Daarna klik je op OK en dan komt je variabele met het percentage droomslaap ten opzichte van de totale slaap in je data venster te staan.quote:Op donderdag 5 juni 2014 10:07 schreef Rubman het volgende:
[..]
Dit begrijp ik niet helemaal, ben redelijk beginneling met SPSS dus wat meer hulp is welkom.
Als ik via compute variable voor de = Percentage invoer en daarna droomslaap/totale slaap krijg ik geen uitkomst.
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
quote:Op donderdag 5 juni 2014 10:16 schreef Operc het volgende:
[..]
Klik op compute variable, bij Target Variable typ je de naam van de nieuwe variabele in. Bij Numeric Expression, komt de formule te staan. Dubbelklik in de lijst links op de variabele DroomSlaap (afhankelijk van hoe je die hebt genoemd heet die dus anders.) Daarna klik je in het rekenmachientjesstukje op "/" en daarna klik je in de linker lijst dubbel op de variabele totale slaap. Vervolgens klik je op "*" in het rekenmachientje en typ je daarna 100. Daarna klik je op OK en dan komt je variabele met het percentage droomslaap ten opzichte van de totale slaap in je data venster te staan.Bedankt, had niet meteen door dat er een nieuwe variabele gemaakt werdSPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.![]()
Hiermee kan ik wel weer verderLaaiend enthousiast kwam hij uit de brandende kerncentrale en keek stralen om zich heen!
Scatterplot, en dan evt. een lijn erdoor laten plotten, in spss komt dan ook de regressievergelijking erbij te staan.quote:Op donderdag 5 juni 2014 13:53 schreef Rubman het volgende:
Nu zit ik met een volgend probleem waar ik mij even geen raad mee weet.
Kies een maat voor botdichtheid en relateer die aan het cumulatief rookgedrag (pyr), weer voor beide leden van de tweeling. (Grafisch en via regressie en voer de verschillende controles uit op de normaliteit.)
ik heb een dataset met gegevens over tweelingen en levensstijlen en botdichtheid
De verschillende maten voor botdichtheid worden aangegeven met respectievelijk LSx (Lumbar spine (g/cm**2)) FNx (Femoral neck (g/cm**2)) en FSx(Femoral shaft (g/cm**2)) dit is dus de meetlocatie van de botdichtheid aangegeven met een afkorting en een x waarbij de x een 1 of 2 kan zijn afhankelijk van bij welke tweeling de meting is gedaan.
Pyr staat voor pakjes gerookt per jaar (hoeft niet te betekenen dat ze nog roken)
Ik heb dus geen idee hoe ik die aan elkaar moet relateren, als ik er een lijngrafiek van maak krijg ik enkel hele vreemde grafieken en een boxplot lijkt me ook niet de beste oplossing.
Het lijkt me dat "Loop While stemmen >= 0" inderdaad een oneindige loop is. Daar moet iets als "and stemmen < 51" bij. En volgens mij wordt er dan nog niet helemaal juist geteld maar dat merk je vanzelf wel.quote:Op zondag 8 juni 2014 15:19 schreef kickdown58 het volgende:
Beste mensen heeft er iemand enige ervaring met excel VBA?
Voor mijn project moet ik het stemproces(optellen van de stemmen in correcte hoeveelheden bij elke partij) genereren.
Nu heb ik om kleins te beginnen het volgende geprobeerd, maar mijn Excel loopt elke keer vast omdat ik denk dat deze code iets oneindig doet?
In excel mogen geen formules gebruikt worden alleen vaste waardes, als test heb ik er ook 2 neergezet.
Wat ik wil bereiken is dat het gegeven aantal stemmen wordt verdeeld over de partijen in dit voorbeeldje 2 partijen en 50stemmen, Partij1 = 23 stemmen part2 = 22 stemmen. En dat wanneer part1 vol zit hij door gaat naar 2. Het max stemmen van een partij staat in excel dus. Uiteindelijk moeten de uitkomsten in excel komen naast de van te voren ingevoerde cijfers.
Wie kan mij hiermee helpen?
De code is als volgt:
Sub st31()
Dim stemmen, aftel, stemmenpart1, stemmenpart2 As LongPtr
Dim tekst1, tekst2 As String
stemmen = 50
stemmenpart1 = 0
stemmenpart2 = 0
aftel = 1
Do
Loop While stemmen >= 0
stemmen = stemmen - aftel
Do While stemmenpart1 <= Worksheets("st").Cells(3, 2)
stemmenpart1 = stemmenpart1 + aftel
Loop
If stemmenpart1 = True Then
tekst1 = stemmenpart1
End If
Do While stemmenpart1 = Worksheets("st").Cells(3, 2)
stemmenpart2 = stemmenpart2 + aftel
Loop
If stemmenpart2 = True Then
tekst2 = stemmenpart2
End If
Worksheets("st").Cells(3, 3) = tekst1
Worksheets("st").Cells(3, 4) = tekst2
End Sub
Nee, tell me more?quote:
Analyze -> descriptive statistics -> frequenciesquote:Op woensdag 2 juli 2014 11:51 schreef surfertjejesper het volgende:
Beste SPSS helden,
Op dit moment ben ik bezig met mijn afstudeeronderzoek en heb een vraag over een SPSS analyse.
Ik doe een onderzoek naar welke behoeften mensen hebben op een webshop en in de fysieke winkel, bijvoorbeeld, in welke mate hebben consumenten behoefte aan reviews op een webshop, of het product aanraken in de winkel etc.
Ook vraag ik in de enquête in welke mate zij de winkel/webshop beoordelen op deze punten.
Zo heb ik 2 vragen gemeten op basis van een 5 punt likert schaal:
- In welke mate vindt u de volgende functies belangrijk op een webshop? --> reviews en beoordelingen
- Hoe beoordeelt u de Euro Funcenter webshop op deze functies? --> reviews en beoordelingen
Op deze manier kan ik zien wat mensen belangrijk vinden en waar er verbeterpunten liggen, of niet.
Weet iemand een mooie duidelijke manier om naast elkaar dit aan te tonen in SPSS? ik kom er zelf niet zo goed uit namelijk. Dus bijvoorbeeld:
100 mensen vinden reviews en beoordelingen zeer belangrijk
80 mensen vinden de reviews en beoordelingen op de webshop matig.
enzovoort.
Ik hoop dat jullie me kunnen helpen!
Klopt! Deze manier had ik eerst ook. Alleen ik dacht, misschien is er een mooiere manier om dit naast elkaar weer te geven. Zodat je in een snelle oogopslag kan zien bv: 80% vind reviews 'zeer belangrijk', maar 70% beoordeeld bedrijf xx op dit punt 'matig'. Dan weet je dat hier verbeterpunten liggen.quote:Op woensdag 2 juli 2014 12:12 schreef Operc het volgende:
[..]
Analyze -> descriptive statistics -> frequencies
Als je zorgt dat je in je variabelen scherm de labels van de values hebt aangepast naar de benamingen die je noemt kun je op deze manier een tabel krijgen met de aantallen die je zoekt.
Als je eerst nog op Charts klikt (voor je op OK klikt) dan kun je nog kiezen uit wat grafiekjes.
Ah op die manier. Dan zou ik op basis van de frequency tabellen de data in Excel plaatsen en op die manier grafieken maken. Het zal vast ook kunnen in SPSS, maar ik ben niet zo thuis in de Chartbuilder.quote:Op woensdag 2 juli 2014 12:27 schreef surfertjejesper het volgende:
[..]
Klopt! Deze manier had ik eerst ook. Alleen ik dacht, misschien is er een mooiere manier om dit naast elkaar weer te geven. Zodat je in een snelle oogopslag kan zien bv: 80% vind reviews 'zeer belangrijk', maar 70% beoordeeld bedrijf xx op dit punt 'matig'. Dan weet je dat hier verbeterpunten liggen.
ik weet niet of dit mogelijk is, of is het verstandiger om het gewoon simpel te houden
In ieder geval bedankt voor je tip alvast!
Een chi-square test alleen of er verschillen zijn, maar niet waar die verschillen zitten.quote:Op dinsdag 8 juli 2014 11:35 schreef Jiveje het volgende:
Ik ben bijna klaar met het afronden van mijn masterscriptie, maar hik al enige weken tegen hetzelfde probleem aan.
Wat ik heb: iedere respondent kreeg 3 namen onder ogen te zien, OF alle 3 in het Engels OF alle 3 in het Nederlands. Respondenten zelf verschilden qua nationaliteit: het waren Nederlanders of Belgen. Per voorgelegde naam gaven zij hun mening, die vervolgens zijn gecodeerd naar 0 = negatief, 1 = neutraal en 2 = positief. In totaal heb ik 155 (respondenten) x 3 (voorgelegde namen) = 465 meningen.
Wat ik wil: iets zinnigs kunnen zeggen over eventuele verschillen in aantallen. Ik wil in eerste instantie het aantal negatieve, neutrale en positieve meningen vergelijken tussen de Engelse en de Nederlandse versie. Kijken of deze verschillen in totale aantal en in aantal negatieve, neutrale of positieve meningen. Tenslotte zou ik ook nog willen kijken in hoeverre de meningen verschillen als het aankomt op nationaliteit; dus verschilt het totale aantal meningen en het aantal negatieve, neutrale en positieve meningen tussen Belgen en Nederlanders.
Kan iemand mij hiermee helpen?
UPDATE: Ter verduidelijking onderstaande uitkomst van een chi-kwadraat. Kan ik hier nu iets zeggen over dat de totale aantallen significant verschillen. Of ook welke onderling verschillen?
[ afbeelding ]
Wat bedoel je met de pooled data? Kun je de output posten?quote:Op donderdag 10 juli 2014 19:58 schreef christiman het volgende:
Als ik een Mann-Whitney U test doe met een geïmputeerde dataset, krijg ik wel netjes de P-waarden voor mijn originele data en elke imputatiestap (10), maar ik krijg geen P-waarden voor mijn 'pooled' dataset. Terwijl ik wel ranks krijg voor de pooled data.
Waarom krijg ik hiervoor geen p-waarde en hoe kan ik ervoor zorgen dat ik die wel krijg?
Als ik een two-sample t-test doe, krijg ik wel een p-waarde voor de pooled data, maar dat is natuurlijk niet helemaal netjes, omdat ik niet parametrisch mag testen.
Whoops sorry, verkeerde knopjequote:Op maandag 14 juli 2014 10:21 schreef christiman het volgende:
Het gaat in dit geval om een Wilcoxon signed ranks test, maar hetzelfde probleem doet zich eigenlijk voor bij alle non-parametrische testen:
Je ziet dus bij de "ranks" wel onderin de pooled data (data van alle imputatiestappen samen) staan, maar niet in de "statistics" tabel. Ik heb echter wel een p-waarde nodig voor mijn WSRT voor de pooled data, omdat dat in principe mijn data is na multipele imputatie.
Als ik parametrisch test (paired t-test), dan krijg ik hiervoor wel een p-waarde.
Ik ben er iets meer ingedoken, en Wilkinson is voor dependent samples (dus elke case wordt 2x gemeten, bv voor en na interventie), ik denk dus niet dat dat de juiste test voor je is.quote:Op maandag 14 juli 2014 10:21 schreef christiman het volgende:
Het gaat in dit geval om een Wilcoxon signed ranks test, maar hetzelfde probleem doet zich eigenlijk voor bij alle non-parametrische testen:
[ afbeelding ]
[ afbeelding ]
Je ziet dus bij de "ranks" wel onderin de pooled data (data van alle imputatiestappen samen) staan, maar niet in de "statistics" tabel. Ik heb echter wel een p-waarde nodig voor mijn WSRT voor de pooled data, omdat dat in principe mijn data is na multipele imputatie.
Als ik parametrisch test (paired t-test), dan krijg ik hiervoor wel een p-waarde.
Ik weet dat een Wilcoxon een test is voor dependent samples. Ik heb op dezelfde data zowel een Wilcoxon signed ranks test als een Mann-Whitney U test gedaan, om de within and between groups differences te testen. Daar ging m'n vraag ook niet over.quote:Op maandag 14 juli 2014 10:57 schreef oompaloompa het volgende:
[..]
Ik ben er iets meer ingedoken, en Wilkinson is voor dependent samples (dus elke case wordt 2x gemeten, bv voor en na interventie), ik denk dus niet dat dat de juiste test voor je is.
Welke test wel zou moeten werken is de Mann Whitney. Ik heb zelf net wat data gesimuleerd en dan werkt het gewoon. Misschien heb je je dataset niet goed opgezet? (of misschien begrijp ik verkeerd wat je wilt doen)
Nu begin ik het te begrijpen, helaas geen goed nieuws, dat kan niet in SPSS. Je kunt kijken of je een macro er voor kunt vinden.quote:Op maandag 14 juli 2014 11:00 schreef christiman het volgende:
[..]
Ik weet dat een Wilcoxon een test is voor dependent samples. Ik heb op dezelfde data zowel een Wilcoxon signed ranks test als een Mann-Whitney U test gedaan, om de within and between groups differences te testen. Daar ging m'n vraag ook niet over.
Ik wil weten waarom ik geen testuitslagen krijg voor m'n gepoolde data na imputatie. Ik heb namelijk een p-waarde voor de originele data (voordat er geïmputeerd is voor missing data) en ik wil dus een p-waarde voor m'n dataset na imputatie, dit is de 'pooled data'. Hiervoor krijg ik dus wel descriptives en ranks, maar geen p-waarde.
quote:Op maandag 14 juli 2014 11:57 schreef oompaloompa het volgende:
[..]
Nu begin ik het te begrijpen, helaas geen goed nieuws, dat kan niet in SPSS. Je kunt kijken of je een macro er voor kunt vinden.
nou je ik weet het ook niet zeker ik heb nog nooit met imputed data gewerkt, internet zegt allen dat het niet kan. Hier kun je misschien meer vinden: http://jeremyjaytaylor.sq(...)discuss/post/1436944quote:
Kun je even screenshotje posten van regressieresultaten en de plotjes?quote:Op maandag 28 juli 2014 15:05 schreef christiman het volgende:
Bij partiële correlatie heb ik gevonden dat Y significant negatief gecorreleerd is met X, gecorrigeerd voor W en Z. Om dit visueel weer te geven, gebruik ik een lineaire regressie met Y als dependent variable en X, W en Z als independent variables. Ik laat alle partial plots weergeven.
Echter, X heeft in mijn dataset een range van 38-1120, maar in mijn partial plot krijg ik ook punten in de puntenwolk met een negatieve X-waarde. Als ik mijn X-as wil aanpassen in de chart editor, geeft 'ie aan dat de range in de data loopt van -39 tot 43.
Als ik toch de minimum X-as op 0 zet, is het visuele effect van mijn correlatie weg.
Hoe komt het dat ik een heel andere range van mijn X krijg, en hoe los ik dit op?
Met andere woorden, je kan niet IQ vs DV maken, gecorrigeerd voor een aantal variabelen. Dan moet je dus altijd de residuals plotten?quote:Op maandag 28 juli 2014 16:12 schreef oompaloompa het volgende:
Zo te zien komt dat doordat alleen de partial effecten van beide variabelen geplot zijn (zoals eigenlijk ook hoort). Ik denk dat het mogelijk is om de residuals op te slaan in je dataset dan zou je zelf een plotje IQ vs residuals DV kunnen maken.
Kun je wel maar 1 van de twee variabelen selecteren zoals je wil, of komt er dan ook een foutmelding?quote:Op dinsdag 5 augustus 2014 15:14 schreef fh101 het volgende:
Ola senors en senoritas. Op deze mooie zomerse dag ben ik eens bezig gegaan met SPSS voor mijn masterscriptie, en ik loop eigenlijk al gelijk vast..
Ik wil mijn respondenten selecteren op twee variabelen; doe je X op school of buiten school? Deze twee variabelen lopen van 1 t/m 4 (1 = nooit, 2 = 1 of 2 keer, 3 = +- 1x per week en 4 = meerdere keren per week).
Ik wil mijn respondenten selecteren op dat zij zowel op variabele één als op twee, 2 of hoger geantwoord hebben. Dus ik vul bij select cases in: Var1 = 2 | 3 | 4 & Var2 = 2 | 3 | 4 En vervolgens vertelt SPSS me dat "The sequence of operators found is invalid. Check the expression for ommited or extra operands, operators, and parentheses. Maar ik kan dus echt niet verzinnen wat ik anders zou moeten doen; nergens staat een extra spatie oid. En als ik >1 i.p.v. 2 | 3 | 4 invul krijg ik precies hetzelfde... Wie o wie kan mij helpen?
Ga ik even proberen, thanksquote:Op dinsdag 5 augustus 2014 15:24 schreef Z het volgende:
SPSS snapt "Var1 = 2 | 3 | 4" niet.
Dat moet iets zijn als:
(Var1 = 2 | Var1 = 3 | Var1 = 4) & (...)
Eentje lukt wel gewoon inderdaad.quote:Op dinsdag 5 augustus 2014 15:24 schreef Operc het volgende:
[..]
Kun je wel maar 1 van de twee variabelen selecteren zoals je wil, of komt er dan ook een foutmelding?
quote:Op dinsdag 5 augustus 2014 15:24 schreef Z het volgende:
SPSS snapt "Var1 = 2 | 3 | 4" niet.
Dat moet iets zijn als:
(Var1 = 2 | Var1 = 3 | Var1 = 4) & (...)
Even geprobeerd, als je ook data hebt met veel mogelijkheden: VAR1>1 AND VAR2>1 zou ook moeten werken.quote:Op dinsdag 5 augustus 2014 15:31 schreef fh101 het volgende:
[..]Je bent geweldig
Dit was de oplossing!
Alleen moest & in mijn geval | worden, maar dat is mijn eigen fout
1 2 3 4 5 6 7 8 | DATASET ACTIVATE DataSet0. USE ALL. COMPUTE filter_$=(VAR00001>1 AND VAR00002>1). VARIABLE LABELS filter_$ 'VAR00001>1 AND VAR00002>1 (FILTER)'. VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'. FORMATS filter_$ (f1.0). FILTER BY filter_$. EXECUTE. |
Die had ik ook geprobeerd inderdaad, maar die pakte hij ook niet bij de tweede variabele.quote:Op dinsdag 5 augustus 2014 15:33 schreef Operc het volgende:
[..]
Even geprobeerd, als je ook data hebt met veel mogelijkheden: VAR1>1 AND VAR2>1 zou ook moeten werken.
[ code verwijderd ]
Oh ja, daar kan ik me vaag iets van herinneren inderdaad. Het is al weer een tijdje geleden dat ik met SPSS heb gewerkt, dus ik moet er echt weer even inkomen.quote:Op dinsdag 5 augustus 2014 15:35 schreef dotKoen het volgende:
En als het verschillende waarden moeten zijn ANY(var1,3,6,8)
Heb je ze wel allemaal apart in je regressie analyse gedaan, dus een voor een ipv allemaal tegelijk?quote:Op dinsdag 5 augustus 2014 17:15 schreef LK. het volgende:
Beste Fok-buddies(),
Ik ben voor mijn afstudeeronderzoek gestrand bij de regressie-analyse. Mijn onderzoeksvraag is:
Welke factoren zijn van invloed op de merkmeerwaarde?
Merkmeerwaarde bestaat uit 5 onafhankelijke variabelen (gehaald uit de theorie), namelijk:
• Merkidentiteit
• Merkbetekenis
• Merkrespons
• Merkrelatie
• Content
Deze 5 variabelen heb ik in mijn survey verwerkt in 42 vragen die allen te beantwoorden zijn op basis van een 5-puntsschaal. Vervolgens heb ik een Cronbach's Alpha toegepast op alle factoren en vervolgens de vragen in een schaal geplaatst. Nu rest dus alleen nog een Regressie-analyse om er achter te komen in hoeverre de vijf factoren van invloed zijn op de merkmeerwaarde. ... En zodat ik te weten kom welke factor het meeste van invloed is, zodat ik daar mijn aanbevelingen op kan baseren.
Echter krijg ik bij het uitdraaien van de Regressie-analyse de volgende warning:
"For the final model with dependent variable Merkmeerwaarde, influence statistics can not be computed because the fit is perfect."
Ik begrijp dat dit komt omdat de afhankelijke variabele (Merkmeerwaarde) bestaat uit de 5 onafhankelijke variabelen (merkidentiteit, merkbetekenis, merkrespons, merkrelatie en content).
Mijn vraag: Hoe kan ik dit oplossen, zodat ik alsnog iets kan zeggen over de invloed van de 5 (afzonderlijke) onafhankelijke variabelen op de afhankelijke variabele? (Welke variabele heeft de meeste invloed / is de sterkste predictor?)
|
|
Ik heb zeg maar 0 les gehad in SPSS en er wordt dan ook niet verwacht dat ik een uitgebreide, wiskundige analyse in mijn scriptie verwerk. Hoe simpeler, hoe beter!
Ik moet uiteraard wel een antwoord kunnen geven op mijn onderzoeksvraag. Ik hoop dat hier iemand een oplossing heeft. In elk geval alvast bedankt!
Ja, dat heb ik gedaan maar zodra ik de vijfde dan toevoeg krijg ik de foutmelding. Dat komt waarschijnlijk omdat de 5 onafhankelijke variabelen samen de afhankelijke variabele vormen..quote:Op dinsdag 5 augustus 2014 17:22 schreef fh101 het volgende:
[..]
Heb je ze wel allemaal apart in je regressie analyse gedaan, dus een voor een ipv allemaal tegelijk?
Dat klopt. Dit heet colinneariteit.quote:Op dinsdag 5 augustus 2014 19:54 schreef LK. het volgende:
[..]
Ja, dat heb ik gedaan maar zodra ik de vijfde dan toevoeg krijg ik de foutmelding. Dat komt waarschijnlijk omdat de 5 onafhankelijke variabelen samen de afhankelijke variabele vormen..
Cronbachs Alfa is inderdaad om de betrouwbaarheid van de schalen te meten, daar heb ik het ook voor gebruiktquote:Op dinsdag 5 augustus 2014 20:08 schreef crossover het volgende:
[..]
Dat klopt. Dit heet colinneariteit.
Overigens zegt Cronbachs alfa niets over onderliggende factoren, maar alleen iets over betrouwbaarheid van een schaal (mits je steekproef groot genoeg is, anders is het een slechte schatter maar dat geldt eigenlijk altijd bij statistiek).
Wat je hier wil doen is een zinloze exercitie, omdat je afhankelijke variabele bestaat uit de onafhankelijke variabelen. Dit zegt uiteindelijk dus niets nuttigs.
Je vraag is heel erg raar. Je hebt 42 vragen die allemaal voor 1/42 meetellen in een schaal. Nu wil je een regressie doen om te kijken hoeveel die vragen meetellen, wat dus per definitie 1/42 is per vraag.quote:Op woensdag 6 augustus 2014 12:34 schreef LK. het volgende:
[..]
Cronbachs Alfa is inderdaad om de betrouwbaarheid van de schalen te meten, daar heb ik het ook voor gebruikt. Maar ik moet nu dus de regressie analyse toepassen om te bekijken in hoeverre de factoren van invloed zijn op de merkmeerwaarde.
Hmm, is er geen andere methode om alsnog de gewenste gegevens uitgedraaid te krijgen?
Komt het toevalllig omdat de antwoorden met punten als decimalen gegeven zijn in excell maar spss met commas werkt oid? Dat is bij mij meestal het probleem. De responses die vervallen, vervallen meestal omdat spss ze niet omgezet krijgt in een nummer, daar zou het probleem dus moeten liggen. Misschien dat er spaties in staat of iets anders?quote:Op woensdag 6 augustus 2014 17:04 schreef Wallcrawler-GP het volgende:
Beste Fokkers, (Dubbelpost, mn topic hierover mag dan wel weg)
Google kan me niet helpen, jullie misschien.
Ik heb in excel nogal wat data gekregen (17.000 respondenten). Nu heb ik dat in excel allemaal wat leesbaarder gemaakt en vervolgens geëxporteerd naar SPSS.
In SPSS is (bijna) alles heel mooi. Alleen 1 variabele heeft als type "string" met een nominal measure maar die moet "numeric" met een linear measure zijn. Als ik dat verander in the variable view vervallen opeens een groot aantal responsen.
Hoe kan ik deze variabele wel veranderen in numeriek zodat ik er wel statistische testen mee kan doen.
Let op: alle data die ingevuld is bij de variabele is al numeriek (1-100). Alleen de instellingen kloppen dus niet.
Ik kijk uit naar reacties!
quote:quote:
0s.gif Op woensdag 6 augustus 2014 17:04 schreef Wallcrawler-GP het volgende:
Beste Fokkers, (Dubbelpost, mn topic hierover mag dan wel weg)
Google kan me niet helpen, jullie misschien.
Ik heb in excel nogal wat data gekregen (17.000 respondenten). Nu heb ik dat in excel allemaal wat leesbaarder gemaakt en vervolgens geëxporteerd naar SPSS.
In SPSS is (bijna) alles heel mooi. Alleen 1 variabele heeft als type "string" met een nominal measure maar die moet "numeric" met een linear measure zijn. Als ik dat verander in the variable view vervallen opeens een groot aantal responsen.
Hoe kan ik deze variabele wel veranderen in numeriek zodat ik er wel statistische testen mee kan doen.
Let op: alle data die ingevuld is bij de variabele is al numeriek (1-100). Alleen de instellingen kloppen dus niet.
Ik kijk uit naar reacties!
Super bedankt! Met zoeken en vervangen de punten voor komma's vervangen en daarna kon ik de variabele wel numeriek maken:)quote:Komt het toevalllig omdat de antwoorden met punten als decimalen gegeven zijn in excell maar spss met commas werkt oid? Dat is bij mij meestal het probleem. De responses die vervallen, vervallen meestal omdat spss ze niet omgezet krijgt in een nummer, daar zou het probleem dus moeten liggen. Misschien dat er spaties in staat of iets anders?
Volgens mij heb ik het fout uitgelegd dan. Ik heb inderdaad 42 vragen, die zijn opgedeeld in 5 schalen (merkidentiteit, merkbetekenis, merkrespons, merkrelatie en content). Nu wil ik een regressie-analyse inzetten om erachter te komen in hoeverre elke schaal van invloed is op de afhankelijke variabele (merkmeerwaarde) en welke schaal het meest van invloed is.quote:Op woensdag 6 augustus 2014 21:49 schreef oompaloompa het volgende:
[..]
Je vraag is heel erg raar. Je hebt 42 vragen die allemaal voor 1/42 meetellen in een schaal. Nu wil je een regressie doen om te kijken hoeveel die vragen meetellen, wat dus per definitie 1/42 is per vraag.
Begrijp ik het goed dat elk van die subschalen gemeten wordt met ongeveer 8 van de 42 vragen en dat het alle 42 vragen samen merkmeerwaarde meten?quote:Op donderdag 7 augustus 2014 11:01 schreef LK. het volgende:
[..]
Volgens mij heb ik het fout uitgelegd dan. Ik heb inderdaad 42 vragen, die zijn opgedeeld in 5 schalen (merkidentiteit, merkbetekenis, merkrespons, merkrelatie en content). Nu wil ik een regressie-analyse inzetten om erachter te komen in hoeverre elke schaal van invloed is op de afhankelijke variabele (merkmeerwaarde) en welke schaal het meest van invloed is.
Maar omdat de 5 schalen samen de afhankelijke variabele vormen, geeft SPSS de foutmelding "the fit is perfect". Vandaar mijn vraag of ik op een andere manier kan aantonen in hoeverre de 5 schalen van invloed zijn![]()
Hopelijk is het zo wat duidelijker
Ik heb al een tijd geen regressie-analyse meer gedaan, maar meet je daarmee niet doorgaans de invloed van andere factoren op de afhankelijke variabele? (Factoren zoals leeftijd, salarisschaal etc.)quote:Op donderdag 7 augustus 2014 11:01 schreef LK. het volgende:
[..]
Volgens mij heb ik het fout uitgelegd dan. Ik heb inderdaad 42 vragen, die zijn opgedeeld in 5 schalen (merkidentiteit, merkbetekenis, merkrespons, merkrelatie en content). Nu wil ik een regressie-analyse inzetten om erachter te komen in hoeverre elke schaal van invloed is op de afhankelijke variabele (merkmeerwaarde) en welke schaal het meest van invloed is.
Maar omdat de 5 schalen samen de afhankelijke variabele vormen, geeft SPSS de foutmelding "the fit is perfect". Vandaar mijn vraag of ik op een andere manier kan aantonen in hoeverre de 5 schalen van invloed zijn![]()
Hopelijk is het zo wat duidelijker
Volgens mij bedoelt hij dat ja.quote:Op donderdag 7 augustus 2014 11:30 schreef dotKoen het volgende:
[..]
Begrijp ik het goed dat elk van die subschalen gemeten wordt met ongeveer 8 van de 42 vragen en dat het alle 42 vragen samen merkmeerwaarde meten?
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |