abonnement Unibet Coolblue
pi_133053394
quote:
2s.gif Op vrijdag 8 november 2013 15:02 schreef Z het volgende:
R biedt daar allerlei mogelijkheden voor (lijnen met marges). Ik kan je niet precies vertellen hoe dat aan te pakken.
quote:
0s.gif Op vrijdag 8 november 2013 15:44 schreef Felagund het volgende:
ggplot2 (pakket van R) biedt o.a. de mogelijkheid om de transparantie van punten scatterplots aan te passen, wat patroonherkenning een stuk beter opmaakt. De syntax van dit pakket (plots opgebouwd uit lagen) maakt het ook makkelijk om er een lijn aan toe te voegen.

Ik kan kijken of ik een simpel voorbeeldje kan maken.
Thanks, Ik heb al het een en ander met ggplot gedaan in R maar heb R tot nu toe alleen gebruikt voor datasimulatie etc. Zo te zien is het tijd geworden ook dataanalyse in R te leren doen :P
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_133053707
Maar SPSS blijft een fantastisch pakket. Vandaag dingen gedaan met data restructure en autorecode. Dat zou in andere pakketten uren geduurd hebben en in SPSS zo gepiept. Maar naar mate databestanden groter worden, verwacht ik steeds minder met SPSS te doen. En deste meer met R en Python (pandas).
Aldus.
pi_133053797
quote:
2s.gif Op vrijdag 8 november 2013 19:11 schreef Z het volgende:
Maar SPSS blijft een fantastisch pakket. Vandaag dingen gedaan met data restructure en autorecode. Dat zou in andere pakketten uren geduurd hebben en in SPSS zo gepiept. Maar naar mate databestanden groter worden, verwacht ik steeds minder met SPSS te doen. En deste meer met R en Python (pandas).
Hmm bij mij is het precies andersom, mijn t-toetsen durf ik wel in R te doen, het is mijn 6000N 300 variabelen dataset waar ik het toch wel heel erg fijn vind om mijn data te kunnen zien.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_133053903
Dat begrijp ik. Maar kan je in R toch ook?
Aldus.
pi_133081617
Poeh, ik zit muurvast met iets dat waarschijnlijk heel simpel is. Hoop dat iemand mij hier kan helpen!

Ik heb vier condities, elke proefpersoon heeft één hiervan doorlopen.
De condities zijn genummerd van 1 tm 4. Dat ziet er dus zo uit:



(klein stukje, want 300 proefpersonen)

Nu wil ik één variabele maken waarin ik kan zien wie welke conditie heeft doorlopen, ik wil dus eigenlijk die 4 variabelen van de afbeelding in één variabele proppen. Weet iemand hoe ik dit voor elkaar krijg?
  Redactie Games zaterdag 9 november 2013 @ 17:11:35 #181
181272 crew  Noppie2000
pi_133081721
quote:
0s.gif Op zaterdag 9 november 2013 17:06 schreef Bakkerd het volgende:
Poeh, ik zit muurvast met iets dat waarschijnlijk heel simpel is. Hoop dat iemand mij hier kan helpen!

Ik heb vier condities, elke proefpersoon heeft één hiervan doorlopen.
De condities zijn genummerd van 1 tm 4. Dat ziet er dus zo uit:

[ afbeelding ]

(klein stukje, want 300 proefpersonen)

Nu wil ik één variabele maken waarin ik kan zien wie welke conditie heeft doorlopen, ik wil dus eigenlijk die 4 variabelen van de afbeelding in één variabele proppen. Weet iemand hoe ik dit voor elkaar krijg?
Kan je ze niet simpelweg via compute bij elkaar optellen? Ervanuitgaande dat iedereen maar één conditie heeft doorlopen, krijg je dan dus of 0 +0+0+1 = conditie 1, 0+0+0+2 = conditie 2 enzovoorts. Dan zie je dus aan de hand van de uitkomst welke conditie dat is geweest :)
pi_133081980
HELD!

En dan te bedenken dat ik gisteren en vandaag de compute- en transform functies echt helemaal binnestebuiten heb gekeerd. Thanks :)
pi_133231640
Ik bijt me hier nog steeds op stuk.

Toets of je mag concluderen dat meer dan 30% van het personeel langer dan 30 minuten reistijd heeft.

Hierbij heb ik de binomiale toets gebruikt.


Nu heb ik deze test uitgevoerd (binomiale.. volgens mij de goede) en zie ik dat de significantie zo ontzettend laag is, onder mijn onbetrouwbaarheid van 5%.. hieruit mag ik dan toch concluderen dat 30% van het personeel een reistijd langer dan 30 minuten heeft?

Alvast bedankt..

[ Bericht 3% gewijzigd door ballenbak015 op 13-11-2013 21:38:17 ]
pi_133235799
quote:
0s.gif Op woensdag 13 november 2013 21:11 schreef ballenbak015 het volgende:
Ik bijt me hier nog steeds op stuk.

Toets of je mag concluderen dat meer dan 30% van het personeel langer dan 30 minuten reistijd heeft.

Hierbij heb ik de binomiale toets gebruikt.
[ afbeelding ]

Nu heb ik deze test uitgevoerd (binomiale.. volgens mij de goede) en zie ik dat de significantie zo ontzettend laag is, onder mijn onbetrouwbaarheid van 5%.. hieruit mag ik dan toch concluderen dat 30% van het personeel een reistijd langer dan 30 minuten heeft?

Alvast bedankt..
Voor de zekerheid, je hebt niet het hele personeelsbestand gevraagd naar hun reistijd toch?
pi_133236138
quote:
0s.gif Op woensdag 13 november 2013 22:28 schreef Operc het volgende:

[..]

Voor de zekerheid, je hebt niet het hele personeelsbestand gevraagd naar hun reistijd toch?
Nee, de dataset bestaat uit de gegevens van drie instituten dus niet het gehele personeelsbestand.
pi_133249785
Kan je een enkelvoudige regressie analyse en/of een Chi Square analyse uitvoeren wanneer de N verschilt per schaal (Door missings)?

ps. Ik heb hier eerder een vraag gesteld over mijn masterscriptie en voor degenen mij hierbij hebben proberen te helpen: Het is gelukt. Allereerst kwam mijn begeleidster erachter dat ze een fout had gemaakt dus dat haar feedback niet klopte en we hebben er geen frequentiemaat, maar een prevalentiemaat van gemaakt uiteindelijk (en dus kan ik de Chi-Square doen :-) )
pi_133696496
quote:
0s.gif Op donderdag 14 november 2013 13:22 schreef elineee het volgende:
Kan je een enkelvoudige regressie analyse en/of een Chi Square analyse uitvoeren wanneer de N verschilt per schaal (Door missings)?

ps. Ik heb hier eerder een vraag gesteld over mijn masterscriptie en voor degenen mij hierbij hebben proberen te helpen: Het is gelukt. Allereerst kwam mijn begeleidster erachter dat ze een fout had gemaakt dus dat haar feedback niet klopte en we hebben er geen frequentiemaat, maar een prevalentiemaat van gemaakt uiteindelijk (en dus kan ik de Chi-Square doen :-) )
Goed om te horen dat het gelukt is!

Tegelijkertijd begrijp ik helaas je nieuwe vraag niet. Een chi-square gaat over nominale verdelingen dus ik begrijp niet hoe dat iets te maken kan hebben met een schaal?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_134078061
Ben, na jaren geen SPSS en statistiek toegepast te hebben, nu op zeer pragmatistisch niveau bezig met het verwerken van data.Ik heb naast een 24 tal diepte interviews gehouden te hebben de respondenten ook vragenlijsten laten invullen.

Nu wil ik kijken, middels een T-toets, of groep A significant hoger scoort dan groep B in mijn onderzoek. Het antwoord is (voorlopig) dat dat niet het geval is.

Maar ik neem aan dat SPSS er van uit gaat dat die 24 respondenten een steekproef vormen uit een (zeer) grote populatie. Wat niet het geval is, ik schat de populatie op onder de 100 zelfs. Ik vrees dat dit een grote invloed heeft op de resultaten van de T-toets.

Enig idee hoe SPSS redeneert in deze kwestie en hoe ik dit anders kan aanpassen? Zoals ik al zei is het al een paar jaar geleden dat ik veel met SPSS en statistiek te maken had dus het kan zijn dat ik wat basiskennis mis in deze kwestie...
Patat Friet
pi_134104637
quote:
0s.gif Op maandag 9 december 2013 12:59 schreef ganzenherder het volgende:
Ben, na jaren geen SPSS en statistiek toegepast te hebben, nu op zeer pragmatistisch niveau bezig met het verwerken van data.Ik heb naast een 24 tal diepte interviews gehouden te hebben de respondenten ook vragenlijsten laten invullen.

Nu wil ik kijken, middels een T-toets, of groep A significant hoger scoort dan groep B in mijn onderzoek. Het antwoord is (voorlopig) dat dat niet het geval is.

Maar ik neem aan dat SPSS er van uit gaat dat die 24 respondenten een steekproef vormen uit een (zeer) grote populatie. Wat niet het geval is, ik schat de populatie op onder de 100 zelfs. Ik vrees dat dit een grote invloed heeft op de resultaten van de T-toets.

Enig idee hoe SPSS redeneert in deze kwestie en hoe ik dit anders kan aanpassen? Zoals ik al zei is het al een paar jaar geleden dat ik veel met SPSS en statistiek te maken had dus het kan zijn dat ik wat basiskennis mis in deze kwestie...
De grootte van de populatie maakt in principe niet uit.Wel is het zo dat je steekproef (24 per conditie of 24 in totaal?) extreem klein is, je power zal dus vrij laag zijn. Zo laag dat, als er echt een verschil is in de populatie, de kans dat je dit verschil statistisch aan kunt tonen vrij klein zal zijn door middel van t-toetsen.
Als je iets meer info geeft over wat en hoe je precies gemeten hebt, kan ik misschien iets meer zeggen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_135242442
Binnenkort dien ik mijn eindrapport voor mijn afstuderen in te leveren, met een aantal resultaten die ik tot nu toe van Thesistools binnen heb probeer ik al een beetje te oefenen met het uitlezen en verwerken van de statistieken zodat ik niet over een tijdje alles nog moet ontdekken in SPSS.

Nu loop ik tegen het volgende probleem aan, ik heb het .xls bestand geïmporteerd naar SPSS en dit geeft al een redelijk goede weergave, als ik nu wat crosstables of frequencies probeer te testen en te bekijken telt ie 135 respondenten, dit zijn er eigenlijk 123. Tevens deelt ie de legenda verkeerd in, misschien dat de onderstaande afbeeldingen het verhaal iets duidelijker maken.

Op afbeelding 1 kun je zien dat SPSS de antwoorden '1=man' voornamelijk allemaal onder gewoon '1' geschaard heeft. Afbeelding twee laat de eerste elf (lege) cellen zien welke SPSS ook als respondent meetelt (er zijn nog andere cellen aan het einde die het op 135 laten uitkomen). Mijn vraag is dus hoe ik beide problemen kan verhelpen om alles duidelijk en leesbaar eruit te laten komen, ben helaas niet zo'n ster met SPSS.



pi_135242820
quote:
0s.gif Op woensdag 8 januari 2014 18:56 schreef Thrills het volgende:
Binnenkort dien ik mijn eindrapport voor mijn afstuderen in te leveren, met een aantal resultaten die ik tot nu toe van Thesistools binnen heb probeer ik al een beetje te oefenen met het uitlezen en verwerken van de statistieken zodat ik niet over een tijdje alles nog moet ontdekken in SPSS.

Nu loop ik tegen het volgende probleem aan, ik heb het .xls bestand geïmporteerd naar SPSS en dit geeft al een redelijk goede weergave, als ik nu wat crosstables of frequencies probeer te testen en te bekijken telt ie 135 respondenten, dit zijn er eigenlijk 123. Tevens deelt ie de legenda verkeerd in, misschien dat de onderstaande afbeeldingen het verhaal iets duidelijker maken.

Op afbeelding 1 kun je zien dat SPSS de antwoorden '1=man' voornamelijk allemaal onder gewoon '1' geschaard heeft. Afbeelding twee laat de eerste elf (lege) cellen zien welke SPSS ook als respondent meetelt (er zijn nog andere cellen aan het einde die het op 135 laten uitkomen). Mijn vraag is dus hoe ik beide problemen kan verhelpen om alles duidelijk en leesbaar eruit te laten komen, ben helaas niet zo'n ster met SPSS.

[ afbeelding ]

[ afbeelding ]
De eerste 11 cases (rijen dus) kun je gewoon deleten uit het SPSS bestand. Kijk ook even of er onder de laatste respondent niet nog een rij is waarin iets staat (totaal ofzo) en haal die dan ook weg.

Wat betreft 1 en 1=man: kijk in die kolom of er bij de respondenten 1 of 1=man staat. In principe is het het netste om alleen met de nummers te werken (1 en 2 in dit geval) en dan via Variable View de Labels aan te passen dat 1=man en 2= vrouw. Je kunt dan in het data venster bovenin nog klikken op of je de weergave wil in cijfers (1 en 2) of de labels (man en vrouw). Dit zou al redelijk wat moeten oplossen. Zo niet, laat even weten welk probleem je dan overhoudt (het liefste weer met screenshots.)
pi_135243315
quote:
0s.gif Op woensdag 8 januari 2014 19:03 schreef Operc het volgende:

[..]

De eerste 11 cases (rijen dus) kun je gewoon deleten uit het SPSS bestand. Kijk ook even of er onder de laatste respondent niet nog een rij is waarin iets staat (totaal ofzo) en haal die dan ook weg.

Wat betreft 1 en 1=man: kijk in die kolom of er bij de respondenten 1 of 1=man staat. In principe is het het netste om alleen met de nummers te werken (1 en 2 in dit geval) en dan via Variable View de Labels aan te passen dat 1=man en 2= vrouw. Je kunt dan in het data venster bovenin nog klikken op of je de weergave wil in cijfers (1 en 2) of de labels (man en vrouw). Dit zou al redelijk wat moeten oplossen. Zo niet, laat even weten welk probleem je dan overhoudt (het liefste weer met screenshots.)
Super, bedankt! Dit heeft inderdaad de problemen opgelost. :)
  woensdag 8 januari 2014 @ 19:23:59 #193
165047 eleganza
ik hou van koekjes.
pi_135243935
^ Dit vond ik het grote probleem van Thesistools :( De datafile moet je eerst nog half slopen :')
+1 voor Qualtrics, vind ik echt stukken beter dan TT.
Koekje d'r bij?
pi_135244572
quote:
0s.gif Op woensdag 8 januari 2014 19:12 schreef Thrills het volgende:

[..]

Super, bedankt! Dit heeft inderdaad de problemen opgelost. :)
Mooi :)
quote:
0s.gif Op woensdag 8 januari 2014 19:23 schreef eleganza het volgende:
^ Dit vond ik het grote probleem van Thesistools :( De datafile moet je eerst nog half slopen :')
+1 voor Qualtrics, vind ik echt stukken beter dan TT.
Nooit Thesistools gebruikt (wel vaak langs zien komen). Kan Qualtrics data opslaan als SPSS-bestand? Een programma wat ik ooit gebruikte kon dat wel, maar geen idee meer hoe dat heette.
  woensdag 8 januari 2014 @ 19:40:28 #195
165047 eleganza
ik hou van koekjes.
pi_135244896
quote:
0s.gif Op woensdag 8 januari 2014 19:35 schreef Operc het volgende:

[..]

Nooit Thesistools gebruikt (wel vaak langs zien komen). Kan Qualtrics data opslaan als SPSS-bestand? Een programma wat ik ooit gebruikte kon dat wel, maar geen idee meer hoe dat heette.
Jup, je kunt je data rechstreeks exporteren naar een .sav bestand dat je direct in spss kunt laden, en de variabelen ook al direct een naam geven in qualtrics als je de vragenlijst maakt zodat je je niet dood zoekt in een databestand met 130 variabelen (story of my life). De eerste 6-7 variabelen zijn niet echt relevant, maar data over start/eindtijd, ip adres, respondentid en zulk soort dingen als je iets wil zeggen over de vragenlijst zelf :)

Echt, ik studeer nu 7 jaar, en had in mn eerste jaar willen weten van Qualtrics. Het is super gebruiksvriendelijk, en van ThesisTools heb ik nog moeten huilen toen ik mijn hbo scriptie ging schrijven. :'( Veel universiteiten (vaak faculteiten) hebben een abonnement op qualtrics, waardoor je ongelimiteerd aantal respondenten hebt. Als je het als student zonder abo heb je max 250 respondenten, maar meestal is dat meer dan voldoende.
Koekje d'r bij?
pi_135245016
quote:
0s.gif Op woensdag 8 januari 2014 19:40 schreef eleganza het volgende:

[..]

Jup, je kunt je data rechstreeks exporteren naar een .sav bestand dat je direct in spss kunt laden, en de variabelen ook al direct een naam geven in qualtrics als je de vragenlijst maakt zodat je je niet dood zoekt in een databestand met 130 variabelen (story of my life). De eerste 6-7 variabelen zijn niet echt relevant, maar data over start/eindtijd, ip adres, respondentid en zulk soort dingen als je iets wil zeggen over de vragenlijst zelf :)

Echt, ik studeer nu 7 jaar, en had in mn eerste jaar willen weten van Qualtrics. Het is super gebruiksvriendelijk, en van ThesisTools heb ik nog moeten huilen toen ik mijn hbo scriptie ging schrijven. :'( Veel universiteiten (vaak faculteiten) hebben een abonnement op qualtrics, waardoor je ongelimiteerd aantal respondenten hebt. Als je het als student zonder abo heb je max 250 respondenten, maar meestal is dat meer dan voldoende.
Dat is praktisch inderdaad. :Y Om het werken aan je scriptie (gok ik?) nog makkelijker te maken: gebruik Mendeley voor je literatuur/referenties. Scheelt veel geklooi.

Binnenkort eens naar Qualtrics kijken dan (vooral voor de combinatie met SPSS.)
  woensdag 8 januari 2014 @ 19:45:32 #197
165047 eleganza
ik hou van koekjes.
pi_135245180
quote:
0s.gif Op woensdag 8 januari 2014 19:42 schreef Operc het volgende:

[..]

Dat is praktisch inderdaad. :Y Om het werken aan je scriptie (gok ik?) nog makkelijker te maken: gebruik Mendeley voor je literatuur/referenties. Scheelt veel geklooi.

Binnenkort eens naar Qualtrics kijken dan (vooral voor de combinatie met SPSS.)
Laat ik nou net bijna klaar zijn met mn literatuur :@ :+ Ik ben mn scriptie een beetje verkeerd om aan het schrijven, eerst mn vragenlijst, dan methode/literatuur, dan analyse. (en dan de rest :') ) Maar ik kom hier nog wel even terug voor regressieanalyse. Heb ooit statistiek 1 gevolgd, maar ik ben om te huilen met cijfers. Sla mezelf nog steeds om 't feit dat ik een vragenlijst heb gekozen en niet kwalitatief ben gaan onderzoeken 8)7

* eleganza is echt om te huilen met cijfers en statistiek
Koekje d'r bij?
  maandag 13 januari 2014 @ 00:18:36 #198
78693 Hanzel_lane
Made by cerror
pi_135423586
Helden!

Ik zit met de 2 volgende spss vragen die ik niet kan oplossen:

Het gaat om de volgende spss file:

SPSS File

en de volgende 2 vragen:
1.
On the one hand, the genre may have an influence on the rating of the movie; on the other hand, men and women may differ in their preferences for the different genres. Please analyze whether gender has an effect on the preference for the presented movies and take into account that men and women may have different preferences for the genres.

2.
In the end, the management wants to obtain an explanation for the number of cinema visits in
the last 12 months. Therefore, you are asked to estimate a regression model. Please select a
maximum of 5 predictor variables (plus the constant). (Suggestion: choose the option ‘Linear
regression’ and ‘Method enter’).
a) Is the model you formulate overall significant?
b) Are the signs for the regression parameters as expected – if not, can you find an
explanation?
c) What is the R2
of the model, and what does it represent? Discuss the result critically?
d) Are there any multicollinearity issues?

Ik ben al de hele dag bezig, en ondanks vragen aan medestudenten (die het ook niet weten), boeken en internet; lukt het me niet... Hopelijk kan iemand me (op weg) helpen! Dank ieder.
Op vrijdag 30 juli 2004 13:25 schreef Houzer het volgende:
Hanzel is zo'n knuffelnewbie O+
pi_135423747
Ik kan je file niet zien want heb geen SPSS hier, vraag 2 is:

analyze(of dexcriptive statistics) -> lineair regression -> constante + 5 variabelen aantikken -> druk op ok.

Dan kan je a/b/c/d beantwoorden.

R2 is verklaringskracht, hoge R2 is goed, lage R2 is slecht(met max van 1.0)
  maandag 13 januari 2014 @ 00:32:40 #200
78693 Hanzel_lane
Made by cerror
pi_135423967
thanks voor je snelle respons...

2a en 2b zijn dan wel (redelijk) duidelijk. Ik krijg inderdaad wel een r square uitkomst van 0,038, maar geen idee wat hier mee moet.

en ik heb geen idee wat e bij vraag 2d de bedoeling is!
Op vrijdag 30 juli 2004 13:25 schreef Houzer het volgende:
Hanzel is zo'n knuffelnewbie O+
abonnement Unibet Coolblue
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')