Woordenwolken zijn imho alleen bruikbaar als het korte antwoorden (liefst 1 woord) betreft.quote:Op dinsdag 30 mei 2017 18:54 schreef ZuidGrens het volgende:
[..]
Dat is wel de meest handige (en volgens mij ook een redelijk vaak voorkomende) optie inderdaad.
quote:Op dinsdag 30 mei 2017 19:47 schreef ZuidGrens het volgende:
[..]
Ja, wij houden als vuistregel maximaal drie aan. Maar in mijn geval was het meestal toch 'niet van toepassing' oid
Het is wel erg dom dat je hier pas over na gaat denken als je daadwerkelijk je data moet gaan verwerkenquote:Op dinsdag 30 mei 2017 16:12 schreef koffiehagedis het volgende:
Hi iedereen, ik probeer een dataset te maken in SPSS. De data bestaat uit een enquête met vragen op nominaal niveau. In de enquête zijn per vraag 7 antwoordmogelijkheden, en de optie 'anders, namelijk...'. Ik snap hoe ik een dataset moet opstellen zonder die laatste optie, maar kom er niet uit hoe ik de 'anders, namelijk...' verwerk. Heeft iemand tips in ruil voor eeuwige dankbaarheid?
Maar die leraar heeft je toch een instructie of college gegeven? Dan is dat toch heel eenvoudig op te lossen, zelfs met een beetje logisch nadenken.quote:Op woensdag 31 mei 2017 07:20 schreef koffiehagedis het volgende:
Veel dank voor het meedenken! Hier kan ik absoluut wat mee.
MCH; dit is een opdracht om beter met SPSS te leren werken, de data is mij door een docent aangeleverd. Oordeel niet zo snel.
Een dag is een regelquote:Op donderdag 29 juni 2017 15:44 schreef Z het volgende:
Staat een dag van een respondent op één regel of staat alle data per respondent op 1 regel?
In principe wel, maar met de missende dag erbij en dat voor meerdere subjects in het bestand (die onder elkaar staan)quote:Op donderdag 29 juni 2017 16:07 schreef Z het volgende:
Dus wil je eigenlijk een lege regel toevoegen?
Is dat niet op te lossen bij de data invoer? Anders zou ik het in Excel doen met een marco denk ik, er moeten regels toegevoegd worden.quote:Op donderdag 29 juni 2017 16:30 schreef Temple het volgende:
[..]
In principe wel, maar met de missende dag erbij en dat voor meerdere subjects in het bestand (die onder elkaar staan)
Dank voor je reactie Z! Het is meer voor het kwalitatieve gedeelte van mijn studie, om aan te tonen dat de kwalitatieve analyse representatief is voor de hele populatie. Het wegen zou ik inderdaad moeten doen in mijn kwantitatieve deel!quote:
Volgens mij gaat dit puur om hoe je het opschrijft. Je mag inderdaad niet zeggen dat het hetzelfde is want dat is het niet, alleen berusten de verschillen op toeval en dus is het niet boeiend verder. Je zult met steekproeven enzo altijd beetje verschil hebben want ja dat is nou eenmaal zo, en dit verschil is klein genoeg om te zeggen ok het is goed.quote:Op woensdag 12 juli 2017 15:15 schreef SAB_77 het volgende:
Hi! Iemand die mij kan helpen met het bepalen van de representativiteit van mijn steekproef? Laten we zeggen dat mijn steekproef 30% A, 50%B en 20% C bevat. En ik weet dat de gehele populatie 35% A, 50% B en 15% C bevat
Kan ik dan een Chi square goodness of fit test doen met als expected values de getallen van de populatie? Ik kom dan uit op een p value groter dan 0,05 dus dat zou betekenen dat er geen verschil zou zijn. Maar ik heb wel eens gehoord dat je met een Chi 2 goodness of fit dan niet aan mag nemen dat ze hetzelfde zijn.
Alvast bedankt!
Okeeee, het werd me gisteren iets te veel en was al iets te lang bezig denk ik...quote:Op woensdag 19 juli 2017 18:26 schreef Crack_ het volgende:
Hoihoi, eventjes een checkvraagje
In mijn situatie wordt een advies gegeven en er wordt gevraagd aan mensen welk advies zij daadwerkelijk opvolgen en dan wil ik kijken of er een verschil zit in gegeven advies en daadwerkelijke gedrag. Beide variabelen (advies en gedrag) hebben drie groepen; dus advies ABC en gedrag ABC.
Ik doe een chi-square test en deze is significant. Nu wil ik graag een post-hoc test doen om te kijken waar precies de verschillen zitten in advies - gedrag maarrrr ik kom volgens mij steeds uit op post hoc test within advies of within gedrag zeg maar? Ik wil graag weten welke van de drie groepen van advies verschillend is van welke van de drie groepen van gedrag (dus is a of b of c van advies anders dan a of b of c van gedrag, en nu krijg ik volgens mij is a b of c van gedrag verschillend en dat wil ik niet weten). Ik heb nu gewoon drie variabelen gemaakt van advies a of b of c en gedrag a of b of c en die los met elkaar vergeleken, kan dat zo?
Ennn ik vroeg mij af of chi-square klopt. Zat nogal beetje te kutten met paired maar ik heb geen interventie niks en ik wil iets zeggen over 'als je dit advies krijgt dan is de kans groot dat je dit gaat doen' dus ik dacht hola chi-square
Groetjes kusjes handjes
1 2 3 4 5 | %combineddata(y) data test123; merge een twee; keep variablex; run; |
1 2 3 4 5 | %combineddata(y) data test123; merge een twee; keep &B; run; |
1 2 3 | %let b=variabeleX; %if 2000<&y %then %do; %let B=variabeleZ; %end; |
Hij werkt nu wel zonder dat ik er iets aan heb veranderd. Maar ik heb nu een volgend issue:quote:Op vrijdag 21 juli 2017 14:09 schreef Mynheer007 het volgende:
Ik ben sinds deze week begonnen met SAS.
Nu heb ik een macro geschreven die de handeling verricht voor de jaren 1980-2013 welke als y-waarden worden ingevuld in de macro:
de macro is
[ code verwijderd ]
(de macro is een stuk langer en ingewikkelder maar die kan ik hier niet naar toe kopieren)
Nu is het geval dat de naam van variabele x varieert over tijd. Na 2000 heet variabeleX variabeleZ.
Ik dacht zoiets op te kunnen lossen door variabeleX te vervangen door een %let statement :
[ code verwijderd ]
[ code verwijderd ]
Maar ik kom er niet uit. Zou iemand mij een beetje op weg kunnen helpen?
Thanks. Dat verhielp het probleem inderdaad.quote:Op vrijdag 21 juli 2017 17:44 schreef Z het volgende:
De boel even opnieuw opstarten wellicht? Ik weet niks van SAS maar met Macro's weet je soms niet welke er hoe in het geheugen staat.
Optie 1 valt af omdat je een aanname schendt, namelijk die van onafhankelijke waarnemingen. Dat geldt ook voor optie 2. Repeated measures anova houdt hier wel rekening mee, dus dat lijkt me de voorkeur hebben.quote:Op woensdag 26 juli 2017 16:13 schreef Sonyanijntje het volgende:
Hallo!
Ik hoop dat jullie mij kunnen helpen! Ik heb data van mijn onderzoek maar ik twijfel over statistische test die ik moet gebruiken.
[...]
Iemand een suggestie welke van mijn opties ik het beste kan kiezen?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | %combineddata(y); Mergeddata&y; merge a b; run; %if &y<2003 %then %do; data test&y; merge mergeddata&y d; by db32; run; %end; %if 2003 le &y le 2007 %then %do; data test&y; merge mergeddata&y f; by db45; run; %end; |
Kun je ze niet los van elkaar runnen en die van voor 2003 net zo schrijven als 2003-2007?quote:Op woensdag 2 augustus 2017 12:16 schreef Mynheer007 het volgende:
Ik heb een sas-macro maar er gaat iets niet helemaal naar behoren
[ code verwijderd ]
Ik wil dus verschillende acties uitvoeren voor de jaren voor 2003 en de jaren 2003 tot en met 2007.
Bij het runnen van de macro voor de jaren 2003-2007 gaat alles naar behoren, alleen bij het runnen van de jaren voor 2003 krijg ik een error:
Daaruit blijkt dat de macro op de data van de jaren kleiner dan 2003 ook de actie voor de jaren 2003-2007 uitvoert. Ik zie alleen niet waar de fout in mijn script zit
Ik heb hem herschrevenquote:Op woensdag 2 augustus 2017 12:22 schreef MCH het volgende:
[..]
Kun je ze niet los van elkaar runnen en die van voor 2003 net zo schrijven als 2003-2007?
Ik heb de volgende regel herschreven:quote:Op woensdag 2 augustus 2017 12:22 schreef MCH het volgende:
[..]
Kun je ze niet los van elkaar runnen en die van voor 2003 net zo schrijven als 2003-2007?
1 | %if 2003 le &y le 2007 %then %do; |
1 | %if 2003 le &y AND &y le 2007 %then %do; |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 | makelms <- function(){ # Store the coefficient of linear models with different independent variables cf <- c(coef(lm(Fertility ~ Agriculture, swiss))[2], coef(lm(Fertility ~ Agriculture + Catholic,swiss))[2], coef(lm(Fertility ~ Agriculture + Catholic + Education,swiss))[2], coef(lm(Fertility ~ Agriculture + Catholic + Education + Examination,swiss))[2], coef(lm(Fertility ~ Agriculture + Catholic + Education + Examination +Infant.Mortality, swiss))[2]) print(cf) } # Regressor generation process 1. rgp1 <- function(){ print("Processing. Please wait.") # number of samples per simulation n <- 100 # number of simulations nosim <- 1000 # set seed for reproducability set.seed(4321) # Point A: x1 <- rnorm(n) x2 <- rnorm(n) x3 <- rnorm(n) # Point B: betas <- sapply(1 : nosim, function(i)makelms(x1, x2, x3)) round(apply(betas, 1, var), 5) } # Regressor generation process 2. rgp2 <- function(){ print("Processing. Please wait.") # number of samples per simulation n <- 100 # number of simulations nosim <- 1000 # set seed for reproducability set.seed(4321) # Point C: x1 <- rnorm(n) x2 <- x1/sqrt(2) + rnorm(n) /sqrt(2) x3 <- x1 * 0.95 + rnorm(n) * sqrt(1 - 0.95^2) # Point D: betas <- sapply(1 : nosim, function(i)makelms(x1, x2, x3)) round(apply(betas, 1, var), 5) } betas |
1 2 3 | dataset2000<-read_sas("dataset2000.sas7dbat") plot(dataset2000, x,y) etc.... |
quote:Op zaterdag 26 augustus 2017 15:38 schreef Z het volgende:
Moet kunnen. "Putting all the data frames in a list and looping over that list with lapply".
Bedankt voor de hulp, maar dit gaat specifiek over de dataset. Maar ik wil ook dat de functie de titel van de grafiek aanpast etc., maar aangezien die tussen "" staat, doet de functie daar niets mee.quote:Op zaterdag 26 augustus 2017 22:22 schreef ralfie het volgende:
ehh, paste0("dataset", n, ".sas7dbat") ?
Mann-whitneytoets.quote:Op woensdag 30 augustus 2017 16:49 schreef Lyrebird het volgende:
Populatie a: 500.000 samples, mean = 19, stdv = 10
Populatie b: 500 samples, mean = 23, stdv = 11
Populaties zijn niet normaal verdeeld.
Wat voor een test kan ik het beste gebruiken om aan te tonen of populatie b binnen/buiten populatie a valt?
Nee, want je schendt de assumptie van onafhankelijke waarnemingen, wanneer er sprake is van meerdere metingen per persoon. Een waarneming is dan niet meer onafhankelijk want het is immers afhankelijk van de persoon.quote:Op donderdag 21 september 2017 19:23 schreef No-P het volgende:
Graag uw hulp.
Ik heb van opeenvolgende jaren een populatie gevolgt waarvan een proportie positief scored op een test (dichotoom: positief of negatief).
Graag wil ik een trend analyse doen om aan te tonen dat de proportie positieve testen toeneemt in de tijd. De gescreende individuen in de populatie die worden getest verschillen per jaar.
Welke methode is hier geschikt voor? Ik denk dat ik met logistic regression een heel eind kom.
Wat wil je uberhaupt onderzoeken?quote:Op vrijdag 13 oktober 2017 21:21 schreef icecreamfarmer_NL het volgende:
Meer statistiek/onderzoek maar het heeft een wiskunde component en het is niet de moeite om een apart topic te openen.
Ik zit met het probleem dat ik niet weet of ik een t-test moet doen of een regressie. In het verleden heb ik het allemaal gehad maar het is weg gezakt.
In het kort het onderzoek:
Op dag 1 wordt gevraagd naar de mening over A. (Via een likert schaal).
Op dag 2 wordt onder een compleet andere groep mensen gevraagd naar de mening over B.
Het is trouwens onbekend of de variatie van beiden gelijk zijn.
Nu is de vraag moet ik dit onderzoeken met een double tail independent two sample T test of Welchers T test. Of dat ik het beter kan doen met een regressie (least squares).
Zo ja welke moet ik kiezen en vooral waarom. Mijn gevoel en volgens wiki zegt de T test echter kom ik niet echt achter de voordelen van een T-test over een regressie.
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
[ Bericht 57% gewijzigd door peperkoekmannetje op 30-10-2017 14:16:42 (toevoeging) ]
SPOILEROm spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.Man is de baas, vrouw kent haar plaats.
Beetje googlen, pagina 2: http://canmedia.mcgrawhil(...)bow02371_OLC_7_9.pdfquote:
Thanks voor jouw responsequote:Op donderdag 4 januari 2018 19:24 schreef darthsideaus1 het volgende:
[..]
Beetje googlen, pagina 2: http://canmedia.mcgrawhil(...)bow02371_OLC_7_9.pdf
Bijna goed dus, je hebt te maken met de sample standaarddeviatie en niet die van de populatie.
Oh sorry geen idee, ik weet slechts een beetje af van de meest standaard betrouwbaarheidsintervallen vanwege het premastervak dat ik volg. Het enige dat ik op een rekenmachine kan, is het gemiddelde en de standaardafwijking berekenenquote:Op vrijdag 5 januari 2018 01:23 schreef phpmystyle het volgende:
[..]
Thanks voor jouw response
Kun jij voordoen hoe je hem in de rekenmachine zet? Ik zit ergens te kutten met zo'n haakje, dus ik krijg voortdurend afwijkende uitkomsten.
Forum Opties | |
---|---|
Forumhop: | |
Hop naar: |