abonnement Unibet Coolblue Bitvavo
pi_146458915
Okee, nieuwe vraag :)

In mijn dataset heb ik een aantal missings waardoor de eindvariabele, probleemgedrag, bij respondenten waarbij 1 of meer antwoorden ontbreken niet wordt uitgerekend. Ik weet dat er een trucje bestaat waarbij ik aan kan geven dat de eindvariabele ook met 1 (of 2, 3 etc) missing uitgerekend moet worden, waarbij de missing ingevuld wordt als het gemiddelde van alle andere variabelen. Maar hoe doe ik dat ook alweer?

Google wil me tot nu toe niet echt verder helpen..

youtube gelukkig wel:

[ Bericht 35% gewijzigd door fh101 op 09-11-2014 13:47:54 ]
pi_146904987
Waarschijnlijk heel simpel maar ik zie het echt even niet meer.



De ANOVA geeft F = 150.672. Hoe komen ze van dat getaal op die kans van P>0.0005 :?

Ik zit me rot te zoeken in de tabellen maar ik kan het niet vinden :')
pi_146905295
quote:
0s.gif Op zaterdag 22 november 2014 18:53 schreef -Strawberry- het volgende:
Waarschijnlijk heel simpel maar ik zie het echt even niet meer.

[ afbeelding ]

De ANOVA geeft F = 150.672. Hoe komen ze van dat getaal op die kans van P>0.0005 :?

Ik zit me rot te zoeken in de tabellen maar ik kan het niet vinden :')
Als je handmatig rekent, kijk je in een F-tabel. Bijvoorbeeld deze:
http://homepages.wmich.edu/~hillenbr/619/AnovaTable.pdf

De kritieke f-waarde is 3.20 in jouw voorbeeld (bij alfa = 5%), dus is de test significant. (Want jouw f-waarde is hoger.)
pi_146905569
quote:
1s.gif Op zaterdag 22 november 2014 19:07 schreef Operc het volgende:

[..]

Als je handmatig rekent, kijk je in een F-tabel. Bijvoorbeeld deze:
http://homepages.wmich.edu/~hillenbr/619/AnovaTable.pdf

De kritieke f-waarde is 3.20 in jouw voorbeeld (bij alfa = 5%), dus is de test significant. (Want jouw f-waarde is hoger.)
Ik heb een andere tabel (minder compleet). :{

Maar met jouw tabel snap ik het, thanks!

[ Bericht 3% gewijzigd door -Strawberry- op 22-11-2014 21:31:39 ]
pi_147276426
hallo mede statistiek fanaten,

ik heb een vraag; Ik moet onderzoeken hoe Tutoring effect heeft op het eindexamen cijfer.
intelligentie, stress en Gemiddeld_schoolexamen_cijfer zijn ook in de data set ingesloten, tevens zijn sommigen studenten random aangemoedigd om deel te nemen aan tutoring, dus er is ook een encouragement effect.

wij zaten te denken aan een randomisatie met een encouragement design, als beste manier om te testen.

Alleen zou ik graag willen weten hoe je zon encouragement design precies uitvoert.
Het liefst met spss, maar met eviews is ook een optie.

graag hoor ik van jullie,
pi_147279897
quote:
0s.gif Op donderdag 4 december 2014 13:05 schreef thephantomkij het volgende:
hallo mede statistiek fanaten,

ik heb een vraag; Ik moet onderzoeken hoe Tutoring effect heeft op het eindexamen cijfer.
intelligentie, stress en Gemiddeld_schoolexamen_cijfer zijn ook in de data set ingesloten, tevens zijn sommigen studenten random aangemoedigd om deel te nemen aan tutoring, dus er is ook een encouragement effect.

wij zaten te denken aan een randomisatie met een encouragement design, als beste manier om te testen.

Alleen zou ik graag willen weten hoe je zon encouragement design precies uitvoert.
Het liefst met spss, maar met eviews is ook een optie.

graag hoor ik van jullie,
Zoek je het antwoord of hulp bij het vinden van het antwoord/begrip?
Indien het tweede, ik begrijp niet zo goed wat je bedoelt met een "randomisatie met een encouragement design".
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_147285625
quote:
0s.gif Op zaterdag 22 november 2014 19:18 schreef -Strawberry- het volgende:

[..]

Ik heb een andere tabel (minder compleet). :{

Maar met jouw tabel snap ik het, thanks!
Graag gedaan. :)
quote:
0s.gif Op donderdag 4 december 2014 13:05 schreef thephantomkij het volgende:
hallo mede statistiek fanaten,

ik heb een vraag; Ik moet onderzoeken hoe Tutoring effect heeft op het eindexamen cijfer.
intelligentie, stress en Gemiddeld_schoolexamen_cijfer zijn ook in de data set ingesloten, tevens zijn sommigen studenten random aangemoedigd om deel te nemen aan tutoring, dus er is ook een encouragement effect.

wij zaten te denken aan een randomisatie met een encouragement design, als beste manier om te testen.

Alleen zou ik graag willen weten hoe je zon encouragement design precies uitvoert.
Het liefst met spss, maar met eviews is ook een optie.

graag hoor ik van jullie,
Bedoel je met random aangemoedigd dat je weet wie er zijn aangemoedigd en je dus een interventie aan het testen bent, of weet je sowieso niet wie er zijn aangemoedigd en wie niet? (De niet-wetenschappelijke betekenis van 'random' zeg maar. :P)
pi_147478635
Ik heb een aantal vragen met betrekking tot SPSS in verband met een opdracht voor school.
Alle gegevens (codeboek) staan al in SPSS, ik moet echter de volgende vragen beantwoorden.

Hoeveel vragenlijsten zijn er niet volledig ingevuld?
Hoe kun je alle ingevulde vragenlijsten selecteren?
Hoe kun je niet volledig ingevulde vragenlijsten weggooien?

Hopelijk weet een van jullie hoe dit moet.

Gr en alvast bedankt
pi_147682219
Hoe kan ik met SPSS de antwoorden die ik kreeg op een Likert-schaal van 0-6, hercoderen naar 0-10?
pi_147682499
quote:
0s.gif Op woensdag 17 december 2014 21:01 schreef TineV het volgende:
Hoe kan ik met SPSS de antwoorden die ik kreeg op een Likert-schaal van 0-6, hercoderen naar 0-10?
*1.666?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_147683080
Bedankt voor je reactie, ik ben aan het zoeken via welke opdracht in SPSS ik dat kan ingeven (recode,...)?
pi_147683190
Waarom zou je het willen? Methodologisch niet heel netjes ook.

compute var_x = var_x * 1,6667.
exe.
Aldus.
pi_147683409
Mijn antwoorden worden nu weergegeven in scores op 6, niet echt heel overzichtelijk. Beter zou zijn om scores op 10 weer te geven.
pi_147685868
Het blijven maar zes waarden.
Aldus.
pi_147687885
quote:
0s.gif Op woensdag 17 december 2014 21:21 schreef TineV het volgende:
Mijn antwoorden worden nu weergegeven in scores op 6, niet echt heel overzichtelijk. Beter zou zijn om scores op 10 weer te geven.
Kort door de bocht: als je scores op 10 had willen hebben, had je er bij de dataverzameling om moeten vragen. Vooral omdat respondenten 0-10 heel anders opvatten dan 0-6. Enzoals hierboven gezegd, het aantal mogelijke waarden verandert niet. :)
pi_147688460
Ja misschien is mijn vraag niet heel duidelijk, het gaat over herschalen naar een score tussen 0 en 10 of 0 en 100%, dat leest en interpreteert wat makkelijker.
pi_147784771
Hallo iedereen,

ik heb een spss-vraagje.
Voor mijn onderzoek heb ik enquêtes uitgestuurd waarbij respondenten op verschillende items moeten antwoorden op een 7punten likert schaal (van helemaal niet akkoord (1) tot helemaal akkoord (7). Na reliability analysis heb ik de items telkens samengevoegd tot verschillende variabelen. Hiervoor heb ik het gemiddelde genomen van de waarden van de bijhorende items.

1) Eerst was mijn schaal dus duidelijk ordinaal. Door het nemen van de gemiddelden van de samengevoegde scores van telkens 5 items kom ik nu kommagetallen uit. Moet ik deze afronden naar gehele getallen, zodat 1 nog steeds 'helemaal niet akkoord' betekent, en en 4 ' neutraal ' ..., of behoud ik de kommagetallen voor mijn onderzoek en worden dit hierdoor intervalschalen?

2) Eigenlijk bevraag ik dimensies. Dat wil zeggen dat in mijn studie rond socialisatie hoge scores bijvoorbeeld betekenen dat respondenten in groep werden opgeleid, en lage scores betekenen dat respondenten individueel werden opgeleid. Nu wil ik telkens nagaan wat bijvoorbeeld de invloed is van de socialisatietactiek 'collectief' op de tevredenheid van de respondent (ook gemeten op een 7pointlikertschaal'. Zo wens ik uiteindelijk na te gaan of collectieve socialiatie (hoge score op die variabel) beter is dan individuele socialisatie (lage score op die variabele) voor de tevredenheid van de respondent.
Iemand enig idee welke stappen ik hiervoor in spss moet uitvoeren en welke analyses ik moet doen?

Sorry voor de lange post.
Alvast heel erg bedankt!
pi_147785200
quote:
0s.gif Op woensdag 17 december 2014 22:41 schreef TineV het volgende:
Ja misschien is mijn vraag niet heel duidelijk, het gaat over herschalen naar een score tussen 0 en 10 of 0 en 100%, dat leest en interpreteert wat makkelijker.
Het punt is (zoals Z al aangaf) dat het maar 7 waarden blijven (0-6). Stel je rekent het om naar 0-10, dan is de score "1" bijvoorbeeld niet mogelijk, want 0 op 0-6 blijft 0 bij 0-10 en 1 bij 0-6 wordt 1.667 bij 0-10. Het lijkt daardoor dus alsof je een continue schaal hebt, terwijl het nog steeds maar 7 waardes blijven. Omrekenen naar 0-10 maakt het misschien meer intuïtief, maar de vraag is of dat dan wel weergeeft wat je aan data hebt verzameld.

quote:
0s.gif Op zaterdag 20 december 2014 20:42 schreef C_737 het volgende:
Hallo iedereen,

ik heb een spss-vraagje.
Voor mijn onderzoek heb ik enquêtes uitgestuurd waarbij respondenten op verschillende items moeten antwoorden op een 7punten likert schaal (van helemaal niet akkoord (1) tot helemaal akkoord (7). Na reliability analysis heb ik de items telkens samengevoegd tot verschillende variabelen. Hiervoor heb ik het gemiddelde genomen van de waarden van de bijhorende items.

1) Eerst was mijn schaal dus duidelijk ordinaal. Door het nemen van de gemiddelden van de samengevoegde scores van telkens 5 items kom ik nu kommagetallen uit. Moet ik deze afronden naar gehele getallen, zodat 1 nog steeds 'helemaal niet akkoord' betekent, en en 4 ' neutraal ' ..., of behoud ik de kommagetallen voor mijn onderzoek en worden dit hierdoor intervalschalen?
Sommige wetenschappers argumenteren dat je bij Likert-schalen uit kunt gaan van een continue variabele, als de Likert-schaal genoeg opties heeft (bij 3 opties wordt het lastiger.) Dus als je de literatuur induikt en dat kunt onderbouwen, zijn kommagetallen prima te verantwoorden. Als je de score op een schaal wilt berekenen zou ik gewoon de totaalscore pakken, maar ik weet niet of dat in jouw onderzoek toepasbaar is. Als je daarna een groepsgemiddelde berekent ligt het voor de hand om een getal met 2 cijfers achter de komma te rapporteren.

quote:
2) Eigenlijk bevraag ik dimensies. Dat wil zeggen dat in mijn studie rond socialisatie hoge scores bijvoorbeeld betekenen dat respondenten in groep werden opgeleid, en lage scores betekenen dat respondenten individueel werden opgeleid. Nu wil ik telkens nagaan wat bijvoorbeeld de invloed is van de socialisatietactiek 'collectief' op de tevredenheid van de respondent (ook gemeten op een 7pointlikertschaal'. Zo wens ik uiteindelijk na te gaan of collectieve socialiatie (hoge score op die variabel) beter is dan individuele socialisatie (lage score op die variabele) voor de tevredenheid van de respondent.
Iemand enig idee welke stappen ik hiervoor in spss moet uitvoeren en welke analyses ik moet doen?
Als ik het goed begrijp is je onafhankelijke variabele continue (van 1-7) en je afhankelijke variabele ook? In dat geval zou ik naar correlaties gaan kijken. (Algemene tip: Zoek de tabel achterin Andy Field - Discovering Statistics Using SPSS op, daar kun je meestal wel uit afleiden wat voor soort analyse past bij jouw data.)
pi_147807100
Bedankt voor de snelle reactie!
Ik ga dus inderdaad mijn variabelen als continu beschouwen.

Ik heb de tabel achterin Andy Field - discovering statistics using spss bekeken (bedankt voor de tip), en ik denk dat ik SpearmanCorrelation of Kendall's Tau zal moeten toepassen voor de correlatie na te gaan. Maar wat is hier het exacte verschil tussen? Ik weet niet wat best van toepassing is voor mijn onderzoek.

Ik denk niet dat correlaties voldoende zijn voor een thesis in onze school, dus zal ik vermoedelijk hierbij ook nog logistische regressie moeten toepassen. Is het mogelijk deze beide analyses te doen voor dezelfde gegevens?

bedankt
pi_147847480
quote:
0s.gif Op zondag 21 december 2014 16:48 schreef C_737 het volgende:
Bedankt voor de snelle reactie!
Ik ga dus inderdaad mijn variabelen als continu beschouwen.

Ik heb de tabel achterin Andy Field - discovering statistics using spss bekeken (bedankt voor de tip), en ik denk dat ik SpearmanCorrelation of Kendall's Tau zal moeten toepassen voor de correlatie na te gaan. Maar wat is hier het exacte verschil tussen? Ik weet niet wat best van toepassing is voor mijn onderzoek.

Ik denk niet dat correlaties voldoende zijn voor een thesis in onze school, dus zal ik vermoedelijk hierbij ook nog logistische regressie moeten toepassen. Is het mogelijk deze beide analyses te doen voor dezelfde gegevens?

bedankt
Ik ga even lekker tegen Operc in en raad je aan een regressie analyse te doen. Dat is eigenlijk niet veel meer of minder dan een iets andere vorm van correlatie, maar een stuk overzichtelijker als je wilt weten wat de invloed van A op B is (waar je vraag op neerkomt). Het geeft dus een causale interpretatie. Echter is het wel belangrijk op te merken dat je geen experimenteel onderzoek uit hebt gevoerd (als ik het goed begrijp) maar puur A en B gemeten hebt waarbij je theorie aangeeft dat je denkt dat A --> B. Het is dus wel belangrijk ergens te vermelden dat ondanks je denkt dat het causaal is en het rapporteert dat het causaal is, je niet uit kunt sluiten dat er ook een effect B --> A is.

Andy Field zou duidelijk genoeg moeten zijn voor de regressie, maar zo niet dan kan ik (en Operc zeker ook) er bij helpen :)
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_147848011
quote:
0s.gif Op maandag 22 december 2014 17:04 schreef oompaloompa het volgende:

[..]

Ik ga even lekker tegen Operc in en raad je aan een regressie analyse te doen. Dat is eigenlijk niet veel meer of minder dan een iets andere vorm van correlatie, maar een stuk overzichtelijker als je wilt weten wat de invloed van A op B is (waar je vraag op neerkomt). Het geeft dus een causale interpretatie. Echter is het wel belangrijk op te merken dat je geen experimenteel onderzoek uit hebt gevoerd (als ik het goed begrijp) maar puur A en B gemeten hebt waarbij je theorie aangeeft dat je denkt dat A --> B. Het is dus wel belangrijk ergens te vermelden dat ondanks je denkt dat het causaal is en het rapporteert dat het causaal is, je niet uit kunt sluiten dat er ook een effect B --> A is.

Andy Field zou duidelijk genoeg moeten zijn voor de regressie, maar zo niet dan kan ik (en Operc zeker ook) er bij helpen :)
Goed punt. :) Ik zat vast in het gedachte patroon of de onafhankelijke variabele een meting werd, of een hoog/laag-indeling voor een ANOVA o.i.d. Dus C_737, lees je ook even in met betrekking tot regressie analyse. ;)
pi_147850800
Anders even een verduidelijking van mijn onderzoek, want ik weet niet zeker of regressie mogelijk is:

Ik heb enquêtes laten invullen door stagiairs, waarbij volgende variabelen op een 7punten likertschaal werden bevraagd a.d.h.v. een 70 tal items:

- 6 socialisatiedimensies (waarbij lage scores (1) telkens verwijzen naar geïndividualiseerde en hoge scores (7) verwijzen naar geïnstitutionaliseerde tactieken.) Deze dimensies zijn 'Collective-individueel', 'formal-informal', 'sequential-random', 'fixed-variable', 'serial-disjunctive' & 'investiture-divestiture'.
Deze tactieken wijzen dus eigenlijk altijd op schalen. Iemand wordt bijvoorbeeld individueel (geindividualiseerd) of collectief (geïnstitutionaliseerd) gesocialiseerd. Daarom werd besloten deze variabelen als continu te behandelen.

- 3 variabelen die de aanpassing van stagiairs meten (namelijk Role clarity, self-efficacy en social acceptance)

- 3 socialisatie-outcomes (stagetevredenheid, organizational commitment & Intention to sollicitate)

Ondanks de Likert schaal worden alle variabelen dus als continu behandeld. Geen één van deze variabelen is echter normaal verdeeld.

Nu wens ik eigenlijk te analyseren wat het effect is van elke aparte socialisatiedimensie op de 3 socalisatie-outcomes. Ik wil m.a.w. telkens weten of bijvoorbeeld de socialisatietactiek 'collectief' (hoge scores op de dimensie collectief-individueel: 7) of 'individueel' (lage scores op de dimensie collectief-individueel: 1) de stagetevredenheid van stagiairs verhoogt, of een derde mogelijkheid, namelijk dat de socialisatietactieken op die dimensie geen invloed hebben op de stagetevredenheid.

Ten tweede wens ik te onderzoeken of de 'aanpassing van stagiairs', voorgesteld door Role clarity, self-efficacy en social acceptance, optreden als mediator tussen de socialisatietactieken en de socialisatie-outcomes.

Ik zou deze analyses grotendeels vanavond en morgen moeten doen, mijn promotor is in verlof en mijn handboek legt niet goed uit welke correlatie en regressie analyse ik moet gebruiken als er geen normale verdeling is. Weten jullie welke analyses ik precies moet uitvoeren (welk soort toets voor correlatie of regressie bv.?

Dat zou me echt uit de nood helpen! Ik ben jullie eeuwig dankbaar!
pi_147851117
Ik hoop dat je altijd statistiek genegeerd hebt o.i.d., want dit is niet echt een simpele opdracht om zelf even uit te zoeken zonder enige achtergrond. Vreemd dat je begeleider hier niet meer over uit heeft gelegd (of jij niet goed genoeg opgelet hebt? ;) )

quote:
0s.gif Op maandag 22 december 2014 19:13 schreef C_737 het volgende:
Anders even een verduidelijking van mijn onderzoek, want ik weet niet zeker of regressie mogelijk is:

Ik heb enquêtes laten invullen door stagiairs, waarbij volgende variabelen op een 7punten likertschaal werden bevraagd a.d.h.v. een 70 tal items:

- 6 socialisatiedimensies (waarbij lage scores (1) telkens verwijzen naar geïndividualiseerde en hoge scores (7) verwijzen naar geïnstitutionaliseerde tactieken.) Deze dimensies zijn 'Collective-individueel', 'formal-informal', 'sequential-random', 'fixed-variable', 'serial-disjunctive' & 'investiture-divestiture'.
Deze tactieken wijzen dus eigenlijk altijd op schalen. Iemand wordt bijvoorbeeld individueel (geindividualiseerd) of collectief (geïnstitutionaliseerd) gesocialiseerd. Daarom werd besloten deze variabelen als continu te behandelen.
Ok, dus je hebt 6 IV's waarvan je wilt weten of ze invloed hebben op je DV's

quote:
- 3 variabelen die de aanpassing van stagiairs meten (namelijk Role clarity, self-efficacy en social acceptance)
Je zegt hiervan dat ze mediatoren zijn, maar dat kan niet echt met een continue IV, kun je in normale Nederlandse woorden zeggen wat precies je hypothese is voor deze constructen? (dus A leidt tot B of A leidt alleen tot B voor vrouwen, dat soort taal).

quote:
- 3 socialisatie-outcomes (stagetevredenheid, organizational commitment & Intention to sollicitate)
Dit zijn 3 losse IV's

quote:
Nu wens ik eigenlijk te analyseren wat het effect is van elke aparte socialisatiedimensie op de 3 socalisatie-outcomes. Ik wil m.a.w. telkens weten of bijvoorbeeld de socialisatietactiek 'collectief' (hoge scores op de dimensie collectief-individueel: 7) of 'individueel' (lage scores op de dimensie collectief-individueel: 1) de stagetevredenheid van stagiairs verhoogt, of een derde mogelijkheid, namelijk dat de socialisatietactieken op die dimensie geen invloed hebben op de stagetevredenheid.
Voordat je dit gaat doen, wil ik je vragen 2 correlatie-grafieken te posten (zal na posten uitleggen waarom).
Ten eerste de correlaties tussen de IV's, ten tweede de correlaties tussen de DV's. De beste methode hangt namelijk af van of ze wel of niet correleren.

quote:
Ten tweede wens ik te onderzoeken of de 'aanpassing van stagiairs', voorgesteld door Role clarity, self-efficacy en social acceptance, optreden als mediator tussen de socialisatietactieken en de socialisatie-outcomes.
Zie hierboven

quote:
Ik zou deze analyses grotendeels vanavond en morgen moeten doen,
Wow, hoe hard is die deadline?

quote:
mijn promotor is in verlof en mijn handboek legt niet goed uit welke correlatie en regressie analyse ik moet gebruiken als er geen normale verdeling is.
Zolang je N hoog genoeg is, is dat niet erg.

quote:
Weten jullie welke analyses ik precies moet uitvoeren (welk soort toets voor correlatie of regressie bv.?

Dat zou me echt uit de nood helpen! Ik ben jullie eeuwig dankbaar!
Ja maar dat hangt dus van een aantal zaken af.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_147852801
Het lukt me niet om hier afbeeldingen te posten...

Jah, ik heb nog maar een 3tal weken geleden een andere begeleider gekregen en door dat ik al vast werk was afspreken niet evident ;)

Alleszins, als je denkt dat dit niet haalbaar is, enig idee van hoe ik de analyse kan vereenvoudigen? De titel is " de impact van geïnstitutionaliseerde socialisatietactieken op de aanpassing van stagiairs: een hulpmiddel voor het bekomen van de optimale stage".

Wel is het belangrijk dat ik de socialisatietactieken per dimensie onderzoek, aangezien het belang hiervan meermaals benadrukt staat in mijn literatuurstudie..

Bij de IV's is er enkel geen significante correlatie tussen Collective en Sequential, (De dimensie 'formal' gebruik ik niet, aangezien de interne consistentie van de items te laag was.)
Bij 'de aanpassing van stagiairs' is er enkel een significante correlatie tussen Role clarity en social acceptance.
Bij de DV's zijn alle correlaties significant...
pi_147854284
quote:
0s.gif Op maandag 22 december 2014 20:09 schreef C_737 het volgende:
Het lukt me niet om hier afbeeldingen te posten...

Jah, ik heb nog maar een 3tal weken geleden een andere begeleider gekregen en door dat ik al vast werk was afspreken niet evident ;)

Alleszins, als je denkt dat dit niet haalbaar is, enig idee van hoe ik de analyse kan vereenvoudigen? De titel is " de impact van geïnstitutionaliseerde socialisatietactieken op de aanpassing van stagiairs: een hulpmiddel voor het bekomen van de optimale stage".

Wel is het belangrijk dat ik de socialisatietactieken per dimensie onderzoek, aangezien het belang hiervan meermaals benadrukt staat in mijn literatuurstudie..

Bij de IV's is er enkel geen significante correlatie tussen Collective en Sequential, (De dimensie 'formal' gebruik ik niet, aangezien de interne consistentie van de items te laag was.)
Bij 'de aanpassing van stagiairs' is er enkel een significante correlatie tussen Role clarity en social acceptance.
Bij de DV's zijn alle correlaties significant...
Wat is je N?

De correlatie-vraag was om uit te zoeken in hoeverre je vragen echt andere dingen meten. Als je bv het effect van geslacht op lengte en gewicht los meet, zul je zien dat geslacht op allebei een effect heeft, maar het effect van geslacht op gewicht kan gewoon puur een indirect van lengte op gewicht zijn (lange mensen wegen meer), daarom is het belangrijk de correlaties te bekijken om wat meer inzicht in je constructen te krijgen.

Als je Dv's samenhangen kun je er voor kiezen ze samen te voegen als dat theoretisch ergens op slaat. Wel of niet samenvoegen maar hier niet zo heel veel uit.

Voor je IV's zijn correlaties problematischer. Dit maakt het heel erg ingewikkeld om te begrijpen wat er nu precies echt aan de hand is. Even een voorbeeldje waarin het wel logisch wat er aan de hand is om te omschrijven wat ik bedoel:

Je hebt geslacht en lengte gemeten en onderzoekt ed effecten hiervan op gewicht.
Als je naar die twee dingen los kijkt zul je vinden dat:
1. geslacht groot effect heeft op gewicht
2. lengte groot effect heeft op gewicht

maar ook dat:
3. geslacht en lengte sterk correleren

Wordt het hogere gewicht dat veroorzaakt door geslacht of door lengte? Die twee kun je niet uit elkaar halen omdat ze zo erg correleren.

Als al je IVs "sterk" correleren, wordt interpretatie heel erg moeilijk.

Probeer anders even uit te zoeken met bv. imgur hoe je een plaatje post, want ik ben bang dat dat wel echt nodig zal zijn.

Als je dat hebt gevonden, post dan de volgende output:
1. corrrelatiematrix IV's
2. mulitple regressie (onder analyze), met 1 van je DV's als dependent, en per blokje 1 van je IV's toevoegend.

Daarmee zouden ik/Operc je een stuk verder moeten kunnen helpen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_147857785
Kan je onderstaande links zien?

http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#0
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#1
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#2
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#3
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#4

Ik heb dus inderdaad besloten om mijn model tot volgende te reduceren:

- 5 Socialisatietactieken ( collective, sequential, fixed, serial, investiture)
- 2 var voor de aanpassing van stagiairs (Role clarity & social acceptance)
- 1 variabele voor het succes van een stage (gemiddelde van stagetevredenheid, org commitment en intention to sollicitate)
pi_147871961
quote:
0s.gif Op maandag 22 december 2014 21:56 schreef C_737 het volgende:
Kan je onderstaande links zien?

http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#0
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#1
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#2
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#3
http://imgur.com/Rq50Jgh,vcApcTu,9HBITOO,NZABY3o,9BHUOyI#4

Ik heb dus inderdaad besloten om mijn model tot volgende te reduceren:

- 5 Socialisatietactieken ( collective, sequential, fixed, serial, investiture)
- 2 var voor de aanpassing van stagiairs (Role clarity & social acceptance)
- 1 variabele voor het succes van een stage (gemiddelde van stagetevredenheid, org commitment en intention to sollicitate)
Shit sorry, had niet je nieuwe post gezien (als je iemand quote krijgen ze een pop-up weet je zeker dat ze door hebben dat je hebt gereageerd).

In je regressie kun je inderdaad zien dat je een probleem hebt dat lijkt op mijn voorbeeld (met lengte, geslacht en gewicht).

In je tweede model zie je dat zowel collective als sequential significante voorspellers zijn, maar dat in je gehele model (model 5) sequential niet meer significant is, Serial, en daarna Investiture nemen als het ware het voorspellende vermogen van sequential over. Dat komt omdat die alledrie enorm sterk samenhangen.
Wat ik zou doen is OF model 5 rapporteren (staat in andy field als het goed is, of pallant nog beter als ze die in je bieb hebben), OF alleen een model met collective en investiture rapprteren.
Soewieso welke van e twee je ook kiest zul je aan moeten geven dat sequential, serial en investitute zo hoog met elkaar correleren dat je statistisch gezien niet kunt bepalen welk deel van de variantie uniek verklaard word door deze concepten individueel.

Was dat een beetje te volgen?
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_149826179
Ik kom zelf niet uit dit vraagstuk, misschien dat hier iemand het weet:

Ik heb een databestand (zie voorbeeld) waarin voor een gemeente per jaar de kenmerken van bedrijven staan die er gevestigd zijn, zoals het aantal arbeidsplaatsen. Ieder bedrijf heeft voor ieder jaar een regel, maar niet alle bedrijven hebben evenveel regels (bijv. door later starten/ failliet gaan/ verhuizen).

De bedrijven zijn aan de hand van het aantal arbeidsplaatsen ingedeeld in categorieën (in het voorbeeld zijn dit er 2). Maar nu wil ik een variabele construeren die aangeeft of een bedrijf in vergelijking met een jaar eerder (als deze er is) gestegen of gedaald is binnen deze categorieën.

Maar hoe? Ik dacht zelf in de richting van een do repeat/ loop, maar daar loop ik op vast.

voorbeeld in spoiler:
SPOILER
Om spoilers te kunnen lezen moet je zijn ingelogd. Je moet je daarvoor eerst gratis Registreren. Ook kun je spoilers niet lezen als je een ban hebt.
Dank!
pi_149835255
Kun je je voorbeeld aanvullen met welke output je zou willen hebben?

Bedrijf 1 is in 2013 tov 2012 naar een categorie lager gegaan (en dus gedaald in aantal werknemers), wat moet dan de output worden?

Is de dataset zoals in het voorbeeld beperkt tot maximaal een range van iets van 10 jaar? Vergelijken tussen observaties (rijen) is vaak gevaarlijk en lastig, zeker in (ik denk?) SPSS. Daarom zou ik eerst de dataset van lang naar breed formaat overzetten (alle jaren voor elk bedrijf in 1 observatie.
Dat doe je zo:
1
2
3
CASESTOVASRS
/id=nr
/index = jaar.

Daarna is het relatief eenvoudig.

[ Bericht 17% gewijzigd door dotKoen op 19-02-2015 19:33:56 ]
pi_149836572
Volgens mij kan dat niet in SPSS als je data er zo uit ziet: hetzelfde bedrijf op meerdere rijen. Als je de data per bedrijf op 1 regel zet, elk jaar wordt dan een variabele, is het een makkie. Je kan je data herstructureren met behulp van "restructure", een fantastische SPSS functie. Te vinden in een menu (data geloof ik).
Aldus.
pi_152006232
Hoi!

Stomme vraag misschien, maar is het mogelijk om van de variabelen die ik via "compute variable" heb aangemaakt de numerieke code terug te vinden en/of te veranderen ? Dus stel ik heb een variabele aangemaakt: "somscore" = variabele1 + variabele2 + variabele3, en ik wil er bijvoorbeeld nog een variabele extra aan toevoegen of weghalen, kan dat? Of moet ik dan weer een hele nieuwe variabele aanmaken?

Hoop dat iemand nog reageert, aangezien het forum al lange tijd niet gebruikt is
pi_152007316
quote:
7s.gif Op zaterdag 25 april 2015 01:24 schreef Natoo het volgende:
Hoi!

Stomme vraag misschien, maar is het mogelijk om van de variabelen die ik via "compute variable" heb aangemaakt de numerieke code terug te vinden en/of te veranderen ? Dus stel ik heb een variabele aangemaakt: "somscore" = variabele1 + variabele2 + variabele3, en ik wil er bijvoorbeeld nog een variabele extra aan toevoegen of weghalen, kan dat? Of moet ik dan weer een hele nieuwe variabele aanmaken?

Hoop dat iemand nog reageert, aangezien het forum al lange tijd niet gebruikt is
Dat ligt er aan of je meteen de recode gerunned hebt of naar syntax gepaste. Als je het naar syntax gepaste hebt is het heel gemakkelijk aan te passen, als je het meteen gerunned hebt ben ik bang dat het niet zo gemakkelijk gaat (maar ik kan het verkeerd hebben).
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_152008268
Je zou natuurlijk

1Compute somscore2 = somscore + var4.
kunnen doen. Wederom een argument om alles in syntax te doen.
pi_152019308
Bedankt voor jullie reacties!
Inderdaad het beste om de syntax te gebruiken.. had ik in dit geval niet gedaan. Vanaf nu wel weer :)
Maar dan moet ik het zelf in de code aanpassen, toch? Ben namelijk niet zo goed in syntax-taal..

Zou fijner zijn als het werkte zoals in excel.. als je een kolomwaarde aanpast dat de somscore/gem./etc. dan ook aanpast..
pi_152019604
quote:
0s.gif Op zaterdag 25 april 2015 18:20 schreef Natoo het volgende:
Maar dan moet ik het zelf in de code aanpassen, toch? Ben namelijk niet zo goed in syntax-taal..
Als je er niet zo goed in bent, kun je het ook via de menuknoppen doen en op Paste klikken in plaats van OK. Dan plakt hij de code in een syntax bestand en kun je zelf zien hoe de syntax eruit ziet. :)
pi_152020296
quote:
Als je er niet zo goed in bent, kun je het ook via de menuknoppen doen en op Paste klikken in plaats van OK. Dan plakt hij de code in een syntax bestand en kun je zelf zien hoe de syntax eruit ziet. :)
Ja dat wel, maar ik bedoel als ik berekeningen aan wil passen moet ik dat in de syntax doen (in syntax-taal)..
pi_152023339
Zo moeilijk is dat nou ook weer niet.
Aldus.
pi_152027346
Even nog iets anders.. ben even helemaal in de war!

Ik heb verschillende schalen.. van sommige schalen heb ik de somscores, van anderen heb ik gemiddelden. Nou heb ik de descriptives opgevraagd van de schalen om te kijken of ze normaal verdeeld zijn etc.. maar een "mean" van een somscore-schaal betekent iets anders dan een "mean" van een gemiddelde-schaal.

Moet ik de descriptives van alle schalen op hetzelfde 'niveau' opvragen? (dus of allemaal somscores, of allemaal gemiddelden?). Of hoeft dat niet? En hoe interpreteer ik deze verschillende descriptives? De 'mean' van een gemiddelde-schaal is wat men gemiddeld scoort en de 'mean' van een somscore-schaal is wat men totaal gemiddeld scoort, Of zo?
pi_152028619
quote:
11s.gif Op zaterdag 25 april 2015 22:55 schreef Natoo het volgende:
Even nog iets anders.. ben even helemaal in de war!

Ik heb verschillende schalen.. van sommige schalen heb ik de somscores, van anderen heb ik gemiddelden. Nou heb ik de descriptives opgevraagd van de schalen om te kijken of ze normaal verdeeld zijn etc.. maar een "mean" van een somscore-schaal betekent iets anders dan een "mean" van een gemiddelde-schaal.

Ik zou pakken wat voor de lezer het logischte is (meestal is dat gemiddelde, maar stel dat het een "schaal zou zijn van 10 proefwerkvragen die allemaal 0.0-1.0 punt opleveren, dan zou een somscore logischer zijn)

quote:
Moet ik de descriptives van alle schalen op hetzelfde 'niveau' opvragen? (dus of allemaal somscores, of allemaal gemiddelden?). Of hoeft dat niet? En hoe interpreteer ik deze verschillende descriptives? De 'mean' van een gemiddelde-schaal is wat men gemiddeld scoort en de 'mean' van een somscore-schaal is wat men totaal gemiddeld scoort, Of zo?
inderdaad
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_152028705
Mijn dank is groot!
pi_152100467
Gezien de aard van mijn onderzoek was het de bedoeling om een multipele regressie uit te gaan voeren. Ik ben allereerst begonnen met uit uitrekenen van alle descriptives, waaruit bleek dat sommige variabelen niet normaal verdeeld bleken te zijn.. wat is nu mijn vervolgstap?

Ik neem aan dat ik eerst moet beginnen met het berekenen van de correlaties tussen de variabelen (middels een Spearman Correlatie gezien de niet-normale verdelingen, maar ook een kleine steekproefgrootte (N=25))?. En kan ik het beste de Mediaan (+MAD als spreidingsmaat) weergeven ipv de gemiddelden?

En wat doe ik daarna? Normaal volg ik gewoon een stappenplan om te kijken welke toets ik uit moet voeren, maar ik loop nu allemaal tegen dingen aan waar ik nog niet eerder mee te maken heb gehad (kleine steekproef, niet-normale verdelingen, etc.)

Iemand die mij weer op weg kan helpen, wellicht? :)
pi_152101266
quote:
2s.gif Op zondag 14 september 2014 17:56 schreef Z het volgende:
Python heeft toch ook een mooie statistiekmodule (Panda's)?
Zag dat er ook iets als ipython is icm notebook dat je interactief kunt programmeren en ook delen. Je kunt ook R code e.d. implementeren. Ben er zelf niet bekend mee maar ga mij er eens in verdiepen. Gebruik R voor statistiek en Python voor de lol om programma's te schrijven.

SPSS is naar mijn idee wat verouderd, beperkt en is een black box dus heb gekozen voor R. Waarom kiezen de meesten nog voor SPSS of is dit geen vrijwillige keuze? Ik heb namelijk het idee dat er een shift gaande is naar R en dergelijke. Als je toch nog met geen van beiden bekend bent lijkt mij de keuze voor R logischer. Het is ook gratis.
"Happiness is not getting more, but wanting less"
pi_152103822
SPSS is veel toegankelijker en makkelijker. R heeft een flink steile leercurve.
Aldus.
  dinsdag 28 april 2015 @ 20:00:36 #269
219590 oompaloompa
doompadeedee
pi_152103954
quote:
0s.gif Op dinsdag 28 april 2015 18:04 schreef Natoo het volgende:
Gezien de aard van mijn onderzoek was het de bedoeling om een multipele regressie uit te gaan voeren. Ik ben allereerst begonnen met uit uitrekenen van alle descriptives, waaruit bleek dat sommige variabelen niet normaal verdeeld bleken te zijn.. wat is nu mijn vervolgstap?

Ik neem aan dat ik eerst moet beginnen met het berekenen van de correlaties tussen de variabelen (middels een Spearman Correlatie gezien de niet-normale verdelingen, maar ook een kleine steekproefgrootte (N=25))?. En kan ik het beste de Mediaan (+MAD als spreidingsmaat) weergeven ipv de gemiddelden?

En wat doe ik daarna? Normaal volg ik gewoon een stappenplan om te kijken welke toets ik uit moet voeren, maar ik loop nu allemaal tegen dingen aan waar ik nog niet eerder mee te maken heb gehad (kleine steekproef, niet-normale verdelingen, etc.)

Iemand die mij weer op weg kan helpen, wellicht? :)
Normaal verdeelde data is in principe geen harde eis omdat er nog geen enkele verdeling is gevonden waarbij bij n>30 de gemiddelden niet normaal verdeeld waren (dat tweede is wel een "harde" eis).
Kleine steekproef is wel vrij vervelend om veel redenen :P

Als je data niet extreem raar verdeeld zijn, zou ik denk ik gewoon verder gaan met je geplande methodes en ergens vermelden dat je data niet normaal verdeeld waren en dat je resultaten dus iets minder betrouwbaar zijn oid.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
  dinsdag 28 april 2015 @ 20:01:31 #270
219590 oompaloompa
doompadeedee
pi_152103986
quote:
1s.gif Op dinsdag 28 april 2015 18:38 schreef ssebass het volgende:

[..]

Zag dat er ook iets als ipython is icm notebook dat je interactief kunt programmeren en ook delen. Je kunt ook R code e.d. implementeren. Ben er zelf niet bekend mee maar ga mij er eens in verdiepen. Gebruik R voor statistiek en Python voor de lol om programma's te schrijven.

SPSS is naar mijn idee wat verouderd, beperkt en is een black box dus heb gekozen voor R. Waarom kiezen de meesten nog voor SPSS of is dit geen vrijwillige keuze? Ik heb namelijk het idee dat er een shift gaande is naar R en dergelijke. Als je toch nog met geen van beiden bekend bent lijkt mij de keuze voor R logischer. Het is ook gratis.
Ik doe nieuwe dingen in R, en gebruik SPSS vooral nog omdat het simpel is en ik er aan gewend ben. Als ik van scratch zou moeten beginnen zou ik alles in R doen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_152110373
quote:
Als je data niet extreem raar verdeeld zijn, zou ik denk ik gewoon verder gaan met je geplande methodes en ergens vermelden dat je data niet normaal verdeeld waren en dat je resultaten dus iets minder betrouwbaar zijn oid.
Ok, thanks. Ik heb verder nog niet op de verdere aannames voor een multipele regressie getoetst.. maar het zou me niks verbazen als ik er niet aan voldoe (ook gezien mijn kleine steekproefgrootte). Zijn er dan nog andere opties/meer robuustere methodes om regressie te toetsen?

[ Bericht 13% gewijzigd door Natoo op 29-04-2015 23:49:23 ]
  maandag 11 mei 2015 @ 14:57:24 #272
399455 Pinkdwarf
Free the Boobies
pi_152490279
Hopelijk kunnen jullie mij helpen.
Voor mijn scriptie ben ik bezig met een andere techniek voor een onderzoek op de CT-scan.
Nu ben ik geen held met SPSS en heb het grootste deel wel af, maar kom er nu totaal niet meer uit.

Wat ik wil is eigenlijk dit (uit een ander, al gepubliceerd onderzoek):


Maar dan met mijn data zou het dit worden (qua opzet):


En de data die ik in SPSS heb:


Iemand enig idee hoe ik dit voor elkaar krijg? :)
Alvast enorm bedankt!
You can only have the sunshine after the rain..
pi_152490547
quote:
0s.gif Op maandag 11 mei 2015 14:57 schreef Pinkdwarf het volgende:
Hopelijk kunnen jullie mij helpen.
Voor mijn scriptie ben ik bezig met een andere techniek voor een onderzoek op de CT-scan.
Nu ben ik geen held met SPSS en heb het grootste deel wel af, maar kom er nu totaal niet meer uit.

Wat ik wil is eigenlijk dit (uit een ander, al gepubliceerd onderzoek):
[ afbeelding ]

Maar dan met mijn data zou het dit worden (qua opzet):
[ afbeelding ]

En de data die ik in SPSS heb:
[ afbeelding ]

Iemand enig idee hoe ik dit voor elkaar krijg? :)
Alvast enorm bedankt!
Als je een ANOVA doet, kun je bij "Options" op "Descriptives" klikken. Dan krijg je bij je ANOVA tabel ook een tabel met de Means, SDs etc per groep en voor het totaal. Dit kun je dan doen voor elke afhankelijke variabele. (Je bent alleen geïnteresseerd in de verschillen tussen Bolus en Test en niet AFC rechts/links etc toch?)
pi_152509292
Ik ben even compleet gefrustreerd. Ik heb data in spss die ik niet kan analyseren omdat hij vindt dat mijn gemiddelde score een string is. Ik heb er inmiddels een aardappelhoofd van gekregen en ook in de syntax van SPSS kom ik niet verder.

compute Score = number(SC0_1).
execute.
recode SC0_1 (convert) into score2.
execute.
COMPUTE score = NUMBER(SC0_1, F8.12).
execute.

werken allemaal niet. In de 'view variable' de variabele van string naar numeric veranderen heeft tot gevolg dat alle waardes verdwijnen. Uiteindelijk heb ik de huidige laatste drie variabelen verkregen door automatic recode te gebruiken, maar de hoeveelheid informatie die daarbij verloren gaat is onacceptabel. Hij houdt dan twee decimalen over van de veertig.

Helaas moet dit per se in spss. Iemand nog een tip?
Your opinion of me is none of my business.
pi_152509530
quote:
0s.gif Op maandag 11 mei 2015 23:13 schreef Sarasi het volgende:
Ik ben even compleet gefrustreerd. Ik heb data in spss die ik niet kan analyseren omdat hij vindt dat mijn gemiddelde score een string is. Ik heb er inmiddels een aardappelhoofd van gekregen en ook in de syntax van SPSS kom ik niet verder.

compute Score = number(SC0_1).
execute.
recode SC0_1 (convert) into score2.
execute.
COMPUTE score = NUMBER(SC0_1, F8.12).
execute.

werken allemaal niet. In de 'view variable' de variabele van string naar numeric veranderen heeft tot gevolg dat alle waardes verdwijnen. Uiteindelijk heb ik de huidige laatste drie variabelen verkregen door automatic recode te gebruiken, maar de hoeveelheid informatie die daarbij verloren gaat is onacceptabel. Hij houdt dan twee decimalen over van de veertig.

Helaas moet dit per se in spss. Iemand nog een tip?
Dat is altijd even klooien ja. Je kunt proberen om de kolom naar Excel te plakken, daar de juiste celstructuur te kiezen en vervolgens weer in SPSS te zetten. :)
  dinsdag 12 mei 2015 @ 08:52:36 #276
399455 Pinkdwarf
Free the Boobies
pi_152514671
quote:
0s.gif Op maandag 11 mei 2015 15:06 schreef Operc het volgende:

[..]

Als je een ANOVA doet, kun je bij "Options" op "Descriptives" klikken. Dan krijg je bij je ANOVA tabel ook een tabel met de Means, SDs etc per groep en voor het totaal. Dit kun je dan doen voor elke afhankelijke variabele. (Je bent alleen geïnteresseerd in de verschillen tussen Bolus en Test en niet AFC rechts/links etc toch?)
Het is gelukt! Mijn dank is groot :D
You can only have the sunshine after the rain..
pi_152515653
quote:
0s.gif Op dinsdag 12 mei 2015 08:52 schreef Pinkdwarf het volgende:

[..]

Het is gelukt! Mijn dank is groot :D
Top! Succes met je onderzoek. :)
  dinsdag 12 mei 2015 @ 10:33:00 #278
171936 DuTank
Spaashaas.
pi_152516621
quote:
0s.gif Op maandag 11 mei 2015 23:13 schreef Sarasi het volgende:
Ik ben even compleet gefrustreerd. Ik heb data in spss die ik niet kan analyseren omdat hij vindt dat mijn gemiddelde score een string is. Ik heb er inmiddels een aardappelhoofd van gekregen en ook in de syntax van SPSS kom ik niet verder.

compute Score = number(SC0_1).
execute.
recode SC0_1 (convert) into score2.
execute.
COMPUTE score = NUMBER(SC0_1, F8.12).
execute.

werken allemaal niet. In de 'view variable' de variabele van string naar numeric veranderen heeft tot gevolg dat alle waardes verdwijnen. Uiteindelijk heb ik de huidige laatste drie variabelen verkregen door automatic recode te gebruiken, maar de hoeveelheid informatie die daarbij verloren gaat is onacceptabel. Hij houdt dan twee decimalen over van de veertig.

Helaas moet dit per se in spss. Iemand nog een tip?
In mijn dataset had ik ook twee variabelen die string waren. Wat bleek? Dit waren variabelen waar deelnemers een getal moest intikken (leeftijd bijvoorbeeld). Nu hadden een aantal mensen per ongeluk een / erbij getypt. Nadat ik die had weg gehaald, kon ik het wel veranderen als numerieke data.
Herb is the healing of a nation, alcohol is the destruction.
  dinsdag 12 mei 2015 @ 20:14:32 #279
379986 GoobyPls
Gooby Pls :)
pi_152536133
Zijn hier Excel danwel Google spreadsheet (voorkeur) helden?

Ik zoek een formule voor een close text match.

Voorbeeld:
Kolom A
Book7324

Kolom C
Book7324 eu

Ik wil dat die deze match maakt, een voorwaarde moet zijn dat er een spatie tussenzit. Dit moet met wildcards mogelijk zijn, maar ik kom er toch niet helemaal uit.

Weet iemand tevens een manier om in 1x een cel van al zijn special characters en spaties te ontdoen?
pi_152540478
In Excel macro's kan je de like operator gebruiken. Je kan dus een functie maken.

Google: excel macro like function
Aldus.
  dinsdag 12 mei 2015 @ 21:41:07 #281
379986 GoobyPls
Gooby Pls :)
pi_152540958
quote:
2s.gif Op dinsdag 12 mei 2015 21:31 schreef Z het volgende:
In Excel macro's kan je de like operator gebruiken. Je kan dus een functie maken.

Google: excel macro like function
Dit gaat me iets te snel, hoe zou de formule bij bovenstaand voorbeeld eruit zien?
pi_152541221
quote:
0s.gif Op dinsdag 12 mei 2015 21:41 schreef GoobyPls het volgende:
Google: excel macro like function
In Excel kan je macro's maken en met een macro kan je een functie maken. Macro's bieden veel meer functionaliteiten dan functies (en een functies is in wezen een macro). Hoe je precies jouw functie maakt, weet ik niet, maar je googelt dat zo bij elkaar.
Aldus.
pi_152541856
En anders met een zoekfunctie. Je kan geloof ik zoeken naar een niet exacte match. En als de overeenkomst altijd links in de cel staat en het extra deel tekst rechts (zoals in je voorbeeld), kan je het oplossen met een =rechts() functie gecombineerd met een zoekfunctie.
Aldus.
  donderdag 14 mei 2015 @ 16:02:35 #284
379986 GoobyPls
Gooby Pls :)
pi_152593789
Wat zou in mijn voorbeeld de functie dan worden?
pi_152594419
Wat wil je dat het resultaat is?
Aldus.
  donderdag 14 mei 2015 @ 16:43:34 #286
379986 GoobyPls
Gooby Pls :)
pi_152594660
De lookup op A1 (Book7324) moet de waarde in B (Book7324 eu) vinden.
pi_152599460
Is het nu zo dat het begin altijd klopt en de extra, niet matchende tekst, altijd achteraan staat?
Aldus.
  donderdag 14 mei 2015 @ 21:59:57 #288
85514 ralfie
!Yvan eht nioj
pi_152604592
quote:
0s.gif Op donderdag 14 mei 2015 16:43 schreef GoobyPls het volgende:
De lookup op A1 (Book7324) moet de waarde in B (Book7324 eu) vinden.
vert.zoeken("*Book7324*";A1:A100;1;ONWAAR)

of VLOOKUP in engels
  donderdag 14 mei 2015 @ 22:37:18 #289
379986 GoobyPls
Gooby Pls :)
pi_152606246
quote:
2s.gif Op donderdag 14 mei 2015 19:38 schreef Z het volgende:
Is het nu zo dat het begin altijd klopt en de extra, niet matchende tekst, altijd achteraan staat?
Ja
pi_152620424
Ben momenteel druk bezig met het analyseren van data uit mijn enquête. Het is een hoop puzzelen en ik begrijp nog niet heel veel maar vroeg me af of ik in de groede richting zit. Als het complete onzin is wat ik hier verkondig dan wil ik dat net zo graag weten!

Ben bezig met een Pearson correlatie toets(?), het gaat over het beeld wat mensen over Facebook hebben en of dit verband heeft met leeftijd.

Analyze > Correlate > Bivariate

Dan krijg ik dit resultaat:



Betekent de -.224 dat er een enigszins negatief verband is tussen de twee, dat ouderen dus een negatiever beeld hebben? Staat de ,005 voor dat dit verband geen toeval is?

Alvast bedankt O+
pi_152621475
quote:
0s.gif Op vrijdag 15 mei 2015 13:56 schreef Tobi-wan het volgende:

Betekent de -.224 dat er een enigszins negatief verband is tussen de twee, dat ouderen dus een negatiever beeld hebben? Staat de ,005 voor dat dit verband geen toeval is?

Alvast bedankt O+
Ja, het is geen sterk effect, maar volgens die tabel is er een negatieve correlatie tussen de twee variabelen. Dus als de waarde van de ene variabele stijgt, dan daalt de waarde van de andere variabele. :)

Wat betreft de p-waarde: Doorgaans houden mensen een alpha aan van 0.05 en je p-waarde is lager dan dat. Dat betekent dat je stelt dat die waarde zo klein is, dat je de nul-hypothese (geen effect) verwerpt en de alternatieve hypothese (wel een effect) aanneemt. Het verband kan dus nog steeds een toevalligheid zijn, (Die kans is er altijd, aangezien p niet nul kan zijn) maar je stelt dat die kans zo klein is, dat je redenen hebt om die conclusie te verwerpen. :)
pi_152621890
quote:
0s.gif Op vrijdag 15 mei 2015 14:39 schreef Operc het volgende:

[..]

Ja, het is geen sterk effect, maar volgens die tabel is er een negatieve correlatie tussen de twee variabelen. Dus als de waarde van de ene variabele stijgt, dan daalt de waarde van de andere variabele. :)

Wat betreft de p-waarde: Doorgaans houden mensen een alpha aan van 0.05 en je p-waarde is lager dan dat. Dat betekent dat je stelt dat die waarde zo klein is, dat je de nul-hypothese (geen effect) verwerpt en de alternatieve hypothese (wel een effect) aanneemt. Het verband kan dus nog steeds een toevalligheid zijn, (Die kans is er altijd, aangezien p niet nul kan zijn) maar je stelt dat die kans zo klein is, dat je redenen hebt om die conclusie te verwerpen. :)
Ah super, heb ik toch weer wat geleerd vandaag. Bedankt! Waarom kan de p-waarde niet 0 zijn eigenlijk? Hieronder heb ik een andere vergelijking gevonden waar ook een kleine correlatie is tussen verschillende variabelen. Voor iemand die niet midden in het onderzoek zijn de variabelen natuurlijk onmogelijk te begrijpen.



Het gaat om de verhouding tussen Mavenisme (mensen willen voorzien van informatie) en 'combinatie persoonlijkheden' (hoe iemand zichzelf inschat als het gaat om mensen verbinden, overtuigen en informeren). Het is niet de verhouding waarin ik geïnteresseerd ben, het gaat mij daar om 'mavenisme vs content' en 'combinatie vs content' maar ben bel benieuwd wat het betekent als P daar dus 0 is, ik zie het wel vaker voorbij komen.

Domme vragen bestaan niet maar ik bied alvast mijn excuses aan in het geval dat :@
pi_152621990
quote:
0s.gif Op vrijdag 15 mei 2015 14:54 schreef Tobi-wan het volgende:

[..]

Ah super, heb ik toch weer wat geleerd vandaag. Bedankt! Waarom kan de p-waarde niet 0 zijn eigenlijk? Hieronder heb ik een andere vergelijking gevonden waar ook een kleine correlatie is tussen verschillende variabelen. Voor iemand die niet midden in het onderzoek zijn de variabelen natuurlijk onmogelijk te begrijpen.

[ afbeelding ]

Het gaat om de verhouding tussen Mavenisme (mensen willen voorzien van informatie) en 'combinatie persoonlijkheden' (hoe iemand zichzelf inschat als het gaat om mensen verbinden, overtuigen en informeren. Het is niet de verhouding waarin ik geïnteresseerd ben, het gaat mij daar om 'mavenisme vs content' en 'combinatie vs content' maar ben bel benieuwd wat het betekent als P daar dus 0 is, ik zie het wel vaker voorbij komen.

Domme vragen bestaan niet maar ik bied alvast mijn excuses aan in het geval dat :@
Een p-waarde is eigenlijk gewoon een stuk van de oppervlakte onder de grafiek van een normaalverdeling. De normaalverdeling zal aan de uiteinden asymptotisch worden naar 0. Dat betekent dat de grafiek steeds dichter bij 0 komt, maar deze nooit zal raken. Dus je p-waarde kan oneindig klein zijn, maar nooit echt 0. SPSS rekent echter met 3 cijfers achter de komma, dus elke p-waarde van kleiner dan 0.0005 (dus 0.000499...) zal naar 0 worden afgerond. Voor je conclusies maakt dat niet uit, omdat je met een alpha van 0.05 of 0.01 rekent en het alleen gaat om wel/niet significant. Er bestaat vanuit de statistiek niet zoiets als "erg significant" of "een beetje significant." :)

EDIT: Dat de normaalverdeling asymptotisch is, is ook meteen de reden dat je met een 95%CI of 99%CI werkt en nooit met een 100%CI. 100%CI zou betekenen dat het betrouwbaarheidsinterval loopt van - oneindig tot + oneindig. Dat is niet zo informatief. :P
pi_152622732
quote:
0s.gif Op vrijdag 15 mei 2015 14:58 schreef Operc het volgende:

[..]

Een p-waarde is eigenlijk gewoon een stuk van de oppervlakte onder de grafiek van een normaalverdeling. De normaalverdeling zal aan de uiteinden asymptotisch worden naar 0. Dat betekent dat de grafiek steeds dichter bij 0 komt, maar deze nooit zal raken. Dus je p-waarde kan oneindig klein zijn, maar nooit echt 0. SPSS rekent echter met 3 cijfers achter de komma, dus elke p-waarde van kleiner dan 0.0005 (dus 0.000499...) zal naar 0 worden afgerond. Voor je conclusies maakt dat niet uit, omdat je met een alpha van 0.05 of 0.01 rekent en het alleen gaat om wel/niet significant. Er bestaat vanuit de statistiek niet zoiets als "erg significant" of "een beetje significant." :)

EDIT: Dat de normaalverdeling asymptotisch is, is ook meteen de reden dat je met een 95%CI of 99%CI werkt en nooit met een 100%CI. 100%CI zou betekenen dat het betrouwbaarheidsinterval loopt van - oneindig tot + oneindig. Dat is niet zo informatief. :P
Bedankt voor de heldere uitleg! :D
  vrijdag 15 mei 2015 @ 15:24:24 #295
219590 oompaloompa
doompadeedee
pi_152622780
Een tip waar je niet om vraagt. Plot de twee waardes ook eens tegen elkaar met een scatterplot of zoiets.

Het zou kunnen datje data niet linear met elkaar samenhangen, bv (shit dacht dat je positieve correlatie had, nou ja voor het voorbeeld is ie positief):

leeftijd -> liking facebook (1-10)

7 - 5
8 - 4
9 - 3
10 - 2
11 - 3
12 - 4
13 - 5
14 - 6
15 - 7
16 - 8
17 - 9
18 - 10

In zo'n situatie zou je wel een significante correlatie kunnen krijgen en gaat liking over het algemeen omhoog met leeftijd maar zou de claim dat hoeouder je wordt hoe positiever je beeld wordt niet kloppen.
Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-
pi_152623222
quote:
0s.gif Op vrijdag 15 mei 2015 15:24 schreef oompaloompa het volgende:
Een tip waar je niet om vraagt. Plot de twee waardes ook eens tegen elkaar met een scatterplot of zoiets.

Het zou kunnen datje data niet linear met elkaar samenhangen, bv (shit dacht dat je positieve correlatie had, nou ja voor het voorbeeld is ie positief):

leeftijd -> liking facebook (1-10)

7 - 5
8 - 4
9 - 3
10 - 2
11 - 3
12 - 4
13 - 5
14 - 6
15 - 7
16 - 8
17 - 9
18 - 10

In zo'n situatie zou je wel een significante correlatie kunnen krijgen en gaat liking over het algemeen omhoog met leeftijd maar zou de claim dat hoeouder je wordt hoe positiever je beeld wordt niet kloppen.
Ben net uit het systeem gegaan. Ga morgen weer verder, dan zal ik er even naar kijken.

Bedankt voor de tip!
pi_152708097
Heb even geprobeerd om een scatter plot te maken maar ik denk dat ik daar niet heel veel aan heb omdat ik de exacte leeftijden niet heb gevraagd. Het is nu allemaal ingedeeld in groepen en aan verhoudingen kan je wel zien dat mensen minder positief zijn naarmate hun leeftijd stijgt maar het is niet echt duidelijk.



Ik heb wel een andere vraag nog, zoals jullie hier kunnen zien is de indeling qua leeftijd niet echt logisch. Ik had weinig respondenten in de leeftijdsklasse 46-55 en 65+. Om de data toch te kunnen analyseren heb ik twee grotere groepen gemaakt, 36-55 en 55+. Kan ik dit goed praten? Ik lever dan waarschijnlijk in op betrouwbaarheid maar als ik in een bepaalde groep maar 10 respondenten heb kan ik daar volgens mij helemaal geen uitspraak over doen.

[ Bericht 31% gewijzigd door Tobi-wan op 18-05-2015 11:52:14 ]
pi_152708248
quote:
0s.gif Op donderdag 14 mei 2015 22:37 schreef GoobyPls het volgende:

[..]

Ja
Kan je dan niet een oplossing met '=LINKS()' en '=VERT.ZOEKEN()' knutselen? Eventueel met een tussenkolom.
Aldus.
  dinsdag 19 mei 2015 @ 07:42:35 #299
379986 GoobyPls
Gooby Pls :)
pi_152738896
quote:
0s.gif Op donderdag 14 mei 2015 21:59 schreef ralfie het volgende:

[..]

vert.zoeken("*Book7324*";A1:A100;1;ONWAAR)

of VLOOKUP in engels
Deze pakt die niet als die de waarde uit de cel moet halen, dus:

vert.zoeken("*B1*";A1:A100;1;ONWAAR)

Hoe werken wildcards in deze combinatie?
pi_152744118
quote:
0s.gif Op vrijdag 15 mei 2015 14:58 schreef Operc het volgende:

[..]

Een p-waarde is eigenlijk gewoon een stuk van de oppervlakte onder de grafiek van een normaalverdeling. De normaalverdeling zal aan de uiteinden asymptotisch worden naar 0. Dat betekent dat de grafiek steeds dichter bij 0 komt, maar deze nooit zal raken. Dus je p-waarde kan oneindig klein zijn, maar nooit echt 0. SPSS rekent echter met 3 cijfers achter de komma, dus elke p-waarde van kleiner dan 0.0005 (dus 0.000499...) zal naar 0 worden afgerond. Voor je conclusies maakt dat niet uit, omdat je met een alpha van 0.05 of 0.01 rekent en het alleen gaat om wel/niet significant. Er bestaat vanuit de statistiek niet zoiets als "erg significant" of "een beetje significant." :)

EDIT: Dat de normaalverdeling asymptotisch is, is ook meteen de reden dat je met een 95%CI of 99%CI werkt en nooit met een 100%CI. 100%CI zou betekenen dat het betrouwbaarheidsinterval loopt van - oneindig tot + oneindig. Dat is niet zo informatief. :P
Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?



Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?

quote:
Wat betreft de p-waarde: Doorgaans houden mensen een alpha aan van 0.05 en je p-waarde is lager dan dat. Dat betekent dat je stelt dat die waarde zo klein is, dat je de nul-hypothese (geen effect) verwerpt en de alternatieve hypothese (wel een effect) aanneemt. Het verband kan dus nog steeds een toevalligheid zijn, (Die kans is er altijd, aangezien p niet nul kan zijn) maar je stelt dat die kans zo klein is, dat je redenen hebt om die conclusie te verwerpen.
Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?

[ Bericht 1% gewijzigd door Tobi-wan op 19-05-2015 12:23:57 ]
abonnement Unibet Coolblue Bitvavo
Forum Opties
Forumhop:
Hop naar:
(afkorting, bv 'KLB')