Centraal Statistiektopic (SPSS, R, excel, etc.) #7

zaterdag 25 april 2015 @ 01:24:16 #256

Natoo

Hoi!

Stomme vraag misschien, maar is het mogelijk om van de variabelen die ik via "compute variable" heb aangemaakt de numerieke code terug te vinden en/of te veranderen ? Dus stel ik heb een variabele aangemaakt: "somscore" = variabele1 + variabele2 + variabele3, en ik wil er bijvoorbeeld nog een variabele extra aan toevoegen of weghalen, kan dat? Of moet ik dan weer een hele nieuwe variabele aanmaken?

Hoop dat iemand nog reageert, aangezien het forum al lange tijd niet gebruikt is

zaterdag 25 april 2015 @ 08:09:51 #257

oompaloompa

doompadeedee

quote:
Op zaterdag 25 april 2015 01:24 schreef Natoo het volgende:
Hoi!

Stomme vraag misschien, maar is het mogelijk om van de variabelen die ik via "compute variable" heb aangemaakt de numerieke code terug te vinden en/of te veranderen ? Dus stel ik heb een variabele aangemaakt: "somscore" = variabele1 + variabele2 + variabele3, en ik wil er bijvoorbeeld nog een variabele extra aan toevoegen of weghalen, kan dat? Of moet ik dan weer een hele nieuwe variabele aanmaken?

Hoop dat iemand nog reageert, aangezien het forum al lange tijd niet gebruikt is

Dat ligt er aan of je meteen de recode gerunned hebt of naar syntax gepaste. Als je het naar syntax gepaste hebt is het heel gemakkelijk aan te passen, als je het meteen gerunned hebt ben ik bang dat het niet zo gemakkelijk gaat (maar ik kan het verkeerd hebben).

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zaterdag 25 april 2015 @ 10:17:14 #258

dotKoen

Je zou natuurlijk

1	Compute somscore2 = somscore + var4.

kunnen doen. Wederom een argument om alles in syntax te doen.

zaterdag 25 april 2015 @ 18:20:25 #259

Natoo

Bedankt voor jullie reacties!
Inderdaad het beste om de syntax te gebruiken.. had ik in dit geval niet gedaan. Vanaf nu wel weer

Maar dan moet ik het zelf in de code aanpassen, toch? Ben namelijk niet zo goed in syntax-taal..

Zou fijner zijn als het werkte zoals in excel.. als je een kolomwaarde aanpast dat de somscore/gem./etc. dan ook aanpast..

zaterdag 25 april 2015 @ 18:32:05 #260

Operc

Nr. 40

quote:
Op zaterdag 25 april 2015 18:20 schreef Natoo het volgende:
Maar dan moet ik het zelf in de code aanpassen, toch? Ben namelijk niet zo goed in syntax-taal..

Als je er niet zo goed in bent, kun je het ook via de menuknoppen doen en op Paste klikken in plaats van OK. Dan plakt hij de code in een syntax bestand en kun je zelf zien hoe de syntax eruit ziet.

zaterdag 25 april 2015 @ 19:00:22 #261

Natoo

quote:
Als je er niet zo goed in bent, kun je het ook via de menuknoppen doen en op Paste klikken in plaats van OK. Dan plakt hij de code in een syntax bestand en kun je zelf zien hoe de syntax eruit ziet.

Ja dat wel, maar ik bedoel als ik berekeningen aan wil passen moet ik dat in de syntax doen (in syntax-taal)..

zaterdag 25 april 2015 @ 20:47:28 #262

Z

Zo moeilijk is dat nou ook weer niet.

Aldus.

zaterdag 25 april 2015 @ 22:55:36 #263

Natoo

Even nog iets anders.. ben even helemaal in de war!

Ik heb verschillende schalen.. van sommige schalen heb ik de somscores, van anderen heb ik gemiddelden. Nou heb ik de descriptives opgevraagd van de schalen om te kijken of ze normaal verdeeld zijn etc.. maar een "mean" van een somscore-schaal betekent iets anders dan een "mean" van een gemiddelde-schaal.

Moet ik de descriptives van alle schalen op hetzelfde 'niveau' opvragen? (dus of allemaal somscores, of allemaal gemiddelden?). Of hoeft dat niet? En hoe interpreteer ik deze verschillende descriptives? De 'mean' van een gemiddelde-schaal is wat men gemiddeld scoort en de 'mean' van een somscore-schaal is wat men totaal gemiddeld scoort, Of zo?

zaterdag 25 april 2015 @ 23:31:40 #264

oompaloompa

doompadeedee

quote:
Op zaterdag 25 april 2015 22:55 schreef Natoo het volgende:
Even nog iets anders.. ben even helemaal in de war!

Ik heb verschillende schalen.. van sommige schalen heb ik de somscores, van anderen heb ik gemiddelden. Nou heb ik de descriptives opgevraagd van de schalen om te kijken of ze normaal verdeeld zijn etc.. maar een "mean" van een somscore-schaal betekent iets anders dan een "mean" van een gemiddelde-schaal.

Ik zou pakken wat voor de lezer het logischte is (meestal is dat gemiddelde, maar stel dat het een "schaal zou zijn van 10 proefwerkvragen die allemaal 0.0-1.0 punt opleveren, dan zou een somscore logischer zijn)

quote:
Moet ik de descriptives van alle schalen op hetzelfde 'niveau' opvragen? (dus of allemaal somscores, of allemaal gemiddelden?). Of hoeft dat niet? En hoe interpreteer ik deze verschillende descriptives? De 'mean' van een gemiddelde-schaal is wat men gemiddeld scoort en de 'mean' van een somscore-schaal is wat men totaal gemiddeld scoort, Of zo?

inderdaad

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

zaterdag 25 april 2015 @ 23:34:35 #265

Natoo

Mijn dank is groot!

dinsdag 28 april 2015 @ 18:04:20 #266

Natoo

Gezien de aard van mijn onderzoek was het de bedoeling om een multipele regressie uit te gaan voeren. Ik ben allereerst begonnen met uit uitrekenen van alle descriptives, waaruit bleek dat sommige variabelen niet normaal verdeeld bleken te zijn.. wat is nu mijn vervolgstap?

Ik neem aan dat ik eerst moet beginnen met het berekenen van de correlaties tussen de variabelen (middels een Spearman Correlatie gezien de niet-normale verdelingen, maar ook een kleine steekproefgrootte (N=25))?. En kan ik het beste de Mediaan (+MAD als spreidingsmaat) weergeven ipv de gemiddelden?

En wat doe ik daarna? Normaal volg ik gewoon een stappenplan om te kijken welke toets ik uit moet voeren, maar ik loop nu allemaal tegen dingen aan waar ik nog niet eerder mee te maken heb gehad (kleine steekproef, niet-normale verdelingen, etc.)

Iemand die mij weer op weg kan helpen, wellicht?

dinsdag 28 april 2015 @ 18:38:07 #267

ssebass

quote:
Op zondag 14 september 2014 17:56 schreef Z het volgende:
Python heeft toch ook een mooie statistiekmodule (Panda's)?

Zag dat er ook iets als ipython is icm notebook dat je interactief kunt programmeren en ook delen. Je kunt ook R code e.d. implementeren. Ben er zelf niet bekend mee maar ga mij er eens in verdiepen. Gebruik R voor statistiek en Python voor de lol om programma's te schrijven.

SPSS is naar mijn idee wat verouderd, beperkt en is een black box dus heb gekozen voor R. Waarom kiezen de meesten nog voor SPSS of is dit geen vrijwillige keuze? Ik heb namelijk het idee dat er een shift gaande is naar R en dergelijke. Als je toch nog met geen van beiden bekend bent lijkt mij de keuze voor R logischer. Het is ook gratis.

"Happiness is not getting more, but wanting less"

dinsdag 28 april 2015 @ 19:56:09 #268

Z

SPSS is veel toegankelijker en makkelijker. R heeft een flink steile leercurve.

Aldus.

dinsdag 28 april 2015 @ 20:00:36 #269

oompaloompa

doompadeedee

quote:
Op dinsdag 28 april 2015 18:04 schreef Natoo het volgende:
Gezien de aard van mijn onderzoek was het de bedoeling om een multipele regressie uit te gaan voeren. Ik ben allereerst begonnen met uit uitrekenen van alle descriptives, waaruit bleek dat sommige variabelen niet normaal verdeeld bleken te zijn.. wat is nu mijn vervolgstap?

Ik neem aan dat ik eerst moet beginnen met het berekenen van de correlaties tussen de variabelen (middels een Spearman Correlatie gezien de niet-normale verdelingen, maar ook een kleine steekproefgrootte (N=25))?. En kan ik het beste de Mediaan (+MAD als spreidingsmaat) weergeven ipv de gemiddelden?

En wat doe ik daarna? Normaal volg ik gewoon een stappenplan om te kijken welke toets ik uit moet voeren, maar ik loop nu allemaal tegen dingen aan waar ik nog niet eerder mee te maken heb gehad (kleine steekproef, niet-normale verdelingen, etc.)

Iemand die mij weer op weg kan helpen, wellicht?

Normaal verdeelde data is in principe geen harde eis omdat er nog geen enkele verdeling is gevonden waarbij bij n>30 de gemiddelden niet normaal verdeeld waren (dat tweede is wel een "harde" eis).
Kleine steekproef is wel vrij vervelend om veel redenen

Als je data niet extreem raar verdeeld zijn, zou ik denk ik gewoon verder gaan met je geplande methodes en ergens vermelden dat je data niet normaal verdeeld waren en dat je resultaten dus iets minder betrouwbaar zijn oid.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 28 april 2015 @ 20:01:31 #270

oompaloompa

doompadeedee

quote:
Op dinsdag 28 april 2015 18:38 schreef ssebass het volgende:

[..]

Zag dat er ook iets als ipython is icm notebook dat je interactief kunt programmeren en ook delen. Je kunt ook R code e.d. implementeren. Ben er zelf niet bekend mee maar ga mij er eens in verdiepen. Gebruik R voor statistiek en Python voor de lol om programma's te schrijven.

SPSS is naar mijn idee wat verouderd, beperkt en is een black box dus heb gekozen voor R. Waarom kiezen de meesten nog voor SPSS of is dit geen vrijwillige keuze? Ik heb namelijk het idee dat er een shift gaande is naar R en dergelijke. Als je toch nog met geen van beiden bekend bent lijkt mij de keuze voor R logischer. Het is ook gratis.

Ik doe nieuwe dingen in R, en gebruik SPSS vooral nog omdat het simpel is en ik er aan gewend ben. Als ik van scratch zou moeten beginnen zou ik alles in R doen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

dinsdag 28 april 2015 @ 22:49:16 #271

Natoo

quote:
Als je data niet extreem raar verdeeld zijn, zou ik denk ik gewoon verder gaan met je geplande methodes en ergens vermelden dat je data niet normaal verdeeld waren en dat je resultaten dus iets minder betrouwbaar zijn oid.

Ok, thanks. Ik heb verder nog niet op de verdere aannames voor een multipele regressie getoetst.. maar het zou me niks verbazen als ik er niet aan voldoe (ook gezien mijn kleine steekproefgrootte). Zijn er dan nog andere opties/meer robuustere methodes om regressie te toetsen?

[ Bericht 13% gewijzigd door Natoo op 29-04-2015 23:49:23 ]

maandag 11 mei 2015 @ 14:57:24 #272

Pinkdwarf

Free the Boobies

Hopelijk kunnen jullie mij helpen.
Voor mijn scriptie ben ik bezig met een andere techniek voor een onderzoek op de CT-scan.
Nu ben ik geen held met SPSS en heb het grootste deel wel af, maar kom er nu totaal niet meer uit.

Wat ik wil is eigenlijk dit (uit een ander, al gepubliceerd onderzoek):

Maar dan met mijn data zou het dit worden (qua opzet):

En de data die ik in SPSS heb:

Iemand enig idee hoe ik dit voor elkaar krijg?

Alvast enorm bedankt!

You can only have the sunshine after the rain..

maandag 11 mei 2015 @ 15:06:33 #273

Operc

Nr. 40

quote:
Op maandag 11 mei 2015 14:57 schreef Pinkdwarf het volgende:
Hopelijk kunnen jullie mij helpen.
Voor mijn scriptie ben ik bezig met een andere techniek voor een onderzoek op de CT-scan.
Nu ben ik geen held met SPSS en heb het grootste deel wel af, maar kom er nu totaal niet meer uit.

Wat ik wil is eigenlijk dit (uit een ander, al gepubliceerd onderzoek):
[ afbeelding ]

Maar dan met mijn data zou het dit worden (qua opzet):
[ afbeelding ]

En de data die ik in SPSS heb:
[ afbeelding ]

Iemand enig idee hoe ik dit voor elkaar krijg?
Alvast enorm bedankt!

Als je een ANOVA doet, kun je bij "Options" op "Descriptives" klikken. Dan krijg je bij je ANOVA tabel ook een tabel met de Means, SDs etc per groep en voor het totaal. Dit kun je dan doen voor elke afhankelijke variabele. (Je bent alleen geïnteresseerd in de verschillen tussen Bolus en Test en niet AFC rechts/links etc toch?)

maandag 11 mei 2015 @ 23:13:33 #274

Sarasi

Quack.

Ik ben even compleet gefrustreerd. Ik heb data in spss die ik niet kan analyseren omdat hij vindt dat mijn gemiddelde score een string is. Ik heb er inmiddels een aardappelhoofd van gekregen en ook in de syntax van SPSS kom ik niet verder.

compute Score = number(SC0_1).
execute.
recode SC0_1 (convert) into score2.
execute.
COMPUTE score = NUMBER(SC0_1, F8.12).
execute.

werken allemaal niet. In de 'view variable' de variabele van string naar numeric veranderen heeft tot gevolg dat alle waardes verdwijnen. Uiteindelijk heb ik de huidige laatste drie variabelen verkregen door automatic recode te gebruiken, maar de hoeveelheid informatie die daarbij verloren gaat is onacceptabel. Hij houdt dan twee decimalen over van de veertig.

Helaas moet dit per se in spss. Iemand nog een tip?

Your opinion of me is none of my business.

maandag 11 mei 2015 @ 23:20:36 #275

Operc

Nr. 40

quote:
Op maandag 11 mei 2015 23:13 schreef Sarasi het volgende:
Ik ben even compleet gefrustreerd. Ik heb data in spss die ik niet kan analyseren omdat hij vindt dat mijn gemiddelde score een string is. Ik heb er inmiddels een aardappelhoofd van gekregen en ook in de syntax van SPSS kom ik niet verder.

compute Score = number(SC0_1).
execute.
recode SC0_1 (convert) into score2.
execute.
COMPUTE score = NUMBER(SC0_1, F8.12).
execute.

werken allemaal niet. In de 'view variable' de variabele van string naar numeric veranderen heeft tot gevolg dat alle waardes verdwijnen. Uiteindelijk heb ik de huidige laatste drie variabelen verkregen door automatic recode te gebruiken, maar de hoeveelheid informatie die daarbij verloren gaat is onacceptabel. Hij houdt dan twee decimalen over van de veertig.

Helaas moet dit per se in spss. Iemand nog een tip?

Dat is altijd even klooien ja. Je kunt proberen om de kolom naar Excel te plakken, daar de juiste celstructuur te kiezen en vervolgens weer in SPSS te zetten.

dinsdag 12 mei 2015 @ 08:52:36 #276

Pinkdwarf

Free the Boobies

quote:
Op maandag 11 mei 2015 15:06 schreef Operc het volgende:

[..]

Als je een ANOVA doet, kun je bij "Options" op "Descriptives" klikken. Dan krijg je bij je ANOVA tabel ook een tabel met de Means, SDs etc per groep en voor het totaal. Dit kun je dan doen voor elke afhankelijke variabele. (Je bent alleen geïnteresseerd in de verschillen tussen Bolus en Test en niet AFC rechts/links etc toch?)

Het is gelukt! Mijn dank is groot

You can only have the sunshine after the rain..

dinsdag 12 mei 2015 @ 09:45:38 #277

Operc

Nr. 40

quote:
Op dinsdag 12 mei 2015 08:52 schreef Pinkdwarf het volgende:

[..]

Het is gelukt! Mijn dank is groot

Top! Succes met je onderzoek.

dinsdag 12 mei 2015 @ 10:33:00 #278

DuTank

Spaashaas.

quote:
Op maandag 11 mei 2015 23:13 schreef Sarasi het volgende:
Ik ben even compleet gefrustreerd. Ik heb data in spss die ik niet kan analyseren omdat hij vindt dat mijn gemiddelde score een string is. Ik heb er inmiddels een aardappelhoofd van gekregen en ook in de syntax van SPSS kom ik niet verder.

compute Score = number(SC0_1).
execute.
recode SC0_1 (convert) into score2.
execute.
COMPUTE score = NUMBER(SC0_1, F8.12).
execute.

werken allemaal niet. In de 'view variable' de variabele van string naar numeric veranderen heeft tot gevolg dat alle waardes verdwijnen. Uiteindelijk heb ik de huidige laatste drie variabelen verkregen door automatic recode te gebruiken, maar de hoeveelheid informatie die daarbij verloren gaat is onacceptabel. Hij houdt dan twee decimalen over van de veertig.

Helaas moet dit per se in spss. Iemand nog een tip?

In mijn dataset had ik ook twee variabelen die string waren. Wat bleek? Dit waren variabelen waar deelnemers een getal moest intikken (leeftijd bijvoorbeeld). Nu hadden een aantal mensen per ongeluk een / erbij getypt. Nadat ik die had weg gehaald, kon ik het wel veranderen als numerieke data.

Herb is the healing of a nation, alcohol is the destruction.

dinsdag 12 mei 2015 @ 20:14:32 #279

GoobyPls

Gooby Pls :)

Zijn hier Excel danwel Google spreadsheet (voorkeur) helden?

Ik zoek een formule voor een close text match.

Voorbeeld:
Kolom A
Book7324

Kolom C
Book7324 eu

Ik wil dat die deze match maakt, een voorwaarde moet zijn dat er een spatie tussenzit. Dit moet met wildcards mogelijk zijn, maar ik kom er toch niet helemaal uit.

Weet iemand tevens een manier om in 1x een cel van al zijn special characters en spaties te ontdoen?

dinsdag 12 mei 2015 @ 21:31:22 #280

Z

In Excel macro's kan je de like operator gebruiken. Je kan dus een functie maken.

Google: excel macro like function

Aldus.

dinsdag 12 mei 2015 @ 21:41:07 #281

GoobyPls

Gooby Pls :)

quote:
Op dinsdag 12 mei 2015 21:31 schreef Z het volgende:
In Excel macro's kan je de like operator gebruiken. Je kan dus een functie maken.

Google: excel macro like function

Dit gaat me iets te snel, hoe zou de formule bij bovenstaand voorbeeld eruit zien?

dinsdag 12 mei 2015 @ 21:46:22 #282

Z

quote:
Op dinsdag 12 mei 2015 21:41 schreef GoobyPls het volgende:
Google: excel macro like function

In Excel kan je macro's maken en met een macro kan je een functie maken. Macro's bieden veel meer functionaliteiten dan functies (en een functies is in wezen een macro). Hoe je precies jouw functie maakt, weet ik niet, maar je googelt dat zo bij elkaar.

Aldus.

dinsdag 12 mei 2015 @ 21:58:00 #283

Z

En anders met een zoekfunctie. Je kan geloof ik zoeken naar een niet exacte match. En als de overeenkomst altijd links in de cel staat en het extra deel tekst rechts (zoals in je voorbeeld), kan je het oplossen met een =rechts() functie gecombineerd met een zoekfunctie.

Aldus.

donderdag 14 mei 2015 @ 16:02:35 #284

GoobyPls

Gooby Pls :)

Wat zou in mijn voorbeeld de functie dan worden?

donderdag 14 mei 2015 @ 16:32:19 #285

Z

Wat wil je dat het resultaat is?

Aldus.

donderdag 14 mei 2015 @ 16:43:34 #286

GoobyPls

Gooby Pls :)

De lookup op A1 (Book7324) moet de waarde in B (Book7324 eu) vinden.

donderdag 14 mei 2015 @ 19:38:21 #287

Z

Is het nu zo dat het begin altijd klopt en de extra, niet matchende tekst, altijd achteraan staat?

Aldus.

donderdag 14 mei 2015 @ 21:59:57 #288

ralfie

!Yvan eht nioj

quote:
Op donderdag 14 mei 2015 16:43 schreef GoobyPls het volgende:
De lookup op A1 (Book7324) moet de waarde in B (Book7324 eu) vinden.

vert.zoeken("*Book7324*";A1:A100;1;ONWAAR)

of VLOOKUP in engels

donderdag 14 mei 2015 @ 22:37:18 #289

GoobyPls

Gooby Pls :)

quote:
Op donderdag 14 mei 2015 19:38 schreef Z het volgende:
Is het nu zo dat het begin altijd klopt en de extra, niet matchende tekst, altijd achteraan staat?

Ja

vrijdag 15 mei 2015 @ 13:56:21 #290

Tobi-wan

Ben momenteel druk bezig met het analyseren van data uit mijn enquête. Het is een hoop puzzelen en ik begrijp nog niet heel veel maar vroeg me af of ik in de groede richting zit. Als het complete onzin is wat ik hier verkondig dan wil ik dat net zo graag weten!

Ben bezig met een Pearson correlatie toets(?), het gaat over het beeld wat mensen over Facebook hebben en of dit verband heeft met leeftijd.

Analyze > Correlate > Bivariate

Dan krijg ik dit resultaat:

Betekent de -.224 dat er een enigszins negatief verband is tussen de twee, dat ouderen dus een negatiever beeld hebben? Staat de ,005 voor dat dit verband geen toeval is?

Alvast bedankt

vrijdag 15 mei 2015 @ 14:39:17 #291

Operc

Nr. 40

quote:
Op vrijdag 15 mei 2015 13:56 schreef Tobi-wan het volgende:

Betekent de -.224 dat er een enigszins negatief verband is tussen de twee, dat ouderen dus een negatiever beeld hebben? Staat de ,005 voor dat dit verband geen toeval is?

Alvast bedankt

Ja, het is geen sterk effect, maar volgens die tabel is er een negatieve correlatie tussen de twee variabelen. Dus als de waarde van de ene variabele stijgt, dan daalt de waarde van de andere variabele.

Wat betreft de p-waarde: Doorgaans houden mensen een alpha aan van 0.05 en je p-waarde is lager dan dat. Dat betekent dat je stelt dat die waarde zo klein is, dat je de nul-hypothese (geen effect) verwerpt en de alternatieve hypothese (wel een effect) aanneemt. Het verband kan dus nog steeds een toevalligheid zijn, (Die kans is er altijd, aangezien p niet nul kan zijn) maar je stelt dat die kans zo klein is, dat je redenen hebt om die conclusie te verwerpen.

vrijdag 15 mei 2015 @ 14:54:27 #292

Tobi-wan

quote:
Op vrijdag 15 mei 2015 14:39 schreef Operc het volgende:

[..]

Ja, het is geen sterk effect, maar volgens die tabel is er een negatieve correlatie tussen de twee variabelen. Dus als de waarde van de ene variabele stijgt, dan daalt de waarde van de andere variabele.

Wat betreft de p-waarde: Doorgaans houden mensen een alpha aan van 0.05 en je p-waarde is lager dan dat. Dat betekent dat je stelt dat die waarde zo klein is, dat je de nul-hypothese (geen effect) verwerpt en de alternatieve hypothese (wel een effect) aanneemt. Het verband kan dus nog steeds een toevalligheid zijn, (Die kans is er altijd, aangezien p niet nul kan zijn) maar je stelt dat die kans zo klein is, dat je redenen hebt om die conclusie te verwerpen.

Ah super, heb ik toch weer wat geleerd vandaag. Bedankt! Waarom kan de p-waarde niet 0 zijn eigenlijk? Hieronder heb ik een andere vergelijking gevonden waar ook een kleine correlatie is tussen verschillende variabelen. Voor iemand die niet midden in het onderzoek zijn de variabelen natuurlijk onmogelijk te begrijpen.

Het gaat om de verhouding tussen Mavenisme (mensen willen voorzien van informatie) en 'combinatie persoonlijkheden' (hoe iemand zichzelf inschat als het gaat om mensen verbinden, overtuigen en informeren). Het is niet de verhouding waarin ik geïnteresseerd ben, het gaat mij daar om 'mavenisme vs content' en 'combinatie vs content' maar ben bel benieuwd wat het betekent als P daar dus 0 is, ik zie het wel vaker voorbij komen.

Domme vragen bestaan niet maar ik bied alvast mijn excuses aan in het geval dat

vrijdag 15 mei 2015 @ 14:58:39 #293

Operc

Nr. 40

quote:
Op vrijdag 15 mei 2015 14:54 schreef Tobi-wan het volgende:

[..]

Ah super, heb ik toch weer wat geleerd vandaag. Bedankt! Waarom kan de p-waarde niet 0 zijn eigenlijk? Hieronder heb ik een andere vergelijking gevonden waar ook een kleine correlatie is tussen verschillende variabelen. Voor iemand die niet midden in het onderzoek zijn de variabelen natuurlijk onmogelijk te begrijpen.

[ afbeelding ]

Het gaat om de verhouding tussen Mavenisme (mensen willen voorzien van informatie) en 'combinatie persoonlijkheden' (hoe iemand zichzelf inschat als het gaat om mensen verbinden, overtuigen en informeren. Het is niet de verhouding waarin ik geïnteresseerd ben, het gaat mij daar om 'mavenisme vs content' en 'combinatie vs content' maar ben bel benieuwd wat het betekent als P daar dus 0 is, ik zie het wel vaker voorbij komen.

Domme vragen bestaan niet maar ik bied alvast mijn excuses aan in het geval dat

Een p-waarde is eigenlijk gewoon een stuk van de oppervlakte onder de grafiek van een normaalverdeling. De normaalverdeling zal aan de uiteinden asymptotisch worden naar 0. Dat betekent dat de grafiek steeds dichter bij 0 komt, maar deze nooit zal raken. Dus je p-waarde kan oneindig klein zijn, maar nooit echt 0. SPSS rekent echter met 3 cijfers achter de komma, dus elke p-waarde van kleiner dan 0.0005 (dus 0.000499...) zal naar 0 worden afgerond. Voor je conclusies maakt dat niet uit, omdat je met een alpha van 0.05 of 0.01 rekent en het alleen gaat om wel/niet significant. Er bestaat vanuit de statistiek niet zoiets als "erg significant" of "een beetje significant."

EDIT: Dat de normaalverdeling asymptotisch is, is ook meteen de reden dat je met een 95%CI of 99%CI werkt en nooit met een 100%CI. 100%CI zou betekenen dat het betrouwbaarheidsinterval loopt van - oneindig tot + oneindig. Dat is niet zo informatief.

vrijdag 15 mei 2015 @ 15:23:09 #294

Tobi-wan

quote:
Op vrijdag 15 mei 2015 14:58 schreef Operc het volgende:

[..]

Een p-waarde is eigenlijk gewoon een stuk van de oppervlakte onder de grafiek van een normaalverdeling. De normaalverdeling zal aan de uiteinden asymptotisch worden naar 0. Dat betekent dat de grafiek steeds dichter bij 0 komt, maar deze nooit zal raken. Dus je p-waarde kan oneindig klein zijn, maar nooit echt 0. SPSS rekent echter met 3 cijfers achter de komma, dus elke p-waarde van kleiner dan 0.0005 (dus 0.000499...) zal naar 0 worden afgerond. Voor je conclusies maakt dat niet uit, omdat je met een alpha van 0.05 of 0.01 rekent en het alleen gaat om wel/niet significant. Er bestaat vanuit de statistiek niet zoiets als "erg significant" of "een beetje significant."

EDIT: Dat de normaalverdeling asymptotisch is, is ook meteen de reden dat je met een 95%CI of 99%CI werkt en nooit met een 100%CI. 100%CI zou betekenen dat het betrouwbaarheidsinterval loopt van - oneindig tot + oneindig. Dat is niet zo informatief.

Bedankt voor de heldere uitleg!

vrijdag 15 mei 2015 @ 15:24:24 #295

oompaloompa

doompadeedee

Een tip waar je niet om vraagt. Plot de twee waardes ook eens tegen elkaar met een scatterplot of zoiets.

Het zou kunnen datje data niet linear met elkaar samenhangen, bv (shit dacht dat je positieve correlatie had, nou ja voor het voorbeeld is ie positief):

leeftijd -> liking facebook (1-10)

7 - 5
8 - 4
9 - 3
10 - 2
11 - 3
12 - 4
13 - 5
14 - 6
15 - 7
16 - 8
17 - 9
18 - 10

In zo'n situatie zou je wel een significante correlatie kunnen krijgen en gaat liking over het algemeen omhoog met leeftijd maar zou de claim dat hoeouder je wordt hoe positiever je beeld wordt niet kloppen.

Op dinsdag 1 november 2016 00:05 schreef JanCees het volgende:
De polls worden ook in 9 van de 10 gevallen gepeild met een meerderheid democraten. Soms zelf +10% _O-

vrijdag 15 mei 2015 @ 15:36:29 #296

Tobi-wan

quote:
Op vrijdag 15 mei 2015 15:24 schreef oompaloompa het volgende:
Een tip waar je niet om vraagt. Plot de twee waardes ook eens tegen elkaar met een scatterplot of zoiets.

Het zou kunnen datje data niet linear met elkaar samenhangen, bv (shit dacht dat je positieve correlatie had, nou ja voor het voorbeeld is ie positief):

leeftijd -> liking facebook (1-10)

7 - 5
8 - 4
9 - 3
10 - 2
11 - 3
12 - 4
13 - 5
14 - 6
15 - 7
16 - 8
17 - 9
18 - 10

In zo'n situatie zou je wel een significante correlatie kunnen krijgen en gaat liking over het algemeen omhoog met leeftijd maar zou de claim dat hoeouder je wordt hoe positiever je beeld wordt niet kloppen.

Ben net uit het systeem gegaan. Ga morgen weer verder, dan zal ik er even naar kijken.

Bedankt voor de tip!

maandag 18 mei 2015 @ 11:45:38 #297

Tobi-wan

Heb even geprobeerd om een scatter plot te maken maar ik denk dat ik daar niet heel veel aan heb omdat ik de exacte leeftijden niet heb gevraagd. Het is nu allemaal ingedeeld in groepen en aan verhoudingen kan je wel zien dat mensen minder positief zijn naarmate hun leeftijd stijgt maar het is niet echt duidelijk.

Ik heb wel een andere vraag nog, zoals jullie hier kunnen zien is de indeling qua leeftijd niet echt logisch. Ik had weinig respondenten in de leeftijdsklasse 46-55 en 65+. Om de data toch te kunnen analyseren heb ik twee grotere groepen gemaakt, 36-55 en 55+. Kan ik dit goed praten? Ik lever dan waarschijnlijk in op betrouwbaarheid maar als ik in een bepaalde groep maar 10 respondenten heb kan ik daar volgens mij helemaal geen uitspraak over doen.

[ Bericht 31% gewijzigd door Tobi-wan op 18-05-2015 11:52:14 ]

maandag 18 mei 2015 @ 11:51:56 #298

Z

quote:
Op donderdag 14 mei 2015 22:37 schreef GoobyPls het volgende:

[..]

Ja

Kan je dan niet een oplossing met '=LINKS()' en '=VERT.ZOEKEN()' knutselen? Eventueel met een tussenkolom.

Aldus.

dinsdag 19 mei 2015 @ 07:42:35 #299

GoobyPls

Gooby Pls :)

quote:
Op donderdag 14 mei 2015 21:59 schreef ralfie het volgende:

[..]

vert.zoeken("*Book7324*";A1:A100;1;ONWAAR)

of VLOOKUP in engels

Deze pakt die niet als die de waarde uit de cel moet halen, dus:

vert.zoeken("*B1*";A1:A100;1;ONWAAR)

Hoe werken wildcards in deze combinatie?

dinsdag 19 mei 2015 @ 12:12:23 #300

Tobi-wan

quote:
Op vrijdag 15 mei 2015 14:58 schreef Operc het volgende:

[..]

Een p-waarde is eigenlijk gewoon een stuk van de oppervlakte onder de grafiek van een normaalverdeling. De normaalverdeling zal aan de uiteinden asymptotisch worden naar 0. Dat betekent dat de grafiek steeds dichter bij 0 komt, maar deze nooit zal raken. Dus je p-waarde kan oneindig klein zijn, maar nooit echt 0. SPSS rekent echter met 3 cijfers achter de komma, dus elke p-waarde van kleiner dan 0.0005 (dus 0.000499...) zal naar 0 worden afgerond. Voor je conclusies maakt dat niet uit, omdat je met een alpha van 0.05 of 0.01 rekent en het alleen gaat om wel/niet significant. Er bestaat vanuit de statistiek niet zoiets als "erg significant" of "een beetje significant."

EDIT: Dat de normaalverdeling asymptotisch is, is ook meteen de reden dat je met een 95%CI of 99%CI werkt en nooit met een 100%CI. 100%CI zou betekenen dat het betrouwbaarheidsinterval loopt van - oneindig tot + oneindig. Dat is niet zo informatief.

Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?

Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?

quote:
Wat betreft de p-waarde: Doorgaans houden mensen een alpha aan van 0.05 en je p-waarde is lager dan dat. Dat betekent dat je stelt dat die waarde zo klein is, dat je de nul-hypothese (geen effect) verwerpt en de alternatieve hypothese (wel een effect) aanneemt. Het verband kan dus nog steeds een toevalligheid zijn, (Die kans is er altijd, aangezien p niet nul kan zijn) maar je stelt dat die kans zo klein is, dat je redenen hebt om die conclusie te verwerpen.

Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?

[ Bericht 1% gewijzigd door Tobi-wan op 19-05-2015 12:23:57 ]

dinsdag 19 mei 2015 @ 13:09:51 #301

Operc

Nr. 40

quote:
Op dinsdag 19 mei 2015 12:12 schreef Tobi-wan het volgende:

[..]

Moet hier toch nog even op terugkomen, het is toch niet helemaal duidelijk. Als de p-waarde 0.000 is in SPSS (dus niet 0 want dat kan niet), kan je de hypothese dat iets geen effect heeft verwerpen?

Aangezien het om een correlatie gaat, kun je de nulhypothese dat er geen correlatie is tussen de twee variabelen verwerken. 0.000 is immers lager dan 0.05. Zeggen dat er een effect is (wat ik deed in de eerste post, excuses), zou ik achterwege laten, omdat dat zou kunnen worden gelezen als "Variabele 1 beïnvloed Variabele 2" en die conclusie kun je bij correlaties niet trekken. Er is een samenhang en je kunt beoordelen of deze positief of negatief is en sterk of zwak.

quote:
[ afbeelding ]

Heb even bovenstaande vergelijking gemaakt omdat het zonder onderzoek aannemelijk is dat deze gegevens met elkaar verbonden zijn. Hier geldt ook hetgeen wat je hierboven plaatste?

De uitleg uit mijn vorige past en wat ik hierboven zeg gelden ook voor deze variabelen ja. Zoals je zelf zegt is dit resultaat te verwachten omdat je in beide vragen min of meer hetzelfde meet.

quote:
Of moet ik hier de scatter plot toe te passen om te zien of er echt een correlatie tussen de twee variabelen is?

De correlatie is er, maar zoals oompaloompa al zei, het hoeft niet perse een lineair verband te zijn. De scatterplots kunnen helpen om daar wat meer inzicht in te krijgen.

Forum Opties
Forumhop:
Hop naar:	(afkorting, bv 'KLB')

» school, studie en onderwijs

» school, studie en onderwijs