SPSS-vraag

06-11-2017 22:19 8 berichten
Alle reacties Link kopieren
Ik heb weer een SPSS-vraag.
Wellicht is de vraag voor experts simpel te beantwoorden.

Ik heb een variabele met een scheefheid die groter is dan 2.
Om een normale verdeling te krijgen,
Heb ik een nieuwe variabele gemaakt mbv een lg10-transformatie.
Nu blijkt de nieuwe variabele echter een veel grotere scheefheid te hebben!
Er is niet sprake van ontbrekende of rara waarden.
Wie weet hoe dit kan en hoe ik alsnog een normale verdeling kan krijgen?

Alvast enorm bedankt voor de hulp!!
Alle reacties Link kopieren
Succes! Hoop dat iemand je kan helpen. Ik vond SPSS altijd een gedoe en ben blij dat ik er van af ben..
Alle reacties Link kopieren
Ik dacht misschien met een mediaan split? Staan wel filmpjes van op YouTube.
Alle reacties Link kopieren
Ik zou even een histogram maken van de oorspronkelijke variabele, en ook eentje van de log10-getransformeerde. Dan kun je in ieder geval even zien wat je transformatie gedaan heeft. Vind dat zelf altijd een stuk meer informatie geven dan op getallen afgaan.
Ik heb ooit met spss gewerkt (dus dacht dat ik wel ff mee kon kijken), maar snap van de eerste zin al geen fuck. Ik word oud. :-$ @( :facepalm:
Bij deze een wat langer antwoord, ik hoop dat je er wat aan hebt.

Als eerste keus, zou ik, als het kan een nonparametrische test gebruiken, dan hoeft de data niet normaal verdeeld te zijn en omzeil je het hele probleem. Voor veel statistische testen bestaan er nonparametrische alternatieven dus wellicht dat die je kunnen helpen.

Als die niet bestaat, geldt voor veel parametrische testen (waarbij de data dus normaal verdeeld dient te zijn), dat bij een groepsgrootte die groot genoeg is, het niet erg belangrijk meer is of de data normaal verdeeld is. Dit is dus afhankelijk van de test die je wil gebruiken.

Mocht dat ook niet werken dan zul je de data kunnen transformeren. Ik zou eerst controleren of je je logtransformatie goed hebt toegepast. Het is vreemd dat de data rechts-scheef is en nog schever is geworden. Kweepeers suggestie is een goede. Let er ook op dat logtransformatie hier niet kan als je negatieve getallen en nullen in je data hebt.

Als dit niet werkt dan zou je andere transformaties kunnen proberen. Er zijn er heel veel (bv worteltrekken en de derdemachtswortel) en het belangrijkste criterium welke te gebruiken is kijken welke werkt. Let op of die transformaties mogen bij negatieve getallen en nullen als je die hebt.

Dit is een link die het redelijk beschrijft:
http://fmwww.bc.edu/repec/bocode/t/transint.html

In z’n algemeenheid raad ik datatransformatie echt af. De data komen er totaal anders uit te zien en de resultaten worden lastiger te interpreteren omdat de eenheden ook getransformeerd worden. Als je bijvoorbeeld loggetransformeerde leeftijden statistisch test tussen twee groepen, en je vindt een significant verschil, kun je niet zeggen dat één groep significant ouder in jaren is dan de ander, maar alleen in loggetransformeerde jaren.

Succes!
Alle reacties Link kopieren
Super bedankt voor de reacties!! In het bijzonder kinase3000!
Hier ben ik enorm mee geholpen.
Alle reacties Link kopieren
Toch nog een additionele vraag:

Ik heb dmv reflection en log-transformatie een negative skewness genormaliseerd (lg10(max variabele+1-variabele)).

Hierna wil ik een samengestelde variabele/ construct bouwen,
daarom doe ik een factoranalyse.
Echter heeft de genormaliseerde variabele nu een negatieve factor loading.

Nu lees ik op internet dat variabelen in principe niet genormaliseerd hoeven te worden bij FA, klopt dit?
Maar wanneer zou ik dan wel een variabele moeten normaliseren?
Kan ik voor het bouwen van de samengestelde variabele de oorspronkelijke variabele gebruiken die niet normaal verdeeld is??

Alvast weer enorm bedankt!!

Dit is een oud topic. Het topic is daarom gesloten.
Maak een nieuw topic aan om verder praten over dit onderwerp.

Terug naar boven