Digi
alle pijlers
SPSS-vraag
maandag 6 november 2017 22:19
Ik heb weer een SPSS-vraag.
Wellicht is de vraag voor experts simpel te beantwoorden.
Ik heb een variabele met een scheefheid die groter is dan 2.
Om een normale verdeling te krijgen,
Heb ik een nieuwe variabele gemaakt mbv een lg10-transformatie.
Nu blijkt de nieuwe variabele echter een veel grotere scheefheid te hebben!
Er is niet sprake van ontbrekende of rara waarden.
Wie weet hoe dit kan en hoe ik alsnog een normale verdeling kan krijgen?
Alvast enorm bedankt voor de hulp!!
Wellicht is de vraag voor experts simpel te beantwoorden.
Ik heb een variabele met een scheefheid die groter is dan 2.
Om een normale verdeling te krijgen,
Heb ik een nieuwe variabele gemaakt mbv een lg10-transformatie.
Nu blijkt de nieuwe variabele echter een veel grotere scheefheid te hebben!
Er is niet sprake van ontbrekende of rara waarden.
Wie weet hoe dit kan en hoe ik alsnog een normale verdeling kan krijgen?
Alvast enorm bedankt voor de hulp!!
dinsdag 7 november 2017 00:20
dinsdag 7 november 2017 03:10
Bij deze een wat langer antwoord, ik hoop dat je er wat aan hebt.
Als eerste keus, zou ik, als het kan een nonparametrische test gebruiken, dan hoeft de data niet normaal verdeeld te zijn en omzeil je het hele probleem. Voor veel statistische testen bestaan er nonparametrische alternatieven dus wellicht dat die je kunnen helpen.
Als die niet bestaat, geldt voor veel parametrische testen (waarbij de data dus normaal verdeeld dient te zijn), dat bij een groepsgrootte die groot genoeg is, het niet erg belangrijk meer is of de data normaal verdeeld is. Dit is dus afhankelijk van de test die je wil gebruiken.
Mocht dat ook niet werken dan zul je de data kunnen transformeren. Ik zou eerst controleren of je je logtransformatie goed hebt toegepast. Het is vreemd dat de data rechts-scheef is en nog schever is geworden. Kweepeers suggestie is een goede. Let er ook op dat logtransformatie hier niet kan als je negatieve getallen en nullen in je data hebt.
Als dit niet werkt dan zou je andere transformaties kunnen proberen. Er zijn er heel veel (bv worteltrekken en de derdemachtswortel) en het belangrijkste criterium welke te gebruiken is kijken welke werkt. Let op of die transformaties mogen bij negatieve getallen en nullen als je die hebt.
Dit is een link die het redelijk beschrijft:
http://fmwww.bc.edu/repec/bocode/t/transint.html
In z’n algemeenheid raad ik datatransformatie echt af. De data komen er totaal anders uit te zien en de resultaten worden lastiger te interpreteren omdat de eenheden ook getransformeerd worden. Als je bijvoorbeeld loggetransformeerde leeftijden statistisch test tussen twee groepen, en je vindt een significant verschil, kun je niet zeggen dat één groep significant ouder in jaren is dan de ander, maar alleen in loggetransformeerde jaren.
Succes!
Als eerste keus, zou ik, als het kan een nonparametrische test gebruiken, dan hoeft de data niet normaal verdeeld te zijn en omzeil je het hele probleem. Voor veel statistische testen bestaan er nonparametrische alternatieven dus wellicht dat die je kunnen helpen.
Als die niet bestaat, geldt voor veel parametrische testen (waarbij de data dus normaal verdeeld dient te zijn), dat bij een groepsgrootte die groot genoeg is, het niet erg belangrijk meer is of de data normaal verdeeld is. Dit is dus afhankelijk van de test die je wil gebruiken.
Mocht dat ook niet werken dan zul je de data kunnen transformeren. Ik zou eerst controleren of je je logtransformatie goed hebt toegepast. Het is vreemd dat de data rechts-scheef is en nog schever is geworden. Kweepeers suggestie is een goede. Let er ook op dat logtransformatie hier niet kan als je negatieve getallen en nullen in je data hebt.
Als dit niet werkt dan zou je andere transformaties kunnen proberen. Er zijn er heel veel (bv worteltrekken en de derdemachtswortel) en het belangrijkste criterium welke te gebruiken is kijken welke werkt. Let op of die transformaties mogen bij negatieve getallen en nullen als je die hebt.
Dit is een link die het redelijk beschrijft:
http://fmwww.bc.edu/repec/bocode/t/transint.html
In z’n algemeenheid raad ik datatransformatie echt af. De data komen er totaal anders uit te zien en de resultaten worden lastiger te interpreteren omdat de eenheden ook getransformeerd worden. Als je bijvoorbeeld loggetransformeerde leeftijden statistisch test tussen twee groepen, en je vindt een significant verschil, kun je niet zeggen dat één groep significant ouder in jaren is dan de ander, maar alleen in loggetransformeerde jaren.
Succes!
dinsdag 7 november 2017 15:17
Toch nog een additionele vraag:
Ik heb dmv reflection en log-transformatie een negative skewness genormaliseerd (lg10(max variabele+1-variabele)).
Hierna wil ik een samengestelde variabele/ construct bouwen,
daarom doe ik een factoranalyse.
Echter heeft de genormaliseerde variabele nu een negatieve factor loading.
Nu lees ik op internet dat variabelen in principe niet genormaliseerd hoeven te worden bij FA, klopt dit?
Maar wanneer zou ik dan wel een variabele moeten normaliseren?
Kan ik voor het bouwen van de samengestelde variabele de oorspronkelijke variabele gebruiken die niet normaal verdeeld is??
Alvast weer enorm bedankt!!
Ik heb dmv reflection en log-transformatie een negative skewness genormaliseerd (lg10(max variabele+1-variabele)).
Hierna wil ik een samengestelde variabele/ construct bouwen,
daarom doe ik een factoranalyse.
Echter heeft de genormaliseerde variabele nu een negatieve factor loading.
Nu lees ik op internet dat variabelen in principe niet genormaliseerd hoeven te worden bij FA, klopt dit?
Maar wanneer zou ik dan wel een variabele moeten normaliseren?
Kan ik voor het bouwen van de samengestelde variabele de oorspronkelijke variabele gebruiken die niet normaal verdeeld is??
Alvast weer enorm bedankt!!