Hallo liebe Statistik-Kenner,
ich habe einen Datensatz mit ca. 430 Personen und wollte innerhalb dieser Stichprobe einige Variablen miteinander korrelieren.
Zu Beginn habe ich für diejenigen Skalen, die mich interessiert haben den K-S Test auf Normalverteilung gemacht. Der wird allerdings für fast jede Variable signifikant. Liegt das an meiner SP-Größe?
Habe mir zwar auch die Histogramme angesehen aber ich bin mir nicht sicher, wie viel "grafischen Spielraum" ich da bzgl. der Abweichung von der Normalverteilung habe?
Ich habe mir außerdem angesehen, welche Korrelationen von anderen verwendet wurden, die diese Verfahren angewendet hatten. Auch da gab es welche, die Pearson verwendeten und welche, die auf Spearman zurückgegriffen haben.
Die Variablen sind zumeist 5stufig oder auch mal 6stufig (z.B. 0 = nie bis 6 = sehr oft) und ich bin mir nicht sicher, ob ich ordinales Niveau annehmen muss oder auf intervallskaliert zurückgreifen kann. Wie begründe ich meine Wahl?
Vielen Dank vorab für eventuelle Hinweise!
Gruß,
Sixty
Welche Korrelation?
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Je größer die Stichprobe, desto kleiner sind die Effekte, die auf einem gegebenen Signifikanzniveau abgesichert werden können. 430 Personen ist bei einem sensitiven Test wie dem KSO schon recht groß, d.h. sehr kleine Effekte können bereits nachweisbar sein, die allerdings nicht relevant sein müssen. Ob bei dieser Stichprobengröße überhaupt die Frage nach Normalverteilung noch im Vordergrund steht, wäre zu bezweifeln (hierzu gab es schon auf dieser Plattform jede Menge Diskussion).Zu Beginn habe ich für diejenigen Skalen, die mich interessiert haben den K-S Test auf Normalverteilung gemacht. Der wird allerdings für fast jede Variable signifikant. Liegt das an meiner SP-Größe?
Bei Spearman besteht die Gefahr, dass wegen der Ordinalskalen viele Verbundränge entstehen. Bei Pearson wiederum besteht das Risiko der schiefen Verteilungen. Das Ganze ist vor dem Hintergrund der Daten abzuwägen. Auf jeden Fall sollten die Korrelationen nicht zu fundamental unterschiedlichen Ergebnissen kommen (etwa wenn der eine positive und der andere eine negative Korrelation nachweisen würde, oder der eine hoch positiv (Pearson) und der Spearman nahe Null und n. s. Dann besteht mit Sicherheit ein Datenproblem.Ich habe mir außerdem angesehen, welche Korrelationen von anderen verwendet wurden, die diese Verfahren angewendet hatten. Auch da gab es welche, die Pearson verwendeten und welche, die auf Spearman zurückgegriffen haben.
Gruß
drfg2008