Hallo zusammen,
ich habe eine Fülle von Variablen (knapp 100) und möchte herausfinden, welche sehr stark miteinander korrelieren (um diese für evtl. Folgeanalysen aus dem Datensatz herauszunehmen).
Die Ausprägungen der einzelnen Variablen sind intervallskaliert oder verhältnisskaliert. Nach Tests zeigt es mir nicht annhähernd eine Normalverteilung an.
Zur Feststellung der Korrelation eignet sich daher nicht Pearson.
Da die Daten nicht ordinalskaliert sind kann ich aber auch keinen Spearman verwenden.
1.
Welche Alternativen die Korrelation zweier Variablen herauszufinden? Muss ich die Daten verändern?
Kann/Sollte ich irgendwie eine Normalverteilung herstellen?
2.
Welche Methode empfehlt ihr zum Umgang mit Ausreißern?
--> Über Box-Plot identifizieren und dann löschen? Muss ich sie immer eliminieren (Datenverlust)?
Vielen Dank schon jetzt für Eure Mühe und viele Grüße,
Tony
Korrelationskoeffizienten - Normalverteilung, Ausreißer
-
- Beiträge: 2
- Registriert: 01.09.2011, 10:42