Hallo zusammen,
wie man an meiner Frage erkennt, bin ich kein Spezialist im Bereich Statistik
Ich habe für 4 unabhängige metrische Variablen versucht zu errechnen, ob diese normal verteilt sind. Sowohl der Shapiro-Wilk Test als auch der K-S Test sagen bei allen 4 Variablen, dass sie NICHT normal verteilt sind. Wenn man sich aber die dazu gehörigen Q-Q-Plots ansieht, dann sieht die Datenverteilung eigentlich schon ziemlich linear aus (zumindest auf dem normalen Q-Q-Plot, nicht so sehr auf dem bereinigten).
Wie kann das sein? Kann ich, aufgrund der Testergebnisse trotzdem davon ausgehen, dass es sich hier nie um normal verteilte Daten handelt?
Ich muss dies deshalb wissen, weil ich danach Korrelationen zwischen diesen Daten berechnen will. Und soweit ich gelesen habe, gilt die Pearson Korrelation nur für normal verteilte Variablen und die Spearman Korrelation für nicht normal verteilte. Richtig?
Danke für jegliche Hilfe und Erklärung!
Lily
NICHT normal verteilt trotz Q-Q-Plot?
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Diese Tests geben nur Auskunft über den sog. p-Wert. Dieser wird mit dem vorgegebenen Alpha-Niveau verglichen. Sollte dieses Alpha-Niveau höher liegen als der p-Wert, wird die H0 nicht abgelehnt. So die Konvention.Sowohl der Shapiro-Wilk Test als auch der K-S Test sagen bei allen 4 Variablen, dass sie NICHT normal verteilt sind.
Nicht ganz richtig. Der Spearman ist nichts anderes als der Pearson über die rangtransformierten Werte. Die Rangtransformation berwirkt (zum Beispiel), dass Ausreißerproblematiken keine Rolle spielen. Rangstatistiken sind aber nicht ganz so beliebig über jede Verteilung sinnvoll einsetzbar.Und soweit ich gelesen habe, gilt die Pearson Korrelation nur für normal verteilte Variablen und die Spearman Korrelation für nicht normal verteilte. Richtig?
In deinem Fall wirst du mit dem Spearman eher "auf Nummer Sicher gehen". Die Effizienz dieses Spearmans wird bei perfekter Normalverteilung wohl nicht so groß sein wie der Pearson (aber immer noch beinahe so groß), bei Ausreißerproblematiken hingegen liefert der Pearson schon sehr verzerrte Ergebnisse, der Spearman nicht.
Zu den Begriffen der Effizienz (von parametrischen Verfahren gegenüber ihren NP- Äquivalenten) siehe Stichwort "A.R.E." - Literatur: z.B. Büning.
drfg2008
-
- Beiträge: 6
- Registriert: 29.04.2013, 23:18
Hallo nochmal und vielen Dank für die ausführlichen Antworten!
Ich habe nun gerechnet, und nachdem sowohl bei Spearman als auch bei Pearson eine nicht signifikante Korrelation raus kommt, ist es vermutlich nicht so schlimm, ob die Variablen nun wirklich normal verteilt sind oder nicht. Richtig? Im Prinzip geht es mir ja nur darum, eine Korrelation zu bestätigen bzw. abzulehnen.
Danke und lg!
Ich habe nun gerechnet, und nachdem sowohl bei Spearman als auch bei Pearson eine nicht signifikante Korrelation raus kommt, ist es vermutlich nicht so schlimm, ob die Variablen nun wirklich normal verteilt sind oder nicht. Richtig? Im Prinzip geht es mir ja nur darum, eine Korrelation zu bestätigen bzw. abzulehnen.
Danke und lg!