NICHT normal verteilt trotz Q-Q-Plot?

Beitrag von **LiLy_88** » 30.04.2013, 20:00

Hallo zusammen,

wie man an meiner Frage erkennt, bin ich kein Spezialist im Bereich Statistik

Ich habe für 4 unabhängige metrische Variablen versucht zu errechnen, ob diese normal verteilt sind. Sowohl der Shapiro-Wilk Test als auch der K-S Test sagen bei allen 4 Variablen, dass sie NICHT normal verteilt sind. Wenn man sich aber die dazu gehörigen Q-Q-Plots ansieht, dann sieht die Datenverteilung eigentlich schon ziemlich linear aus (zumindest auf dem normalen Q-Q-Plot, nicht so sehr auf dem bereinigten).

Wie kann das sein? Kann ich, aufgrund der Testergebnisse trotzdem davon ausgehen, dass es sich hier nie um normal verteilte Daten handelt?

Ich muss dies deshalb wissen, weil ich danach Korrelationen zwischen diesen Daten berechnen will. Und soweit ich gelesen habe, gilt die Pearson Korrelation nur für normal verteilte Variablen und die Spearman Korrelation für nicht normal verteilte. Richtig?

Danke für jegliche Hilfe und Erklärung!
Lily

Beitrag von **muon-stat** » 01.05.2013, 12:33

Hallo Lilly,

So wie du die Ergebnisse beschreibst, werden sowohl der NP-Korrelationstest wie auch der Parametrische-Korrelationstest ein sehr ähnliches Ergebnis liefern. Hast du beide schon berechnet?

Grüße,
muon-stat

Beitrag von **drfg2008** » 01.05.2013, 19:29

Sowohl der Shapiro-Wilk Test als auch der K-S Test sagen bei allen 4 Variablen, dass sie NICHT normal verteilt sind.

Diese Tests geben nur Auskunft über den sog. p-Wert. Dieser wird mit dem vorgegebenen Alpha-Niveau verglichen. Sollte dieses Alpha-Niveau höher liegen als der p-Wert, wird die H0 nicht abgelehnt. So die Konvention.

Und soweit ich gelesen habe, gilt die Pearson Korrelation nur für normal verteilte Variablen und die Spearman Korrelation für nicht normal verteilte. Richtig?

Nicht ganz richtig. Der Spearman ist nichts anderes als der Pearson über die rangtransformierten Werte. Die Rangtransformation berwirkt (zum Beispiel), dass Ausreißerproblematiken keine Rolle spielen. Rangstatistiken sind aber nicht ganz so beliebig über jede Verteilung sinnvoll einsetzbar.

In deinem Fall wirst du mit dem Spearman eher "auf Nummer Sicher gehen". Die Effizienz dieses Spearmans wird bei perfekter Normalverteilung wohl nicht so groß sein wie der Pearson (aber immer noch beinahe so groß), bei Ausreißerproblematiken hingegen liefert der Pearson schon sehr verzerrte Ergebnisse, der Spearman nicht.

Zu den Begriffen der Effizienz (von parametrischen Verfahren gegenüber ihren NP- Äquivalenten) siehe Stichwort "A.R.E." - Literatur: z.B. Büning.

Beitrag von **LiLy_88** » 02.05.2013, 19:33

Hallo nochmal und vielen Dank für die ausführlichen Antworten!

Ich habe nun gerechnet, und nachdem sowohl bei Spearman als auch bei Pearson eine nicht signifikante Korrelation raus kommt, ist es vermutlich nicht so schlimm, ob die Variablen nun wirklich normal verteilt sind oder nicht. Richtig? Im Prinzip geht es mir ja nur darum, eine Korrelation zu bestätigen bzw. abzulehnen.

Danke und lg!

Beitrag von **drfg2008** » 03.05.2013, 20:57

bei nicht-signifikanten p-Werten würde man bei entsprechend großen Stichproben die H0 (rho in der GG ist null -> "es besteht kein Zusammenhang") nicht verworfen werden