NICHT normal verteilt trotz Q-Q-Plot?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
LiLy_88
Beiträge: 6
Registriert: 29.04.2013, 23:18

NICHT normal verteilt trotz Q-Q-Plot?

Beitrag von LiLy_88 »

Hallo zusammen,

wie man an meiner Frage erkennt, bin ich kein Spezialist im Bereich Statistik :wink:

Ich habe für 4 unabhängige metrische Variablen versucht zu errechnen, ob diese normal verteilt sind. Sowohl der Shapiro-Wilk Test als auch der K-S Test sagen bei allen 4 Variablen, dass sie NICHT normal verteilt sind. Wenn man sich aber die dazu gehörigen Q-Q-Plots ansieht, dann sieht die Datenverteilung eigentlich schon ziemlich linear aus (zumindest auf dem normalen Q-Q-Plot, nicht so sehr auf dem bereinigten).

Wie kann das sein? Kann ich, aufgrund der Testergebnisse trotzdem davon ausgehen, dass es sich hier nie um normal verteilte Daten handelt?

Ich muss dies deshalb wissen, weil ich danach Korrelationen zwischen diesen Daten berechnen will. Und soweit ich gelesen habe, gilt die Pearson Korrelation nur für normal verteilte Variablen und die Spearman Korrelation für nicht normal verteilte. Richtig?

Danke für jegliche Hilfe und Erklärung!
Lily
muon-stat
Beiträge: 25
Registriert: 20.04.2013, 22:40

Beitrag von muon-stat »

Hallo Lilly,

So wie du die Ergebnisse beschreibst, werden sowohl der NP-Korrelationstest wie auch der Parametrische-Korrelationstest ein sehr ähnliches Ergebnis liefern. Hast du beide schon berechnet?

Grüße,
muon-stat
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Sowohl der Shapiro-Wilk Test als auch der K-S Test sagen bei allen 4 Variablen, dass sie NICHT normal verteilt sind.
Diese Tests geben nur Auskunft über den sog. p-Wert. Dieser wird mit dem vorgegebenen Alpha-Niveau verglichen. Sollte dieses Alpha-Niveau höher liegen als der p-Wert, wird die H0 nicht abgelehnt. So die Konvention.

Und soweit ich gelesen habe, gilt die Pearson Korrelation nur für normal verteilte Variablen und die Spearman Korrelation für nicht normal verteilte. Richtig?
Nicht ganz richtig. Der Spearman ist nichts anderes als der Pearson über die rangtransformierten Werte. Die Rangtransformation berwirkt (zum Beispiel), dass Ausreißerproblematiken keine Rolle spielen. Rangstatistiken sind aber nicht ganz so beliebig über jede Verteilung sinnvoll einsetzbar.

In deinem Fall wirst du mit dem Spearman eher "auf Nummer Sicher gehen". Die Effizienz dieses Spearmans wird bei perfekter Normalverteilung wohl nicht so groß sein wie der Pearson (aber immer noch beinahe so groß), bei Ausreißerproblematiken hingegen liefert der Pearson schon sehr verzerrte Ergebnisse, der Spearman nicht.

Zu den Begriffen der Effizienz (von parametrischen Verfahren gegenüber ihren NP- Äquivalenten) siehe Stichwort "A.R.E." - Literatur: z.B. Büning.
drfg2008
LiLy_88
Beiträge: 6
Registriert: 29.04.2013, 23:18

Beitrag von LiLy_88 »

Hallo nochmal und vielen Dank für die ausführlichen Antworten!

Ich habe nun gerechnet, und nachdem sowohl bei Spearman als auch bei Pearson eine nicht signifikante Korrelation raus kommt, ist es vermutlich nicht so schlimm, ob die Variablen nun wirklich normal verteilt sind oder nicht. Richtig? Im Prinzip geht es mir ja nur darum, eine Korrelation zu bestätigen bzw. abzulehnen.

Danke und lg!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

bei nicht-signifikanten p-Werten würde man bei entsprechend großen Stichproben die H0 (rho in der GG ist null -> "es besteht kein Zusammenhang") nicht verworfen werden
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten