Korrelation vs. Chi-Quadrat-Test

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
FG
Beiträge: 19
Registriert: 12.07.2011, 11:01

Korrelation vs. Chi-Quadrat-Test

Beitrag von FG »

Hallo Leute,

Vielleicht kann mir das jemand von Euch helfen. Eine meiner Hypothesen lautet: Je häufiger ein Handy benutzt wird um ins Internet zu gelangen, desto häufiger wird Facebook benutzt.
Für jede der genannten Variablen gab es im Fragenbogen die Wahlmöglichkeit von 1 bis 5. (nie bis häufig) Die Variablen sind also intervallskaliert.


Teste ich den Korrelationskoeffizient kommt raus:
Korrelation nach Person ,234**
Signifikanz (2-seitig) ,000

Korrelationskoeffizient ist hier also sehr schwach ausgeprägt, auch wenn es eine Korrelation in der Grundgesamtheit gibt, aufgrund der Signifikanz von 0,000.



Mache ich daraus aber eine Kreuztabelle mit Chi-Quadrat-Test, so kommt Folgendes raus:
Asymptotische Signifikanz (2-seitig) ,001

aber

a. 3 Zellen (12,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 3,44.


Hier zeigt mir SPSS einen hoch signifikanten Zusammhang. Kann es sein, dass das darin liegt, dass 12% der Zellen eine erwartete Häufigkeit kleiner 5 haben und dadurch der Chi-Quadrat-Test sehr fehleranfällig wird? Oder mache ich hier gar einen Denkfehler und Korrelation zu berechnen ist mit solchen Skalen nicht sinnvoll?


Ich wäre für Hilfe sehr dankbar.

Herzliche Grüße
saja
Beiträge: 5
Registriert: 15.07.2011, 16:03

Beitrag von saja »

Das mal vornweg: mit chi2 kenne ich mich nicht so gut aus, aber soweit ich weiß, nutzt man den, wenn man nominale Daten oder keine Verteilungsannahmen hat. Warum nimmst du ihn hier überhaupt? Die Korrelation erscheint mir hier als das gängigere Verfahren. Es wirkt so als rechnest du einfach weiter, weil dir die Ergebnisse nicht passen... Was ich im Übrigen nicht verstehe: ,000 ist doch genauso hoch signifikant wie ,001?

Wenn die erwarteten Häufigkeiten in der Kreuztabelle kleiner als 5 sind, verletzt du eine Voraussetzung für den chi2 Test. Wie robust der Test dann trotzdem noch ist, lässt sich bestimmt sehr einfach gogglen.

Gruß
eprager84
Beiträge: 6
Registriert: 15.07.2011, 19:20

Beitrag von eprager84 »

Also ich bin auch kein Statistikcrack, aber les mich da für meine eigene Doktorarbeit im Moment so ein bißchen ein.

2 Dinge sind mir aufgefallen:

1. Meiner Ansicht nach, darfst du da keine Pearson-Korrelation rechnen, da deine Variablen nicht normalverteilt und intervallskaliert sind. Für eine Pearson-Korrelation müssen diese Bedingungen aber erfüllt sein. In deinem Fall glaube ich also, müsstest du eine Spearman-Korrelation rechnen.

2. Wenn die erwartete Häufigkeit beim Chi²-Test zu niedrig ist, ist meines Wissens nach ein Fisher-Exakt-Test vorzuziehen.

Grüße

Ricki
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Je häufiger ein Handy benutzt wird um ins Internet zu gelangen, desto häufiger wird Facebook benutzt.

Die Hypothese beinhaltet zumindest einen monotonen Trend. Und als solcher sollte auch getestet werden. Geeignete Verfahren:

Pearson
Spearman
Kendall


Gruß
drfg2008
FG
Beiträge: 19
Registriert: 12.07.2011, 11:01

Beitrag von FG »

Vielen lieben Dank für die Antworten und entschuldigt bitte, dass ich erst so spät antworte.

@saja: Ich habe Korrelation berechnet, weil uns das so beigebracht wurde. Und die Daten seien auch intervallskaliert. Aber ich dachte, eigentlich müsste auch chi2 gehen, darum habe ich es einfach mal ausprobiert. Ich wollte einfach verstehen, warum hier chi2 nicht geht oder ob er doch valide ist. Und ,000 (hintere Dezimalstellen zeigt SPSS standardmäßig nicht an) ist natürlich noch ein wenig signifikanter als ,001, d.h. ja nur dass das Ergebnis mit unter 1% Wahrscheinlichkeit falsch ist, umgekehrt also zu 99% richtig. Zur Robustheit: SPSS schreibt ja sogar dazu, wie fehleranfällig diese Hochrechnung dann ist. In meinem Fall zu 12%.

@alle: Mich verunsichert noch etwas bei Korrelationen. Zum Beispiel:

Ich erhalte ein Ergebnis wo der Korrelationskoeffizient 0,7 beträgt. Es besteht also ein eindeutiger Zusammenhang, aber die Signifikanztest (2-seitig) ergibt ,167. Es gibt also einen positiven Zusammenhang zwischen den zwei getesteten Variablen, aber nur in der Stichprobe. Den Zusammenhang kann man nicht auf die Grundgesamtheit übertragen, da die Signifikanz nicht gegeben. Zusammengefasst: Das Ergebnis ist nicht wirklich brauchbar.

Habe ich das so richtig interpretiert?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ich erhalte ein Ergebnis wo der Korrelationskoeffizient 0,7 beträgt. Es besteht also ein eindeutiger Zusammenhang, aber die Signifikanztest (2-seitig) ergibt ,167.

Das Ergebnis ist zwar verwunderlich, aber möglich. Denn dein r in der Stichprobe ist eine Zufallsvariable. Und der Test lautet, ob rho = 0 ist. Und nicht r=0.

Gruß
drfg2008
FG
Beiträge: 19
Registriert: 12.07.2011, 11:01

Beitrag von FG »

Mit rho meinst Du Korrelationskoeffizient der Hypothese 0?

Habe ich vorher richtig interpretiert? Bei anderen getesteten Korrelationen bekomme ich hohe Signifikanz aber ein sehr schwache Korrelation - mich wundert das auch...

Jede Variable hat "nur" fünf Merkmalsausprägungen von 1-5, was nie bis häufig entspricht. Ist das eventuell der Grund?

Danke, LG
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten