Chi-Quadrat Test und Stichprobengröße

Beitrag von **chris11** » 19.07.2012, 08:24

Hallo zusammen,

im Zuge einer statistischen Arbeit untersuche ich Abhängigkeiten mithilfe von Chi-Quadrat. Leider ist die Fallzahl meiner Stichprobe nicht sehr groß (103), so dass die Ergebnisse zwar eine Aussage zulassen diese aber nicht so zuverlässig aus meiner Sicht sind. Die Anforderungen die der Chi-Quadrat Test haben muss, werden nicht immer erreicht. Das Chi-Quadrat kann zwar entsprechend interpretiert werden, aber die Signifikanz liegt meistens über 5%. Ich habe diese Stichprobe verzehntfacht, sodass insgesamt nicht 103 Fälle sondern 1030 Fälle vorhanden sind. Letztendlich sind die Verhältnisse der Zahlen doch gleich geblieben oder habe ich da einen Denkfehler? Die Aussage von Chi-Quadrat ist die selbe, nur dass das Signifikanzniveau sich ändert.

Hier die beiden Ergebnisse:

Chi-Quadrat nach Pearson - Anzahl der gültigen Fälle 103
Wert ,893a
df3
Asymptotische Signifikanz 0,827

(a. 4 Zellen (50,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 0,87.)

Chi-Quadrat nach Pearson - Anzahl der gültigen Fälle 1030
Wert 8,931a
df3
Asymptotische Signifikanz 0,030

(a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 8,74.)

Vielen Dank für eure Hilfe

Beitrag von **Generalist** » 19.07.2012, 09:12

Worin genau besteht jetzt das Problem bzw. wie lautet die Frage?

Beitrag von **chris11** » 19.07.2012, 09:34

Hallo,

also noch kurz als weitere Info.

Die Grundgesamtheit beträgt 966 und meine Stichprobe enthält 103 Fälle. Wenn ich den Chi-Quadrat Test durchführe bekomme ich zwar Ergebnisse, aber die Anforderungen die der Test eigentlich erfüllen sollte wie z. B. eine erwartete Häufigkeit von 5 in den Zellen oder max. 20% der Zellen mit einer erwarteten Häufigkeit von ist oft nicht gegeben. Damit er diese Anforderungen erfüllt, habe ich die gleichen Fälle 10-fach in der Datei hinzugefügt, so dass die Verhältnisse ja weiterhin stimmen und die Anforderungen für den Test erfüllt werden. Nun hat sich aber das Signifikanzniveau geändert und zwar zu einem besseren Wert. Kann ich ohne weiteres die Stichprobe verzehnfachen? Sind die Werte dann noch repäsentativ und richtig?

103 Fälle Signiveau = 0,827 also 82,7%
1030 Fälle Signiveau = 0,030 also 3%

Danke schön

Beitrag von **Generalist** » 19.07.2012, 11:03

Ich verstehe es leider immer noch nicht. Ist das ein Gedankenexperiment?
Oder wo kommen die zusätzlichen ca. 900 Fälle her, die unglaublicherweise
auch noch so verteilt sind, dass sie exakt den ersten 103 entsprechen?

Beitrag von **chris11** » 19.07.2012, 11:06

Ja also es handelt sich dabei um die gleichen Fälle.

Beitrag von **chris11** » 19.07.2012, 11:36

Man könnte auch fragen: Warum ändert sich das Signiveau zum besseren wenn die Fallzahl der Stichprobe vergrößert wird? Darf man die Anzahl der Fälle überhaupt erhöhen, wenn die Anteile gleich bleiben?

Beitrag von **Generalist** » 19.07.2012, 13:10

Der Signifikanztest berechnet, wie wahrscheinlich die Stichprobendaten
wären, wenn sie aus einer Grundgesamtheit stammten, in der es keinen
Zusammenhang zwischen den Variablen gibt.

Eine Abweichung von der hypothetisch angenommenen Unabhängigkeit
der Variablen ist desto aussagekräftiger (mit einem desto kleineren p-Wert
assoziiert), je größer die Anzahl der Fälle, anhand derer die Abweichung
beobachtet wurde. Bei kleinen Stichproben können sich beobachtete
Zusammenhänge noch durchaus im Zufallsbereich bewegen. Bei
großen Stichproben ist die Schätzung genauer und beobachtete
Zusammenhänge werden schneller als nicht-zufällig erkannt.

Beitrag von **chris11** » 19.07.2012, 14:09

Dann ist es auch eher wieder eine Sache der Interpretation in Bezug auf die Stichprobe?

Aber ist der Chi-Quadrat Test pauschal ungültig wenn z.B. mehr als 20% der Zellen eine erwartete Häufigkeit von unter 5 haben oder ist er einfach nicht mehr so zuverlässig in der Aussage, was sich dann wiederum durch einen höheren Signifikanzwert wiederspiegelt? Also kann man den Test dann überhaupt nicht anwenden?

LG Chris11

Beitrag von **Generalist** » 19.07.2012, 14:40

Dann ist es auch eher wieder eine Sache der Interpretation in Bezug auf die Stichprobe?

Ich verstehe leider die Fraghe nicht. Worauf bezieht sie sich?

Aber ist der Chi-Quadrat Test pauschal ungültig wenn z.B. mehr als 20% der Zellen eine erwartete Häufigkeit von unter 5 haben

Es ist eine Voraussetzung. Wie sehr Verstöße gegen diese Voraussetzung
die Testergebnisse ungültig machen, weiß ich leider nicht. Sicherlich
werden die p-Werte verzerrt. In welcher Richtung un in welchem
Ausmaß, hängt wohl vom konkreten Fall ab.