T-test oder U-Test : KS-Test liefert keine Normalverteilung

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
caddy
Beiträge: 5
Registriert: 29.02.2012, 15:19

T-test oder U-Test : KS-Test liefert keine Normalverteilung

Beitrag von caddy »

Hallo,

ich bearbeitet zur Zeit ein Thema und habe Probleme mit der Interpretation. Konkret geht es um eine Sekundäranaylse der PISA Daten 2003.

Ich möchte die Matheleistung der koedukativ unterrichteten Schüler nach Geschlecht gegenüber stellen und gegen eine Unterschiedshypothese testen.

Ha : Matheleistung der Koedukativ unterricht. Jungen ist besser als die der Mädchen.

Die Histogramme liegen sehr nach an der Normalverteilung aber der KS-Test sagt leider das es keine NV ist. Das histogramm der Jungen ist ganz leicht rechtsgipflig.

Code: Alles auswählen

         ML_M     ML_J      ML_BEIDE
N       2048     2116       4184
MW      499,     514,         506,
SA         94,       99,         97, 
DA       ,032     ,041         ,034
KSZ    1,458   1,892         2,184
ASig     ,028     ,002         0,000
ASIG oder ASIG/2 ist bei beiden Verteilungen kleiner 0.05 und somit kann man zu 95% nicht von einer Normalverteilung ausgehen. Interpretiere ich das richtig ?


Folglich kann ich nicht wie geplant den t-Test anwenden und müsste dann auf einen anderen Test gehen (W-U-Test) ??

Wäre toll wenn ihr mir helfen könntet... Bin wie immer zu spät dran...

Vielen Dank und viele Grüße,
Caddy
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ich möchte die Matheleistung der koedukativ unterrichteten Schüler nach Geschlecht gegenüber stellen und gegen eine Unterschiedshypothese testen.
Eine Frage voraus: Hast du 15-Jährige über verschiedene Klassenstufen? Oder stammen alle Probanden aus einer Klassenstufe?
drfg2008
caddy
Beiträge: 5
Registriert: 29.02.2012, 15:19

Beitrag von caddy »

Das habe ich nicht differenziert. Sollte aber auch unabhängig von meiner Frage sein, oder ?

Natürlich fange ich mir u.U. einen Fehler ein. Aber ich denke, das es hier in erster Linie ums Doing geht ist ein "Messfehler" verschmerzbar. Ich einer "richtigen" Studie wäre das natürlich ein pöhser Fehler.
caddy
Beiträge: 5
Registriert: 29.02.2012, 15:19

Beitrag von caddy »

Ich habe nun eine explorative Datenanalyse über beide Variablen gefahren (matheleistung_ko_mädchen, mathelesitung_ko_jungen werden aus der matheleistung_ko ermittelt, diese wiederum aus der matheleistung und einer Variablen koedukation) .

matheleistung_jungen 4660 Fälle (davon 2300 fehlend, klar sind ja auch Mädchen...). Schiefe -.280,Kurtosis -.328 Beide Werte liegen im Intervall -1,1 so dass der Verdacht naheliegt doch eine NV zu haben. Die Tests auf NV sind aber weiterhin NICHT signifikant.

(Mädchen/Junge)
KS : 0,032 bzw 0,041
Shapiro : 0,000 btw 0,000 bei einer Statsitik von 0,992 (bzw. 0,991)


Ich bin ratlos... Das optische Ergebnis (Histogramm) ist doch relativ eindeutig. Oder habe ich einen Fehler bei der Berechnung der "Variablen" matheleistung_ko_jungen gemacht (wegen 50% fehlender Daten) ?

Wie ihr merkt habe ich mit Statistik und SPSS arg zu kämpfen...
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Es ist bei derart großen Stichproben für die Zuverlässigkeit des t-Tests
nicht mehr erforderlich, dass Stichproben aus normalverteilten
Grundgesamtheiten stammen.
http://www.uni-graz.at/ilona.papousek/t ... s/faq.html FAQ#4
(t-Tests sind dasselbe wie einfaktorielle ANOVAS mit 2 Gruppen).

Bei derart großen Stichproben wäre aber auch ein U-Test kein Problem,
der Verlust an statistischer Trennschärfe im Vergleich zum t-Test fällt
da nicht weiter ins Gewicht.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Das habe ich nicht differenziert. Sollte aber auch unabhängig von meiner Frage sein, oder ?

Natürlich fange ich mir u.U. einen Fehler ein. Aber ich denke, das es hier in erster Linie ums Doing geht ist ein "Messfehler" verschmerzbar. Ich einer "richtigen" Studie wäre das natürlich ein pöhser Fehler.
Ja, bei PISA geht's nur ums Doing.

Das Problem ist, dass bei PISA unterschiedliche Klassenstufen in einen Topf geworfen werden, nur weil 15-Jährige die Zielgruppe sind. Um das zu differenzieren wäre eigentlich ein Verfahren notwendig, das die Klassenstufe mit berücksichtigt: etwa Kovarianzanalysen. Und dann stellt sich gar nicht mehr die Frage nach U- oder t-Test.
drfg2008
caddy
Beiträge: 5
Registriert: 29.02.2012, 15:19

Beitrag von caddy »

@generalist : Danke für die konkrete Antwort auf meine Frage. Ich hatte dies auch irgendwo gelesen. Also kann ich für die (Nicht-)Bestätigung meiner Hypothese den t-Test heranziehen.

@drfg2008 : Nein, nicht bei PISA, sondern bei meiner Hausarbeit in der ich Hypothesen anhand einer Sekundäranalyse teste. Das ich hier u.U. Äpfel mit Birnen vergleiche, das habe ich verstanden und werde ich evtl im Fazit berücksichtigen. Auch dafür ein Danke.


Ich habe nun den t-Test gefahren. Dieser ermittelt ja anhand des Levene-Test die Varianzgleichheit (oder ebend nicht). Dort habe ich eine Signifikanz von 0,004 < 0.05. Somit muss sich von einer Ungleichheit der Varianzen ausgehen und dort das Resultat nachschlagen. Die Signifikanz (2-seitig) des t-Test ist 0.000 mit einem T von -4.763. Mein Hypothese ist aber doch eine (einseitig) gerichtete Unterschiedshypothese. Ich denke da das Ergebnis jetzt schon höchssignifikat ist kann ich mir das Nachschlagen des T-Wertes in der entsprechenden Tabelle sparen.

Kann ich nun davon ausgehen, das die Nullhypothese abgelehnt wird da das Ergebnis höchst Signifikant ist. Somit ist die Alternativhypothese koedukative Jungen besser als koedukative Mädchen bestätigt ?

Habe ich das richtig interpretiert ?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Wenn du nur auf die Frage abzielst, ob ein t-Test oder ein U-Test der richtige Test ist, und falls der "t-Test mit Gleichheit der Varianzen" oder "Ungleichheit" zu verwenden ist (wie bei SPSS sinngemäß formuliert) ist die Antwort ganz einfach:

Bei derart großen Stichproben wie bei PISA spielt das keine Rolle mehr. Und der Levene-Test wird bei derart großen Stichproben wahrscheinlich immer signifikant. Daher würde man die zweite Zeile im t-Test nehmen (Ungleichheit) und bei einem sig. t-Test die Nullhypothese verwerfen. Mit welcher Wahrscheinlichkeit dann allerdings die Gegenhypthese angenommen werden kann, ergibt sich nicht aus dem t-Test. Da müsstest du noch die Power berechnen (Programm: G*Power, kostenlos zum Downloaden). Und da bei PISA nur relationale Werte (die berühmt-berüchtigten PISA-Punkte) angegeben sind, die meist auf µ=500 standardisiert sind, entsteht gleich das nächste Problem: Was bedeutet das (z.B. 483 Punkte) und was bedeuten Punktunterschiede? Frage nach der Relevanz.

Eben PISA-Müll.
drfg2008
caddy
Beiträge: 5
Registriert: 29.02.2012, 15:19

Beitrag von caddy »

Nun, ich möchte hier keine Grundsatzdiskussion führen ob PISA gut oder schlecht ist, ich denke darüber könnte man in einem externen Forum philosophieren. Aber auch da bin ich nicht tief genug im Thema eingearbeitet. Es geht hier prinzipiell um das Anwenden der "Tools" und das auch nur im begrenzten Umfang.

Dank für die Antwort. Das mit der "Power" habe ich mir mal notiert. Wenn noch Zeit ist werde ich meine Ausarbeitung um diesen Punkt erweitern. Es gab aber die Ansage "nicht zuviel" zu machen...

Ich habe alternativ mal den u-Test gefahren, wie muss ich diese Ergebnisse deuten :

Code: Alles auswählen

Female  2028 (N) 1986,00 (MRang) 4027601 (RSumme)
Male 2116 (N) 2155,41 (MRang) 4560839 (RSumme )

Mann-Whitney-U : 1970195,000
Wilcoxon-W : 4027601 ( =RSumme der Mädchen) 
Z : -4.557
ASig (s-seit) : 0.000 

Auch hier :
Ha ist bestätigt, H0 wird verworfen (Signifikanz).
Aber was bedeuten die anderen Parameter des u-Test ?


Wenn wir diesen Support, den es hier gibt, mal im studentischen Forum gehabt hätten...
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Aber was bedeuten die anderen Parameter des u-Test ?
Die Entschlüsselung der Abkürzungen kann vermutlich erfolgen anhand des
Handbuchs Deiner Software oder entsprechender Webseiten. Falls es um
die Bedeutung der Parameter geht, auch da hilft das Netz, z.B.
http://de.wikipedia.org/wiki/Wilcoxon-Mann-Whitney-Test
Wenn wir diesen Support, den es hier gibt, mal im studentischen Forum gehabt hätten...
Bevor es "support" gab, hat man's erstmal mit eigenständigem
Recherchieren versucht.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten