T-Test verstehen & interpretieren (+ Effektstärke)
-
- Beiträge: 20
- Registriert: 12.12.2011, 18:36
T-Test verstehen & interpretieren (+ Effektstärke)
Hallo zusammen,
ich bin ein SPSS Neuling, allerdings konnten mir tolle SPSS-Videos unter Youtube sehr gut helfen in die Materie rein zu kommen.
Allerdings habe ich nun ein Problem meinen T-Test zu verstehen und das Ergebnis auszuwerten. Vielleicht hapert es auch noch ein wenig am allgemeinen Verständnis.
Ich habe folgende Hypothese aufgestellt: "Frauen sind gestresster als Männer." (in meiner Arbeit geht es um das Stressempfinden im Beruf)
Hierzu habe ich einen T-Test berechnet, der mir folgendes Ergebnis ausgeworfen hat:
http://imageshack.us/photo/my-images/204/spssm.jpg/
Ich hätte das nun wie folgt interpretiert:
Da beim Levene Test ein Wert von 0.93 rauskommt und dieser größer als 0.05 ist sind die Variablen gleich, deshalb muss ich mir die erste Zeile anschauen.
Hier sehe ich das 0.407 > 0.05 ist, bzw. da es sich bei meinem Test um eine gerichtete Hypothese handelt muss ich die 0.41 : 2 rechnen,
ergibt also: 0.203 > 0.05, deshalb muss ich die Hypothese verwerfen.
Interpretiert hätte ich das dann wie folgt: "...der T-Test hat gezeigt, dass es keinen signifikanten Unterschied zwischen dem Stresserleben der Frauen und der Männer gibt..:".
Bis hierhin soweit richtig, oder bin ich völlig auf dem Holzweg?
Könnte / sollte ich denn dann noch die Effektstärke berechnen? Ich verstehe das in der Literatur so, dass man die Effektstärke nur berechnet, wenn es einen signifikanten Unterschied gibt, also, wenn ich meine Hypothese aufrechterhalten kann, bzw. diese bestätigt wird?
Ich wäre für jede Hilfe dankbar!
ich bin ein SPSS Neuling, allerdings konnten mir tolle SPSS-Videos unter Youtube sehr gut helfen in die Materie rein zu kommen.
Allerdings habe ich nun ein Problem meinen T-Test zu verstehen und das Ergebnis auszuwerten. Vielleicht hapert es auch noch ein wenig am allgemeinen Verständnis.
Ich habe folgende Hypothese aufgestellt: "Frauen sind gestresster als Männer." (in meiner Arbeit geht es um das Stressempfinden im Beruf)
Hierzu habe ich einen T-Test berechnet, der mir folgendes Ergebnis ausgeworfen hat:
http://imageshack.us/photo/my-images/204/spssm.jpg/
Ich hätte das nun wie folgt interpretiert:
Da beim Levene Test ein Wert von 0.93 rauskommt und dieser größer als 0.05 ist sind die Variablen gleich, deshalb muss ich mir die erste Zeile anschauen.
Hier sehe ich das 0.407 > 0.05 ist, bzw. da es sich bei meinem Test um eine gerichtete Hypothese handelt muss ich die 0.41 : 2 rechnen,
ergibt also: 0.203 > 0.05, deshalb muss ich die Hypothese verwerfen.
Interpretiert hätte ich das dann wie folgt: "...der T-Test hat gezeigt, dass es keinen signifikanten Unterschied zwischen dem Stresserleben der Frauen und der Männer gibt..:".
Bis hierhin soweit richtig, oder bin ich völlig auf dem Holzweg?
Könnte / sollte ich denn dann noch die Effektstärke berechnen? Ich verstehe das in der Literatur so, dass man die Effektstärke nur berechnet, wenn es einen signifikanten Unterschied gibt, also, wenn ich meine Hypothese aufrechterhalten kann, bzw. diese bestätigt wird?
Ich wäre für jede Hilfe dankbar!
-
- Beiträge: 141
- Registriert: 25.07.2008, 19:08
Nein, bist du nicht. Schau dir allein mal den Mittelwert für Frauen und Männer an. Der erscheint mir sehr maginal zu sein.
Allgemein ist nach der Aussage "Frauen und Männer in der Stichprobe verhalten sich hinsichtlich Stresserleben identisch" Feierabend.
Was für Effektstärken willst du da bitte berechnen?
EDIT: Unsinn entfernt
Allgemein ist nach der Aussage "Frauen und Männer in der Stichprobe verhalten sich hinsichtlich Stresserleben identisch" Feierabend.
Was für Effektstärken willst du da bitte berechnen?
EDIT: Unsinn entfernt
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
@skuz
Falsch.
[1]
[2]
[3]
[4] Effektstärke zielt auf Relevanz. Was relevant ist, muss fachwissenschaftlich im Voraus festgelegt werden.
[5] gerichtete (einseitige) Hypothesen ("mehr", "größer") führen natürlich zu anderen kritischen Werten als bei zweiseitigen Hypothesen.
Ansonsten alles richtig interpretiert
Falsch.
[1]
Nein. Es geht um die Varianzen, nicht die Variablen. Man geht von gleichen Varianzen aus, also erste Zeile im t-Test.Da beim Levene Test ein Wert von 0.93 rauskommt und dieser größer als 0.05 ist sind die Variablen gleich,
[2]
Falsch. Die Hypothese beim t-Test lautet auf Gleichheit der mittleren Werte. Und die wird nicht verworfen.ergibt also: 0.203 > 0.05, deshalb muss ich die Hypothese verwerfen
[3]
Das ist fast richtig. "Aufgrund des eingesetzten t-Tests konnte kein Unterschied ... festgestellt werden."Interpretiert hätte ich das dann wie folgt: "...der T-Test hat gezeigt, dass es keinen signifikanten Unterschied zwischen dem Stresserleben der Frauen und der Männer gibt..:".
[4] Effektstärke zielt auf Relevanz. Was relevant ist, muss fachwissenschaftlich im Voraus festgelegt werden.
[5] gerichtete (einseitige) Hypothesen ("mehr", "größer") führen natürlich zu anderen kritischen Werten als bei zweiseitigen Hypothesen.
drfg2008
-
- Beiträge: 20
- Registriert: 12.12.2011, 18:36
Vielen lieben Dank für die schnellen Antworten!
und @ drfg2008: Der Name kam mir bekannt vor..: Vielen Dank für die tollen Videos! Die sind sehr sehr hilfreich, danke für die Mühe! Die sind jedem SPSS Laien nur zu empfehlen!
[1]
[2]
Zum Verständnis:
Meine Hypothese / die interessierende Hypothese ist H0: "Frauen sind gestresster als Männer."
Dies wird mittels T-Test getestet, bzw. anhand des t-Tests wird überprüft, ob sich Frauen und Männer hinsichtlich des Stressempfinden unterscheiden.
Der T-Test testet allerdings die Hypothese (H1): "Es gibt keinen stressbedingten Unterschied zwischen Männern und Frauen, bzw. die Mittelwerte sind gleich".
und da 0.203 > 0.05 sage ich das H1 nicht verworfen wird. (aber ist das nicht das Gleiche wie wenn ich sage ich verwerfe H0?)
[5]
und @ drfg2008: Der Name kam mir bekannt vor..: Vielen Dank für die tollen Videos! Die sind sehr sehr hilfreich, danke für die Mühe! Die sind jedem SPSS Laien nur zu empfehlen!
[1]
Da habe ich mich vertippt, das sollte Varianzen und nicht Variablen heißen, mein Fehler!Nein. Es geht um die Varianzen, nicht die Variablen. Man geht von gleichen Varianzen aus, also erste Zeile im t-Test.
[2]
Also testet man generell (zu erst) mit dem T-Test immer auf "Gleichheit der mittleren Werte"!?Falsch. Die Hypothese beim t-Test lautet auf Gleichheit der mittleren Werte. Und die wird nicht verworfen.
Zum Verständnis:
Meine Hypothese / die interessierende Hypothese ist H0: "Frauen sind gestresster als Männer."
Dies wird mittels T-Test getestet, bzw. anhand des t-Tests wird überprüft, ob sich Frauen und Männer hinsichtlich des Stressempfinden unterscheiden.
Der T-Test testet allerdings die Hypothese (H1): "Es gibt keinen stressbedingten Unterschied zwischen Männern und Frauen, bzw. die Mittelwerte sind gleich".
und da 0.203 > 0.05 sage ich das H1 nicht verworfen wird. (aber ist das nicht das Gleiche wie wenn ich sage ich verwerfe H0?)
[5]
in meinem Fall handelt es sich aber um eine gerichtete Hypothese und deshalb war es richtig 0.41 : 2 zu rechnen, ergibt also: 0.203 > 0.05 !?gerichtete (einseitige) Hypothesen ("mehr", "größer") führen natürlich zu anderen kritischen Werten als bei zweiseitigen Hypothesen.
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
eigentlich ist das ein in der Wissenschaft nicht richtig geklärtes Thema (Fisher-Modell , Neyman-Pearson Modell), siehe auch Gerd Gigerenzers Artikel.
Üblich ist Folgendes:
Da der Sig. Wert 0,407 beträgt (erste Zeile) gilt das Ergebnis als "nicht signifikant". Die H0 (Gleichheit der Mittelwerte) wird folglich nicht verworfen. Bei einseitiger Fragestellung interessiert nur eine Seite der t-Verteilung, d.h. der kritische Wert wird bei einseitiger Fragestellung ein anderer sein, als bei 2-seitiger Fragestellung (also ca. 1,65 statt 1, 96). Damit würde die H0 früher abgelehnt. Da die t-Verteilung symmetrisch ist, ließe sich der Sig.-Wert bei einseitiger Fragestellung auch halbieren und prüfen, ob dieser größer 5%/1% (je nach Sig. Niveau) ist. Das Ergebnis wäre in diesem Fall gleich.
Üblich ist Folgendes:
Da der Sig. Wert 0,407 beträgt (erste Zeile) gilt das Ergebnis als "nicht signifikant". Die H0 (Gleichheit der Mittelwerte) wird folglich nicht verworfen. Bei einseitiger Fragestellung interessiert nur eine Seite der t-Verteilung, d.h. der kritische Wert wird bei einseitiger Fragestellung ein anderer sein, als bei 2-seitiger Fragestellung (also ca. 1,65 statt 1, 96). Damit würde die H0 früher abgelehnt. Da die t-Verteilung symmetrisch ist, ließe sich der Sig.-Wert bei einseitiger Fragestellung auch halbieren und prüfen, ob dieser größer 5%/1% (je nach Sig. Niveau) ist. Das Ergebnis wäre in diesem Fall gleich.
drfg2008
-
- Beiträge: 20
- Registriert: 12.12.2011, 18:36
Ich versuche mal mein gewonnens Wissen, bzw. eure Hilfe, auf ein weiteres Beispiel anzuwenden:
Folgende Hypothese möchte ich nun über den T-Test prüfen:
H0 = "Lehrer an der Gesamtschule sind gestresster als Lehrer an der BOS oder Berufsschule"
Siehe: http://imageshack.us/photo/my-images/833/spss222.jpg/
Ich hätte das Ergebnis nun wie folgt interpretiert:
1) Der Levene Test ergibt: 0,459 > 0,05 -> Varianzen sind gleich (d.h. erste Zeile anschauen)
2) Die Sig. (2-seitig) beträgt 0,005. Ist also kleiner als 0,05, deshalb bestätigt dies meine Hypothese H0, bzw. es widerlegt die Hypothese H1, die besagt "es gibt keinen stressbedingten Unterschied zwischen Lehrer an der Gesamtschule und Lehrer der BOS oder Berufsschule".
3) Interpretation: "Aufgrund des eingesetzten t-Tests konnte ein Unterschied ... festgestellt werden."
a) Habe ich es nun richtig verstanden?
b) Nun muss/sollte ich noch die Effektstärte berechnen, um meine Interpretation zu konkretisieren, ist das korrekt?
Folgende Hypothese möchte ich nun über den T-Test prüfen:
H0 = "Lehrer an der Gesamtschule sind gestresster als Lehrer an der BOS oder Berufsschule"
Siehe: http://imageshack.us/photo/my-images/833/spss222.jpg/
Ich hätte das Ergebnis nun wie folgt interpretiert:
1) Der Levene Test ergibt: 0,459 > 0,05 -> Varianzen sind gleich (d.h. erste Zeile anschauen)
2) Die Sig. (2-seitig) beträgt 0,005. Ist also kleiner als 0,05, deshalb bestätigt dies meine Hypothese H0, bzw. es widerlegt die Hypothese H1, die besagt "es gibt keinen stressbedingten Unterschied zwischen Lehrer an der Gesamtschule und Lehrer der BOS oder Berufsschule".
3) Interpretation: "Aufgrund des eingesetzten t-Tests konnte ein Unterschied ... festgestellt werden."
a) Habe ich es nun richtig verstanden?
b) Nun muss/sollte ich noch die Effektstärte berechnen, um meine Interpretation zu konkretisieren, ist das korrekt?
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
naja, das ist schon soweit richtig. Nur zielt die H0 beim t-Test eigentlich auf gleiche Mittelwerte, diese wird verworfen.
(wenn man mal von der etwas komplizierteren Diskussion um Neyman-Pearson und Fisher absieht)
soweit alles richtig interpretiert.
(wenn man mal von der etwas komplizierteren Diskussion um Neyman-Pearson und Fisher absieht)
soweit alles richtig interpretiert.
Das wird eher selten gemacht. Hier bietet sich das Programm GPower an. Was "relevante" Effektgrößen sind richtet sich nach der Substanzwissenschaft. Cohen hat hier pauschale Größen vorgeschlagen. Einfach mal das kostenlose Programm runterladen und reinschauen.b) Nun muss/sollte ich noch die Effektstärte berechnen, um meine Interpretation zu konkretisieren, ist das korrekt?
drfg2008
-
- Beiträge: 20
- Registriert: 12.12.2011, 18:36
Danke für deinen Tipp! on GPower habe ich bis dato noch nichts gehört.
[1]
Ich habe nun einmal meine Effektstärken ausgerechnet:
http://imageshack.us/photo/my-images/56 ... strke.jpg/
Ich habe zwei Formeln zur Berechnung der Effektgröße gefunden und es einfach mal mit beiden versucht. Ich komme einmal auf -0.526 und mit der anderen Formel auf -0.521 (schon mal ein gutes Zeichen, dass beides gleich sind
).
Allerdings habe ich noch ein Verständnisproblem wie ich die Werte einsetzen muss. Meine Hypothese lautet ja "Lehrer an der Gesamtschule sind gestresster als Lehrer an der BOS oder Berufsschule".
und bei beiden Formeln für die Effektstärke muss ich den einen MIttelwert mit dem anderen Mittelwert subtrahieren. Aber welchen Wert nehme ich als erstes, bzw. wie deute ich mein Ergebnis, wenn ich als "ersten Mittelwert" den Mittelwert der Gesamtschullehrer nehme und damit dann auf eine negative Effektstärke (-0.52) komme?
Laut Literatur gelten folgende Werte:
ε = .2 kleine Effektstärke
ε = .5 mittlere Effektstärke
ε = .8 große Effektstärke
Aber wie deute ich mein negativen Wert? Ich würde es wie folgt deuten:
Da der Mittelwert der Gesamtschullehrer niedriger ist (ein niedriger Mittelwert steht nach meiner Kodierung für einen höheren Stresswert, z.b. 1 = "in sehr hohem Maß". 5 = "in sehr geringem Maß") und laut meinem T-Test die Mittelwerte nicht gleich sind gibt es einen Unterschied von mittlerer Bedeutsamkeit. Aber wie interpretiere ich das Minus? Oder hätte ich bei der Berechnung des Mittelwertes 50.15 - 45.35 rechnen sollen?
[2]
Ich habe dank deinem Tipp mir nun auch GPower besorgt und meiner Werte eingegeben:
http://imageshack.us/photo/my-images/808/gpower.jpg/
Mir hat sich aber die Frage gestellt welchen Wert ich für "Power (1-ß err prob)" nehmen soll? Ich hab online eine Beispielrechnung gefunden, die haben den Wert 0.8 benutzt, das habe ich dann auch gemacht.
Was genau aber gibt mir nun das GPower Ergebnis an?
Ich habe es so verstanden, dass er mir anzeigt, welche Stichprobengröße ich bräuchte um auf die Gesamtpopulation schließen zu können und diese habe ich erreicht. Aber wo finde ich die "wahre Teststärkenwert"? Oder habe ich die falsche Rechnung benutzt?
Vielen Dank für die Hilfe, ich hoffe außerdem, dass meine Anhänge auch anderen Leuten, die noch nicht so ganz fit in SPSS und der Statistikwelt sind, helfen können!
[1]
Ich habe nun einmal meine Effektstärken ausgerechnet:
http://imageshack.us/photo/my-images/56 ... strke.jpg/
Ich habe zwei Formeln zur Berechnung der Effektgröße gefunden und es einfach mal mit beiden versucht. Ich komme einmal auf -0.526 und mit der anderen Formel auf -0.521 (schon mal ein gutes Zeichen, dass beides gleich sind

Allerdings habe ich noch ein Verständnisproblem wie ich die Werte einsetzen muss. Meine Hypothese lautet ja "Lehrer an der Gesamtschule sind gestresster als Lehrer an der BOS oder Berufsschule".
und bei beiden Formeln für die Effektstärke muss ich den einen MIttelwert mit dem anderen Mittelwert subtrahieren. Aber welchen Wert nehme ich als erstes, bzw. wie deute ich mein Ergebnis, wenn ich als "ersten Mittelwert" den Mittelwert der Gesamtschullehrer nehme und damit dann auf eine negative Effektstärke (-0.52) komme?
Laut Literatur gelten folgende Werte:
ε = .2 kleine Effektstärke
ε = .5 mittlere Effektstärke
ε = .8 große Effektstärke
Aber wie deute ich mein negativen Wert? Ich würde es wie folgt deuten:
Da der Mittelwert der Gesamtschullehrer niedriger ist (ein niedriger Mittelwert steht nach meiner Kodierung für einen höheren Stresswert, z.b. 1 = "in sehr hohem Maß". 5 = "in sehr geringem Maß") und laut meinem T-Test die Mittelwerte nicht gleich sind gibt es einen Unterschied von mittlerer Bedeutsamkeit. Aber wie interpretiere ich das Minus? Oder hätte ich bei der Berechnung des Mittelwertes 50.15 - 45.35 rechnen sollen?
[2]
Ich habe dank deinem Tipp mir nun auch GPower besorgt und meiner Werte eingegeben:
http://imageshack.us/photo/my-images/808/gpower.jpg/
Mir hat sich aber die Frage gestellt welchen Wert ich für "Power (1-ß err prob)" nehmen soll? Ich hab online eine Beispielrechnung gefunden, die haben den Wert 0.8 benutzt, das habe ich dann auch gemacht.
Was genau aber gibt mir nun das GPower Ergebnis an?
Ich habe es so verstanden, dass er mir anzeigt, welche Stichprobengröße ich bräuchte um auf die Gesamtpopulation schließen zu können und diese habe ich erreicht. Aber wo finde ich die "wahre Teststärkenwert"? Oder habe ich die falsche Rechnung benutzt?
Vielen Dank für die Hilfe, ich hoffe außerdem, dass meine Anhänge auch anderen Leuten, die noch nicht so ganz fit in SPSS und der Statistikwelt sind, helfen können!
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
nach deinen Angaben ist der Test schon gelaufen. Das bedeutet: post hoc!
Das hast du bei GPower falsch eingestellt. Im Nachhinein (post hoc) wirst du die Power berechnen.
Und so geht das:
1. GPower starten
2. bei GPower den t-Test (post hoc) einstellen (post hoc compute achieved power ...)
3. Sample Size der Gruppen einstellen
4. one tail
5. determine
6. n1!=n2 also Mean Groups einstellen
7. Sigma einstellen
8. Calculate and transfer to ...
9. Calculate
Wenn ich mich nicht vertan habe, dann wäre das Ergebnis wie folgt:
Inhaltliche Interpretation: sehr geringe Effektstärke, sehr geringe Power, nicht signifikant. Kurz: Männer sind genauso (sehr oder wenig) gestresst wie Frauen.
Alles klar ?
Das hast du bei GPower falsch eingestellt. Im Nachhinein (post hoc) wirst du die Power berechnen.
Und so geht das:
1. GPower starten
2. bei GPower den t-Test (post hoc) einstellen (post hoc compute achieved power ...)
3. Sample Size der Gruppen einstellen
4. one tail
5. determine
6. n1!=n2 also Mean Groups einstellen
7. Sigma einstellen
8. Calculate and transfer to ...
9. Calculate
Wenn ich mich nicht vertan habe, dann wäre das Ergebnis wie folgt:
Code: Alles auswählen
t tests - Means: Difference between two independent means (two groups)
Analysis: Post hoc: Compute achieved power
Input: Tail(s) = One
Effect size d = 0.1540848
α err prob = 0.05
Sample size group 1 = 48
Sample size group 2 = 71
Output: Noncentrality parameter δ = 0.8245863
Critical t = 1.6579817
Df = 117
Power (1-β err prob) = 0.2046771
Alles klar ?
drfg2008
-
- Beiträge: 20
- Registriert: 12.12.2011, 18:36
Vielen Dank für die sehr genaue Ausführung!
Ich habe es jetzt mal versucht, mein Problem liegt in der Berechnung des "Effect size d"?
Also welchen Wert würde ich mit meinen Zahlen in "Mean group 1" und welchen in "Mean group 2" und welchen in "SD "Sigma" within each group"? Ich habe jetzt fast alle Zahlen eingegeben, aber ich komme nicht auf deinen Wert von "0.1540848".
Eine Frage zu deiner Interpretation habe ich auch noch:
Woher genau entnimmst du, dass die Effektstärke gering ist, da die Power (0.2046771) gering ist?
Ich habe es jetzt mal versucht, mein Problem liegt in der Berechnung des "Effect size d"?
Also welchen Wert würde ich mit meinen Zahlen in "Mean group 1" und welchen in "Mean group 2" und welchen in "SD "Sigma" within each group"? Ich habe jetzt fast alle Zahlen eingegeben, aber ich komme nicht auf deinen Wert von "0.1540848".
Eine Frage zu deiner Interpretation habe ich auch noch:
Woher genau entnimmst du, dass die Effektstärke gering ist, da die Power (0.2046771) gering ist?
-
- Beiträge: 20
- Registriert: 12.12.2011, 18:36