Welcher Signifikanztest ist ratsam?
-
Butter_Blume
- Beiträge: 27
- Registriert: 29.06.2011, 12:30
Welcher Signifikanztest ist ratsam?
Hallo Leute,
ich habe eine Variable, die nominal skaliert (Täter ja, Täter nein) ist und einer Variable die metrisch (Alter) ist. Gerne würde ich jetzt nach signifikanten Unterschieden suchen.
Welcher Test ist hier anzuwenden?
ich habe eine Variable, die nominal skaliert (Täter ja, Täter nein) ist und einer Variable die metrisch (Alter) ist. Gerne würde ich jetzt nach signifikanten Unterschieden suchen.
Welcher Test ist hier anzuwenden?
-
Butter_Blume
- Beiträge: 27
- Registriert: 29.06.2011, 12:30
-
Generalist
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
für den t-test bräuchte ich mittelwerte, da aber ungefähr 90% keine Täter sind unterscheiden sich die Zahlen nur ganz gering um ein paar Zahlen nach dem Komma.
1,02
1,03 usw
Mittelwerte sind da doch nicht wirklich aussagekräftig, oder?
unterschiedliche Stichprobengrößen sind beim t-Test ein geringeres Problem, als etwa das Problem der sog. 'Heavy Tails' (viel Fläche in den Rändern der Verteilung).
Der U-Test geht nicht von Mittelwerten aus. Diesen hier bevorzugen.
Das Ergebnis kann auch nicht stimmen, da aus der Forschung bekannt ist, dass Alter (und weitere Variablen wie Geschlecht und soz. ökon. Hintergrund) ein wesentlicher Faktor ist. Bestimmte Straftaten werden in bestimmten Altersklassen besonders häufig gemessen. Folglich liegt wahrscheinlich ein Fehler im Design vor.
Ich kenne auch kein Kind, das im Alter von 1,02 Jahren einen Bankraub begeht. Du must schon ein wenig mitdenken. Du hast die Variablen vertauscht. 1-2 sind die Gruppenvariablen! Nicht die Testvariable.
Gruß
drfg2008
-
Butter_Blume
- Beiträge: 27
- Registriert: 29.06.2011, 12:30
Ich kenne auch kein Kind, das im Alter von 1,02 Jahren einen Bankraub begeht.
Vielen Dank für die Hinweise. Ich weiß, ne summer school wird fällig...
gibt es noch irgendwelche Richtwerte für den Output, was ich bei der Interpretation beachten muss?
U=51.593, Z=-2,485, p =0.013
darauf habe ich die Stärke des Unterschieds nach folgender Formel ermittelt
r = Z / Wurzel (N=1796)
r= -0,0575
Da scheint doch die Stärke des Zusammenhangs gering zu sein, oder?
Vielen Dank für die Hinweise. Ich weiß, ne summer school wird fällig...
gibt es noch irgendwelche Richtwerte für den Output, was ich bei der Interpretation beachten muss?
U=51.593, Z=-2,485, p =0.013
darauf habe ich die Stärke des Unterschieds nach folgender Formel ermittelt
r = Z / Wurzel (N=1796)
r= -0,0575
Da scheint doch die Stärke des Zusammenhangs gering zu sein, oder?
-
Butter_Blume
- Beiträge: 27
- Registriert: 29.06.2011, 12:30
hier aus dem Forum... da wurde gesagt, dass man die Stärke händisch ermitteln muss
das N habe ich eingesetzt
http://www.statistik-tutorial.de/forum/ftopic67.html
wobei ich das - irritierend finde
das N habe ich eingesetzt
http://www.statistik-tutorial.de/forum/ftopic67.html
wobei ich das - irritierend finde
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
bei dem Design sind mir jetzt Zweifel gekommen.
Als -fiktives- Beispiel. Angenommen es ginge darum festzustellen, ob das Alter eine Rolle spielt hinsichtlich der Bereitschaft zur Entwendung von rosaroten Kaugummis. Du weißt, diese leckeren runden Dinger, auf die 5-9-Jährige einfach nicht verzichten können. Kein Taschengeld, keine Kaugummis. Und da die Eltern primär an die Zähne denken und dafür kein Taschengeld zur Verfügung stellen, die Kleinen das aber ganz anders sehen, landen ganze Tüten im Schulranzen. Natürlich werden sie entdeckt, denn sie sind (noch) nicht so klug wie unsere Finanzberater. Die klauen auch keine Kaugummis, sondern Peanuts.
Mit dem U-Test hast du eine lineare Rangstatistik und darin besteht nun das Problem. Denn weder vorher (vor dem Alter von 5 Jahren) noch nachher (nach dem Alter von 9 Jahren) tritt diese ‚Straftat’ auf (denn ab 9 Jahren erhalten die meisten Kinder ihr eigenes Taschengeld und müssen nicht im Laden klauen und vorher auch nicht, da sind sie noch mit Bankrauben beschäftigt).
So, damit ist das Design schon erledigt. Denn ein Mittelwertunterschied (t-Test) oder eine lineare Rangstatistik (U-Test) werden hier –wenn überhaupt- nur kleine Zusammenhänge finden.
Bei zeitlich gebundenen Erscheinungen dieser Art ist der Einsatz von t-Test und U-Test nicht unbedingt angezeigt.
Das Ganze kann man auch als Simulation darstellen. Hier werden zwei Gruppen gebildet. Gruppe 2 tritt im Zeitraum t1-t250 und in t751-t1000 auf. Gruppe 1 tritt nur in t251 bis t750 auf. Das wäre als ob sämtliche Kinder im Zeitraum t251 bis t750 Kaugummis klauen, davor und danach nicht. Die Ergebnisse des U-, und des t-Tests sind natürlich nicht signifikant (p=100%).
Dass du überhaupt Zusammenhänge mit dem Design feststellen konntest, verweist eher auf starke Zusammenhänge.
Damit war also mein erster Rat (siehe oben) mit dem U-Test, der auf einen 'Unterschied' abzielt-wie in der Formulierung der Fragestellung- glatt falsch. Denn es geht nicht um 'Unterschiede' im Alter im Sinne einer Zu- oder Abnahme, sondern (wie ich vermute), um altersspezifische Schwerpunkte.
Gruß
Als -fiktives- Beispiel. Angenommen es ginge darum festzustellen, ob das Alter eine Rolle spielt hinsichtlich der Bereitschaft zur Entwendung von rosaroten Kaugummis. Du weißt, diese leckeren runden Dinger, auf die 5-9-Jährige einfach nicht verzichten können. Kein Taschengeld, keine Kaugummis. Und da die Eltern primär an die Zähne denken und dafür kein Taschengeld zur Verfügung stellen, die Kleinen das aber ganz anders sehen, landen ganze Tüten im Schulranzen. Natürlich werden sie entdeckt, denn sie sind (noch) nicht so klug wie unsere Finanzberater. Die klauen auch keine Kaugummis, sondern Peanuts.
Mit dem U-Test hast du eine lineare Rangstatistik und darin besteht nun das Problem. Denn weder vorher (vor dem Alter von 5 Jahren) noch nachher (nach dem Alter von 9 Jahren) tritt diese ‚Straftat’ auf (denn ab 9 Jahren erhalten die meisten Kinder ihr eigenes Taschengeld und müssen nicht im Laden klauen und vorher auch nicht, da sind sie noch mit Bankrauben beschäftigt).
So, damit ist das Design schon erledigt. Denn ein Mittelwertunterschied (t-Test) oder eine lineare Rangstatistik (U-Test) werden hier –wenn überhaupt- nur kleine Zusammenhänge finden.
Bei zeitlich gebundenen Erscheinungen dieser Art ist der Einsatz von t-Test und U-Test nicht unbedingt angezeigt.
Das Ganze kann man auch als Simulation darstellen. Hier werden zwei Gruppen gebildet. Gruppe 2 tritt im Zeitraum t1-t250 und in t751-t1000 auf. Gruppe 1 tritt nur in t251 bis t750 auf. Das wäre als ob sämtliche Kinder im Zeitraum t251 bis t750 Kaugummis klauen, davor und danach nicht. Die Ergebnisse des U-, und des t-Tests sind natürlich nicht signifikant (p=100%).
Dass du überhaupt Zusammenhänge mit dem Design feststellen konntest, verweist eher auf starke Zusammenhänge.
Damit war also mein erster Rat (siehe oben) mit dem U-Test, der auf einen 'Unterschied' abzielt-wie in der Formulierung der Fragestellung- glatt falsch. Denn es geht nicht um 'Unterschiede' im Alter im Sinne einer Zu- oder Abnahme, sondern (wie ich vermute), um altersspezifische Schwerpunkte.
Code: Alles auswählen
input program.
loop a =1 to 1000 by 1.
end case.
end loop.
end file.
end input program.
exe.
IF ($CASENUM >250 & $CASENUM <= 750) Gruppe=1.
RECODE Gruppe (MISSING=2).
EXECUTE.
val lab Gruppe 1'Kaugummi-Dieb'
2'kein Kaugummi-Dieb'.
NPAR TESTS
/M-W= a BY Gruppe(1 2)
/MISSING ANALYSIS.
T-TEST GROUPS=Gruppe(1 2)
/MISSING=ANALYSIS
/VARIABLES=a
/CRITERIA=CI(.95).drfg2008
-
Butter_Blume
- Beiträge: 27
- Registriert: 29.06.2011, 12:30
naja, die Annahme basiert ja auf gewissen Erkenntnissen, ist also nicht aus dem hohlen Bauch entstanden.
Es geht ganz konkret um Mobbing. Bisherige Studien sagen, dass dieses eher bei jüngeren Kindern verstärkt auftritt und mit dem Alter abnimmt. Ich möchte jetzt nur kucken, ob wirklich unter den jüngeren Schülern die Prävalenz (Opfer und Täter) höher ist (was ich nicht replizieren konnte) und ob Unterschiede nach Alter signifikant sind. Ich weiß, dass das mit einem Querschnitt nicht optimal ist, aber Längsschnittstudien in diesem Bereich gibt es leider kaum und auch ich war nicht in der Lage dieses zu realisieren.
"Dass du überhaupt Zusammenhänge mit deinem wahrscheinlich ungeeigneten Design feststellen konntest, verweist eher auf starke Zusammenhänge."
Diese Aussage verstehe ich leider nicht ganz... interessant ist doch, dass ich für das Phänomen Mobbing wie Cybermobbing bei der Täterseite signifikante Unterschiede nachweisen konnte. was würdest du denn als geeigneter empfehlen?
Du hast aber in einem Punkt vollkommen recht, die Effekttstärken sind super niedrig...
Es geht ganz konkret um Mobbing. Bisherige Studien sagen, dass dieses eher bei jüngeren Kindern verstärkt auftritt und mit dem Alter abnimmt. Ich möchte jetzt nur kucken, ob wirklich unter den jüngeren Schülern die Prävalenz (Opfer und Täter) höher ist (was ich nicht replizieren konnte) und ob Unterschiede nach Alter signifikant sind. Ich weiß, dass das mit einem Querschnitt nicht optimal ist, aber Längsschnittstudien in diesem Bereich gibt es leider kaum und auch ich war nicht in der Lage dieses zu realisieren.
"Dass du überhaupt Zusammenhänge mit deinem wahrscheinlich ungeeigneten Design feststellen konntest, verweist eher auf starke Zusammenhänge."
Diese Aussage verstehe ich leider nicht ganz... interessant ist doch, dass ich für das Phänomen Mobbing wie Cybermobbing bei der Täterseite signifikante Unterschiede nachweisen konnte. was würdest du denn als geeigneter empfehlen?
Du hast aber in einem Punkt vollkommen recht, die Effekttstärken sind super niedrig...
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Ich habe den Text online mehrfach geändert, daher steht das jetzt alles etwas verändert.
Es geht um Schwerpunkte. Wenn genügend Daten vorhanden sind, eventuell erst einmal eine Verteilung anzeigen lassen. Zwei Verteilungen lassen sich auf 'Unterschiedlichkeit' testen über den KS-Omnibustest. Auf Lageverschiebungen zu testen macht hier wirklich nur zum Teil Sinn. Eventuell eine Tabelle erstellen, relevante Altersgruppen segmentieren und diese als Chi-Quadrat Test prüfen. A posteriori die korrigierten Residuen einsetzen.
Gruß
Es geht um Schwerpunkte. Wenn genügend Daten vorhanden sind, eventuell erst einmal eine Verteilung anzeigen lassen. Zwei Verteilungen lassen sich auf 'Unterschiedlichkeit' testen über den KS-Omnibustest. Auf Lageverschiebungen zu testen macht hier wirklich nur zum Teil Sinn. Eventuell eine Tabelle erstellen, relevante Altersgruppen segmentieren und diese als Chi-Quadrat Test prüfen. A posteriori die korrigierten Residuen einsetzen.
... und später in den Büros wieder zunimmt. Wenn du in deiner Arbeit dich offensichtlich nur auf 'Kinder-Mobbing' fokussierst, dann ist selbstverständlich, dass mit dem Ende der Kindheit auch das spezifische Mobbing endet. Das wäre aber tautologisch.Es geht ganz konkret um Mobbing. Bisherige Studien sagen, dass dieses eher bei jüngeren Kindern verstärkt auftritt und mit dem Alter abnimmt.
Mit Querschnitt oder Längsschnitt hat das erst einmal weniger zu tun. Ich kann auch -als Beispiel- bei Körpergewicht oder Körpergröße eine Zunahme im Alter von 1-18 gut über eine Querschnittstudie nachweisen.Ich weiß, dass das mit einem Querschnitt nicht optimal ist, aber Längsschnittstudien in diesem Bereich gibt es leider kaum und auch ich war nicht in der Lage dieses zu realisieren.
Gruß
drfg2008



