Welcher Signifikanztest ist ratsam?

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Butter_Blume
Beiträge: 27
Registriert: 29.06.2011, 12:30

Welcher Signifikanztest ist ratsam?

Beitrag von Butter_Blume »

Hallo Leute,

ich habe eine Variable, die nominal skaliert (Täter ja, Täter nein) ist und einer Variable die metrisch (Alter) ist. Gerne würde ich jetzt nach signifikanten Unterschieden suchen.

Welcher Test ist hier anzuwenden?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

gedanklich 'umdrehen' und den U-Test berechnen (ggf. t-Test).

Gruß
drfg2008
Butter_Blume
Beiträge: 27
Registriert: 29.06.2011, 12:30

Beitrag von Butter_Blume »

Danke für die schnelle Antwort.

für den t-test bräuchte ich mittelwerte, da aber ungefähr 90% keine Täter sind unterscheiden sich die Zahlen nur ganz gering um ein paar Zahlen nach dem Komma.

1,02

1,03 usw

Mittelwerte sind da doch nicht wirklich aussagekräftig, oder?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Du sollst es gedanklich UMDREHEN. Wenn Du den Zusammenhang zwischen Täterschaft und Alter berechnen willst, dann nimmst Du Täterschaft als Gruppierungsvariable in einem t- oder U-Test und vergleichst das Alter der Täter mit dem der Nichttäter.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

für den t-test bräuchte ich mittelwerte, da aber ungefähr 90% keine Täter sind unterscheiden sich die Zahlen nur ganz gering um ein paar Zahlen nach dem Komma.
1,02
1,03 usw
Mittelwerte sind da doch nicht wirklich aussagekräftig, oder?

unterschiedliche Stichprobengrößen sind beim t-Test ein geringeres Problem, als etwa das Problem der sog. 'Heavy Tails' (viel Fläche in den Rändern der Verteilung).

Der U-Test geht nicht von Mittelwerten aus. Diesen hier bevorzugen.

Das Ergebnis kann auch nicht stimmen, da aus der Forschung bekannt ist, dass Alter (und weitere Variablen wie Geschlecht und soz. ökon. Hintergrund) ein wesentlicher Faktor ist. Bestimmte Straftaten werden in bestimmten Altersklassen besonders häufig gemessen. Folglich liegt wahrscheinlich ein Fehler im Design vor.

Ich kenne auch kein Kind, das im Alter von 1,02 Jahren einen Bankraub begeht. Du must schon ein wenig mitdenken. Du hast die Variablen vertauscht. 1-2 sind die Gruppenvariablen! Nicht die Testvariable.

Gruß
drfg2008
Butter_Blume
Beiträge: 27
Registriert: 29.06.2011, 12:30

Beitrag von Butter_Blume »

Ich kenne auch kein Kind, das im Alter von 1,02 Jahren einen Bankraub begeht. :D

Vielen Dank für die Hinweise. Ich weiß, ne summer school wird fällig...

gibt es noch irgendwelche Richtwerte für den Output, was ich bei der Interpretation beachten muss?

U=51.593, Z=-2,485, p =0.013

darauf habe ich die Stärke des Unterschieds nach folgender Formel ermittelt

r = Z / Wurzel (N=1796)

r= -0,0575

Da scheint doch die Stärke des Zusammenhangs gering zu sein, oder?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

r = Z / Wurzel (N=1796)
Wo hast du das her?

Gruß
drfg2008
Butter_Blume
Beiträge: 27
Registriert: 29.06.2011, 12:30

Beitrag von Butter_Blume »

hier aus dem Forum... da wurde gesagt, dass man die Stärke händisch ermitteln muss

das N habe ich eingesetzt


http://www.statistik-tutorial.de/forum/ftopic67.html


wobei ich das - irritierend finde
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

bei dem Design sind mir jetzt Zweifel gekommen.

Als -fiktives- Beispiel. Angenommen es ginge darum festzustellen, ob das Alter eine Rolle spielt hinsichtlich der Bereitschaft zur Entwendung von rosaroten Kaugummis. Du weißt, diese leckeren runden Dinger, auf die 5-9-Jährige einfach nicht verzichten können. Kein Taschengeld, keine Kaugummis. Und da die Eltern primär an die Zähne denken und dafür kein Taschengeld zur Verfügung stellen, die Kleinen das aber ganz anders sehen, landen ganze Tüten im Schulranzen. Natürlich werden sie entdeckt, denn sie sind (noch) nicht so klug wie unsere Finanzberater. Die klauen auch keine Kaugummis, sondern Peanuts.

Mit dem U-Test hast du eine lineare Rangstatistik und darin besteht nun das Problem. Denn weder vorher (vor dem Alter von 5 Jahren) noch nachher (nach dem Alter von 9 Jahren) tritt diese ‚Straftat’ auf (denn ab 9 Jahren erhalten die meisten Kinder ihr eigenes Taschengeld und müssen nicht im Laden klauen und vorher auch nicht, da sind sie noch mit Bankrauben beschäftigt).

So, damit ist das Design schon erledigt. Denn ein Mittelwertunterschied (t-Test) oder eine lineare Rangstatistik (U-Test) werden hier –wenn überhaupt- nur kleine Zusammenhänge finden.

Bei zeitlich gebundenen Erscheinungen dieser Art ist der Einsatz von t-Test und U-Test nicht unbedingt angezeigt.

Das Ganze kann man auch als Simulation darstellen. Hier werden zwei Gruppen gebildet. Gruppe 2 tritt im Zeitraum t1-t250 und in t751-t1000 auf. Gruppe 1 tritt nur in t251 bis t750 auf. Das wäre als ob sämtliche Kinder im Zeitraum t251 bis t750 Kaugummis klauen, davor und danach nicht. Die Ergebnisse des U-, und des t-Tests sind natürlich nicht signifikant (p=100%).

Dass du überhaupt Zusammenhänge mit dem Design feststellen konntest, verweist eher auf starke Zusammenhänge.

Damit war also mein erster Rat (siehe oben) mit dem U-Test, der auf einen 'Unterschied' abzielt-wie in der Formulierung der Fragestellung- glatt falsch. Denn es geht nicht um 'Unterschiede' im Alter im Sinne einer Zu- oder Abnahme, sondern (wie ich vermute), um altersspezifische Schwerpunkte.

Code: Alles auswählen

input program.
loop a =1 to 1000 by 1.
end case.
end loop. 
end file.
end input program.
exe.

IF  ($CASENUM >250 & $CASENUM <= 750) Gruppe=1.
RECODE Gruppe (MISSING=2).
EXECUTE.

val lab Gruppe 1'Kaugummi-Dieb'
                      2'kein Kaugummi-Dieb'.

NPAR TESTS
  /M-W= a BY Gruppe(1 2)
  /MISSING ANALYSIS.

T-TEST GROUPS=Gruppe(1 2)
  /MISSING=ANALYSIS
  /VARIABLES=a
  /CRITERIA=CI(.95).
Gruß
drfg2008
Butter_Blume
Beiträge: 27
Registriert: 29.06.2011, 12:30

Beitrag von Butter_Blume »

naja, die Annahme basiert ja auf gewissen Erkenntnissen, ist also nicht aus dem hohlen Bauch entstanden.

Es geht ganz konkret um Mobbing. Bisherige Studien sagen, dass dieses eher bei jüngeren Kindern verstärkt auftritt und mit dem Alter abnimmt. Ich möchte jetzt nur kucken, ob wirklich unter den jüngeren Schülern die Prävalenz (Opfer und Täter) höher ist (was ich nicht replizieren konnte) und ob Unterschiede nach Alter signifikant sind. Ich weiß, dass das mit einem Querschnitt nicht optimal ist, aber Längsschnittstudien in diesem Bereich gibt es leider kaum und auch ich war nicht in der Lage dieses zu realisieren.

"Dass du überhaupt Zusammenhänge mit deinem wahrscheinlich ungeeigneten Design feststellen konntest, verweist eher auf starke Zusammenhänge."

Diese Aussage verstehe ich leider nicht ganz... interessant ist doch, dass ich für das Phänomen Mobbing wie Cybermobbing bei der Täterseite signifikante Unterschiede nachweisen konnte. was würdest du denn als geeigneter empfehlen?

Du hast aber in einem Punkt vollkommen recht, die Effekttstärken sind super niedrig...
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ich habe den Text online mehrfach geändert, daher steht das jetzt alles etwas verändert.

Es geht um Schwerpunkte. Wenn genügend Daten vorhanden sind, eventuell erst einmal eine Verteilung anzeigen lassen. Zwei Verteilungen lassen sich auf 'Unterschiedlichkeit' testen über den KS-Omnibustest. Auf Lageverschiebungen zu testen macht hier wirklich nur zum Teil Sinn. Eventuell eine Tabelle erstellen, relevante Altersgruppen segmentieren und diese als Chi-Quadrat Test prüfen. A posteriori die korrigierten Residuen einsetzen.
Es geht ganz konkret um Mobbing. Bisherige Studien sagen, dass dieses eher bei jüngeren Kindern verstärkt auftritt und mit dem Alter abnimmt.
... und später in den Büros wieder zunimmt. Wenn du in deiner Arbeit dich offensichtlich nur auf 'Kinder-Mobbing' fokussierst, dann ist selbstverständlich, dass mit dem Ende der Kindheit auch das spezifische Mobbing endet. Das wäre aber tautologisch.
Ich weiß, dass das mit einem Querschnitt nicht optimal ist, aber Längsschnittstudien in diesem Bereich gibt es leider kaum und auch ich war nicht in der Lage dieses zu realisieren.
Mit Querschnitt oder Längsschnitt hat das erst einmal weniger zu tun. Ich kann auch -als Beispiel- bei Körpergewicht oder Körpergröße eine Zunahme im Alter von 1-18 gut über eine Querschnittstudie nachweisen.

Gruß
drfg2008
Butter_Blume
Beiträge: 27
Registriert: 29.06.2011, 12:30

Beitrag von Butter_Blume »

Ich danke Dir, drfg2008!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten