intervallskalierte Kontrollvariable bei Chi-Quadrat-Test

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
psy-nautilus
Beiträge: 10
Registriert: 26.07.2013, 18:10

intervallskalierte Kontrollvariable bei Chi-Quadrat-Test

Beitrag von psy-nautilus »

Hallo,

ich komme bei Folgendes nicht ganz weiter. Ich habe Geschlecht (m/w) mit Bildung (niedrig, mittel, hoch) in einer Kreuztabelle verglichen und möchte den signifikanten Unterschied für Alter kontrollieren und dabei ungern Altersgruppen kreieren. Für die Kontrollvariablefunktion bei Kreuztabellen in SPSS empfiehlt es sich ja Altersgruppen zu bilden, gäbe es denn noch eine andere Möglichkeit oder muss ich Bildung mit Alter separat korrelieren? Wie würde das gehen?

Danke + Gruß
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

das geht dann über logistische Regressionen
drfg2008
psy-nautilus
Beiträge: 10
Registriert: 26.07.2013, 18:10

Beitrag von psy-nautilus »

Wie bringe ich denn 3 Variablen in eine logistische Regression?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

hier gibt es die verschiedensten Möglichkeiten. Gut dokumentiiert für SPSS bei Achim Bühl (deutsch), bei Backhaus (deutsch) müsste es eigentlich auch was geben oder bei Andy Field (englisch).
drfg2008
Wolf Riepl
Beiträge: 21
Registriert: 23.03.2009, 12:28

Beitrag von Wolf Riepl »

Wenn Bildung mit drei Ausprägungen die abhängige Variable ist, kann man eine ordinal-logistische Regression anwenden. Die ist allerdings ziemlich anspruchsvoll hinsichtlich Voraussetzungen und Interpretation. Da finde ich die multinomiale ein wenig einfacher, aber immer noch für Fortgeschrittene. Beides sind Erweiterungen des binär-logistischen Regressionsmodells. Alternative wäre, Bildung zu zwei Kategorien zusammenzufassen (z. B. niedrig / hoch). Oder ist es möglich, statt der drei Kategorien die Bildungsjahre zu verwenden? Dann geht evtl. lineare Regression. Vorher würde ich mir ansehen, ob die Bildungsjahre einigermaßen brauchbar verteilt sind.

Alter und Geschlecht wie von drfg2008 beschrieben als UVs einsetzen. Geschlecht am besten 0/1 codieren, ich bevorzuge eindeutige Bezeichnungen wie "weiblich" mit 1=weiblich und 0=männlich, weil ich dann immer weiß, in welche Richtung ich interpretieren muss. Bei "Geschlecht" muss man immer nachschlagen. Alter metrisch einsetzen.

Regressionsverfahren (logistische wie auch lineare) "trennen" Effekte, d. h. man sieht dann den Geschlechtseffekt unter Kontrolle des Alters. Was die Kontrollvariable ist und was die "Hauptvariable", liegt bei der Interpretation des Forschers, "technisch" gibt es keinen Unterschied. Mit anderen Worten: man kann ebenso vom Alterseffekt unter Kontrolle des Geschlechts sprechen.
"Wieso interpretieren? Das Ergebnis steht doch schon da!"
"Die Zahlen sprechen nicht für sich selbst ..."
psy-nautilus
Beiträge: 10
Registriert: 26.07.2013, 18:10

Beitrag von psy-nautilus »

Hey Ihr beiden,

super vielen Dank! Leider kann ich an der Bildungskategorie nicht viel machen, also Jahresangaben variieren zu stark über vier beteiligte Länder. Zu zwei Kategorien zusammenzufassen widerspricht mir etwas meinem Ziel, nämlich, dass die bisherigen Ergebnisse zeigen, dass Geschlecht sich eher wenig in niedrigerem und mittlerem Bildungsgrad unterscheiden, sondern der Effekt eher beim höheren Bildungsgrad zu sehen ist. Die Männer sind aber signifikant älter als die Frauen, daher kam meine Überlegung für Alter zu kontrollieren. Einerseits gibt es vermutlich schon einen Geschlechtseffekt, aber der Alterseffekt müsste mehr Varianz aufklären, meine ich.
Von einer ordinal-logistischen Regression habe ich noch nicht wirklich gehört. Was meintest Du denn mit anspruchsvollen Voraussetzungen, hinsichtlich der Datenqualität oder wie?
Wolf Riepl
Beiträge: 21
Registriert: 23.03.2009, 12:28

Beitrag von Wolf Riepl »

Bei der ordinal-logistischen Regression wird für jeden "Sprung" von einer Kategorie zur nächsten ein binär-logistisches Modell geschätzt (bei Dir wären das somit zwei Modelle). Eine Annahme dabei ist, dass die Koeffizienten jeweils gleich sind. Will man diese Annahme nicht treffen, kann man Modelle mit unterschiedlichen Koeffizienten schätzen. (Oder eben manuell zwei separate binär-logistische Modelle erstellen.)

Für alle logistischen Modelle gilt: Bei der Interpretation muss man sorgfältig zwischen Wahrscheinlichkeiten, Chancen (Verhältnis zweier Wahrscheinlichkeiten) und Chancenverhältnissen (Odds Ratios) unterscheiden. Wer genau sein will, braucht umständliche Formulierungen. Es gibt etliche Unterschiede zur linearen Regression, man braucht meines Erachtens schon etwas Einarbeitungszeit in diese Modelle.

Wenn Du schon bei niedrigem UND mittlerem Bildungsgrad nur geringe Unterschiede hast, vs. deutlicheren Unterschieden bei hohem Bildungsgrad, kannst Du doch zwei Kategorien bilden?
psy-nautilus
Beiträge: 10
Registriert: 26.07.2013, 18:10

Beitrag von psy-nautilus »

Hm, ich habe mich jetzt noch etwas mehr eingearbeitet und logistische Regression ist durchaus voraussetzungsvoll. Kurz habe ich überlegt, ob ich nicht einfach Bildung (3-stufig) mit Alter korreliere, aber das ist ja auch fast unmöglich. Punkt-biseral kommt ja nicht in Frage, ich habe im Forum mal etwas gesucht und es gibt Vorschläge zu Eta-Quadrat oder auch Test auf Lageunterschiede. Wäre nach wie vor logistische Regression das bessere Verfahren?
Wolf Riepl
Beiträge: 21
Registriert: 23.03.2009, 12:28

Punkt-biseriale Korrelation

Beitrag von Wolf Riepl »

Es kommt halt immer darauf an, wie streng man mit den Voraussetzungen umgeht bzw. was der Betreuer mag und was nicht. Ich habe schon öfter Korrelationen mit Variablen gesehen, die nur wenige Ausprägungen aufwiesen. Eine Alternative zur Pearson-Korrelation wäre die Spearman'sche Rangkorrelation, die ist verteilungsfrei, wie es so schön heißt. Meistens (wenn es keine starken Ausreißer gibt) unterscheiden sich die Korrelationskoeffizienten zwischen Pearson-Korrelation und Spearman-Korrelation nicht sehr stark. (Ich hatte mal ein Extrembeispiel, in dem der eine sig. positiv, der andere sig. negativ war! Das sind Ausnahmen.)
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten