
Ich hatte dieses Semester (Master Sozialwissenschaften) ein Seminar zur multivariaten Datenanalyse. Nun schreibe ich eine Hausarbeit und habe mir als Thema "Armut in der BRD" ausgesucht. Ziel ist es mit Hilfe einer logistischen Regression die Chancen bzw. Risiken arm zu werden, zu ermitteln. Soweit so gut, aber ich habe ein fieses Problem.
Ich muss jedem einen Wert (0 = nicht arm ; 1 = arm) zuweisen.
Das möchte ich mit Hilfe der EU Definition, der Definition die sich durchgesetzt hat bzw. durchzusetzen scheint, der Armutsgrenzen machen. Diese besagt, dass derjenige arm ist, der weniger als 60% des Medians des Nettoäquivalenzeinkommens (im jeweiligen Land) zur Verfügung hat.
Ich arbeite mit dem Mikrozensus. Dieser enthält für jeden Befragten des Haushaltsnettoeinkommens, in dem Haushalt in dem die Person eben lebt. Aufgrund der Tatsache, dass es innerhalb von Haushalten zu massiven Kostenreduzierungen kommt (man braucht nicht 4 Kühlschränke bei 4 Personen Haushalten, kann sich mit 4 Personen Familienpackungen kaufen usw.), brauch beispielsweise ein 4 Personen Haushalt nicht 4.000 Euro um genauso vermögend, wie ein Single zu sein, der alleine wohnt und 1.000 Euro Nettolohn hat. Daher ist es wichtig das Nettoäquivalenzeinkommen zu berechnen. Dies geschieht anhand von Gewichtungen (1. erwachsene Person im Haushalt bekommt den Wert 1, jede weitere erwachsene Person den Wert 0,6 und für Kinder unter 13 ist es 0,3). Letztlich wird dann das Nettoeinkommen des Haushaltes durch die aufaddierten Gewichte geteilt und man hat das Nettoäquivalenzeinkommen des Haushaltes. Dann kann man gucken, in welchen Haushalten das Nettoäquivalenzeinkommen unter 60% des Medians des Nettoäquivalenzeinkommens liegt und sagen die Person lebt in einem armen Haushalt und die Person nicht.
Theoretisch alles kein Problem, praktisch schon:
Jeder Person das passende Gewicht zuzuteilen bekomm ich hin.
ABER: Wie addiere ich über die Haushalte die Gewichte mit Hilfe der SPSS-Syntax auf und weise jeder Person dann das entsprechende Gewicht zu?
Dabei muss ich ja dann berücksichtigen, welche Personen zusammen leben. Es gibt keine Variable, die mir genau sagt, wer in einem Haushalt zusammenlebt. Also keine fortlaufende Haushaltsnummer.
Aber es gibt zwei Variablen mit deren Hilfe ich genau sagen kann, wer in welchem Haushalt wohnt. Dabei handelt es sich um die Bezirksnummer und die Haushaltsnummer in diesem Bezirk.
Der Schritt danach, wäre auch kein großes Problem. Müsste dann einfach nur das Nettoeinkommen durch das Gewicht teilen. Dann hätte ich das Nettoäquivalenzeinkommen und daran kann ich sagen, wer ist arm und wer nicht.
Also meine Frage an euch: Wie addiere ich die Gewichte auf und weise jeder Person das Gewicht seines Haushaltes zu?
LG, Tasso