Wie kann ich hier eine Korrelation berechnen?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

Guten Tag alle miteinander!


Nun, ich würde gerne versuchen herauszufinden, ob es einen Zusammenhang gibt zwischen Urbanisierung und Bildungsstand. Ich habe mir dafür Daten geholt über die Dichte an Einwohnern (in Einwohner/km2) für dutzende Gemeinden, sowie den Bildungsstand der Einwohner für diese.

Erstens: Ist das so überhaupt möglich? Könnte man daraus irgendwelche Schlüsse ziehen, wenn ich hier feststelle, dass es eine Korrelation gibt? (z.B. steigender Bildungsstand mit steigender Einwohlerzahl)

Zweitens: Zu welcher Korrelationsmethode (oder anderer Methode) würdet ihr mir raten?


Vielen Dank an euch ;)


PS: Habe die selbe Frage auch hier gestellt (nur, dass ihr bescheid wisst).
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

Hallo Blob123

Du kannst soviel Fragen an soviele richten wie du willst.
Es gibt nun mal Personen, die glauben ihren Antworten könne man nichts
mehr hinzufügen. Hab mich darüber auch schon geärgert.

Zusammenhang Urbanisierung und Bildungsstand..
wie operationalisiert man das?.. auf welchem Skalenniveau.
Am besten immer intervallnieveau.
wie ist das Kausal zu denken, wenn überhaupt?
Je dichter die Leuter umso dümmer? (richtig verstehen)

erst mal Bildung, das klingt einfacher.
Ich mags wenn man das dreifach abbildet: Schulabschluß (ordinal), Berufsausbildung
und ausgeübter Beruf. (gut, die daten muss man erst mal haben...)
besser wär IQ, oder vielleicht sozialer Status (da gibts irgend so eine Skala, Umrechnung von Zeugs hinauf auf Intervallniveau, mal googln)

Urbanisierung, Einwohnerdichte, das ist erst mal metrisch (SN >= Intervallniveau)
klingt aber irgendwie dünn. Denk an Teile des Osten, dünn besiedelt, Abwanderung
und doch kein Villenviertel. wie ist das mit der Mobilität..oder gehts um:
IQ bei Gebuhrt plus urbanes Umfeld --> IQ im alter?
Denk auch z.B Mediatoren wie Stress und Lärm bei hoher Dichte, aber auch multikulti, Kultur, Abwechslung usw im Vergleich Stadt-Land...

KoKo Bilung mit Dichte, da Bildung nur ordinal geht nur Spearman
Du siehst, so was wird komplex....
aber macht ja nix, umso besser...

Da kann man sich viel ausdenken..
Mach dir die Zieletztung des Ganzen klar, reduziert die Kompexität:
a)Will ich was erklären? (Grundlagenforschung, Kausalität)
b)Will ich was vorhersagen? (z.B.:Ich will ins Dorf XY ziehen, und frag mich wie die Leute wohl drauf sind? wird mein Kind klüger, wenn es auf den Land aufwächst?)oder
c)Will ich eine Anwendung? (Wie muss ich bauen, das die Leute nicht verblöden?)

einfach mal machen...trail and error... aber am besten immer im Team.

gruß
dutchie
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

ach ja, und bitte nicht die Foren verlinken.

gruß
dutchie
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

Servus Dutchie ;)

Danke für deine Meinung / Sichtweise!

Skalenniveau wäre ordinal für die Bildung und Absolutskala für die Einwohner / Dichte.

Bildung:
IQ, Sozialer Status habe ich nicht. Beruf muss ich nachschauen, könnte auf jeden Fall interessant sein, man könnte auch einen Index machen.

Urbanisierung: Würde ich tatsächlich nur mit Einwohner pro km2 rechnen, da mir nichts anderes zur Verfügung steht.


Meine Hypothese würde eigentlich genau umgekehrt lauten, als du sie beschrieben hast. :) Ich komme aber auch aus Österreich, da ist die Lage etwas anders. Bei euch ist das Land sehr urban, was wohl auf der Zeit vor der Vereinigungs Deutschlands liegt. Österreich war schon immer mehr oder weniger ein "Körper" und es gab in der Monarchie keine Gründe, dass andere Städte wachsen. Somit hatten viele Reformen z.B. im Bildungsbereich die ländlichen Gegenden von Österreich nur sehr spät erreicht, im Gegensatz zu Deutschland, wo der ländliche Raum (vor allem im Westen) von vielen kleinen Städten geprägt war.

Grundsätzlich ist hier bei uns allgemein bekannt, dass die Menschen am "Land" weniger gebildet sind, als in den wenigen Städten, die wir haben. (ist jetzt nichts gegen das Land, lebe selber am Land :D)

Deshalb die Hypothese: Je höher die Einwohnerdichte, desto höher der durchschnittliche Bildungsabschluss.


Ob das wissenschaftlich "okay" wäre, das so auszurechnen? Wie du sagst, gibt es sicher weitere Faktoren, die das beeinflussen...

Also du sagst Spearman… dann werde ich das wohl versuchen :D
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

Hallo blob123

Gruß nach Österreich. :D
Sind wir gespannt was rauskommt...

gruß
dutchie
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

dutchie hat geschrieben:Hallo blob123

Gruß nach Österreich. :D
Sind wir gespannt was rauskommt...

gruß
dutchie
Tja, sagen wir so, ich bin schon an der Dateneingabe ins SPSS gescheitert. :lol:
Ich bin etwas unsicher wie ich sie eingeben sollte, denn mir liegen ja absolute Zahlen vor, z.B. 887 für alle 20 bis 24-jährigen in einer gewissen Gemeinde. Ich möchte irgendwie versuchen es zu vermeiden, 887 Fälle ins SPSS einzutragen, und stattdessen nur die absolute Zahl. Ich weiß, dass es nicht schwer ist, 887 Fälle auf einmal zu importieren, es verwirrt mich lediglich, weil ich dann andere Variablen auch noch hinzufügen muss, z.B. für den Bildungsstand. Ich nehme jetzt die Zahl 141, das sind die, die nur die Pflichtschule haben. Also 887 Fälle eintragen, von denen ich für die 141 ersten nur den Wert für die Pflichtschule eingebe.

Weißt du, ob's da auch eine andere Lösung gibt, zwecks Übersichtlichkeit? Ich meine, es ist wahrscheinlich am "saubersten" so… da mir die Daten für ganz Österreich zur Verfügung stehen, hätte ich aber doch gerne versucht, ganz Österreich auszuwerten, und da wird's dann eventuell doch sehr unübersichtlich :?

Ich hab die Daten in Excel-Dateien, sind aber wie gesagt nur absolute Daten, keine einzelnen Fälle… wie arbeitet man da in der Regel? Also sagen wir in statistischen Ämtern, wie machen die das? Machen die alles manuell?
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

hallo blob123

Welcher Art sind denn eigentlich deine Merkmalsträger?
Wenn die Merkmalsträger Städte sind, dann hat die Stadt die Variable 20 bis 24 jährige
mit der Ausprägung 887. Also eine Zeile pro Stadt.
Oder willst du jeden Bürger Österreichs in die Datei packen, dann müsst du in dieser Stadt OBEN, 887 mal die Intervallmitte von 20 bis 24 eintragen, das ist dann aber nicht das wahre Alter. In SPSS kann man die obige Variante nur zur Eingabe, in die untere irgendwie umstellen,wenn überhaupt nötig, weiß gerade aber nicht wie.
In der Datei hast du aber eine Stadt = eine Zeile.
Dir liegen bereits aggregierte Daten vor und nicht Rohwerte, oder?
Na ja, das Einwohnermeldeamt, arbeitet ja bereits seit, sagen wir mal 300 Jahre an der Datei, und die wurschteln auch nicht mit excel rum und haben wieviel Mitarbeiter, also wenig Arbeit ist das nicht.
gruß
dutchie
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

dutchie hat geschrieben:hallo blob123

Welcher Art sind denn eigentlich deine Merkmalsträger?
Wenn die Merkmalsträger Städte sind, dann hat die Stadt die Variable 20 bis 24 jährige
mit der Ausprägung 887. Also eine Zeile pro Stadt.
Oder willst du jeden Bürger Österreichs in die Datei packen, dann müsst du in dieser Stadt OBEN, 887 mal die Intervallmitte von 20 bis 24 eintragen, das ist dann aber nicht das wahre Alter. In SPSS kann man die obige Variante nur zur Eingabe, in die untere irgendwie umstellen,wenn überhaupt nötig, weiß gerade aber nicht wie.
In der Datei hast du aber eine Stadt = eine Zeile.
Dir liegen bereits aggregierte Daten vor und nicht Rohwerte, oder?
Na ja, das Einwohnermeldeamt, arbeitet ja bereits seit, sagen wir mal 300 Jahre an der Datei, und die wurschteln auch nicht mit excel rum und haben wieviel Mitarbeiter, also wenig Arbeit ist das nicht.
gruß
dutchie
Ja, ich bin es genau umgekehrt angegangen, wollte alle Einwohner eintragen, und dann irgendwie mit Syntax definieren in welcher Stadt sie leben, welchen Bildungsstand sie haben, welches Alter, etc.

Die Städte als einzelne Fälle, wie du es beschreibst, daran habe ich gedacht, aber es hat mich gedanklich verwirrt. Ich hab jetzt versucht es umzusetzen und weiß auch wieso.

Ich hab jetzt die Variablen:

• PolitischerBezirk, nominal (Werte = einzelne Gemeinden bzw. Städte)
• Einwohnerdichte, metrisch (keine angegebenen Werte in der Variablenansicht, den tatsächlichen Wert (in km²) gebe ich dann in der Datenansicht ein)
• Bildungsstand, ordinal (Werte = von 0 bis 7 die Pflichtschule bis zur Hochschule)

Jetzt habe ich erstens das Problem mit dem Alter. Wenn ich jetzt das Alter in Kategorien darstelle und meine Werte ebenfalls von 0 bis 5 gehen (eben 20-24-jährige, etc.), dann müsste ich eine extra Variable für jede Altersgruppe haben. Ich finde das unschön, ist aber vielleicht die einzige Lösung.

Und vor allem ist auch die Variable Bildungsstand - meine wichtigste Variable - ein Problem, weil wenn eine Zeile ein Stadt/Gemeine darstellt (politischer Bezirk in meinen Daten), dann kann ich ja keine Variable "Bildungsstand" dafür haben, weil es ja nicht nur einen Bildungsstand gibt, sondern verschiedene Bildungsstände für verschiedene Personen. Eventuell wieder eine Variable pro "Bildungsstufe". Ist sehr ungewohnt mit Städten statt Personen zu arbeiten, eigentlich ist man es eher gewohnt, dass Altersgruppen oder Bildungsstufen eine einzige Variable mit verschiedenen Werten darstellen :D

Die verschiedenen Daten aus verschiedenen Datensätzen in eine einzige SPSS-Datei unterzubringen stellt sich schwieriger heraus, als ich dachte… :lol:
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

Bzw., was möglich wäre, wäre halt den durchschnittlichen Bildungsstand berechnen (vielleicht mit dem Median oder so) und dann eben DOCH jedem politischem Bezirk einen eigenen Bildungsstand zu geben. Ob das dann wissenschaftlich korrekt ist?
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

hallo blob123

Wenn du eine Variable wie Bevölkerungsdichte hast, ist erstmal dei Stadt oder entsprechende Region Merkmalsträger..
Du kannst auch einer Person die Bevölkerungsdichte zuweisen in der sie lebt.. ist auch komisch.
Dann korreliert du über personen und hast die Aussage wenn XY sein Abitur macht steigt die Bevölkerung um 3 Personen, klingt komisch macht aber erst mal nix, du hast nun mal verschiedene Daten Ebenen.
Personen (1.level) gruppieren sich zu Bezirken 82.level), Bezirke gruppieren sich zu Länder,usw
Jetzt muss man nur beachten ob die Merkmale des 2ten levels Aggregationen aus dem ersten Level sind, oder genuin dem 2ten Level angehören.
Der "Bildungsgrad einer Stadt" wird aus Infos des ersten Levels berechnet,
Das Gründungsdatum oder die Durchschnittstemperatur (stimmt nicht ganz) hat mit den Leuten in der Stadt nix zu tun.
Versuch die Daten so einzugeben wie sie vorliegen, wenn du 5 Alterskategoreien hast, dann sind das 5 Variablen.
Du kannst diese 5 Variablen aber auch in Dummys umformen und in eine lineare Regg. tun.
Wenn du Stadt als Fälle hast, kann man dann Aussagen über Personen machen, oder nur über Städte?

lieber blob123
keep on going
gruß
dutchie
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

Danke dutchie für deine Hilfe wieder einmal, ohne dich wüsste ich echt nicht weiter :D Gut, dass es Leute wie dich gibt ;) Das regt dazu an, in dem, wo man sich auskennt, sein Wissen ebenfalls zur Verfügung zu stellen … also tust du auf jeden Fall was gutes :D

Hmm, ich glaube ich sehe was du meinst … ich werde es wohl bei Städten belassen, dann kann man nur Schlüsse über Städte ziehen, aber das war ein bisschen das Ziel, also ist es okay schätze ich.

Mit Dummies und linearer Regression kenne ich mich leider (noch) nicht aus, also schließe ich das erstmal aus.

Was du bzgl. Bildungsgrad meintest verstehe ich nicht ganz, aber du meinst ja ich soll die Daten eher belassen wie sie sind. Macht es nicht mehr Sinn, für den Bildungsgrad den jeweiligen Median der Gemeinde zu nehmen und diesen auf einen Korrelationstest mit der Dichte zu testen? Oder tatsächlich alle Bildungskategorien als eigene Variablen, wie beim Alter?

Theoretisch komm ich noch irgendwie mit, aber praktisch läuft gerade gar nichts. :shock: Die Umsetzung ins SPSS macht mir echt zu schaffen, bzw. ich glaube ich verwechsle hier einiges. Variablen sind ja Merkmale, ich habe meine Städte (Merkmalsträger) aber auch als Variable - ich glaube das ist falsch … weiß aber nicht, wohin ich die hinzufügen sollte? Oder ist das doch richtig?
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

echt super, chaos, :shock: aber ich sag dir das läuft nur so, Verzweiflung ist auch mein ständiger Begleiter
Merkmalsträger-- Merkmal (Variable)--- Merkmalsausprägung
Erwin----Geschlecht----männlich
Erwin ist einer von Vielen, der Population

oder mach mal pause 8)
gruß
dutchie
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

dutchie hat geschrieben:echt super, chaos, :shock: aber ich sag dir das läuft nur so, Verzweiflung ist auch mein ständiger Begleiter
Merkmalsträger-- Merkmal (Variable)--- Merkmalsausprägung
Erwin----Geschlecht----männlich
Erwin ist einer von Vielen, der Population

oder mach mal pause 8)
gruß
dutchie

Genau da scheitere ich … 

Ich hab jetzt mit einem Freund darüber diskutiert, und der meint, dass das, was ich machen möchte, mit diesen Daten gar nicht möglich ist. :(
Die Daten scheinen nicht dafür geeignet zu sein. Die sehen so aus:

BILD (klick mich)

Also kein Rohdaten, sondern aggregierte Daten. Das lässt sich mit den anderen Variablen nicht kombinieren und an die Rohdaten komme ich auch nicht ran, deshalb habe ich jetzt eine alternative Idee gehabt:

Ich würde gerne den durchschnittlichen Bildungsstand jeder Gemeinde berechnen. Wenn ich hier mit einem brauchbaren Wert herauskomme, dann könnte ich diesen leicht verwenden, um einen Korrelationstest nach Spearman mit der Einwohnerdichte der Gemeinde zu machen.

Jetzt die Frage: Wie kann ich am Besten solch einen Mittelwert mit den Daten im Bild berechnen? Die Daten sind mal wieder nicht sehr gut geeignet wie ich schätze, aber irgendwie muss es doch gehen. Alter würde ich glatt weglassen - das macht es zu kompliziert, ich schaffe es ja nicht mal so…

Danke :)
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von dutchie »

Hallo
mach so:
du rechnest keinen Bildungsdurchschnitt
du bestimmst den Prozentsatz z.B. Hochschule im Burgenland der 20 bis 44 Jährigen 7149/56131, über alle Regionen
das korrelierst du mit der Bevölkerungsdichte, dann weiß du je höher die Dichte desto größer der Anteil an Hochschulabsolventen
Ist dieser Anteil hoch, ist gleichzeitig der Anteil Lehre eher niedrig, da die sich zu 100 ergänzen, so ca.

gruß Dutchie
Blob123
Beiträge: 28
Registriert: 20.02.2018, 11:43

Re: Wie kann ich hier eine Korrelation berechnen?

Beitrag von Blob123 »

dutchie hat geschrieben:Hallo
mach so:
du rechnest keinen Bildungsdurchschnitt
du bestimmst den Prozentsatz z.B. Hochschule im Burgenland der 20 bis 44 Jährigen 7149/56131, über alle Regionen
das korrelierst du mit der Bevölkerungsdichte, dann weiß du je höher die Dichte desto größer der Anteil an Hochschulabsolventen
Ist dieser Anteil hoch, ist gleichzeitig der Anteil Lehre eher niedrig, da die sich zu 100 ergänzen, so ca.

gruß Dutchie
Ja, das ist auch gut - hab das jetzt mittlerweile mit ISCED gemacht, also kategorial / ordinal. Komischerweise kommen da bei Spearman immer gleich ziemlich extreme Werte wie 1 oder -1 heraus… irgendwas mache ich immer falsch.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten