Klassifizieren für Regression

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
thessa86
Beiträge: 5
Registriert: 23.07.2013, 18:19

Klassifizieren für Regression

Beitrag von thessa86 »

Hallo alle,

ich habe eine kurze Frage zur Aufbereitung von Daten für eine Regression.

Wie klassifiziert man (sachlogisch oder statistisch motiviert) intervallskalierte Variablen? Beispielsweise habe ich die Variable "Anzahl Leute in der Firma", die von 6 bis 99 reicht. Nun möchte ich eine Regression rechnen, halte aber eine Standardisierung für ungünstig, da ich denke, dass es eine Grenze für den linearen Zusammenhang mit der Zielvariable gibt. Wie erkenn ich diese Grenze?

Angenommen, die Freude am Ungang mit Kollegen steigt signifikant mit der Zahl der Mitarbeiter, aber nur bis zu einer Mitarbeiterzahl von 20. Dann wüsste ich, dass ich den Trennwert bei 20 Mitarbeitern setze und hätte 2 Ausprägungen?! Stimmt das? Und wie bekomm ich so etwas raus?

Bisher habe ich es so gemacht, dass ich die Ausprägungen einfach bei 50% der Fälle geteilt habe und eine Dummy-Variable draus gemacht habe.

Wär schön, wenn mir das jemand erklären könnte, da fehlt mir echt die Logik für :D
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

dann gehst du prinzipiell von nicht-linearen Verhältnissen aus. Ob es wirklich Cut-Points gibt, von denen aus es dann schlagartig keinerlei Zuwachs (zum Beispiel an Zufriedenheit) gibt, wäre die Frage. Ich würde eher von einem nicht-linearen Zusammenhang ausgehen, mit einer gewissen Sättigung und dann auf eine entsprechende Funktion regressieren. Stichwort: Sättigungsfunktion.

Cutpoints: bräuchte man einen sehr großen Datensatz und würde dann nach einer zunächst graphischen Analyse einen Bruchpunkt in der Prognose suchen.
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten