"Problem" zweier metrischen Variablen bei Regressi

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Katharina2005
Beiträge: 3
Registriert: 18.11.2009, 11:11

"Problem" zweier metrischen Variablen bei Regressi

Beitrag von Katharina2005 »

Hallo erstmal! Toll dass es so ein Forum gibt! ich hoffe ihr könnt mir weiter helfen:
Die Frage die ich mit meiner Auswertung beantworten will ist, wie gut der offline/online Gebrauch den Kundennutzen voraussagt. Voraussagen sind zukunftsaussichten das heißt ich benutze eine Regression.
Ich habe eine nominale Variable mit 0=offline user und 1 = online user sowie eine metrische Variable profit. wenn ich das trotzdem (obwohl nciht zwei metrische) durchlaufen lasse bekommen ich einen R-Quadrat Wert von 0, Signifikanz ist vorhanden. Aber eigentlich kann man das ja nicht machen.. Eine lineare Regression erfordert ja eigentlich zwei metrische Variablen. Dann gibt es ja noch die logistische Regression bei der ich dieses Problem ja generell umgehen könnte. Aber da sagt SPSS dass das nciht geht. ich kann mir auch gerade nicht vorstellen wie ich die eine nominale sinnvoll umkodieren kann.... für Tipps und Anregungen wäre ich sehr dankbar!!
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

regression sein lassen und stattdessen mittelwertsvergleich?

logistische regression geht nicht, weil dort das kriterium dichotom ist, wogegen du einen dichotomen prädiktor hast.
Katharina2005
Beiträge: 3
Registriert: 18.11.2009, 11:11

Beitrag von Katharina2005 »

KarinJ hat geschrieben:regression sein lassen und stattdessen mittelwertsvergleich?

logistische regression geht nicht, weil dort das kriterium dichotom ist, wogegen du einen dichotomen prädiktor hast.
für die nachwelt:
eine lineare regression ist möglich da es sich bei dem einen um eine dummy variable handelt! codierung: 0,1
KarinJ
Beiträge: 939
Registriert: 13.05.2008, 10:52

Beitrag von KarinJ »

dass dummy-variablen in eine lineare regression aufgenommen werden dürfen, wird der nachwelt eher bekannt sein.

meine meinung scheinst du falsch zu finden? dann folgendes:

eine regression mit nur einem prädiktor ist nicht anderes als eine pearson-korrelation. es gibt nur einen dichtomen prädiktor, also ist der pearson-koeffizient in dem fall nicht angemessen, weil der pearson-koeffizient nur für 2 intervallskalierte (und normalverteilte) variablen berechnet werden sollte. wenn also pearson-koeffizient nicht angemessen ist, ist folglich auch die regression nicht angemessen. der angemessene koeffizient für ein echt dichotomes merkmal und ein ordinales merkmal wäre der rang-biseriale koeffizient.

weiterhin finde ich die formulierung des zusammenhangs eines dichtomen merkmals mit einer kontinuierlichen variable immer etwas künstlich bis merkwürdig. andere wohl nicht, sonst wäre der rang-biseriale koeffizient ja nicht entwickelt worden. jedenfalls ist nach meiner meinung bei dieser konstellation eher ein mittelwertsvergleich angemessen und liefert wohl auch besser interpretierbare ergebnisse. aber du wirst schon zurecht kommen.
Katharina2005
Beiträge: 3
Registriert: 18.11.2009, 11:11

Beitrag von Katharina2005 »

KarinJ hat geschrieben:dass dummy-variablen in eine lineare regression aufgenommen werden dürfen, wird der nachwelt eher bekannt sein.

meine meinung scheinst du falsch zu finden? dann folgendes:

eine regression mit nur einem prädiktor ist nicht anderes als eine pearson-korrelation. es gibt nur einen dichtomen prädiktor, also ist der pearson-koeffizient in dem fall nicht angemessen, weil der pearson-koeffizient nur für 2 intervallskalierte (und normalverteilte) variablen berechnet werden sollte. wenn also pearson-koeffizient nicht angemessen ist, ist folglich auch die regression nicht angemessen. der angemessene koeffizient für ein echt dichotomes merkmal und ein ordinales merkmal wäre der rang-biseriale koeffizient.

weiterhin finde ich die formulierung des zusammenhangs eines dichtomen merkmals mit einer kontinuierlichen variable immer etwas künstlich bis merkwürdig. andere wohl nicht, sonst wäre der rang-biseriale koeffizient ja nicht entwickelt worden. jedenfalls ist nach meiner meinung bei dieser konstellation eher ein mittelwertsvergleich angemessen und liefert wohl auch besser interpretierbare ergebnisse. aber du wirst schon zurecht kommen.
Nein nein deine Antwort war nicht falsch!!Sorry, dass ein Missverständnis! Danke für deine Antwort, die hat mir sehr geholfen!! Und finde deine Antwort auch viel verständlicher! Ich habe beides gemacht ;-)
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten