Hallo,
ich möchte gerne mit SPSS eine multiple Regressionsanalyse erstellen und Einflussfaktoren auf den Preis von Häusern analysieren. Meine abh. Variable ist also Preis.
Als unabh. Variablen habe ich Variablen wie z.B. die Größe oder wie viele Badezimmer ein jedes Haus besitzt.
Eine Variable macht mir jedoch besondere Sorgen, und zwar die Variable "Gebiet" (1,2,3,4, oder 5). Ich habe es mit Dummyvariablen versucht - leider ohne Erfolg!
Wie kann ich diese Variable konkret bei der linearen Regression behandeln? Einfach aufnehmen, wie z.B. die ratio Variable "Größe" des Hauses wäre wohl falsch, oder?
Über jeden Tipp bin ich dankbar! Falls jemand eine Schritt-für-Schritt-Anleitung parat hat, wäre ich sehr glücklich!
Beste Grüße, Hans
Multiple Regressionsanalyse mit nominalen Variablen
-
- Beiträge: 2
- Registriert: 08.01.2011, 16:39
-
- Beiträge: 2
- Registriert: 08.01.2011, 16:39
Vielen Dank für Deine Antwort.
Es ist so, dass die 5 Gebiete eine Stadt abdecken, die als Population betrachtet werden kann. Aus dieser Population entstammen die Daten des Samples.
Nun habe ich vorher mittels ANOVA getestet, ob überhaupt Unterschiede zwischen den 5 Gebieten in den durchschnittlichen Preisen der Häuser gibt. Mit dem Ergebnis, dass sich die durchschnittlichen Preise der Häuser zwischen den Gebieten nicht unterscheiden.
Macht es nun überhaupt noch Sinn, die Variable "Gebiet" mit in die Regressions-Analyse aufzunehmen, als potenziell erklärende Variable des Preises?
Mit "leider ohne Erfolg" meinte ich die vielen Unsicherheiten, die sich in der Durchführung auftaten. Ich hatte zu viele unterschiedliche Ergebnisse am Ende, da ich in meinem Fall keine eindeutige Vorgehensweise im Web finden konnte. Nun bin ich aber auf die Frage gestoßen, ob die Aufnahme überhaupt sinnvoll ist.
Wie würdest Du/wie würdet Ihr das bewerten?
MfG, Hans
Es ist so, dass die 5 Gebiete eine Stadt abdecken, die als Population betrachtet werden kann. Aus dieser Population entstammen die Daten des Samples.
Nun habe ich vorher mittels ANOVA getestet, ob überhaupt Unterschiede zwischen den 5 Gebieten in den durchschnittlichen Preisen der Häuser gibt. Mit dem Ergebnis, dass sich die durchschnittlichen Preise der Häuser zwischen den Gebieten nicht unterscheiden.
Macht es nun überhaupt noch Sinn, die Variable "Gebiet" mit in die Regressions-Analyse aufzunehmen, als potenziell erklärende Variable des Preises?
Mit "leider ohne Erfolg" meinte ich die vielen Unsicherheiten, die sich in der Durchführung auftaten. Ich hatte zu viele unterschiedliche Ergebnisse am Ende, da ich in meinem Fall keine eindeutige Vorgehensweise im Web finden konnte. Nun bin ich aber auf die Frage gestoßen, ob die Aufnahme überhaupt sinnvoll ist.
Wie würdest Du/wie würdet Ihr das bewerten?
MfG, Hans