Hallo zusammen,
ich habe mal eine ganz profane Frage. Ich möchte eine binär-Logistische Regression rechnen. Da es zu meiner Untersuchungsfrage viele verschiedene Erklärungsansätze gibt explodiert gerade meine UV Anzahl.
Wieviele kann man eigentlich berücksichtigen? Gib es eine Faustregel? Ist es besser Variablen als intervallskaliert zu modellieren oder sollte man besser kategorisieren?
Danke.
Wieviel UVs kann ich nutzen.
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Pro Prädiktor mindestens 10 Ereignisse in der AV. D.h. wenn Du beispielsweise bei 100 Fällen eine Verteilung 30 zu 70 bei der AV hast, sollten es nicht mehr als 3 Prädiktoren sein. Siehe Peduzzi, Concato, Kemper et al. (1996). A simulation study of the number of events per variable in logistic regression analysis. Journal of Clinical Epidemiology 49, S. 1373–9.
Die Frage nach der Kategorisierung verstehe ich nicht ganz. Wozu soll das dienen? Es verschenkt statistische Informationen und erhöht die Zahl der UVs, beides nicht wünschenswert.
Die Frage nach der Kategorisierung verstehe ich nicht ganz. Wozu soll das dienen? Es verschenkt statistische Informationen und erhöht die Zahl der UVs, beides nicht wünschenswert.
-
- Beiträge: 6
- Registriert: 28.10.2007, 18:42
Vielen Dank für den Hinweis. Das mit der Kategorisierung sehe ich genauso. Ich habe bloß immer einmal wieder gelesen das das Leute machen und mir war nicht klar warum. Z.B. habe ich hier einen Text, welcher zwar nicht die UVs erhöht, aber mit dem Hinweis auf eine bessere Zellenbesetzung eine Noten-variable so zusammenfasst. (1 2=1) (3=3) (4=4) (5 6=5). Bei einem Chi-Quadrat Test verstehe ich das ja noch, wegen der 5 Falle pro Zelle, aber nicht bei einer logistischen Regression?