Ich habe jetzt mal eine Faktoranalyse durchgeführt und dann eine logistische Regression.
Allerdings habe ich ein Problem beim Interpretieren der Ergebnisse aus der logistischen Regression, vor allem der Klassifizierungstabelle.
Die Klassifizierungstabelle gibt folgendes aus:
Code: Alles auswählen
Klassifizierungstabelle(a)
|---------|---------------------|------------------------------------------|
| |Beobachtet |Vorhergesagt |
| |---|----------------|-------------------------|
| |Ergebnis |Prozentsatz der Richtigen|
| | |------------|---| |
| |-10 |10 | |
|---------|-----------------|---|------------|---|-------------------------|
|Schritt 1|Ergebnis |-10|624 |254|71,1 |
| | |---|------------|---|-------------------------|
| | |10 |508 |305|37,5 |
| |-----------------|---|------------|---|-------------------------|
| |Gesamtprozentsatz | | |54,9 |
|---------|---------------------|------------|---|-------------------------|
a. Der Trennwert lautet ,500
Der Gesamtprozentsatz mit 54,9% ist nicht besonders gut, das ist klar (da in dem Datensatz 10 und -10 fast gleich oft vorkommen) .
Mich interresiert vor allem, was die beiden anderen Werte bei "Prozentsatz der Richtigen" bedeuten.
Bedeutet es, dass das Modell das Ergebnis von -10 mit 71,1% Genaugigkeit vorhergesagt hat, und das Ergebnis von 10 mit 37,5% Genauigkeit?
Wenn ja, könnte man das Modell doch prinzipiell dazu nutzen, jeweils nur das Ergebnis von -10 vorhersagen zu lassen.