Datensatz auswerten - Faktoranalyse, Interpretation?

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
eagle
Beiträge: 7
Registriert: 01.08.2011, 15:06

Datensatz auswerten - Faktoranalyse, Interpretation?

Beitrag von eagle »

Hallo,

ich habe ein Problem beim Auswerten von einem Datensatz.
Der Datensatz sieht folgendermaßen aus:

Code: Alles auswählen

Resultat | Indikator1 | Indikator2 | Indikator3 | ...
   -10   |     34,4   |     0,45   |     11,7   | ...
   -10   |     55,1   |     1,02   |      5,5   | ...
   +10   |     17,4   |    -0,15   |     11,7   | ...
...
Mein Problem besteht nun darin, dass ich Kombinationen von Indikatoren finden möchte, die mir Rückschlüsse auf das Resultat ermöglichen, da zuerst nur die Indikatoren bekannt sind.

Da ich mich leider erst seit kurzem mit der Materie und SPSS (bzw. in meinem Fall PSPP ;-) ) beschäftige, bin ich mir nicht sicher, wie man den Datensatz dahingehend auswerten kann. Meine Vermutung wäre, mit einer multivariablen Faktoranalyse. Ich habe auch schon verschiedenes zur Faktoranalyse gelesen, allerdings bin ich mir absolut nicht sicher ob es damit geht, und vor allem, wie die Ergebnisse der Faktoranalyse interpretiert werden müssen.

Ich hoffe ich Frage damit nicht zu viel und bin über jede Hilfestellung dakbar!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Du hast doch eine kausale Richtung in der Hypothese: Indikatoren 1 bis n bestimmen das Resultat.

Hier kommen eigentlich Regressionsverfahren zum Einsatz. Welche dann genau, hängt von den Daten ab.

Gruß
drfg2008
eagle
Beiträge: 7
Registriert: 01.08.2011, 15:06

Beitrag von eagle »

Vielen Dank erstmal für die schnelle Antwort.
Ich werde mal versuchen mich etwas über Regressionsanalyse schlau zu machen.

Eine Frage hätte ich aber noch zur Regressionsanalyse:
Das Resultat hat immer nur die Werte 10 oder -10. Die Indikatoren können aber alle Werte annehmen. Ist es dann trotzdem möglich per Regressionsanalyse eine Kombination an Indikatoren zu finden (sofern es überhaupt eine Kombination gibt), die mit möglichst hoher Wahrscheinlichkeit vorhersagt, welchen Wert das Resultat bekommen wird.

Vielen Dank im Vorraus.
Gerne kann ich auch den kompletten Datensatz bereitstellen, wenn das hilfreich ist.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

das ist gleich ein ganz kompliziertes Projekt:
eine Kombination an Indikatoren zu finden (sofern es überhaupt eine Kombination gibt), die mit möglichst hoher Wahrscheinlichkeit vorhersagt, welchen Wert das Resultat bekommen wird.
Bist du sicher, dass du eine Kombination willst?

Falls ja, dann wäre schon eine Faktorenanalyse der Indikatoren notwendig (orthogonale Rotation - Varimax oder Equamax) sowie Bildung von Faktorregressionswerten. Und dann müsste man sich überlegen, welche Regression in Frage kommt. Eventuell eine logistische Regression ggf. (binär logistisches Modell).

Gruß
drfg2008
eagle
Beiträge: 7
Registriert: 01.08.2011, 15:06

Beitrag von eagle »

Jein. Ziel ist es mit möglichst hoher Wahrscheinlichkeit vorherzusagen, ob das Ergebnis 10 oder -10 wird.

Das Problem ist, dass ich nicht weis, welcher der Indikatoren tatsächlich Einfluss auf das Ergebnis hat. Zudem kann es möglich sein, dass eventuell keiner der Indikatoren alleine eine Vorhersagekraft besitzt, sondern nur eine Kombination aus verschiedenen Indikatoren (oder allen).
eagle
Beiträge: 7
Registriert: 01.08.2011, 15:06

Beitrag von eagle »

Ich habe jetzt mal eine Faktoranalyse durchgeführt und dann eine logistische Regression.
Allerdings habe ich ein Problem beim Interpretieren der Ergebnisse aus der logistischen Regression, vor allem der Klassifizierungstabelle.

Die Klassifizierungstabelle gibt folgendes aus:

Code: Alles auswählen

Klassifizierungstabelle(a)
|---------|---------------------|------------------------------------------|
|         |Beobachtet           |Vorhergesagt                              |
|                           |---|----------------|-------------------------|
|                               |Ergebnis        |Prozentsatz der Richtigen|
|                           |   |------------|---|                         |
|                               |-10         |10 |                         |
|---------|-----------------|---|------------|---|-------------------------|
|Schritt 1|Ergebnis         |-10|624         |254|71,1                     |
|         |                 |---|------------|---|-------------------------|
|         |                 |10 |508         |305|37,5                     |
|         |-----------------|---|------------|---|-------------------------|
|         |Gesamtprozentsatz    |            |   |54,9                     |
|---------|---------------------|------------|---|-------------------------|
a. Der Trennwert lautet ,500
Der Gesamtprozentsatz mit 54,9% ist nicht besonders gut, das ist klar (da in dem Datensatz 10 und -10 fast gleich oft vorkommen) .
Mich interresiert vor allem, was die beiden anderen Werte bei "Prozentsatz der Richtigen" bedeuten.

Bedeutet es, dass das Modell das Ergebnis von -10 mit 71,1% Genaugigkeit vorhergesagt hat, und das Ergebnis von 10 mit 37,5% Genauigkeit?

Wenn ja, könnte man das Modell doch prinzipiell dazu nutzen, jeweils nur das Ergebnis von -10 vorhersagen zu lassen.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Bedeutet es, dass das Modell das Ergebnis von -10 mit 71,1% Genaugigkeit vorhergesagt hat, und das Ergebnis von 10 mit 37,5% Genauigkeit?

Der Begriff 'Genauigkeit' existiert in diesem Zusammenhang nicht. Die Vier-Feldertafel gliedert sich in

RP richtig positiv
FP falsch positiv
RN richtig negativ
FN falsch negativ

http://de.wikipedia.org/wiki/Beurteilun ... sifikators

Gruß
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten