Faktorenanalyse - Clusteranalyse

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
lele
Beiträge: 5
Registriert: 27.10.2011, 14:04

Faktorenanalyse - Clusteranalyse

Beitrag von lele »

Liebe Leute des SPSS Forums,

ich habe die Beiträge zu Faktoren- und Clusteranalyse gelesen, allerdings habe ich keine Antwort uaf meine Fragen gefunden.
Ich habe mehrere Items zu Studienkonflikten. Diese habe ich einer Faktorenanalyse unterzogen. Die Ergebnisse leißen sich gut interpretieren. Die Werte der Faktorenanalyse habe ich als Extra-Variablen abgespeichert. So weit so gut.
Nun habe ich mit den Faktoren eine Clusterzentrenanalyse durchgeführt. Die Clusterzahl habe ich vorher durch eine hierarchische Clusteranalyse bestimmt, die eine Clusterzahl von sechs ergab. Diese Cluster versuche ich nun mittels standardisierter Residuen und der beobachteten und erwarteten Häufigkeiten mit den dichotom ausgeprägten Variablen (bspw. Geschlecht) ins Verhältnis zu setzen. Andere Variablen versuche ich mit der ANOVA und dem Post Hoc Duncan Test auf Zusammenhänge zu überprüfen. Ziel ist es die gebildeten Cluster auf statistische Zusammenhänge mit anderen Variablen zu testen. Ich bekomme auch interpretierbare Ergebnisse. Die Frage 1 ist dennoch: Ist das ein sinnvolles Vorgehen?
Frage 2: Bietet es sich an, die Faktoren zur Berechnung der Cluster zu nehmen oder ist es sinnvoller die ursprünglichen Items heranzuziehen? Hintergrund der Frage ist, dass sich zum Teil erhebliche Unterschiede ergeben, wenn die jeweils unterschiedlich gebildeten Cluster wie oben beschrieben mit anderen Variablen auf statistische Zusammenhänge untersucht werden. Das verwundert zwar nicht, aber es stellt sich die Frage, was denn das sinnvollere Vorgehen ist - Cluster aus Faktoren oder Cluster aus Items?

Ich hoffe das war verständlich. Wenn nicht, gerne nachfragen. Besten Dank schonmal fürs antworten.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Das verwundert zwar nicht, aber es stellt sich die Frage, was denn das sinnvollere Vorgehen ist - Cluster aus Faktoren oder Cluster aus Items?
Das ist dir überlassen, da dein Vorgehen ohnehin eher als heuristisch zu bezeichnen wäre.

Die Berechnung einer Faktorenanalyse vor der eigentlichen Clusterung hat den Vorteil, dass nicht jedes Item gleichwertig in die Analyse eingeht (bei z-Standardisierung der Items), sondern nur mit seiner Ladung auf den jeweiligen Faktor. Faktorregressionswerte sind für die Clusterung eigentlich recht gut geeignet. Vom Prinzip her wäre also die Berechnung von Faktorregressionswerten (orthogonale R.) und dann die Clusterung ein sinnvolles Vorgehen, das Redundanzen vermeidet.

Allerdings hängt die Beurteilung von der Fragestellung ab.
drfg2008
lele
Beiträge: 5
Registriert: 27.10.2011, 14:04

Anschlussfrage

Beitrag von lele »

Vielen Dank für die Antwort.
Die Z-transformierten Werte sind für mich nur schwer zu interpretieren und sie legen meines Erachtens und aus meiner Kenntnis des Datensatzes (den Häufigkeiten und der Signifikanztests) Schwerpunkte, die für mich nicht nachvollziehbar sind. So nimmt ein Faktor, der aus drei Variablen bestehet, die aber, den Häufigkeiten nach, nur ganz geringe Werte besitzen, plötzlich bei einem Cluster sehr hohe Werte an. Bei der Lösung mit den Variablen weisen diese drei Variablen hingegen keine besonders hohen Werte auf.
Ich würde aufgrund der Übersichtlichkeit gerne mit Faktoren weiter rechenen, misstraue jedoch, u.a. aufgrund des eben genannten Beispiels ,dem weiterrechnen mit den transformierten Werten.
Daher habe ich Faktoren als Summenscores berechnet. Die Faktoren mit den z-transformierten Werten und die Faktoren, die aus den Summenscores gebildet wurden habe ich miteienader korreliert, um zu sehen, ob sie die gleiche Information abbilden, und es ergaben sich Korrelationskoeffizienten um 0,9.
Wenn ich mit den Werten der aufsummierten Faktoren weiterrechne, bekomme ich sehr gut zu interpretierende Ergebnisse.
Die Frage ist nun: Darf ich mit den aufsummierten Faktoren weiterrechnen oder nicht?

Ich fürchte ich habe ein wenig verschwurbelt geschrieben, hoffe aber dennoch, dass das ist einigermaßen verständlich ist.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten