Clusteranalyse gemischt-skalierte Daten

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
beka
Beiträge: 2
Registriert: 23.07.2014, 16:18

Clusteranalyse gemischt-skalierte Daten

Beitrag von beka »

Hallo zusammen,

Im Rahmen meiner Masterarbeit möchte ich eine Clusteranalyse mit gemischt skalierten Variablen durchführen und frage mich, wie ich das am besten mache.
Ich habe folgende Variablen:
• Binär: Geschlecht (zwei Ausprägungen: 0 und 1)
• Nominal/ordinal: Kundenstatus (fünf Ausprägungen von 0 bis 4)
• Metrisch: Anteil emotionaler Wörter im Text (Zahl von 0-100)

Soweit ich weiß, gibt es folgende Möglichkeiten, unterschiedlich skalierte Variablen zu clustern:

1. Alle Variablen auf ein einheitliches Skalenniveau bringen, z.B. mittels Mediandichotomisierung. Problem hierbei: Informationsverluste
2. Ähnlichkeitskoeffizienten bzw. Distanzen für die verschiedenen Skalenniveaus getrennt berechnen und dann die Gesamtähnlichkeit als gewichteten Mittelwert bestimmen. Problem hierbei: Wie kann ich diese manuell erstellte Distanzmatrix in SPSS einlesen und für eine Clusteranalyse verwenden?
3. Two-Step-Clusteranalyse in SPSS für kategoriale und metrische Daten. Problem: SPSS gewichtet Unterschiede in kategorialen Variablen höher als Unterschiede in metrischen Variablen. Dadurch wird das Ergebnis verzerrt.

Da es bei allen drei Varianten Probleme gibt, frage ich mich, welches die beste Lösung ist und wie ich die jeweiligen Probleme umgehen kann.

Über eine schnelle Antwort würde ich mich sehr freuen!
Vielen Dank für eure Hilfe!
Beste Grüße,
beka
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten