Hallo,
ich möchte einen Datensatz (n Personen) clustern, der sowohl metrisch als auch binär skalierte Variablen enthält. Laut dem Lehrbuch von Backhaus et al. "Multivariate Analysemethoden" gibts die Möglichkeit, gemischt-skalierte Variablen durch eine "getrennte Berechnung von Ähnlichkeitskoeffizienten bzw. Distanzen" zu verarbeiten. Später könne man diese - in meinem Fall zwei - Matrizen miteinander verrechnen.
Ich habe also manuell zwei Matrizen erstellt: Eine Distanzmatrix (n x n), die nur auf den metrischen Variablen basiert und eine Distanzmatrix (n x n), die nur auf den Binärvariablen basiert. Danach habe ich eine Gesamt-Distanzmatrix (n x n) erstellt, deren Einträge den plausibel gewichteten Mittelwerten der beiden vorher erstellten Matrizen entsprechen.
Nun möchte ich diese Gesamtdistanzmatrix (liegt als .sav und als .tmp vor) manuell einlesen und einer Clusteranalyse unterziehen. Ich habs mit folgendem CODE versucht:
CLUSTER
/MATRIX IN ('C:\Users\Flo\Desktop\quellenb.arbeit\evaluationsAKtuell\Clusteranalyse-Datenbasis\tmpSymbiose.tmp')
/METHOD SINGLE
/PRINT SCHEDULE
/PRINT DISTANCE
/PLOT DENDROGRAM VICICLE.
EXECUTE.
Es kam die Warnung: "CLUSTER stellte zu wenig vollständige und eindeutige Eingabezeilen und/oder Eingabespalten fest. CLUSTER benötigt mindestens eine 3x3-Distanzmatrix, um die Analyse zu vervollständigen. CLUSTER fährt fort und bearbeitet alle restlichen, aufgeteilten Dateien."
Kennt jemand eine Möglichkeit, wie ich diese Gesamtdistanzmatrix einer Clusteranalyse unterziehen kann?
Viele Grüße,
Florian
Clusteranalyse metrische/binäre Variablen
-
- Beiträge: 1
- Registriert: 04.09.2012, 10:16