Hallo Forum,
ich führe eine Clusteranalyse durch und habe als Ergebnis z.B. 3 Cluster identifiziert und auch die validität ist gegeben.
Frage1:
Kann ich irgendwie für die identifizierten Cluster nun homogenitätswerte/Ähnlichkeitswerte herauslesen? Welches Maß und wie funktioniert es in SPSS?
z.B. Clusterhomogenitätswert für Cl1 ist XY und Clusterhomogenitätswert für Cl2 ist ZX ?
Frage2:
Ich möchte die Clusterhomogenitätswerte je Cluster Vergleichen mit Ausgangsdaten (Gruppierung von 10-15 Fällen sogenannte Szenarien) d.h. ich möchte für einen Teil der Daten z.B. Fall A1 (15 Fälle) und der dazugehörigen Ausprägungen der Variablen auch diese Homogenitätsaussage treffen.
Hoffe ich konnte mein Problem rüberbringen.
Und danke vorab für jeden Hinweis.
VG Smoki5530
Clusteranalyse:"Ähnlichkeitswerte/Homogenitätswerte&quo
-
smoki530
- Beiträge: 12
- Registriert: 21.03.2012, 15:43
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
das ist zu allgemein gefragt, denn es gibt viele verschiedene Cluster Methoden, die auch unterschiedlich verwendet werden können. SPSS hat hier eine sehr große Bandbreite von Möglichkeiten.
Sollten die Variablen metrisches Skalenniveau aufweisen, wäre als Beispiel die K-Means Clusterung denkbar (Statistiken dann über die ANONVA, Pseudo R, etc.).
Literatur evtl. nachschauen bei Backhaus oder Andy Field, ggf. Bühl.
Sollten die Variablen metrisches Skalenniveau aufweisen, wäre als Beispiel die K-Means Clusterung denkbar (Statistiken dann über die ANONVA, Pseudo R, etc.).
Literatur evtl. nachschauen bei Backhaus oder Andy Field, ggf. Bühl.
drfg2008
-
smoki530
- Beiträge: 12
- Registriert: 21.03.2012, 15:43
Bessere Fragestellung...
Hallo drfg2008 und alle anderen 
danke für die Antwort.
Ich denke die Formulierung meiner Frage war nicht glücklich.
Ich versuche es erneut.
Ausgansdaten sind 15 Produkte mit je 10 Szenarien, d.h. 10 verschiedene Fälle pro Produkt und den entsprechenden Ausprägungen der Variablen (7Variablen pro Fall)
Im ersten Schritt füre ich eine Clusteranalyse für (n=150) durch mit der quadrierten euklidischen Distanz, alles gut und schön. Ich finde die Cluster (n=3).
Im Anschluss möchte ich mit den Ergebnissen einen Vergleich der "homogenität" anstellen. d.h. ich möchte sehen, welche der Szenarien entsprechend der Ähnlichkeiten geclustert wurden (d.h. hier löse ich den Bezug zum Produkt auf) und Bilde Clusterlösungen... (bis hierher habe ich es durchgeführt) kein Problem
Als Vergleichsmaß für die Ähnlichkeit
-der Fälle in den Clustern,
-und der Ähnlichkeit der Ausgangsdaten d.h. 10Fälle pro Produkt (die habe ich gekennzeichnet, d.h. ich weiß welcher Fall zu welchem Ausgangsprodukt gehört).
möchte ich einen Homogenitäts/Ähnlichkeitswert vergleichen.
Mit der Standardabweichung habe ich es versucht, aber ich bin mir sicher dass es einen besseren Wert dafür gibt...
Meine Frage nun, welches "homogenitätsmaß" nehme ich nun für die Interpretation der Ähnlichkeit innerhalb der Cluster (Cluster 1 bis 3) und der Ausgangsdaten Produkte 1-15.
Wenn ich mir das Dendrogramm anschaue, könnte ich für die gewählte Clusterlösung den auf 25 normierten Wert verwenden, jedoch ist dann das Problem dass ich für die Ausgangsdaten nur "null" stehen habe.
Ich hoffe jetzt habe ich die Frage verständlich gestellt.
Thanxalot
VG
danke für die Antwort.
Ich denke die Formulierung meiner Frage war nicht glücklich.
Ich versuche es erneut.
Ausgansdaten sind 15 Produkte mit je 10 Szenarien, d.h. 10 verschiedene Fälle pro Produkt und den entsprechenden Ausprägungen der Variablen (7Variablen pro Fall)
Im ersten Schritt füre ich eine Clusteranalyse für (n=150) durch mit der quadrierten euklidischen Distanz, alles gut und schön. Ich finde die Cluster (n=3).
Im Anschluss möchte ich mit den Ergebnissen einen Vergleich der "homogenität" anstellen. d.h. ich möchte sehen, welche der Szenarien entsprechend der Ähnlichkeiten geclustert wurden (d.h. hier löse ich den Bezug zum Produkt auf) und Bilde Clusterlösungen... (bis hierher habe ich es durchgeführt) kein Problem
Als Vergleichsmaß für die Ähnlichkeit
-der Fälle in den Clustern,
-und der Ähnlichkeit der Ausgangsdaten d.h. 10Fälle pro Produkt (die habe ich gekennzeichnet, d.h. ich weiß welcher Fall zu welchem Ausgangsprodukt gehört).
möchte ich einen Homogenitäts/Ähnlichkeitswert vergleichen.
Mit der Standardabweichung habe ich es versucht, aber ich bin mir sicher dass es einen besseren Wert dafür gibt...
Meine Frage nun, welches "homogenitätsmaß" nehme ich nun für die Interpretation der Ähnlichkeit innerhalb der Cluster (Cluster 1 bis 3) und der Ausgangsdaten Produkte 1-15.
Wenn ich mir das Dendrogramm anschaue, könnte ich für die gewählte Clusterlösung den auf 25 normierten Wert verwenden, jedoch ist dann das Problem dass ich für die Ausgangsdaten nur "null" stehen habe.
Ich hoffe jetzt habe ich die Frage verständlich gestellt.
Thanxalot
VG



