Clusteranalyse:"Ähnlichkeitswerte/Homogenitätswerte&quo

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
smoki530
Beiträge: 12
Registriert: 21.03.2012, 15:43

Clusteranalyse:"Ähnlichkeitswerte/Homogenitätswerte&quo

Beitrag von smoki530 »

Hallo Forum,
ich führe eine Clusteranalyse durch und habe als Ergebnis z.B. 3 Cluster identifiziert und auch die validität ist gegeben.

Frage1:
Kann ich irgendwie für die identifizierten Cluster nun homogenitätswerte/Ähnlichkeitswerte herauslesen? Welches Maß und wie funktioniert es in SPSS?

z.B. Clusterhomogenitätswert für Cl1 ist XY und Clusterhomogenitätswert für Cl2 ist ZX ?

Frage2:
Ich möchte die Clusterhomogenitätswerte je Cluster Vergleichen mit Ausgangsdaten (Gruppierung von 10-15 Fällen sogenannte Szenarien) d.h. ich möchte für einen Teil der Daten z.B. Fall A1 (15 Fälle) und der dazugehörigen Ausprägungen der Variablen auch diese Homogenitätsaussage treffen.

Hoffe ich konnte mein Problem rüberbringen.
Und danke vorab für jeden Hinweis.

VG Smoki5530
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

das ist zu allgemein gefragt, denn es gibt viele verschiedene Cluster Methoden, die auch unterschiedlich verwendet werden können. SPSS hat hier eine sehr große Bandbreite von Möglichkeiten.

Sollten die Variablen metrisches Skalenniveau aufweisen, wäre als Beispiel die K-Means Clusterung denkbar (Statistiken dann über die ANONVA, Pseudo R, etc.).

Literatur evtl. nachschauen bei Backhaus oder Andy Field, ggf. Bühl.
drfg2008
smoki530
Beiträge: 12
Registriert: 21.03.2012, 15:43

Bessere Fragestellung...

Beitrag von smoki530 »

Hallo drfg2008 und alle anderen :)

danke für die Antwort.

Ich denke die Formulierung meiner Frage war nicht glücklich.
Ich versuche es erneut.
Ausgansdaten sind 15 Produkte mit je 10 Szenarien, d.h. 10 verschiedene Fälle pro Produkt und den entsprechenden Ausprägungen der Variablen (7Variablen pro Fall)

Im ersten Schritt füre ich eine Clusteranalyse für (n=150) durch mit der quadrierten euklidischen Distanz, alles gut und schön. Ich finde die Cluster (n=3).

Im Anschluss möchte ich mit den Ergebnissen einen Vergleich der "homogenität" anstellen. d.h. ich möchte sehen, welche der Szenarien entsprechend der Ähnlichkeiten geclustert wurden (d.h. hier löse ich den Bezug zum Produkt auf) und Bilde Clusterlösungen... (bis hierher habe ich es durchgeführt) kein Problem

Als Vergleichsmaß für die Ähnlichkeit
-der Fälle in den Clustern,
-und der Ähnlichkeit der Ausgangsdaten d.h. 10Fälle pro Produkt (die habe ich gekennzeichnet, d.h. ich weiß welcher Fall zu welchem Ausgangsprodukt gehört).
möchte ich einen Homogenitäts/Ähnlichkeitswert vergleichen.
Mit der Standardabweichung habe ich es versucht, aber ich bin mir sicher dass es einen besseren Wert dafür gibt...

Meine Frage nun, welches "homogenitätsmaß" nehme ich nun für die Interpretation der Ähnlichkeit innerhalb der Cluster (Cluster 1 bis 3) und der Ausgangsdaten Produkte 1-15.

Wenn ich mir das Dendrogramm anschaue, könnte ich für die gewählte Clusterlösung den auf 25 normierten Wert verwenden, jedoch ist dann das Problem dass ich für die Ausgangsdaten nur "null" stehen habe.

Ich hoffe jetzt habe ich die Frage verständlich gestellt.

Thanxalot
VG
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten