Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Hallo zusammen,
ich bin neu hier und hoffe geholfen zu werden und manchmal auch selbst zu helfen.
Frage: Ich habe Fälle (Produkte) mit Variablen (Produkteigenschaften). Die Werte liegen in einem Wertebereich, zB. Preis 3,50 bis 480Euro, oder Leistung 400Watt bis 550Watt usw.
D.h. eine Variable hat womöglich zwei ausprägungen (oberer und unterer Bereich).
Wie gehe ich damit in einer Clusteranalyse um, wenn ich die Fälle (Produkte) anhand der Variablen und Wertebereiche Clustern möchte?
Es gibt ein Beispiel bei Bühl / Zoefel (SPSS Einführung) mit der Clusterung von Biersorten (Alkoholgehalt und Kosten).
Sollte man sich an diesem Beispiel orientieren, dann würde -bei Gleichwertigkeit der Variablen- jede Variable z-transformiert (entsprechende Transformation anklicken) und dann geclustert.
Danke, Ich habe mir das Buch besorgt aber bin nicht wirklich schlauer geworden!
Kurze präzisierung meiner Frage.
Ich habe Variablen die nicht durch einen Wert sondern durch zwei Werte beschrieben werden z.B. Variable "Leistung": 300 Watt bis 500 Watt, d.h. eine Bandbreite (da die Werte nicht genau ermittelt werden können)
Jetzt zur Frage:
Wie kann ich die Werte in einer Clusteranalyse verwenden? Ich habe den Tipp bekommen mit intervallen (gleiche Abstände) und danach weiter mit Klassen zu arbeiten.
Das Problem dass ich dann habe ich folgendes: wenn ich die intervalle zu groß wähle, dann kann man die klassen nicht mehr auseinanderhalten, d.h. z.B. Klassenbreite für o.g. beispiel von 200Watt bis 500Watt, und wenn ich die Intervalle zu eng wähle, zu.B. 200-300 und 400-500 dann ist die wird meine Variable zwei Klassen weit sein, das macht also auch keinen Sinn.