Hallo zusammen,
ich beschäftige mich im Rahmen meines Studiums neu mit der Clusteranalyse. Ich hätte eine paar Fragen und hoffe es kann mir jemand weiterhelfen. Ich bedanke mich dafür. Meine Fragen:
- Die Daten für die Clusteranalyse haben unterschiedliche Maße. Müssen die Kriterien auf das selbe Maß gebracht werden? Zum Bespiel geht es einmal um Anzahl Zeilen Code, aber dann auch um Ja/Nein Kriterien. Außerdem kann es auch möglich sein, dass z.B. bei einer Sicherheitsstufe eine Abstunfung von 1 bis 6 gibt. Wie muss man hier vorgehen?
- Wenn man für die Clusteranalyse nur metrische Merkmale hat, aber diese unterschiedlich hoch sind z.B. einmal von 1 bis 1000 und ein anderes Markmal aber 1 bis 1.000.000. Wie wie weiter beeinflusst das die Clusteranalye?
- Wenn es wirklich Merkmale gibt, die man höher gewichten möchte als andere Merkmale, reicht es dann einfach den Wertebereich zu erhöhen?
Vielen Dank für die Antworten.
Bitte um Hilfe bei Clusteranalyse - Allgemeine Fragen
-
- Beiträge: 2
- Registriert: 10.04.2011, 19:05
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
z-Transformation der Variable und anschließend entsprechend gewichten- Wenn es wirklich Merkmale gibt, die man höher gewichten möchte als andere Merkmale, reicht es dann einfach den Wertebereich zu erhöhen?
(Variable-Mittelwert)/Standardabweichung
Dialog: Transformieren, Variable berechnen
automatische z-Transformation: "standardisierte Variablen als Variable speichern".
Dialog: deskriptive Statistik
drfg2008