Korrespondenzanalyse + Clusteranalyse

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Korrespondenzanalyse + Clusteranalyse

Beitrag von Konkordanz »

Hallo,

ich habe einen Datensatz mit 38 politischen Aussagen, 14 Parteien und zu diesen jeweils eine Aussage "Ablehnung" (Code 0), "neutral" (1) ODER Zustimmung (3). Mein Ziel ist es nun, die Gemeinsamkeiten zwischen den Parteien herauszufinden. Hierfür nutze ich als erstes die Clusteranalyse und stelle im Dendrogramm fest, dass Partei 4 und 1 sehr spät vereinigt werden. Das deutet für mich darauf hin, dass sich fast alle anderen Parteien näher sind als diese beiden es zueinander sind und beispielsweise Partei 9 und 13 (die ja eine Stufe eher verbunden worden sind) eine größere Ähnlichkeit aufweisen. Hier befindet sich das Dendrogramm: http://www.bilder-upload.eu/show.php?fi ... 413315.jpg

Um sich ein weiteres optisches Bild von diesem Sachverhalt zu verschaffen nutze ich die Korrespondenzanalyse und erstelle ein Biplot, in welchem die Parteien sowie die 38 politischen Statements in unterschiedlichen Distanzen dargestellt werden. Hier befindet sich diese Grafik: http://www.bilder-upload.eu/show.php?fi ... 412925.jpg

Bei der Interpretation des Biplots fällt jedoch auf: Partei 1 und 4 stehen hier wesentlich näher beieinander als Partei 9 und 13; also spuckt mir der Biplot eine andere Distanz aus. Weiß jemand, woran das liegt? Oder interpretiere ich hier falsch?
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von dutchie »

Hallo

Du hast eine andere Methode und bekommst eine anderes Ergebniss.
Mich überraschen eher die Übereinstimmungen.

Bei cluster, wie hast du die Distanz berechnet bei codierung 0--1--3 (?????)

wie hast du daraus Häufigkeiten gemacht?

gruß
dutchie
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von Konkordanz »

Naja, aber grundsätzlich haben beide doch die selbe Funktion (grafische Darstellung der Ähnlichkeiten), oder?
Für die Clusteranalyse habe ich gar nichts gerechnet; habe sie einfach im SPSS durchlaufen lassen.

Ich habe aber noch etwas gegoogelt und herausgefunden, dass man kategoriale Variablen in einer Clusteranalyse dichotomisieren sollte. Gehst du da mit? Jedenfalls habe ich das gemacht. Entsprechend habe ich 14x38x3 Zellen bzw. Daten (14 Parteien, 38 Themengebiete, 3 Dummyvariablen [Ablehnung, Zustimmung, neutral]). Lasse ich mit diesen Daten ein neues Dendrogramm ausspucken erhalte ich folgendes:http://www.bilder-upload.eu/show.php?fi ... 557209.jpg

Hier wirkt das ganze schon wesentlich stimmiger mit der Korrespondenzanalyse.

Würdest du sagen, dass das Vorgehen so passt?
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von dutchie »

Hallo mein Lieber... schöner beitrag 8)
Konkordanz hat geschrieben:Für die Clusteranalyse habe ich gar nichts gerechnet; habe sie einfach im SPSS durchlaufen lassen.
:( Ach, du musst doch Einstellungen vornehmen, oder schauen was default ist...du musst die Cluster Methode wählen,
die Voreingestellt ist nicht gut...


Kategoriale Variablen muss man, zu Dummies wandeln, sonst kannst du keine Abstände rechnen.
Man würde nicht sagen dichotomisieren, weil sonst entsteht der Eindruck du wandelst das in nur eine Variable mit
zwei Ausprägungen um.
Wenn du 3 kategorien hast brauchst du zwei Dummies!!!
a-->1 0
b-->0 1
c-->0 0
Mach mal lineare Regression mit dritter Dummy AV und die anderen beiden UV...

Ablehnung, Zustimmung, neutral, ist aber mindestens ordinal...wenn nicht sogar intervall

Du hast Clusteranlyse mit 114 dichotomen Variblen, was hast du da für ein Distanzmaß genommen, das gibts doch viel Auswahl.

Du kannst auch noch Diskriminanzanalyse, MDS, und Faktorenanalyse machen, dann hast du fünf Lösungen.
Mach mal FA mit zwei Faktoren speicher die Faktorwerte für die Parteien und plotte dies (Streudiagramm).
Konkordanz hat geschrieben:Hier wirkt das ganze schon wesentlich stimmiger mit der Korrespondenzanalyse.
Was sagt dir, dass die Korrespndenzanalyse richtiger, besser ist, (wohl wegen dem schönen Bild,
deshalb ist das im Marketing auch angesagt :lol: )

Aber wenn ich mir die Verteilung der Fragen in der Ebene anschaue, denk ich mir das die doch auch klumpen müssten?
Machen denn die Parteicluster Sinn?
Konkordanz hat geschrieben:Würdest du sagen, dass das Vorgehen so passt?
Na ja, weiß nicht was du überhaupt ausrechnen willst, Abstände zwischen Parteien, Abstände zwischen Inhalten?
Man kann auch mit einer Säge einen Nagel in die Wand hauen.

gruß
dutchie
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von Konkordanz »

Huhu,

der Grund, weshalb ich keine Einstellungen vorgenommen habe, war einfach: Die Clusteranalyse hat unübersichtlich viele Einstellungsmöglichkeiten und ich kenne mich nicht gut damit aus. Deshalb wollte ich es einfach so mal probieren und schauen, was das Resultat ist :D Aber ich bin natürlich daran interessiert, dass geeignete Verfahren zu nutzen...
dutchie hat geschrieben:du musst die Cluster Methode wählen, die Voreingestellt ist nicht gut...
Die "Cluster-Methode"? Was genau meinst du? Unter dem Punkt "Cluster-Methode" sind 7 verschiedene aufgelistet (zB "Linkage zwischen den Gruppen" etc.). Welche davon würdest du empfehlen und wieso?
dutchie hat geschrieben: Kategoriale Variablen muss man, zu Dummies wandeln, sonst kannst du keine Abstände rechnen.
Man würde nicht sagen dichotomisieren, weil sonst entsteht der Eindruck du wandelst das in nur eine Variable mit
zwei Ausprägungen um. Wenn du 3 kategorien hast brauchst du zwei Dummies!!!
Ja, davon habe ich gelesen, verstehe aber das dahinterliegende Prinzip nicht. Bei der Dummy-Codierung bin ich wie folgt vorgegangen: Ich habe von jeder einzelnen politischen Aussage 3 Dummy-Variablen gemacht: Ablehnung Ja/nein, Neutral Ja/nein, Zustimmung ja/nein. Somit habe ich 38x3 Variablen und das für alle 14 Parteien. Wenn ich nun eine Clusteranalyse mit den Dummyvariablen für "Ablehnung" und "Zustimmung" durchführe (also k-1), dann kommt ein anderes Ergebnis heraus als wenn ich entscheide, die Dummyvariable "Ablehnung" und "neutral" aufzunehmen. Wenn das also so einen Unterschied ergibt, woher soll ich (und erst recht SPSS) dann wissen, welche Variablen relevant sind? Aufgrund dessen hatte ich mich dazu entschieden, alle Variablen in die Clusteranalyse aufzunehmen.
dutchie hat geschrieben:Mach mal lineare Regression mit dritter Dummy AV und die anderen beiden UV...
Wie soll ich eine lineare Regression mit "dritter Dummy AV" durchführen, wenn ich doch so viele Dummyvariablen habe und ich im SPSS lediglich eine einzige AV auswählen darf? Oder meinst du, ich soll einfach irgendeine nehmen? Und: Was ist der Mehrwert einer linearen Regression bei meiner Fragestellung? Also, warum deine Empfehlung einer linearen Regression?
dutchie hat geschrieben:Mach mal FA mit zwei Faktoren speicher die Faktorwerte für die Parteien und plotte dies (Streudiagramm).
In einer Faktorenanalyse haben sich die Fragestellungen in eher konservative und eher linke Themenbereiche gegliedert.
Du meinst, ich soll eine Faktorenanalyse mit allen politischen Fragestellungen durchführen, die Werte in neuer Variable speichern und diese in einem Streudiagramm durchführen? Ist das richtig?
dutchie hat geschrieben:Machen denn die Parteicluster Sinn?
Ja, so, wie sie in den geposteten Grafiken stehen, ergeben sie interpretativ tatsächlich Sinn. Aber variiert das Ergebnis eben leicht, je nach dem, ob ich ALLE Dummyvariablen aufnehme, nur k-1 und dann variieren sie eben auch, je nach dem für welche beiden ich mich entscheide...ich tendiere daher dazu, alle Dummys weiterhin aufzunehmen.
dutchie hat geschrieben:Na ja, weiß nicht was du überhaupt ausrechnen willst, Abstände zwischen Parteien, Abstände zwischen Inhalten?
Ziel meiner Analyse sollen die Abstände bzw. Ähnlichen zwischen den Parteien sein.

:)
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von dutchie »

hallo hallo

du hast doch ursprünglich:

zustimmung 100
ablehnung 010
neutral 001

mit den drei Dummies, wie oben dargestellt, dann ist doch der Unterschied zwischen zustimmung und
ablehnung genauso groß, wie der Unterschied zwischen neutral und Zustimmung, ist das logisch?

zustimmung 10
ablehnung 01
neutral 00

Wenn du das so machst ist der Unterschied zwischen Zustimm. und Ablehnung =2
und beide Unterschiede der Extremen zu neutral =1

Bei intervallniveau ist die beste Methode "WARD"
Mach die Regression mit den drei Dummies für ein Item!
Du speicherst die Faktorwerte ab, stellst aber auf nur zwei Faktoren ein.
Konservativ und links ist doch nur ein Faktor, die extreme einer Dimension?

gruß
dutchie
Konkordanz
Beiträge: 81
Registriert: 25.03.2018, 17:56

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von Konkordanz »

Hallo Dutchie,

ja, rein logisch müssten die Abstände zwischen den Dummies die selben sein und entsprechend müssten die Ergebnisse gleich sein. Das sind sie aber eben nicht. Wenn ich die Clusteranalyse (Ward-Methode) mit den 38 Variablen Zustimmung Ja/Nein und den 38 Variablen Neutral Ja/Nein, erhalte ich ein anderes Ergebnis als in dem Fall der der Variablen für neutral Ja/Nein und Ablehnung Ja/Nein.
Welches Vorgehen ist nun also richtig? Das Ward-Verfahren mit allen Dummies? Oder nur mit einem Teil der Dummyvariablen? Oder nehme ich doch einfach die Ausgangsdaten ohne Dummycodierung?
dutchie
Beiträge: 2640
Registriert: 01.02.2018, 10:45

Re: Korrespondenzanalyse + Clusteranalyse

Beitrag von dutchie »

Hallo
glaubst du, ich weiß nach zwei wochen noch worum es bei der sache ging?

und glaubst du ich fang jetzt nochmal von vorne das lesen an?

gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten