Interpretation von Attributen auf Gesamtzufriedenheit

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Thomas1111
Beiträge: 3
Registriert: 28.01.2014, 16:05

Interpretation von Attributen auf Gesamtzufriedenheit

Beitrag von Thomas1111 »

Hallo,

ich möchte eine Kundenzufriedenheitsbefragung auswerten, bin im Bereich der Statistik eher ein Neuling und würde gerne von Euch Feedback bekommen.

Ich habe eine Kundenzufriedenheitsbefragung vorgenommen, bei der einerseits die Gesamtzufriedenheit sowie auch einige Attribute, die die Gesamtzufriedenheit beeinflussen, auf einer fünfstufigen Likert-Skala abgefragt wurden.

Mein Anliegen ist nun neben einer rein deskriptiven Beschreibung der Daten auch explorativ vorzugehen.
Dabei hatte ich in der Literatur ein interessantes Verfahren entdeckt, das versucht die Wichtigkeit der Attribute zu identifizieren, wenn die Gesamtzufriedenheit hoch bzw. wenn die Gesamtzufriedenheit niedrig ist.

Das erste Verfahren ist im Prinzip eine multiple lineare Regression und wird als Penalty-Reward-Contrast-Analysis bezeichnet. Die Attribute (fünfstufig skaliert) werden in Dummyvariablen zerlegt. Dabei entstehen für jedes Attribut 2 Dummyvariablen.
Beispiel:
Dummyvariable für positive Wahrnehmung wird codiert:
• Werte 4-5 -- > 1
• Werte 1-3 -- > 0
Dummyvariable für negative Wahrnehmung wird codiert:
• Werte 1-2 -- > 1
• Werte 3-5 -- > 0
Anschließend wird mit den Dummyvariablen eine multiple lineare Regression auf die Gesamtzufriedenheit durchgeführt. Die Regressoren sollen dann den Einfluss des Attributs auf die Gesamtzufriedenheit bei positiver und negativer Wahrnehmung darstellen.

Das Problem ist jetzt jedoch, dass die Regression nicht vernünftig ausgeführt werden kann, da leider für einige Dummy-Variablen die Varianzen 0 sind bzw. die Variablen aus mir unerklärlichen Gründen rausgeschmissen werden.

Da ich jedoch trotzdem irgendwie gerne eine Aussage über die Wichtigkeit der einzelnen Attribute in Bezug auf die Gesamtzufriedenheit machen möchte, habe ich es mit einer „einfachen“ multiplen linearen Regression versucht. D.h. die Attribute und die Gesamtzufriedenheit genommen und in SPSS mittels Regression ausgeben lassen. Das Problem ist jedoch, dass obwohl jedes der Attribute mit der Gesamtzufriedenheit korreliert ist (teils deutlich), einige Regressionskoeffizienten ein negatives Vorzeichen haben und damit für meinen Zweck nicht vernünftig interpretierbar sind. Mir geht es ja gerade den Einfluss der Attribute festzustellen und nicht die Gesamtzufriedenheit vorherzusagen.
Dieses Problem scheint mir auf das Problem der Multikollinearität zurückzuführen zu sein, da die Variablen teils deutlich untereinander korreliert sind.

Da ich jedoch gerne irgendwie Hypothesen bzw. Handlungsempfehlungen aus den Daten ableiten möchte, habe ich nun die einfache Korrelation zwischen Attribut und Gesamtzufriedenheit berechnet. Dies funktioniert auch gut, jedoch lasse ich dabei jegliche Korrelation der Attribute untereinander außer Acht!

Ich würde daher gerne von Euch wissen, ob dies eine „halbwegs“ vernünftige Herangehensweise an die explorative Datenanalyse ist bzw. was Ihr dabei als Probleme seht. Glaubt Ihr mit einer einfachen Korrelationen von Attributen und Gesamtzufriedenheit, bei der ich die Korrelationen der Attribute untereinander außer Acht lasse, erhalte ich trotzdem vernünftig interpretierbare Ergebnisse?
Vielleicht gibt es ja auch alternative Herangehensweisen.

Ich bin für jeden Hinweis dankbar. In meiner Arbeit würde ich nämlich ungern falsche bzw. unsinnige Interpretationen vornehmen. Davon gibt’s ja bereits genügend im Internet.

Vielen Dank
Thomas
Jonny
Beiträge: 14
Registriert: 08.02.2014, 20:55

Beitrag von Jonny »

"Anschließend wird mit den Dummyvariablen eine multiple lineare Regression auf die Gesamtzufriedenheit durchgeführt. Die Regressoren sollen dann den Einfluss des Attributs auf die Gesamtzufriedenheit bei positiver und negativer Wahrnehmung darstellen.

Das Problem ist jetzt jedoch, dass die Regression nicht vernünftig ausgeführt werden kann, da leider für einige Dummy-Variablen die Varianzen 0 sind bzw. die Variablen aus mir unerklärlichen Gründen rausgeschmissen werden"

Verstehe ich das richtig, dass du 2 Regressionen durchführen möchtest? Also beide Dummyvariablen als abhängige Variable?

Wenn du eine Dummyvariable als abhängige Variable hast, macht eine lineare Regression keinen Sinn. Versuchs mal mit einer Logitregression.

"Das Problem ist jedoch, dass obwohl jedes der Attribute mit der Gesamtzufriedenheit korreliert ist (teils deutlich), einige Regressionskoeffizienten ein negatives Vorzeichen haben und damit für meinen Zweck nicht vernünftig interpretierbar sind"

EIn negativer Koeffizient bedeutet lediglich, dass die Zufriedenheit sinkt, wenn sich die unabhängige Variable erhöht.
Thomas1111
Beiträge: 3
Registriert: 28.01.2014, 16:05

Beitrag von Thomas1111 »

Jallo Jonny,
vielen Dank erst einmal für die Antwort! Es stellen sich jedoch weiterhin die folgenden Fragen für mich.
Jonny hat geschrieben:"Anschließend wird mit den Dummyvariablen eine multiple lineare Regression auf die Gesamtzufriedenheit durchgeführt. Die Regressoren sollen dann den Einfluss des Attributs auf die Gesamtzufriedenheit bei positiver und negativer Wahrnehmung darstellen.

Das Problem ist jetzt jedoch, dass die Regression nicht vernünftig ausgeführt werden kann, da leider für einige Dummy-Variablen die Varianzen 0 sind bzw. die Variablen aus mir unerklärlichen Gründen rausgeschmissen werden"

Verstehe ich das richtig, dass du 2 Regressionen durchführen möchtest? Also beide Dummyvariablen als abhängige Variable?

Wenn du eine Dummyvariable als abhängige Variable hast, macht eine lineare Regression keinen Sinn. Versuchs mal mit einer Logitregression.
Ich glaube ich habe mich da nicht ganz klar ausgedrückt. Die abhängige Variable wird nicht dichotomisiert, sondern behält weiterhin die 5 möglichen Ausprägungen. Nur die Attribute (Prädiktoren) werden in Dummyvariablen zerlegt. Wenn ich vorher beispielsweise 8 Kriteriumsvariablen habe, dann habe ich nach der Zerlegung in Dummyvariablen 16 Kriteriumsvariablen. Aus jedem Attribut entstehen also 2 Dummyvariablen (eine für positive Wahrnehmung mit Werten 4-5 -- > 1 und 1-3 -- > 0 und eine für negative Wahrnehmung mit Werten 1-2 -- > 1 und 3-5 -- > 0). Der Wert 3 wird somit in beiden Variablen immer zu 0 kategorisiert, da dies eine Vergleichskategorie darstellt.
Bei 8 ursprünglichen unabhängigen Variablen wird also dann eine multiple lineare Regression mit 16 Dummyvariablen auf eine abhängige Variable (Gesamtzufriedenheit) durchgeführt.


Jonny hat geschrieben:"Das Problem ist jedoch, dass obwohl jedes der Attribute mit der Gesamtzufriedenheit korreliert ist (teils deutlich), einige Regressionskoeffizienten ein negatives Vorzeichen haben und damit für meinen Zweck nicht vernünftig interpretierbar sind"

EIn negativer Koeffizient bedeutet lediglich, dass die Zufriedenheit sinkt, wenn sich die unabhängige Variable erhöht.
Ich sehe gerade, dass ich nur von Korrelation geredet habe. Ich meinte eigentlich dass jedes der Attribute deutlich POSITIV mit der Gesamtzufriedenheit korreliert ist. So wie die Fragen gestellt worden sind, war dies auch zu erwarten (es ist anerkannt, dass die abgefragten Attribute alle keinen negativen Einfluss auf die Gesamtzufriedenheit haben können).
Basierend auf den teils sehr ähnlichen positiven Korrelationen der Attribute mit der Gesamtzufriedenheit und der Ergebnisse der multiplen linearen Regression (bei der einige Koeffizienten negativ sind), gehe ich nun von Multikollinearität aus.
Da ich jedoch bei Multikollinearität nicht sehr viel machen kann, außer vielleicht eine explorative Faktorenanalyse (versuche ich auch gerade durchzuführen), besteht weiterhin meine Frage, inwiefern die Interpretation von bivariaten Korrelationen der Attribute mit der Gesamtzufriedenheit sinnvoll ist.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten