Hallo zusammen!
Ich habe eine Vollerhebung mit etwas über 800 Unternehmen gemacht. Für jedes Unternehmen habe ich mehrere Merkmale erhoben, z.B. Rechtsform, Größe, Gesellschafterstruktur, Region, etc.
Hinzu kommt die Anzahl der Kooperationen, die die Unternehmen jeweils haben. Ziel soll es sein, herauszufinden ob es einen Zusammenhang gibt zwischen Unternehmenstyp und Kooperationsaktivität.
Ich denke über zwei Alternativen nach:
1) Clusteranalyse => verschiedene Gruppen von Unternehmen, jeweils mit unterschiedlichem Mittelwert der Kooperationszahl und dann beschreiben, welche Merkmale in welchen Clustern vorliegen. So in der Art: Cluster 1 beinhaltet ca. 90% der großen Unternehmen, alle AGs, eine Hälfte der westdeutschen Unternehmen; Cluster 2 eher kleinere und mittlere, ostdeutsche Unternehmen, die als GmbH organisiert sind, etc.
2) Regression => Anzahl Kooperationen als AV und Merkmale jeweils als UV; Ziel: Welche Variablen sind signifikant in Erklärungsbeitrag und in welche Richtung?
Probleme hierbei:
a) Korrelation zwischen mehr oder weniger allen UV (große Unternehmen sind nunmal fast alle eine AG; Unternehmen in öffentlich-rechtlicher Form können keinen zusätzlichen Gesellschafter haben, fast alle ostdeutschen Unternehmen in meiner Branche sind GmbHs, etc.
b) alle UV sind ordinal/nominal und AV variiert zwischen 0 und 15, wobei eine typische poissonähnliche Verteilung gegeben ist
c) viele multiple Ausreißer je nach Variablenbetrachtung
Daher meine Frage:
Welches Verfahren würdet Ihr grundsätzlich eher nehmen? Wenn Regression, welche Art von Regression und wie gehe ich mit der Multikollinerarität bei kategorialen Variablen sowie den Ausreißern um?
Wäre für eine Anregung dankbar!
Gruß,
J.
Clusteranalyse vs. Regression bei meinem Datensatz
-
- Beiträge: 4
- Registriert: 10.12.2008, 15:34