Fixierte / zufälligen Effekten und dichotome Messgröße

Beitrag von **Brotzeithasser** » 21.04.2012, 14:16

Hallo,

ich schildere erstmal kurz das Problem:

Forschungsfrage: Hat die Anzahl an Patenten, die ein Unternehmen hält Einfluss auf die Wahrscheinlichkeit eines Investments von einem Private Equity Investor?

Die dichotome abhängige Variable Y beschreibt, ob ein Unternehmen einen Private Equity Investor besitzt.

Die erklärende Variable ist die Anzahl der Patente X, die das Unternehmen hält. Es soll überprüft werden, ob diese Anzahl einen Einfluss auf Y besitzt.

Daneben gibt es noch weitere erklärende Variablen, die einen Einfluss auf Y ausüben könnten und beobachtet werden können (z.B. Wachstumsrate der letzten 2 Jahre, Unternehmensalter, Branche).

Außerdem vermute ich, dass es nicht zu beobachtende Variablen gibt (z.B. Professionalität und Ausbildung des Managements, interne Organisation etc.), die sich sowohl auf die erklärte Variable Y, wie auch auf die Patentzahl X auswirkt.

Mein Vorgehen:

Ich suche Unternehmen mit PE-Investoren (Y=1), erhebe die Patentzahl und die übrigen erklärenden Variablen und zu diesen Unternehmen suche ich jeweils Vergleichsunternehmen ohne Investor (Y=0), die dem jeweiligen Unternehmen in Merkmalen wie Mitarbeiterzahl, Umsatz usw. ähneln.

Das heißt ich habe am Ende 100 Gruppen mit jeweils einem Unternehmen bei dem Y=1 ist und z.B. 9 Unternehmen bei denen Y=0 ist.

Diese Gruppen haben verschiedene Mittelwerte bezüglich X, da in manchen Branchen viel patentiert wird und große Unternehmen ebenfalls mehr Patente generieren als kleine.

Modell:

Ich bin auf gemischte lineare Modelle mit Fixierten bzw. zufälligen Effekten gestoßen, die für mein Problem plausibel erscheinen. Allerdings bin ich unsicher, ob diese auch bei dichotomer Messgröße anwendbar sind.

Haltet ihr diese Modelle für sinnvoll oder seht ihr andere, bessere Möglichkeiten?

danke schonmal für alle möglichen Ideen!

PS: Noch eine Analogie fürs Verständnis: Für Medizinische Anwendungen könnte meine Wsk. für ein PE-Investment mit einer bestimmten Krankheit gleichgesetzt werden.

D.h. man untersucht, ob die Anzahl gerauchter Zigaretten pro Tag (= Anzahl Patente) ein erhöhtes Diabetesrisiko (=Wsk. für PE-Invest.) besitzen und muss natürlich um andere Faktoren bereinigen, wie ob jmd. Vegetarier ist, Sport treibt und Übergewicht hat. Daneben kann es noch Faktoren geben, die nicht bekannt sind und sowohl das Rauchen, wie auch den Diabetes beeinflussen, z.B. die soziale Herkunft.

Beitrag von **drfg2008** » 21.04.2012, 15:33

das ist doch der Klassiker für die Diskriminanzanalyse

gut erklärt bei Backhaus ...

http://www.amazon.de/Multivariate-Analysemethoden-anwendungsorientierte-Einf%C3%BChrung-Springer-Lehrbuch/dp/3642164900/ref=sr_1_1?ie=UTF8&qid=1335015215&sr=8-1

Beitrag von **Brotzeithasser** » 21.04.2012, 20:22

Vielen Dank für das Stichwort, damit habe ich mich bisher noch nicht befasst und werde mich mal einlesen!

Beitrag von **Brotzeithasser** » 23.04.2012, 11:02

Ich habe mich inzwischen mal grob informiert. Bei der Diskriminanzanalyse versucht man zwei verschiedene Gruppen zu unterscheiden, die INNERHALB der Gruppen GLEICHE Verteilung aufweisen und zwischen den Gruppen verschieden sind.

Bei mir ist der Fall anders gelagert und daher ist die DKA mMn nicht anwendbar:

Ich habe DREI Ebenen:

- Ein Unternehmen i mit PE-Investor
- zu DIESEM Unternehmen i 10 Unternehmen j=1,...,10 ohne PE-Investor
- 100 derartige Gruppen von Unternehmen ij

Zwischen den Gruppen ij herrscht vollkommene Heterogenität.

D.h. Wenn Unternehmen i=1 ein Kleinunternehmen mit geringem Umsatz ist dann sind die Vergleichsunternehmen Ohne Investor i=1;j=1...10 auch Klein und haben geringen Umsatz. Unternehmen i=2 kann jedoch Groß sein und hohen Umsatz haben, dann haben für i=2;j=1,..,10 die Vergleichsunternehmen auch hohen Umsatz.

Ich will wissen, ob es signifikante Unterschiede in der Anzahl der Patente zwischen i und j gibt.

Beitrag von **drfg2008** » 23.04.2012, 20:46

Vorausgeschickt: Die Diskriminanzanalyse kann auch mehr als zwei Gruppen unterscheiden.

Ich hatte mich an deiner Beschreibung orientiert:

Die dichotome abhängige Variable Y beschreibt, ob ein Unternehmen einen Private Equity Investor besitzt.

Die erklärende Variable ist die Anzahl der Patente X, die das Unternehmen hält. Es soll überprüft werden, ob diese Anzahl einen Einfluss auf Y besitzt.

Daneben gibt es noch weitere erklärende Variablen, die einen Einfluss auf Y ausüben könnten und beobachtet werden können (z.B. Wachstumsrate der letzten 2 Jahre, Unternehmensalter, Branche).

Das wäre über eine Diskriminanzanalyse darstellbar. Aber dann kommt:

und zu diesen Unternehmen suche ich jeweils Vergleichsunternehmen ohne Investor (Y=0), die dem jeweiligen Unternehmen in Merkmalen wie Mitarbeiterzahl, Umsatz usw. ähneln.

Das hatte ich übersehen, dass du praktisch ein Matched Sample aufbaust. Damit wäre eine Diskriminanzanalyse nicht mehr sinnvoll. Wenn du über ein Matched Sample sämtliche Variablen 'kontrollierst' (weil die Unternehmen in allen übrigen Eigenschaften identisch sind), dann reicht ein einfacher stat. Test, z.B. der t-Test oder U-Test über die Anzahl der Patente. Hat aber den Nachteil, den alle Matched Samples haben: Es muss nachgewiesen werden, dass tatsächlich sämtliche anderen Variablen zwischen den Gruppen identisch sind.

Dein Vorgehen hingegen ist mir jetzt nicht klar. Hier denke ich mehr aus der klinischen Psychologie.

Beitrag von **Brotzeithasser** » 24.04.2012, 16:31

Es muss nachgewiesen werden, dass tatsächlich sämtliche anderen Variablen zwischen den Gruppen identisch sind.

Genau hier liegt das Problem. Ich habe quasi drei Kategorien von Einflüssen:

- meine erklärende Hauptvariable (Patentzahl) deren Einfluss getestet werden soll

- weitere beobachtbare erklärende Variablen, bei denen ich einen Einfluss für hochwahrscheinlich halte (Umsatzwachstum, EBIT-Marge etc

- zusätzlich dazu unbeobachtbare erklärende Variablen, die einen Einfluss sowohl auf die erklärende Variable(n) (Patentzahl), als auch auf die erklärte Variable haben. Dies könnten z.B. Managementqualität, Organisationsstruktur etc. sein.

Das Matched-Sample wie du es nennst dient dazu, gleiches mit gleichem zu vergleichen - ich versuche es mit einer Analogie zu erklären:

Ein neuer Dünger soll getestet werden. Es werden Apfel- und Birnenbäume mit dem Dünger gegossen und eine Vergleichsgruppe Apfel-/Birnenbäume nur mit Wasser. Um zu ermitteln, ob der Dünger wirkt werden die gedüngten Äpfel gewogen und mit den ungedüngten verglichen und die gedüngten Birnen gewogen und mit ungedüngten verglichen es werden jedoch nicht Äpfel mit Birnen verglichen.

D.h. man erhält im Prinzip zwei Regressionen. In meinem Ansatz habe ich meinetwegen 100 Regressionen, die alle für sich genommen hochgradig unsignifikant sind, da jeweils nur eine positive Beobachtung enthalten ist. Durch die Vielzahl an "Wiederholungen" will ich aber signifikante Ergebnisse erhalten.

Nach allem was ich gelesen habe ist das ein Fall für random/fixed effects probit bzw. logit-Modell aber ich finde nirgends eine für mich verständliche Erklärung wie man das anstellt geschweige denn Software, die das kann (R kann ich nicht und zu Stata habe ich keinen Zugang) ...

Beitrag von **drfg2008** » 27.04.2012, 13:58

Ein neuer Dünger soll getestet werden. Es werden Apfel- und Birnenbäume mit dem Dünger gegossen und eine Vergleichsgruppe Apfel-/Birnenbäume nur mit Wasser. Um zu ermitteln, ob der Dünger wirkt werden die gedüngten Äpfel gewogen und mit den ungedüngten verglichen und die gedüngten Birnen gewogen und mit ungedüngten verglichen es werden jedoch nicht Äpfel mit Birnen verglichen.

Da gibt es mehrere Möglichkeiten der Auswertung.

Variante 1: Im Prinzip hast du zwei Gruppen, die in ihrer Struktur identisch sind, auch wenn sie aus Äpfeln und Birnen bestehen. Solange in der Vergleichsgruppe genau so viele Äpfel wie Birnen existieren und jedem Apfel der einen Gruppe ein Apfel der anderen Gruppe und jeder Birne der einen Gruppe eine Birne in der anderen Gruppe so zugeordnet werden kann, dass diese in ihren Voraussetzungen vor dem Einsatz des Treatments identisch sind, wäre der Versuchsplan eines Matched Samples erfüllt.

Variante 2: Einsatz von Regressionsmodellen (logistische).

Es gibt sicherlich noch andere.

Beitrag von **Brotzeithasser** » 09.05.2012, 14:28

Okay, und in Bezug auf den Matched Samples-Ansatz: Gibt es da auch eine Möglichkeit jeweils einem Treatment-Objekt mehrere Plazebo-Objekte zuzuordnen?? Oder geht das nur über Mittelwertbildung über die jeweiligen Plazebos??

Also ich will jeweils eine Birne düngen und drei Birnen NICHT düngen.

Bzw... vllt ist es besser ich lad mal einen Auszug aus den Daten hoch, dann kann man sich was drunter vorstellen:

http://img535.imageshack.us/img535/1512 ... nnt1wb.png

Ganz rechts ist das zu erklärende Merkmal (PE-Invest.) Die Daten sind gruppiert, die Gruppe steht ganz links - dazu gehört jeweils 1 Unternehmen das einen PE-Investor hat (PE-Invest=1) und jeweils passende Vergleichsunternehmen, die ähnliche Größe, Mitarbeiterzahl und Branche haben aber PE-Invest=0.

Zusätzlich zu den beobachteten Merkmalen gibt es noch welche, die ich nicht beobachten kann die sich aber SOWOHL auf das zu erklärende, wie auch auf die erklärenden Merkmale auswirken (z.B. die Qualität des Managements)