ich will für die Analyse der Renditen zweier Aktien eine Mischung von Normalverteilungen finden. Nun muss ich ja zum einen die Anzahl der Verteilungen, aus denen die Mischung bestehen soll, herausfinden, zum anderen dann deren Parameter.
Für die Parameter-Schätzung habe ich mir den EM-Algorithmus ausgesucht und habe das dann mal in R zu lösen versucht. Habe dabei abe bemerkt, dass mir nicht so ganz klar ist, was der EM macht.
1. Der Output: R gibt mir eine Mischung aus 2 Normalverteilungen zurück. So weit, so gut. Doch ich bekomme dann auch 2 Vektoren Mü, die jeweils zwei Einträge enthalten, zurück und auch zwei 2x2 Kovarianz-Matrizen.
Mit den Vektoren hätte ich mir den Reim darauf gemacht, dass der erste den Mittelwert für die erste Verteilung (der Mischung) zurückgibt, wofür man ja jetzt zwei Werte bräuchte, da zwei Aktien beschrieben werden (wenn man sich das in einem Plot vorstellt, dann hab ich ja jetzt zwei Achsen, die die Daten beschreiben und deshalb braucht man zwei "Koordinaten"). Und bei den Matrizen habe ich einfach keine Ahnung, was ich mit denen anfangen soll. Habe auch schon gegoogelt, aber ich habe nur Beispiele zum univariaten Fall gefunden.
2. Die Anzahl der Komponenten der Mischverteilung - wie leg ich die fest? Dafür ist der EM doch eigentlich nicht da, oder? Oder passt der Algorithmus das ganze auch in der Hinsicht an?
mfg
