Hi,
folgendes Problem. Ich will in einem Set von Variablen (z. B. 20, oder 200) diejenigen 3 (oder 4, oder 30) Variablen identifizieren, die am niedrigsten miteinander korreliert sind, d. h. der Mittelwert der bivariaten Korrelationen ist für dieses Set minimal im Vergleich zu allen anderen möglichen Kombinationen. Vielleicht ist jemandem das Problem schon mal begegnet im Zusammenhang mit der höchsten Interkorrelation, aber das sollte eigentlich für den Lösungsweg egal sein, denke ich.
Es handelt sich also eher um ein Problem der effizienten Herangehensweise bzw. Programmierung als um ein inhaltliches. Am liebsten wäre mir es würde mit SPSS oder Excel funktionieren, zur Not auch mit R.
Hat jemand eine Idee, vlt auch nur eine kleine?
MfG und Danke
unkorrelierte Variablenkombination identifizieren (advanced)
-
- Beiträge: 5
- Registriert: 31.03.2012, 14:38
-
- Beiträge: 5
- Registriert: 31.03.2012, 14:38
naja, ich glaube leider nicht ganz. Z. B. will ich aus einem Set von 20 Variablen diejenigen drei heraussuchen, die am wenigsten miteinander zusammenhängen, das heißt ich muss immer drei Korrelationskoeffizienten gleichzeitig betrachten. Bei 20 Variablen sind das - wenn ich das richtig sehe - ca. 1140 mögliche Triple. Und wenn ich das von Hand machen will, müsste ich jetzt für jedes Triple den Mittelwert der drei Korrelationskoeffizienten berechnen um mich dann für den kleinsten Mittelwert entscheiden zu können...
Tschuldigung, hab gerade gesehen dass in meiner frage vorhin ein kleiner fehler drin war, so dass man das auch so interpretieren konnte wie drfg2008
Tschuldigung, hab gerade gesehen dass in meiner frage vorhin ein kleiner fehler drin war, so dass man das auch so interpretieren konnte wie drfg2008
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
deine Darstellung lässt mehrere Interpretationen zu. Wenn es darum geht Mittelwerte über Korrelationen (Pearson) zu berechnen kommt ein weiteres Problem hinzu, nämlich die Transformation über Fisher-Z. Denn über die r Pearson lässt sich kein arithm. Mittel sinnvoll berechnen.
drfg2008
-
- Beiträge: 5
- Registriert: 31.03.2012, 14:38
okay, du hast natürlich recht, aber diese Kröte würde ich schlucken, dass ich ohne die Fisher-Transformation vielleicht nicht das tatsächlich perfekte Set ermitteln kann, sondern nur ein ziemlich gutes. Die Ermittlung der unkorrelierten Variablenkombinationen ist nur ein Zwischenschritt für weitere Analysen, das heißt ich wäre auch schon mit einer Lösung ohne Fishers z zufrieden.
Außerdem gehe ich nicht davon aus, dass sich bei den Korrelationskoeffizienten, die hier relevant sind (-0.1 bis 0.1), durch eine Transformation das so viel ändern würde.
Trotzdem danke für den Hinweis, daran hatte ich noch nicht gedacht. Noch 'ne gute Idee...?
Außerdem gehe ich nicht davon aus, dass sich bei den Korrelationskoeffizienten, die hier relevant sind (-0.1 bis 0.1), durch eine Transformation das so viel ändern würde.
Trotzdem danke für den Hinweis, daran hatte ich noch nicht gedacht. Noch 'ne gute Idee...?