Ich habe ein Frage zum Vergleich von Mittelwerten: In meinem Fall handelt es sich bei den zu vergleichenden Variablen um Einschätzung von Eigenschaften (z.B. Qualität) bei ähnlichen Produkten verschiedener Hersteller. Bewertet wurde nur im Falle der Bekanntheit des jeweiligen Produktes. Meine Stichproben sind also nicht unabhängig (in vielen Fällen kennen die Befragten Produkte mehrer Hersteller), aber auch nicht gepaart abhängig (viel Befragte kennen nur das Produkt eines Herstellers, aber nicht das eines anderen). Wie kann ich die Mittelwerte hier korrekt vergleichen, t-Test für gepaarte Stichproben kanns ja nicht sein oder?
Vielen Dank für die Hilfe im Vorraus.
Mittelwertsvergleich bei teilweise abhängiger Stichprobe
-
- Beiträge: 2
- Registriert: 29.10.2008, 16:11
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
unabhängig sollten die daten nicht ausgewertet werden, weil man dazu ein einziges merkmal benötigt, das von verschiedenen gruppen stammt. wenn man die beurteilung zweier hersteller von verschiedenen personen vergleicht, dann hat man zwei merkmale von verschiedenen personen.
ich würde die daten nur mit verfahren für abhängige daten auswerten. du musst dich entscheiden, ob du dafür nur vollständige datensätze nehmen willst (personen, die alle hersteller bewertet haben) = listenweiser fallausschluss, oder ob du den paarweisen fallausschluss nehmen willst, der für jeden vergleich so viele fälle wie möglich nehmen würde. z.b. bei t-test für abhängige, wo man mehrere variablenpaare gleichzeitig eingeben kann, würde bei paarweisem fallausschluss unterschiedliche fallzahlen für die einzelnen tests auftauchen.
übrigens würde ich für die paarweisen tests das signifikanzniveau für mehrfachvergleiche adjustieren, so dass ein test nur dann signifikant würde, wenn sein p-wert kleiner oder gleich .05 geteilt durch anzahl der durchzuführenden tests wäre. z.b. vergleich von 3 herstellern --> 1 mit 2, 2 mit 3, 3 mit 1 = 3 vergleiche --> ,05 / 3 = ,0167 dürfte höchstens erreicht werden.
ich würde die daten nur mit verfahren für abhängige daten auswerten. du musst dich entscheiden, ob du dafür nur vollständige datensätze nehmen willst (personen, die alle hersteller bewertet haben) = listenweiser fallausschluss, oder ob du den paarweisen fallausschluss nehmen willst, der für jeden vergleich so viele fälle wie möglich nehmen würde. z.b. bei t-test für abhängige, wo man mehrere variablenpaare gleichzeitig eingeben kann, würde bei paarweisem fallausschluss unterschiedliche fallzahlen für die einzelnen tests auftauchen.
übrigens würde ich für die paarweisen tests das signifikanzniveau für mehrfachvergleiche adjustieren, so dass ein test nur dann signifikant würde, wenn sein p-wert kleiner oder gleich .05 geteilt durch anzahl der durchzuführenden tests wäre. z.b. vergleich von 3 herstellern --> 1 mit 2, 2 mit 3, 3 mit 1 = 3 vergleiche --> ,05 / 3 = ,0167 dürfte höchstens erreicht werden.