Varianzanalyse (Ausreißer, Normalverteilung...)

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
mia_w
Beiträge: 21
Registriert: 06.08.2012, 19:58

Varianzanalyse (Ausreißer, Normalverteilung...)

Beitrag von mia_w »

Hallo zusammen,

ich stehe gerade irgendwie auf'm Schlauch und hoffe, dass ihr mir vielleicht helfen könnt. :) Ich habe bereits schon im Forum geschaut, aber nichts gefunden, was mir hilft.

Ich möchte eine Varianzanalyse durchführen mit 3 Gruppen (N1= 18, N2 = 20, N3 = 20). Da ich insgesamt nur 58 Beobachtungen (oder teilw. weniger) je Variable habe, möchte ich ungern Ausreißer komplett rausnehmen (d.h. den Probanden komplett löschen). Gibt es eine Möglichkeit den Extremwert herunter bzw. herauf zu setzen, sodass er nicht mehr als Ausreißer erscheint?

Ich weiß, dass ich die Ausreißer durch Boxplots erkennen kann. Wie berechne ich denn den maximal zulässigen Wert (sodass es noch so gerade eben kein Ausreißer ist)?

Außerdem bin ich mir nicht sicher, ob ich mir die Boxplots einer Variable über die gesamte Stichprobe (58 Probanden) oder über die einzelnen Gruppen (18; 20; 20) anschauen muss.

Ganz lieben Dank schon mal! :)
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Gibt es eine Möglichkeit den Extremwert herunter bzw. herauf zu setzen, sodass er nicht mehr als Ausreißer erscheint?
Wozu das denn? Wenn Du begründet entscheidest, dass Du einen
Ausreißer in der Auswertung behälst, dann brauchst Du doch keine
Prozeduren zu verfälschen.
mia_w
Beiträge: 21
Registriert: 06.08.2012, 19:58

Beitrag von mia_w »

Danke erstmal für die schnelle Antwort!

Nein, ich wollte meine Daten nicht fälschen. ;) Ich habe irgendwo (also keine zitierbare Quelle) gelesen, dass man Extremwerte / Ausreißer auf den nächsten noch gerade akzeptierten Wert herab oder herauf setzen kann.

Bei mir ist das Problem, dass ich eine abhängige Variable habe, bei der die Normalverteilung nicht gegeben ist (bei den anderen schon) und dies ja problematisch ist für die Varianzanalyse bzw. t-test.

Ich werde mehrere einfaktorielle Varianzanalysen durchführen. Könnte ich dann auch bei der abhängigen Variable mit Verletzung der Normalverteilung einen nicht-parametrischen Test (Kruskal-Wallis) durchführen. Oder man muss man sich einheitlich für einen entscheiden für alle Analysen?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Nein, ich wollte meine Daten nicht fälschen. ;) Ich habe irgendwo (also keine zitierbare Quelle) gelesen, dass man Extremwerte / Ausreißer auf den nächsten noch gerade akzeptierten Wert herab oder herauf setzen kann.
So platt ausgedrückt ist das nunmal Datenfälschung. Natürlich gibt es
Verfahren, um auch in Anwesenheit von dominierenden Ausreißerwerten
zu robusten Schätzungen zu kommen, aber das ist nicht ganz einfach zu
handhaben.
Bei mir ist das Problem, dass ich eine abhängige Variable habe, bei der die Normalverteilung nicht gegeben ist (bei den anderen schon) und dies ja problematisch ist für die Varianzanalyse bzw. t-test.
Nein. Dafür ist von Belang die Verteilung der Vorhersagefehler (Residuen).
Bzw. die Verteilung innerhalb der einzelnen Gruppen. Bei n > 50 könnte
man bereits argumentieren, dass dabei eine Normalverteilung nicht mehr
ins Gewicht fällt (zentraler Grenzwertsatz). Aber das Ausreißerproblem
ist davon getrennt zu betrachten.
Ich werde mehrere einfaktorielle Varianzanalysen durchführen. Könnte ich dann auch bei der abhängigen Variable mit Verletzung der Normalverteilung einen nicht-parametrischen Test (Kruskal-Wallis) durchführen.
Der wäre die Alternative.
Oder man muss man sich einheitlich für einen entscheiden für alle Analysen?
Da ich nicht die Auffassungen Deines Betreuers kenne, kann ich das
leider nicht beantworten.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

H-Test nehmen
drfg2008
mia_w
Beiträge: 21
Registriert: 06.08.2012, 19:58

Beitrag von mia_w »

Betreuer ist noch länger im Urlaub... Mal gucken, was ich nun mache.
Ganz vielen Dank für die Tipps! :)
mia_w
Beiträge: 21
Registriert: 06.08.2012, 19:58

Beitrag von mia_w »

Eine Frage kurze habe ich doch noch mal:
Also die Normalverteilung (Test durch Kolmogorov Smirnov) muss je Gruppe überprüft werden, richtig?
Nicht für die Gesamtstichprobe.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

die Normalverteilung (Test durch Kolmogorov Smirnov) muss je Gruppe überprüft werden, richtig?

3 Gruppen (N1= 18, N2 = 20, N3 = 20)
Nein. Du gehst in deiner Hypothese ja davon aus, dass sämtliche Probanden einer Grundgesamtheit angehören. Außerdem wäre bei derart kleinen N(i) kaum eine H0: X~ N möglich zu verwerfen.

Bei dieser Stp.Größe würde aber ein H-Test einer Varianzanalyse vorgezogen.
drfg2008
mia_w
Beiträge: 21
Registriert: 06.08.2012, 19:58

Beitrag von mia_w »

Danke!

Mhhh, mein Betreuer meinte damals, dass 20 Fälle je Gruppe ok wären für die Varianzanalyse. Aber ich habe den H-Test nun ebenfalls gemacht. Die Ergebnisse sind identisch.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten