Ausreißer

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
V95
Beiträge: 10
Registriert: 27.05.2020, 10:21

Ausreißer

Beitrag von V95 »

Hallo,

bei der Überprüfung meiner Variabel mit Boxplots habe ich festgestellt, dass es bei einigen der einzelnen Variablen mal mehr mal weniger Ausreißer gibt, aber nie extreme Ausreißer. Zudem sind einige der Variablen auch schief, was vielleicht an den Ausreißern liegen könnte, oder?
Die Ausreißer sind meiner Meinung nach durch natürliche Umstände zustande gekommen.
Jetzt bin ich mir unsicher, wie ich mit den Ausreißer richtig umgehen soll, weil einfach aus den Analysen ausschließen möchte ich sie nicht. Und inwieweit ich sie ignorieren kann, weiß ich auch nicht (weil es ja keinen extremen Ausreißer sind). Da ich Korrelationen und ANOVAS berechnen werde.

Würde mich freuen, wenn jemand Ideen hätte!


Liebe Grüße
Virginia
dutchie
Beiträge: 2647
Registriert: 01.02.2018, 10:45

Re: Ausreißer

Beitrag von dutchie »

Hallo Virginia

Auf keinen Fall Ausreißer unbegründet eliminieren!
Nur wenn z.B ein Eingabefehler vorliegt!

Es kommt dann auch drauf an was gemessen wurde und auf die Stichprobengröße!
Oft ist es auch so, dass die sog. Ausreißer diejenigen sind die den Effekt der UV wiederspiegeln
z.B. bei einer Therapieevaluation, während die "Normalen" die UV einfach verpennt haben!

Also erstmal niemanden ausschließen, vielleicht die Ausreißer mit Hilfe einer neuen Variable markieren.
für den Fall, dass die erneut auffallen. Es gibt immer VP die quatsch ankreuzen, aber das kann man schwer nachweisen!

Bei der Korrelation den Zusammenhang auch per Streudiagramm prüfen,
wenn es dann so erscheint, dass eine VP für die Größe des Zusammenhangs wesentlich verantwortlich ist
oder diesen verhindert. Dann einmal mit und ohne rechnen! Aber man merkt schon,
will man das Ausreißerhandling konsistent durchhalten ist das anstrengend und aufwendig!

Also optimal: rechnen mit und ohne Ausreißer! Wenn das gleiche rauskommt kein problem, berichtet
wird das Ergebnis mit Ausreißern!
Wenn sich die Ergebnisse widersprechen, der Ausreißer Einfluß auf das Ergebnis hat, Problem!
Der Ausreißer zerstört eventuell die externe Validität, d.h. die Population auf die das Ergebnis angewendet werden soll!
Man kann jetzt an den Populationen basteln...und sagen der Ausreißen zerstört die Repräsentativität usw...usw...
das ist aber nur sachbezogen inhaltlich zu klären!

Also praktisch: Ausreißer berichten... und so rechnen als ob nichts gewesen ist, weil wie du sagst:
ganz normale Ausreißer gibt es, sind natürlich, sind teil der Wirklichkeit! Und auch Teil der Methode!
Ausreißer ausschließen ist immer irgendwie auch willkürlich!

gruß
dutchie
V95
Beiträge: 10
Registriert: 27.05.2020, 10:21

Re: Ausreißer

Beitrag von V95 »

Hallo dutchie

Danke für deine Hilfe!

Können die Ausreißer aber auch Grund dafür sein, wenn die Verteilung der Variablen sehr rechts oder linksschief sind? Darf ich denn bei einer ausreichend großen Stichprobe die Schiefe vernachlässigen?

Liebe Grüße
Virginia
dutchie
Beiträge: 2647
Registriert: 01.02.2018, 10:45

Re: Ausreißer

Beitrag von dutchie »

Hallo

Eigentlich nicht, die Schiefe ist eher was systematisches, sollte sein...
Depression ist schief "an sich", weil es nicht normal ist mittlere Symptomatik zu zeigen.
Es ist nicht schief, weil Depressive Ausreißer sind. In dem Sinne sind sie normaler Teil der Population!

Wenn du jetzt auf Normalverteilung prüfst, können die Ausreißer für die Schiefe verantwortich sein, klar!
Aber eine große Stichprobe sollte das auffangen.
Bei N = 100 machen zwei Ausreißer das ganze nicht schief!

Verteilungen sind bei Fragebögen oft schief, weil der Fragebogen zu leicht oder zu schwer ist!
Dann hast du Decken- oder Bodeneffekte.

Eine Aussagen darüber wie Stress bei Studenten verteilt ist, ist das eine, etwas deskriptives!
An sich interessant!
Für eine ANOVA mit dieser Gruppe bei N= 204 ist die Verteilung völlig irrelevant!

Aber ANOVA bei n > 30 pro Gruppen ist die Verteilung egal, das Ding ist robust!
Eine Gruppe war n =7 :( .

Du solltes die Verteilung pro Gruppe beschreiben, weil das an sich interessant ist!
unabhängig von ANOVA, mit der ANOVA hast du kein Problem, das Problem ist, dass du so wenig
Arbeitslose hast und du eigentlich bezüglich dieser Gruppe keine Aussagen treffen kannst.

Insofern ist die ganze Gruppe irgendwie dein Ausreißer. Du kannst eventell Quellen angeben
mit mehr Arbeitslosen, die eine NV nachgewiesen haben und dies auf deinen Fall übertragen!
Wenn irgenwas mit dieser Gruppe aber nicht stimmt z.B. nicht NV ist oder die Varianz anders ist,
hat das aber wenig einfluß weil n =7.

Wenn du Ausreißer beschreibst für die ganze Stichprobe N =260? unabhängig von deinen Gruppen,
für welche Population gilt das?

Bei lin. Regression sich die Residuen anschauen, ist das NV? gibts da ausreißer?
ich glaub da bist noch gar nicht...

und... diese ganzen NV usw. Vorrausetzungen betreffen, wenn überhaupt nur die Berechnung von p!
die haben für die deskriptiver Statistik keinen Bedeutung!

Das einzige Problem ist wenn die Varianzen heterogen sind und die Stichproben ungleich!
Dann kann das die Entscheidung über die Ho verzerren!

rechne einfach mal drauf los und schau was rauskommt...

gruß
dutchie
V95
Beiträge: 10
Registriert: 27.05.2020, 10:21

Re: Ausreißer

Beitrag von V95 »

Hallo dutchie

Genau, ich hab bei den Ausreißern alle 260 mit einbezogen. Die Population ist die österreichische Bevölkerung. Also spiegeln die einzelnen Gruppen dies auf jeden Fall nicht wieder.
Ich hab die Ausreißer der einzelnen Variablen überprüft, weil es eine Vorrausetzung zur Berechnung von Korrelationen ist. Bzw. gibt es einige Ausreißer auch in den Scatterplots. Kann ich das auf die univariaten Ausreißer zurückführen und dann so wie du vorgeschlagen hast, beides mal rechnen mit und ohne Ausreißer?

Ich hab mich wahrscheinlich etwas auf die ganzen Voraussetzungen versteift.

Danke für deine Hilfe!!

Liebe Grüße
Virginia
dutchie
Beiträge: 2647
Registriert: 01.02.2018, 10:45

Re: Ausreißer

Beitrag von dutchie »

hallo Virginia
V95 hat geschrieben:Kann ich das auf die univariaten Ausreißer zurückführen und dann so wie du vorgeschlagen hast, beides mal rechnen mit und ohne Ausreißer?
ja, kannst du machen.

Ist das gut über alle zu korrelieren?
Ich würde vier korrelationen rechnen, je eine für jede Gruppe und dann noch über alle!
dann beziehen sich die Ergebnisse auf eben diese Gruppen,
eine Verallgermeinerung auf die ganz Population, Bevölkerung ist schwierig!

Weil die Gruppe diese ja nicht repräsentieren, das würd ja bedeuten 78% der Österreicher studieren.

Gruß
dutchie
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten