Box-Plot

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Jeanni
Beiträge: 4
Registriert: 18.06.2011, 01:02

Box-Plot

Beitrag von Jeanni »

Hallo Ihr,
ich habe mittels BOXPLOT Ausreisser und Extremwerte identifiziert. Beide möchte ich eleminieren, also aus meinen Berechnungen ausschließen. Muss ich das manuell machen (mein Datensatz ist recht groß :( ) oder besteht die Möglichkeit, das mit SPSS zu automatisieren? Kann mir fast nicht vorstellen, dass das nicht geht...habe natürlich auch schon rumgesucht...der Punktidentifikationsmodus hat mir auch nicht wirklich weitergeholfen, wollte den aktivieren und im BOXPLOT sind die Daten auch markiert, aber nicht in der Datenmatrix...Kennst jemand das Problem, oder komme ich nicht drumherum, jeden Ausreisser und jeden Extremwert per Hand zu löschen?

Danke Euch!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Muss ich das manuell machen (mein Datensatz ist recht groß Sad ) oder besteht die Möglichkeit, das mit SPSS zu automatisieren? Kann mir fast nicht vorstellen, dass das nicht geht...

natürlich lässt sich das in SPSS automatisieren. Es gibt wohl kein Pull-Down Menü "Ausreißer". Aber mittels Syntax lässt sich das lösen.

1. definieren, was als Extremwert / Ausreißer gilt. Das sind Vielfache einer Standardabweichung, oder Vielfaches eines Interquartilsabstandes

2. entsprechenden Quellcode schreiben

3. fertig.

Voll automatisch liefe das mit Syntax + Python innerhalb der Laufzeit über beliebige Datenfiles.


Hier, das wäre eine etwas simple Lösung von Raynald's Website und läuft über z-Werte:

Code: Alles auswählen

* (Q) I would like to exclude "outliers" from my analysis where I define
	outliers as values outside mean +/- 2 times the sd.

* (A) posted by Ray 2001/10/15.

GET FILE='c:\program files\spss\employee data.sav'.

* next command create a new variable named zsal which contains the z-scores of salary.
DESCRIPTIVE salary(zsal) /STATISTICS=MEAN STDDEV MIN MAX.

* Exclude outliers (cases with z-scores outside the (-2,2) range).
SELECT IF RANGE(zsal,-2,2).

DESCRIPTIVE salary zsal /STATISTICS=MIN MAX.
EXECUTE.

 

Als Beispiel:

Code: Alles auswählen

input program.
loop a =1 to 1000 by 1.
end case.
end loop. 
end file.
end input program.
exe.

COMPUTE v1=RV.NORMAL(0,1).
EXECUTE.
FORMATS v1 (f8.4).

DESCRIPTIVES VARIABLES=v1
  /SAVE.

USE ALL.
COMPUTE filter_$=(ABS(Zv1) <= 2).
FILTER BY filter_$.
EXECUTE.
Bei schiefen Verteilungen sollte man ein Vielfaches des Interquartilabstandes nehmen.

Gruß
drfg2008
Jeanni
Beiträge: 4
Registriert: 18.06.2011, 01:02

Beitrag von Jeanni »

Oh ganz lieben Dank!!!!!!!!!!!!!!!! Über diese Option habe ich noch gar nicht nachgedacht, werds gleich mal ausprobieren,

schönen Sonntag:)
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

und ohne Programmierkenntnisse (Syntax/Python):

Analysieren -> Deskriptive Statistiken-> Deskriptive Statistik -> Standardisierte Werte als Variable speichern


Bei der dann entstehenden Variablen diejenigen Werte auswählen, die nicht größer sind als der Betrag von x (z.B. 2)

Daten -> Fälle auswählen -> Falls ... > abs(zvar001) (oder wie auch immer die Variable heißt) <2

So in etwa.

Gruß
drfg2008
Jeanni
Beiträge: 4
Registriert: 18.06.2011, 01:02

Beitrag von Jeanni »

HaT GEKLAPPT!!!!!!!!!!!!!!!!!!!!!!!! Merci :D
coffEaddict
Beiträge: 1
Registriert: 14.06.2012, 13:01

Beitrag von coffEaddict »

Würde die Extremwerte gern in den Berechnungen lassen und nur in der Boxplot-Darstellung entfernen. Der Datensatz ist sehr groß und da gibt es dann leider schon so einige Ausreißer.
Bisher war das auch über die Registerkarte Boxen mit Deaktivierung des Markers für Ausreißer und Extremwerte problemlos möglich (Stand SPSS 11). Weiss jemand eine Möglichkeit wie das in Version 20 funktioniert? Habe mich gefühlt überall schon 10 mal durchgeklickt... :(
Vielen Dank für etwaige Tipps!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten