ich habe mittels BOXPLOT Ausreisser und Extremwerte identifiziert. Beide möchte ich eleminieren, also aus meinen Berechnungen ausschließen. Muss ich das manuell machen (mein Datensatz ist recht groß
Danke Euch!
Muss ich das manuell machen (mein Datensatz ist recht groß Sad ) oder besteht die Möglichkeit, das mit SPSS zu automatisieren? Kann mir fast nicht vorstellen, dass das nicht geht...
Code: Alles auswählen
* (Q) I would like to exclude "outliers" from my analysis where I define
outliers as values outside mean +/- 2 times the sd.
* (A) posted by Ray 2001/10/15.
GET FILE='c:\program files\spss\employee data.sav'.
* next command create a new variable named zsal which contains the z-scores of salary.
DESCRIPTIVE salary(zsal) /STATISTICS=MEAN STDDEV MIN MAX.
* Exclude outliers (cases with z-scores outside the (-2,2) range).
SELECT IF RANGE(zsal,-2,2).
DESCRIPTIVE salary zsal /STATISTICS=MIN MAX.
EXECUTE.
Code: Alles auswählen
input program.
loop a =1 to 1000 by 1.
end case.
end loop.
end file.
end input program.
exe.
COMPUTE v1=RV.NORMAL(0,1).
EXECUTE.
FORMATS v1 (f8.4).
DESCRIPTIVES VARIABLES=v1
/SAVE.
USE ALL.
COMPUTE filter_$=(ABS(Zv1) <= 2).
FILTER BY filter_$.
EXECUTE.