Fehlende Werte / MCAR - Test / Multiple Imputation ?!

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
SueZie
Beiträge: 8
Registriert: 14.09.2013, 03:33

Fehlende Werte / MCAR - Test / Multiple Imputation ?!

Beitrag von SueZie »

Hallo Leute!

Ich bin ganz neu hier (seit gerade mal 2 Minuten :) ) und ich hoffe sehr dass mir jemand helfen kann.
Ich werte gerade die Daten meiner Diplomarbeit aus und weiß nicht so recht was ich mit den fehlenden Daten machen soll.

Mein Thema ist die Validierung von einem Fragebogen. Hierfür habe ich einige Fragebögen erfasst.
Dementsprechend habe ich sehr viele Items (über 300 insgesamt), aber auch viele Fälle/Versuchspersonen, etwa 600.

Es fehlen einige Datenpunkte und nun muss ich entscheiden wie ich mit ihnen umgehe. Es sind unter 2% der gesamten Datenpunkte, die fehlen. Bei den Variablen gibt es vereinzelt welche, bei denen über 5 % fehlen, aber nur wenige und nicht so wichtige Variablen. Bei den Items des Fragebogens, den ich validiere, fehlen höchstens mal 2% der Werte. Jedoch fehlt in JEDER Variable mal mindestens ein Wert und bei über der Hälfte der Fälle wurde mindestens eine Variable nicht angegeben.

1. Nun wollte ich entweder EM oder Multiple Imputation gerne anwenden, weil ich dachte dass das am besten ist für die Daten (besser als Mittelwerte zu nehmen), habe ich da recht???

2. Ich habe den MCAR - Test von Little durchgeführt und dabei alle 300 Variablen eingegeben und er wurde leider signifikant.
Ich denke aber schon, dass die Werte zufällig fehlen, denn es gibt gar keine Muster der fehlenden Werte mit mehreren Fällen, bei denen mehr als eine Variable fehlt. Was mache ich mit dieser Signifikanz nun, was bedeutet das für mein Vorgehen und kann ich das irgendwie ändern? Könnte es an der großen Anzahl der Variablen liegen?

3. ALs ich Multiple Imputation probiert habe, um mir dort das Muster der fehlenden Werte anzusehen, habe ich nur ein schwarzes Diagramm bekommen ohne rote und weise Balken, wahrscheinlich weil es so viele Variablen sind?? Wie löse ich denn dieses Problem?

Ist es irgendwie verständlich, was mein Problem ist?

Die Grundfrage ist eigentlich: was würdet Ihr mir empfehlen zu tun; wie/durch welche Methode soll ich die fehlenden Datenpunkte ersetzen?

Ich wäre für baldige Hilfe unglaublich dankbar, ich bin im unglaublichen Stress, weil ich nicht so viel Zeit habe und relativ bald die Analysen fertig haben muss.

Bitte, bitte, jeder Rat würde helfen, die Beantwortung auch nur einer meiner vielen Fragen wäre super hilfreich!!! Danke schon mal!


Liebe Grüße!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ist es irgendwie verständlich, was mein Problem ist?
Nein, denn wir kennen deine Daten ja gar nicht. Welches Verfahren sinnvoll ist, hängt aber genau von der Datenlage ab. Falls auf Imputation verzichtet werden kann, dann besser eben keine.
drfg2008
SueZie
Beiträge: 8
Registriert: 14.09.2013, 03:33

Beitrag von SueZie »

Hallo! Danke für die Antwort!
Warum sollte Imputation vermieden werden? Ist das nicht die beste Methode grundsätzlich?

Ich würde sie auch gern vermeiden wegen der Komplexität, aber ich will auf jeden Fall die felhenden Daten nicht komplett ausschließen sondern sie irgenwie behalten. Und hier in dem Forum und in der LIteratur meine ich gelesen zu haben, dass Ersetzen durch Mittelwert der Variable die Analysen verfälschen kann. Ist das nicht so?

Und kann es nicht sein dass der MCAR - Test von Little falsch signifikant wird bei zu vielen Variablen? Habe dazu leider nichts gefunden.

Danke schon mal!
SueZie
Beiträge: 8
Registriert: 14.09.2013, 03:33

Beitrag von SueZie »

OK, inzwischen kann ich die Frage erstmal vereinfachen:

ich kann davon ausgehen dass die Daten MAR sind, also zufällig fehlen. Es fehlen nur etwa 1,8 Prozent alles Datenpunkte. Es sind Items mehrerer verschiedener Self-report-Fragebögen.

Welche Methode der Imputation würdet Ihr nun am ehesten empfehlen (mit SPSS am besten), um die fehlenden Datenpunkte zu ersetzen?

Ich überlege zwischen Mittelwert über Item, Mittelwert über Person (im jeweiligen Fragebogen) und Multipler Imputation (welche ich wenn möglich vermeiden würde, da ich das noch nie gemacht habe und es sich nicht so einfach anhört).

drfg2008, ist es vielleicht jetzt eher möglich mit einen Rat zu geben? Oder jemand anderes?

Ich wäre euch unglaublich dankbar!!!
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten