Normalverteilungstest pro Variable oder pro Frage?

Beitrag von **kng** » 14.05.2011, 09:54

Liebe SPSS-ler,

ich habe bei einer kleinen Umfrage folgende Randbedingungen:

- es gibt 3 Variablen, die dazu dienen, eine Frage/Beschreibung zu beantworten/bewerten
- die 3 Variablen sind jeweils mit einer Likert Skala 1-4 abgefragt worden
- ich habe von 21 Personen Rücklauf bekommen
- Neben den Mittelwerten der drei Variablen, möchte ich gern mit SPSS das 95% Konfidenzintervall berechnen
- Dafür sollte ich ja nun auch wissen, ob meine Daten normalverteilt sind.
- Wenn ich mir die einzelnen Ergebnisse der Variablen in SPSS mit Box-Plot (zB) anschaue, stellt man schnell fest, dass die Antworten links- bzw. rechtsschiefe Lage haben. Histogramm etc. bestätigen das auch.

- ich habe nun pro befragte Person das arithmetisches Mittel aus den 3 Variablenantworten errechnet, was ich mal als Stichprobenmittelwert fuer die Frage zu der die 3 Variablen gehören interpretieren würde, und die Verteilung dieser 21 Mittelwerte dann auf Normalverteilung getestet. Ergebnis: Normalverteilung kann angenommen werden.

Die Frage ist nun:
- ist die Zusammenfassung von 3 Variablen, die zu einer Frage gehören, in einem Mittelwert pro befragter Person zum Nachweis der Normalverteilung zulässig? Inhaltlich würde es aus meiner Sicht Sinn machen...

und

- Kann ich dann vor diesem Hintergrund auch das 95% Konfidenzintervall für den Mittelwert der einzelnen Variablen mit SPSS rechnen oder ist die Konfidenzintervallberechnung dann nur für die Stichprobenmittelwerte gültig, die ich auf Normalverteilung getestet habe?

Waere super, wenn mir jemand seine Meinung dazu schreiben könnte...

Danke
kng

Beitrag von **Generalist** » 14.05.2011, 11:17

Likert-type Items werden als solche erst ab 5 Antwortalternativen angesehen. Bei 4stufigen Items ist es mehr als zweifelhaft, dass die Berechnung von Parametern für intervallskalierte Variablen zulässig ist. Allenfalls der Summenscore aus den 3 Items könnte das erlauben. Was die Konfidenzintervalle betrifft, die werden durch die winzige Stichprobe doch ohnehin recht breit, da kommt es auf Normalverteilung in der Grundgesamtheit für die meisten Zwecke doch gar nicht mehr an.

Beitrag von **kng** » 14.05.2011, 11:54

Hallo Generalist,

hier noch einige zusätzliche Infos. Meine Likert Skala 1-4 (nicht wichtig, wenig wichtig, ziemlich wichtig, sehr wichtig) ist nur 4 stufig, da ich die neutrale Antwortmöglichkeit ausgelassen habe und darum gebeten habe, wenn jemand nichts dazu zu sagen weiss, die Skala frei zu lassen. Das heisst, ich habe auf jeden Fall eine 4 stufige Bewertungsmöglichkeit plus der Möglichkeit "keine Angabe".

Zu den Konfidenzintervallen: Trotz der nur 21 Antworten, liegen die Intervalle so, dass ich sie für meine Interpretation benutzen kann. Z.B. kann ich bei einer unteren Intervallgrenze von 3 oder größer einschätzen, dass die vorgegebene Antwort in zB 95 von 100 Fällen als ziemlich wichtig (=3) eingeschätzt wird.

Daher ist der Test auf Normalverteilung momentan der Punkt, den ich regeln muss...

Gruss
kng

Beitrag von **drfg2008** » 14.05.2011, 13:17

Wenn ich mir die einzelnen Ergebnisse der Variablen in SPSS mit Box-Plot (zB) anschaue, stellt man schnell fest, dass die Antworten links- bzw. rechtsschiefe Lage haben. Histogramm etc. bestätigen das auch.

Die Normalverteilung ist in empirischer Realität ohnehin nur ein Ideal. Wenn du wirklich genau wissen willst, wie ein Lageparameter µ verteilt ist, müsstest du ein Bootstrap-Verfahren anwenden. Da hat SPSS sicherlich schon fertige Lösungen, oder du programmierst dir das mit Python oder Makro.

Alles andere ist eben die Ideal-Variante. Und die geht so (wie dir ja bekannt ist):

http://de.wikipedia.org/wiki/Konfidenzi ... rteilungen

Gruß

Beitrag von **Generalist** » 14.05.2011, 13:57

Das heisst, ich habe auf jeden Fall eine 4 stufige Bewertungsmöglichkeit plus der Möglichkeit "keine Angabe".

Likert-type Items sind nach allgemeinem Konsens 5-stufig. "Keine Antwort" ist keine Antwortstufe, auch keine "neutrale", sondern eben keine Antwort. Du hast ordinale Items. Wenn Du die aus pragmatischen Gründen wie intervallskalierte behandeln willst, dann wäre es sinnvoll, wenigstens den inferenzstatistischen Teil wegzulassen, der geht dann doch ein bisschen zu weit. Deine Beschreibung "kann ich bei einer unteren Intervallgrenze von 3 oder größer einschätzen, dass die vorgegebene Antwort in zB 95 von 100 Fällen als ziemlich wichtig (=3) eingeschätzt wird" hat auch nicht sehr viel mit einem Konfidenzintervall für einen Mittelwert zu tun.

Beitrag von **kng** » 14.05.2011, 14:41

ZITAT:
"Deine Beschreibung "kann ich bei einer unteren Intervallgrenze von 3 oder größer einschätzen, dass die vorgegebene Antwort in zB 95 von 100 Fällen als ziemlich wichtig (=3) eingeschätzt wird" hat auch nicht sehr viel mit einem Konfidenzintervall für einen Mittelwert zu tun."

Da muss ich dann doch nochmal nachfragen:

Lassen wir mal mein genanntes Beispiel so stehen. Ich habe noch eine zweite Befragung mit 50 Rückläufen ausgewertet. Darin 3 Fragen mit jeweils 10 - 15 Variablen, die mit einer 4 stufigen Skala beantwortet werden können. Wenn ich dabei die sehr kleinen Standardfehler des Mittelwerts sehe und entsprechend die " recht geringe Spannweite " der Konfidenzintervalle der Mittelwerte, warum kann ich dann nicht sagen, dass der wirkliche Mittelwert in dem ermittelten Bereich um den geschätzten liegt und wenn die untere Grenze des Bereiches größer als 3 ist, wird das mindestens als ziemlich wichtig eingeschätzt?