Problem mit Stichprobenfehler

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
integral
Beiträge: 9
Registriert: 05.01.2008, 22:14

Problem mit Stichprobenfehler

Beitrag von integral »

Hallo zusammen!

Ich habe folgendes Problem und hoffe, es kann mir jemand weiterhelfen:

In einem Land leben 1 Mio Einwohner, die man in einem repräsentativen Sample befragen möchte, ob sie
schon einmal Opfer eines bestimmten Verbrechens geworden sind.
Der Stichprobenfehler soll +/- 2% betragen. Die notwendige Stichprobengrösse berechnet sich dann
nach der Formel 1/Stichprobenfehler^2 und beträgt rund 2'500 Personen (p=0.5).

Es stellt sich heraus, dass 5% der Befragten im letzten Jahr Opfer des Verbrechens wurden, was 125
Opfern entspricht. Nun hätte man gerne gewusst, welcher Anteil der Opfer (und nicht der Bevölkerung!) weiblich ist. Welches ist nun
aber der Stichprobenfehler, wenn man eine Aussage darüber machen will, welcher Anteil der Opfer
weiblich ist?


Welche "Lösung" stimmt?
a) Der Stpfehler beträgt ebenfalls 8%
b) Es wurde aus allen 50'000 Opfern (5% von 1 Mio. EW) eine Zufallsstichprobe im Umfang von 125 Opfern (Opfer im Sample)
gezogen, daher ist der Stichprobenfehler grösser als 8%

:roll: Für Erklärungen bin ich sehr dankbar! Es geht darum, ob der Stichprobenfehler dann für alle "Untergruppen" gleich bleibt oder ob man da quasi jedesmal eine neue Stichprobe zieht und sich die betrachtete "Grundgesamtheit" ändert.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Nun hätte man gerne gewusst, welcher Anteil der Opfer (und nicht der Bevölkerung!) weiblich ist
Liebes Integral,

möchtest du wissen, wieviel Opfer sich hier finden, deine Seminararbeiten zu erklären, dann wäre ich auch mal gespannt ;-)

Sicherlich gibt es andere Möglichkeiten, deine Seminaraufgaben zu lösen (zu lassen ?), z.B. könnte man ja mal den Tutor fragen, oder im Tutorium nach Arbeitsgruppen Ausschau halten. Und seit Gutti wissen wir doch, wie sensibel die wissenschaftliche Welt auf die Plagges & Co. reagieren. Gell?
drfg2008
integral
Beiträge: 9
Registriert: 05.01.2008, 22:14

Beitrag von integral »

Ich weiss ehrlich gesagt nicht, was deine Antwort soll!?
Erstens bin ich kein Student mehr (ich brauche also keine Seminararbeiten schreiben) und zweitens hilft so eine Antwort niemandem weiter. Dass ich auch jemanden ausserhalb dieses Forums fragen könnte, weiss ich selbst. Aber wozu dient das Forum denn? Es handelt sich um ein gross angelegtes Forschungsprojekt bei dem wir wissen müssten, wieviele Personen befragt werden sollen. Meine Frage ist hier nur ein Teilaspekt von vielen weiteren Dingen, die berücksichtigt werden müssen (z.B. die der Altersverteilung der Bevölkerung)

Falls also jemand eine Antwort geben kann, wäre ich froh. Dass mein Beispiel etwas wie aus einem Lehrbuch tönt, hat damit zu tun, dass ich nicht konkret sagen möchte, um welches Land un um welche Fragestellung es sich genau handelt.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

gross angelegtes Forschungsprojekt

Beitrag von drfg2008 »

liebes Integral,

ein gross angelegtes Forschungsprojekt, dass gleich die Lösungen in a) und b) unterteilt?

Welche "Lösung" stimmt?
a) Der Stpfehler beträgt ebenfalls 8%
b) Es wurde aus allen 50'000 Opfern (5% von 1 Mio. EW) eine Zufallsstichprobe im Umfang von 125 Opfern (Opfer im Sample)
gezogen, daher ist der Stichprobenfehler grösser als 8%
Gruß
drfg2008
integral
Beiträge: 9
Registriert: 05.01.2008, 22:14

Re: gross angelegtes Forschungsprojekt

Beitrag von integral »

drfg2008 hat geschrieben:liebes Integral,

ein gross angelegtes Forschungsprojekt, dass gleich die Lösungen in a) und b) unterteilt?

Welche "Lösung" stimmt?
a) Der Stpfehler beträgt ebenfalls 8%
b) Es wurde aus allen 50'000 Opfern (5% von 1 Mio. EW) eine Zufallsstichprobe im Umfang von 125 Opfern (Opfer im Sample)
gezogen, daher ist der Stichprobenfehler grösser als 8%
Gruß
Wenn du dich daran störst, dass ich es in a) und b) unterteilt habe, dann also für dich die Extra-Frage:

- Muss man dann bei der Subgruppe der Opfer den Stichprobenfehler erneut berechnen, diesmal aber bei einer anderen Grundgesamtheit (Täter anstatt Bevölkerung) oder gilt das als ein und dieselbe Stichprobe?

Oder anders gefragt: Kann/muss man das als erneute Stichprobenziehung betrachten, das angesichts der kleineren Stichprobengrösse zu einem schlechteren Stichprobenfehler führt?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Das Problem liegt schon in der Formulierung der Ausgangsfrage:
Die notwendige Stichprobengrösse berechnet sich dann
nach der Formel 1/Stichprobenfehler^2 und beträgt rund 2'500 Personen (p=0.5).
Nein. Bei p=0,5 ist die Varianz von binomial verteilten ZV, nämlich npq, maximal. Hier wird also von einem maximalen Wert ausgegangen und eben nicht, wie im Text, vom "notwendigen" Stichprobenumfang. Im übrigen spricht man auch vom 'optimalen' Stichprobenumfang. Außerdem: Wofür "notwendig"? Typischer Klausurtext eben, weil man in der Klausur den Studis eben kein SamplePower oder G*Power Programm zur Verfügung stellen kann und alle anderen Formeln zu kompliziert sind.

Zweites Problem:
a) Der Stpfehler beträgt ebenfalls 8%
Wieso 'ebenfalls'. Wo sind denn sonst 8% angegeben worden?

Zur Berechnung von optimalen Stichprobenumfängen beim Test über Parameter p einer Binomialverteilung siehe bspw. Bortz (1993, S.120 ff), oder Hartung (1999, S. 206ff)

Berechnungen über: G*Power


Gruß

P.S. Ein Kollege hätte über meine Reaktion eher gelacht.

P.S. Ich tendiere eher zu b) Längere Sätze erscheinen mir immer plausibler. So würde ich das auch in der Klausur machen. ;-) Und so gewinnen die Japaner bei PISA.
drfg2008
integral
Beiträge: 9
Registriert: 05.01.2008, 22:14

Re: re

Beitrag von integral »

Also danke erstmal für deine Antwort, ich glaube allerdings, dass du mein Problem nicht verstanden hast (jedenfalls kann ich darauf keine Antwort erkennen) :-)

Ich habe mich an folgender Formel von Cochran (1963) orientiert
http://www.reduts.net/stichprobengroesse.gif

Bei p=0,5, N=100'000, KI= +/- 3% sagt die mir, dass ich eine Stichprobe von 2393 Personen benötige (optimale Stichprobengrösse).

Wenn ich dann herausfinde, dass von diesen 2393 Personen 5% das gesuchte Merkmal aufweisen, dann liegt der wahre Wert in der Population doch mit 95%iger Wahrscheinlichkeit zwischen 5 +/- 1.96*wurzel(p*q/n) Prozent?

Das ergibt:
0.05 + 1.96*wurzel(0.05*0.95/2393)=0.58
0.05 - 1.96*wurzel(0.05*0.95/2393)=0.41


Was ist nun aber der Stichprobenfehler, wenn mich nicht die Merkmale "erster Ordnung" interessieren, die sich auf die Population beziehen, sondern Merkmale, die sich auf Subgruppen davon (hier: die 5% Täter) beziehen? Wenn ich also z.B. sehe, dass von den 120 Tätern in meiner Stichprobe (5% von der Stichprobe) z.B. 30 weiblich sind. Wie gross ist da der Fehler, den ich dadurch mache, dass ich nicht alle Täter kenne?

Bei einem Viertel Frauen unter den 120 Tätern könnte man ja rechnen:
0.25 + 1.93*wurzel(0.25*0.75/120)=0.327475803
0.25 - 1.93*wurzel(0.25*0.75/120)=0.172524197

Der Anteil würde also zwischen 17 und 33 Prozent liegen. Ist das so richtig?

Sorry, falls ich mich kompliziert ausgedrückt habe :shock:
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ja, Cochran ist immer gut. Und tatsächlich reden wir aneinander vorbei.

Dein letzter Text ist nicht ganz kompatibel mit dem ersten. Das verwirrt jemanden, der ja nicht die gesamten Hintergrundinformationen hat.
Bei p=0,5, N=100'000, KI= +/- 3% sagt die mir, dass ich eine Stichprobe von 2393 Personen benötige (optimale Stichprobengrösse).
Frage wozu? Einen bestimmten -optimalen- Stichprobenumfang benötigt man um eine Effektgröße abzusichern. Die sehe ich allerdings nicht in der Fragestellung zu a) oder b). Außerdem kann das nicht p=0,5 sein. Denn das bezieht sich doch, wenn ich das richtig verstanden habe, auf den Anteil derjenigen, die "Opfer eines bestimmten Verbrechens geworden sind". Und das sind laut Text (Gott sei Dank) nur 5% also p=0,05. Und der Stichprobenfehler wird im ersten Text mit +/- 2% angegeben und im letzten als KI nun mit 3%. Und im ersten Text geht man von einer Grundgesamtheit von 1Mio aus, im letzten von 100.000. Und der eine Text handelt von Opfern, der zweite von Tätern. Nur nebenbei. Ein wenig mehr Konsistenz in den Daten wäre zielführend.

Das KI gibt - ja klar - an, mit welcher Wahrscheinlichkeit der 'wahre Wert' im Bereich des Schätzers +- Intervall liegt.

Nun ist es aber so, dass bei einem p=0,05 (!) die Formeln für die Berechnung des KI etwas komplexer sind (vergleiche Wiki – Artikel [1]). Also nicht so, wie bei dir angegeben. In dem Artikel findet sich auch ein konkretes Rechenbeispiel. Die einfache Approximation durch die Normalverteilung, wie in deinem Beispiel, liegt oft unter dem geforderten Niveau von 0.95. Die Schätzung des Anteilswerts wäre also nicht sehr genau.
Wenn ich also z.B. sehe, dass von den 120 Tätern in meiner Stichprobe (5% von der Stichprobe) z.B. 30 weiblich sind. Wie gross ist da der Fehler, den ich dadurch mache, dass ich nicht alle Täter kenne?
Das müsstest du dann über jede Subgruppe einzeln berechnen. Zur Verfügung stehen, als exaktere Verfahren bei geringeren Substichprobengrößen: Clopper-Pearson, Wilson oder Agresti-Coull. Vor- und Nachteile, siehe Artikel.


[1]
http://de.wikipedia.org/wiki/Konfidenzi ... verteilung
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten