Binomialverteilung: Type II Fehler

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
mikewochner
Beiträge: 7
Registriert: 26.05.2011, 13:59

Binomialverteilung: Type II Fehler

Beitrag von mikewochner »

Hallo zusammen

Mit der kumulativen Binomialverteilung lässt sich der type I Fehler berechnen. D.h. dass die Null hypothese verwirft wenn sie richtig ist:

Pr(Reject H0 | H0 is valid) = Pr(X > x | p) = cdf of binomial

Ich wundere mich, ob es irgendwie möglich ist, den type II Fehler zu berechnen, wenn die Verteilung Binomial ist. Also:

Pr(Accept H0 | H0 is not valid) oder Pr(X < x | not p)

Wie würde das gehen, wenn überhaupt?

Die Frage entsteht im Kontext meiner Arbeit für eine Bank. Der type I Fehler beschreibt den Zustand, wo wir den Mitarbeiter als Risiko erklären, obwohl er keines ist. Das ist zwar nicht schön für den Mitarbeiter, der Type II Fehler ist aber viel wichtiger. Nähmlich, wir erklären den Mitarbeiter nicht als Risiko, obwohl er eines ist.

Die Basis sind eine Anzahl Messungen. Wenn mehr als eine gewisse Anzahl davon mangelhaft sind, wird der Mitarbeiter als Risiko eingestuft. Die Messungen sind alle gleich.

Würde mich über Hilfe oder Literaturhinweise freuen. Habe mit Google nichts gefunden..

Beste Grüsse

Mike
not everything that can be counted counts, and not everything that counts can be counted
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Wie würde das gehen, wenn überhaupt?

Das wird z.B. mit G* Power berechnet. Einzelne Verfahren, wie die Diskriminanzanalyse oder CHAID berechnen die Anteile RP, FP, RN und FN - Klassifikationen. Diese sind allerdings nur als Testeigenschaft zu interpretieren und keinesfalls als Testergebnis. Letzteres hängt noch von der Prävalenz des Merkmals ab.

Gruß

PS Und ich dachte immer, die Banken seien das Risiko erster Ordnung.
drfg2008
mikewochner
Beiträge: 7
Registriert: 26.05.2011, 13:59

Beitrag von mikewochner »

Ich weiss nicht genau, ob mir dies weiterhilft. Eine CART analyse bringt mir auf jedenfall nichts. Auch eine klassische Powerberechnung bringt mich nicht weiter, da ich keine Effektgrösse habe.

Ich suche nach einer mathematischen Umformulierung der Binomialverteilung.

Ich denke aber, dass die nicht möglich ist, weil ich not p als kondition nicht über die Binomialverteilung herleiten kann. Oder kann man?
not everything that can be counted counts, and not everything that counts can be counted
mikewochner
Beiträge: 7
Registriert: 26.05.2011, 13:59

Beitrag von mikewochner »

Ich habe eben keine Gruppen, die ich vergleichen will, sondern jedes Individuum selbst.

Wenn der Mitarbeiter z.B. 12 Messungen hat (11 davon gut sind und eine magelhaft) und wir annehmen, dass bis 10% mangelhafte Messungen ok sind, wie gross ist mein Risiko, dass ich ihn als kein Risiko einstufe, obwohl er eines ist (also in wirklichkeit eine disposition von mehr als 10% hat, welche ich aber nicht direkt Messen kann).

Geht das irgendwie?

Danke & Gruss
not everything that can be counted counts, and not everything that counts can be counted
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Auch eine klassische Powerberechnung bringt mich nicht weiter, da ich keine Effektgrösse habe.
Du kannst Effektgrößen doch simulieren. Also anhand der Frage, wie sieht in der Grundgesamtheit ein kleiner/mittlerer/großer Unterschied zwischen den Fehlerraten eines guten und eines nicht guten Mitarbeiters aus.
mikewochner
Beiträge: 7
Registriert: 26.05.2011, 13:59

Beitrag von mikewochner »

das ist weniger mein Problem. Ich möchte es auf Stufe des einzelnen Mitarbeiter wissen.

Vielleicht hilft die Annahme, dass meine Bank nur einen Mitarbeiter hat, weiter. Wie würde ich diesen einzelen Mitarbeiter bewerten und welche Fehler kann ich dabei machen, wenn meine Messungen binomial verteilt sind?

Danke & Grüsse
mike
not everything that can be counted counts, and not everything that counts can be counted
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

das ist weniger mein Problem. Ich möchte es auf Stufe des einzelnen Mitarbeiter wissen.
Nichts anderes war gesagt.

Es ging um "der Mitarbeiter ist ein Risiko/ist kein Risiko". Das wird entschieden anhand einer Reihe von n Messungen. A priori braucht es eine Festlegung, wie hoch die Fehlerquote in der Grundgesamtheit der Messungen eines Risiko-Mitarbeiters (aus denen die realisierten n Messungen dann eine Stichprobe darstellen) mindestens ist im Vergleich zur Fehlerquote eines nicht-Risiko-Mitarbeiters. Ohne das geht es nicht.

Was Du vielleicht tatsächlich brauchst, ist -> Bayes Statistik.
mikewochner
Beiträge: 7
Registriert: 26.05.2011, 13:59

Beitrag von mikewochner »

Wenn ich Mitarbeiter vergleiche geht das. Dann kann ich eine Gruppe mit schlecht klassierten bilden und deren Durschnittswert mit denen der gut klassierten vergeichen.

Wenn ich aber einen Mitarbeiter nehme, kann ich eine Gruppe mit guten Messungen und eine Gruppe mit schlechten Messungen bilden. Hier kann ich dann aber nur zählen, wie viele er hat.

Oder wo ist hier die Effektgrösse?
not everything that can be counted counts, and not everything that counts can be counted
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten