Hallo,
ich bräuchte etwas Interpretationshilfe für einen Einsatz des Bendfordgesetzes zur Ziffernverteilung als Vergleichshilfe, da ich mir nicht sicher bin, ob ich das Ding korrekt eingesetzt habe.
Beim Datensatz handelt es sich um die Rohdaten zur Bundestagswahl, aber nicht denen aus jedem Wahllokal, sondern dem aggregierten Ergebnis für Deutschland, sowie den Ergebnissen der 17 Bundesländer zusammengeballt in einem Datensatz.
Gezählt habe ich die Zahlen aller gültigen Stimmen, jeweils für die Erst- und Zweitstimme.
Frage1: Ist das ok? Sind Ziffern der Aggregate von natürlichen Zufallszahlenverteilungen auch wieder bendfordverteilt, oder folgen sie einer anderen (natürlichen) Verteilung?
Vorbemerkung zum Zahlensalat:
Einzelne (Prozent-)Zahlen sind gerundet, ausserdem ist es trotz Sorgfalt beim aufbereiten möglich, dass da Fehler drin sind, dh alle Angaben ohne Gewär!
Bei der Erststimme kam folgendes heraus:
Zahl Anzahl Anteil Bendford
1 68 0.26 0.30
2 60 0.23 0.18 <-33%
3 37 0.14 0.12
4 21 0.08 0.10
5 21 0.08 0.08 <-3%
6 18 0.07 0.07 <-5%
7 7 0.03 0.06 <-53%
8 12 0.05 0.05
9 13 0.05 0.05
257
Gerade mal 2 Zahlen weichen um 5% und weniger vom Soll ab, 2 Zahlen haben eine Abweichung von 33% und darüber. Die mittlere Abweichung von der Bendfordverteilung beträgt 17%.
Frage2: Liegt die Abweichung bei 257 Inputzahlen noch im Rahmen, oder ist das schon (zu) viel, als dass es mit normalem Zufall erklärbar ist?
Frage3: Falls Frage2=nein ist, kann es am Wahlmodus liegen? Die Regelung zur Erststimme ist leicht wurschtelig, kann das die Verteilung beeinflussen, ohne dass jemand Hand anlegt?
Bei der Zweitstimme kam folgendes heraus:
Zahl Anzahl Anteil Bendford
1 71 0.27 0.30
2 48 0.18 0.18 <- 2%
3 47 0.18 0.12 <- 42%
4 20 0.08 0.10
5 26 0.10 0.08
6 17 0.06 0.07 <- 4%
7 14 0.05 0.06
8 9 0.03 0.05 <- 34%
9 13 0.05 0.05
265
Auch hier liegen 2 Zahlen um 5% oder weniger daneben, 2 Zahlen liegen deutlich über 33%. Wie bei der Erststimme beträgt die mittlere Abweichung 17%.
Frage4: Die mittlere Abweichung beider Stimmenaggregate beträgt 17%, deutet das darauf hin, dass bei beiden Stimmen gleich viel schief lief/schief gelaufen wurde?
Danke schonmal fürs helfen,
Gruss!
PS: der selbe Beitrag steht auch schon woanders, leider ohne Antwort..