Zuschauerzahlen-Hypothese mit McNemar-Test?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
albrecan
Beiträge: 3
Registriert: 14.06.2012, 10:43

Zuschauerzahlen-Hypothese mit McNemar-Test?

Beitrag von albrecan »

Hallo zusammen!

Ich habe eine Hypothese in der es um die Veränderung des weiblichen Zuschaueranteils nach dem Aufstieg einer Mannschaft im Stadion geht.

Mir liegen die durchschnittlichen Zuschauerzahlen aus der Saison 2010/2011 und aus der Saison 2011/2012 sowie unterteilt in männlicher und weiblicher Anteil vor.

Jetzt möchte ich überprüfen, ob es eine Veränderung gab nach dem Aufstieg, sprich ob der weibliche Anteil im Stadion höher geworden ist.

Ich denke hier ist ein McNemar Test zu wählen, da ich eine abhängige Stichprobe habe und zwei mal teste.

Ich habe jedoch Probleme damit mir die 4-Felder Tafel anhand dieser Hypothese aufzustellen.

Saison 2010/2011
Gesamt: 20.481
davon weibl: 3.299
das sind 16%

Saison 2011/2012
Gesamt: 30.206
davon weibl.: 6.947
das sind 23%

Ich werde wohl den männlichen Teil als eine Situation und den weiblichen als die zweite Situation darstellen müssen oder?

Im Anschluss möchte ich dies gerne mit SPSS Auswerten lassen.
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Geht es um nur 2 Spiele oder sind das Durchschnittsangaben aus allen
Spielen? Falls 2 Spiele: wie willst Du dann einen abhängigen Test
rechnen, wenn Du die Beobachtungen nicht zuordnen kannst? Zum
Beispiel werden nicht alle Frauen aus 2010/11 auch in 2011/12
aufgetaucht sein. Aber bei wie vielen das Muster 2010/11 "ja" 2011/12
"nein" aufgetreten ist, ist unbekannt.

Wären die Zahlen Durchschnittsangaben, dann müssten Daten
für die einzelnen Spiele dem zugrunde liegen, in dem Fall könntest
Du die Frauenanteile der n=17 Heimspiele 2010/11 mit n=17
Heimspielen 2011/12 vergleichen. Bzw. n=16 versus n=16, das
Spiel gegen den Mitaufsteiger wäre evtl. gesondert zu sehen.


An sich ist die Suche nach einer Inferenzstatistik aber etwas seltsam.
Bei solchen Fallzahlen ist der Schätzfehler derartig klein, dass man
getrost die Zahlen interpretieren kann, so wie sie vorliegen.
albrecan
Beiträge: 3
Registriert: 14.06.2012, 10:43

Beitrag von albrecan »

Ich habe auch die einzelnen weiblichen Zuschauerzahlen der 17 Heimspieltage vorliegen. Klar, man sieht, dass es nach dem Aufstieg mehr Frauen sind.

Ich muss es jedoch statistisch auswerten. Ist es dann ein normaler Chi²-Test, bei dem ich die Häufigkeiten der beiden Saisons vergleiche? Wobei ich hiermit ja eigentlich nur nach Verhältnissen fragen kann...
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Wenn wieder dieser Unsinn regiert, dass "statistisch" bedeutet, alles
mit einem Signifikanztest zu traktieren, was nicht bei 3 auf den Bäumen
ist, dann nimm doch tatsächlich die 16 + 16 Einzelspiele und mach zu den
% Frauen als AV einen U-Test, mit Gruppierungsfaktor 2010/11 versus
2011/12.
albrecan
Beiträge: 3
Registriert: 14.06.2012, 10:43

Beitrag von albrecan »

Uni halt.... :)

Was meinst du mit AV?
Ich benötige eine Variante mit Häufigkeiten.
Mittelwerte habe ich bereits in zwei anderen Hypothesen.
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

AV ist abhängige Variable.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Der McNemar Test wäre hier wohl nicht richtig. Dazu müsstest du jeden Fall zweimal zurodnen können, so dass eine 4-Felder Tafel entsteht. Und das ist hier nicht der Fall.
Saison 2010/2011
Gesamt: 20.481
davon weibl: 3.299
das sind 16%

Saison 2011/2012
Gesamt: 30.206
davon weibl.: 6.947
das sind 23%
Was du machen könntest, wäre zu prüfen, ob der Anteil 16% aus 2010/11 und 23% aus 2011/12 aus der gleichen 'Grundgesamtheit' entstammt und die Unterschiede nur auf Zufallsschwankungen gründen.

-> Binomialtest, ggf. dann den Chi-Quadrat Test

Hier die Lösung (Hypothese des Chi-Quadrat Test zielt auf die Unabhängigkeit von Saison und Geschlecht)


Syntax:

Code: Alles auswählen

DATA LIST list 
/saison geschl N.
BEGIN DATA.
2010 1 17182
2010 2 3299
2011 1 23259
2011 2 6947.
END DATA.
EXECUTE.

WEIGHT by N.

CROSSTABS
  /TABLES=saison BY geschl
  /FORMAT=AVALUE TABLES
  /STATISTICS=CHISQ 
  /CELLS=COUNT ROW 
  /COUNT ROUND CELL.

Ergebnis:

Code: Alles auswählen

Chi-Square Tests					
	Value	df	Asymp. Sig. (2-sided)	Exact Sig. (2-sided)	Exact Sig. (1-sided)
Pearson Chi-Square	359.373a	1	.000		
Continuity Correctionb	358.946	1	.000		
Likelihood Ratio	366.928	1	.000		
Fisher's Exact Test				.000	.000
Linear-by-Linear Association	359.366	1	.000		
N of Valid Cases	50687				
a 0 cells (0.0%) have expected count less than 5. The minimum expected count is 4140.08.					
b Computed only for a 2x2 table					

Mit p<0,01 kann die Nullhypothese (gemeinsame Dichte gleich dem Produkt der Randdichten) verworfen werden. Mit anderen Worten, der Anteil der Frauen hat auch stat. sig. zugenommen.

(Bei derart großen Stichproben reicht allerdings -wie Generalist das ja auch schon geschrieben hat- der bloße prozentuale Anteil).
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten