Mittelwert signifikant mit durchschnittlichem Mittelwert

Beitrag von **bruggeni** » 19.10.2011, 16:37

Liebe SPSS-Checker,

bei meiner Diplomarbeit komme ich an folgender Stelle nicht weiter.
Ich vergleiche die Anzahl der Kommentare auf Facebook (numerisch) mit Nachrichtenfaktoren (14 Ausprägungen). Meine Daten sind nicht normalverteilt. Deshalb dürfte ich ja eigentlich keinen Anova-Test machen. Dennoch liefert er mir wichtige Erkenntnisse über die verschiedenen Mittwelwerte. Jetzt habe ich zwei Fälle bei denen ich Hilfe brauche.

1. Fall:
Nachrichtenfaktor "Reichweite" "trifft zu" 13 (Kommentare) Mittelwert: 148,92
"trifft nicht zu" 587 (Kommentare) - Mittelwert: 50,45

- Mittelwert der Kommentare von allen 600 Postings ist 52,88.

Es ist also offensichtlich, dass wenn Reichweite zutrifft die Zahl der Kommentare deutlich höher ist. Aber ist dieser Wert auch signifikant, da die geringe Häufigkeit ja auch auf Zufall schließen lassen könnte. (bezogen auf meine 600 Postings nicht auf eine allgemeine grundgesamtheit wie beim T-Test)

Dafür habe ich den Oneway-Anova-Test gemacht. Er gibt mir eine Signifikanz von 0,000 aus. Soweit so gut, nur darf ich eigentlich diesen Test nicht machen (keine Normalverteilung). Der Mann-Whitney test gibt jedoch nur Rangzahlen an die viel höher sind als die Anzahl der Kommentare.
Was also kann ich tun um folgende Hypothese überprüfen zu können: "Wenn Reichweite zu trifft, steigert sich die Anzahl der Kommentare signifikant."

2. Fall
Wieder sollen Nachrichtenfaktoren mit Kommentaren vergleichen werden.
Dieses Mal geht es um den wichtigsten Nachrichtenfaktor. Ich habe also zwei Variablen.
1. Anzahl der Kommentare (numerisch)
2. Name des Nachrichtenfaktors (14 Ausprägungen)

Wieder kann ich mir die Häufigkeiten und Mittelwerte zu den einzelnen Ausprägungen von Variable 2 durch einen Mittwelwertsvergleich ausgeben lassen. Bsp.
Reichweite, Häufigkeit: 12 (von 600), Mittelwert der Kommentare: 90
Der Mittelwert Kommentare von allen 600 Postings liegt bei 52,92

Hypothese: "Wenn Reichweite der wichtigste Nachrichtenfaktor war, stieg die Anazhl der Kommentare signifikant."

An der Uni konnte diese beiden Fälle niemand lösen. Ich hoffe auf die Weisheit der Vielen! Tausend Dank schon jetzt!

Beitrag von **Generalist** » 19.10.2011, 21:30

Liebe SPSS-Checker,

Das ist wohl irrelevant, da Du keine Fragen zur Software SPSS stellst, sondern es um statistische Probleme geht.

Ich vergleiche die Anzahl der Kommentare auf Facebook (numerisch) mit Nachrichtenfaktoren (14 Ausprägungen).

Das ist leider nicht nachvollziehbar. Normalerweise ist es nützlich, wenn Fragestellung, Erhebungsdesign, Stichprobengröße und Art der Messungen erläutert werden.

Meine Daten sind nicht normalverteilt. Deshalb dürfte ich ja eigentlich keinen Anova-Test machen.

Normalverteilte Daten sind für eine ANOVA nicht erforderlich. Allenfalls normalverteilte Residuen. Und auch die nur bei kleineren Stichproben. Wichtiger ist meistens Varianhomogenität (im Fall ungleich großer Gruppen). Ob überhaupt ein Fall für eine ANOVA bzw. alternativ einen H-Test vorliegt, ist wegen fehlender Studienbeschreibung nicht zu sagen.

1. Fall:
Nachrichtenfaktor "Reichweite" "trifft zu" 13 (Kommentare) Mittelwert: 148,92
"trifft nicht zu" 587 (Kommentare) - Mittelwert: 50,45

Leider nicht zu verstehen, s.o.

Beitrag von **bruggeni** » 20.10.2011, 15:07

Lieber Generlaist,
danke für deine schnelle Antwort. Dann werd ich mal mein Projekt näher beschreiben:

Ich habe insgesamt 600 Facebookpostings von verschiedenen Radiosendern untersucht. Dabei habe ich die Anzahl der Kommentare die jedes Posting verursacht numerisch codiert. Außerdem habe ich codiert ob verschiedene Nachrichtenfaktoren in den Postings zutreffen. Die Faktoren habe ich als einzelne Variablen codiert. (0=trifft nicht zu, 1= trifft zu)
Über einen Mittelwertevergleich (Kommentare/ Nachrichtenfaktor) sehe ich nun ob bsp. beim Faktor "Reichweite" eine durchschnittlich höhere Anzahl der Kommentare vorliegt wenn er mit "1=trifft zu" codiert wurde als wenn er mit "0=trifft nicht zu" codiert wurde.

Konkret am Beispiel Reichweite:
"Trifft zu" ------- Fälle: 13 ---Mittelwert 140
"Trifft nicht zu"--Fälle: 587 -- Mittelwert 50

Fälle Geamt: 600 ---- Mittelwert 52

Wo ich nicht weiterkomme (Problem 1): Wie kann ich untersuchen ob dieser höhere Mittelwert nun einen signifikanten Unterschied zum Mittelwert der Kommentare aller 600 Postings darstellt? Bzw. im Vergleich zu den Fällen wo "0=trifft nicht zu" codiert wurde?

2. Problem
In einer weiteren Variable "Wichtigster Nachrichtenfaktor" habe ich 14 Ausprägungen (Nachrichtenfaktoren). Auch hier kann ich mir die Mittelwerte der Kommentare je Posting für jeden Nachrichtenfaktor ausgeben lassen. Durch die Betrachtung stelle ich fest, dass bei manchen Nachrichtenfaktoren die Anzahl der durchschnittlichen Kommentare deutlich steigt. Auch hier möchte ich wissen, wie ich testen kann ob dieser Anstieg signifikant ist.

Die Verteilung meiner Daten habe ich dem Kolmogorov-Smirnov-Test unterzogen. Dabei kam raus, dass sie zu nahezu 100% Wahrscheinlichkeit nicht normalverteilt sind. Leider weiß ich mit dem Begriff der Residuen nichts anzufangen. Die Varianzhomogenität war bei manchen Faktoren im Anova-Test 0,000.

ich hoffe ich habe mein Problem dieses Mal besser beschrieben und freue mich sehr, wenn mir jemand dabei helfen kann.

Liebe Grüße

Beitrag von **Generalist** » 21.10.2011, 09:16

Wie kann ich untersuchen ob dieser höhere Mittelwert nun einen signifikanten Unterschied zum Mittelwert der Kommentare aller 600 Postings darstellt? Bzw. im Vergleich zu den Fällen wo "0=trifft nicht zu" codiert wurde?

Sinn ergibt nur ein Vergleich ja versus nein. Am einfachsten mit einem U-Test, der hängt nicht von vielen Voraussetzungen ab. Alternativ t-Test, der wiederum hängt von einigen Voraussetzungen ab.

Allerdings besteht das Problem, dass die 600 Beiträge nicht unabhängig voneinander sind, sondern Radiosender-weise zusammengehören. Streng genommen wäre also eine 2-faktorielle Varanzanalyse erforderlich mit "Merkmal vohanden ja/nein" und "Radiosender" als den beiden Einflussfaktoren auf die Antwortfrequenzen. So, wie die Daten in Deinem Beispiel aussehen, wird das aber wohl leider nicht gehen. Wenn man die 13 "Trifft zu"-Beiträge nochmals aufteilt nach Radiosendern, wird das zu kleinteilig.

In einer weiteren Variable "Wichtigster Nachrichtenfaktor" habe ich 14 Ausprägungen (Nachrichtenfaktoren).

Scheint eine einfaktorielle Varianzanalyse zu sein. Am einfachsten ein Kruskal-Wallis H-Test, der erfordert nicht so viele Voraussetzungen wie die oneway-ANOVA.

Statistik-Tutorial Forum

Mittelwert signifikant mit durchschnittlichem Mittelwert

Mittelwert signifikant mit durchschnittlichem Mittelwert

Re: Mittelwert signifikant mit durchschnittlichem Mittelwert

Signifikanz Mittelwert vergleichen

Re: Signifikanz Mittelwert vergleichen