Test auf Signiikanz des Trends/der Regressionsgerade

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Sara_C
Beiträge: 3
Registriert: 27.04.2010, 08:21

Test auf Signiikanz des Trends/der Regressionsgerade

Beitrag von Sara_C »

Guten Morgen zusammen.

Ich hätte, wie man vermuten kann, eine kurze oder mit etwas Pech auch längere Frage in Sachen Statistik und Signifikanz.

Im Moment bin ich gerade dabei ein paar Ergebnisse für meine Bakk auszuarbeiten und darunter auch die Todesfälle durch Blitzschlag/Jahr. Nun sehe ich in meiner Messwolke einen ansteigenden Trend mit den Jahren und wollte den statistisch überprüfen. Hierfür hätte ich mir gedacht ich arbeite mit dem klassischen Signifikanzniveau von 5 %
Nun zu meiner Frage, wie komme ich am „abgesichertsten“ dort hin?

Mein Momentaner Ansatz wäre, dass ich meine erhaltenen Todesfälle mittels Chi-Quadrat-Test mit der Regressionsgerade vergleiche. Sozusagen:
Messwert = Todeszahlen/Jahr
Erwarteter Wert = (Steigung x Jahreszahl + Achsenabschnitt).
Meine H0 sagt somit aus, es besteht kein Zusammenhang, und meine H1 sagt, es besteht einer.

Um alle Statistiker aufstöhnen zu lassen muss ich auch noch anmerken, dass ich recht gerne in Excel bleiben möchte. SPSS ist zwar ein recht mächtiges Programm, aber der Syntax ist mir ein wenig verwirrend und Demoversionen steh ich immer etwas skeptisch gegenüber.

Im Moment würde ich auf p= 0,9907 kommen, was so viel bedeutet wie, der erhaltenen Trend ist signifikant. Theoretisch sogar sehr signifikant, wenn ich Alpha = 0,01 gewählt hätte, aber das im Nachhinein zu ändern wäre schummeln.

Kann man so in etwa argumentieren, oder bin ich hier völlig auf dem statistischen Holzweg?
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Re: Test auf Signiikanz des Trends/der Regressionsgerade

Beitrag von Generalist »

Nun sehe ich in meiner Messwolke einen ansteigenden Trend mit den Jahren und wollte den statistisch überprüfen. Hierfür hätte ich mir gedacht ich arbeite mit dem klassischen Signifikanzniveau von 5 %
Wenn Du ohne vorher formulierte Hypothese einen Datensatz nach Auffälligkeiten absuchst und dann die (zwangsläufig fast immer auftretenden) Auffälligkeiten dann einem inferenzstatistischen Test unterwirfst, liefert der Test unbrauchbare p-Werte.

Aber das nur am Rande.

Wenn der Trend linear ist, kannst Du eine Korrelation oder eine Regression zwischen Jahr und Todesfallzahl überlegen. Wenn es ein nicht linearer Trend ist, eine Spearman-Rangkorelation.
Mein Momentaner Ansatz wäre, dass ich meine erhaltenen Todesfälle mittels Chi-Quadrat-Test mit der Regressionsgerade vergleiche.
Wieso denn das? Die Regressionsgerade repräsentiert doch bereits den Trend.
Im Moment würde ich auf p= 0,9907 kommen, was so viel bedeutet wie, der erhaltenen Trend ist signifikant.
p=0,99 bedeutet, eine Nullhypothese ist beizubehalten. Ein nicht-signifikantes Resultat. Die angestellte Berechnung habe ich leider nicht verstanden.
Sara_C
Beiträge: 3
Registriert: 27.04.2010, 08:21

Beitrag von Sara_C »

Danke für die Antwort.

Also die vorformulierte These war, dass es immer gleich viel (aufgezeichnete) Todesfälle pro Jahr gibt, doch habe ich nun einen scheinbaren Anstieg bemerkt und wollte überprüfen ob dieser irgendwie zu verwerten ist.

Ich bezweifle dass der Trend Linear ist, aber es scheint wesentlich wahrscheinlicher, dass die Todesfälle steigen (vielleicht auch nur die Bereitschaft der Menschen selbiges zu melden, oder die Leute die vom Blitz getroffen werden, melden es weniger oft, wodurch die prozentuele Anzahl der Tode steigt, Interpretation wird dann noch interessant), als dass sie normal verteilt über die Jahre immer gleich bleiben. Das versuche ich irgendwie herauszufinden, nur ist Statistik nicht wirklich meine starke Seite.


Den Chi-Quadrat Test hab ich durchgeführt, um herauszufinden, ob de Unterschiede Signifikant genug sind um die H0 (über die Jahre gleich) zu verwerfen.

Meine Brechnung, wenn ich sie überhaupt so nennen kann, sah so aus, dass ich zwei Spalten hatte.
1. Spalte waren meine erhaltenen Daten
2. Spalte enthielt die erwarteten Daten bei einem linearen Anstieg. Diesen habe ich plump über die Geradengleichung errechnet.
Diese beiden Werteblöcke habe ich dann mittels Excel und Chitest() Funktion vergleichen lassen.
Ich hoffe ich hab das verständlich erklärt.

Ich hab mir alternativ auch überlegt das ganze mittels Korrelationskoeffizienten zu zeigen, doch wüsste ich hier nicht ab welchem Wert ich die Steigung als signifikant erachten könnte.
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Berechne eine Spearman-Rangkorrelation, wenn der Anstieg nicht linear ist. Ansonsten eine Pearson-Korrelation. Signifikanzwerte (die darüber Aufschluss geben, ob der Zusammenhang, also der Korrelationskoeffizient, in der Grundgesamtheit als nicht-null angenommen werden kann) liefern Programme eigentlich automatisch mit. Zu beachten ist, dass statistische Signifikanz keine Aussage zur Bedeutsamkeit ist, sondern eben nur dazu, ob ein Zusammenhang eigentlich (also abgesehen von Stichproben-Zufälligkeiten) und überhaupt besteht oder nicht besteht.
Sara_C
Beiträge: 3
Registriert: 27.04.2010, 08:21

Beitrag von Sara_C »

Danke nochmal für die Antwort.
Ich werde es mal mit Pearson versuchen und schauen was meine Betreuerin dazu sagt. Spearman hab ich kurz probiert zu rechnen und bin katastrophal daran gescheitert, also erwähne ich nur zur Diskussion, dass es eine lineare Abhängigkeit sein könnte.
Wobei, wenn ich ein r von 0,5 erhalte ist das nicht mehr ganz so wahrscheinlich und vermutlich eher Zufall, dass die Werte ansteigen.

Hoffe das reicht für die Argumentation. Wenn ich es sonst mit Signifikanz Niveaus beweisen soll, werden das dann wohl ein paar lange Abende.

Vielen Dank nochmal für die Hilfe.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten