Berechnung der Unsicherheit eines Messwertes (P=95%)

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
samiegirl
Beiträge: 3
Registriert: 08.03.2011, 12:46

Berechnung der Unsicherheit eines Messwertes (P=95%)

Beitrag von samiegirl »

Hallo,

wie kann ich die Unsicherheit eines Messwertes (ohne bekannte Standardabweichung) bestimmen?

Wir haben in einer Aufgabe 5 Messwerte+1 Bildwert bekommen. Die sollten wir graphisch gegeneinander auftragen, Regressionsgeraden einfügen und die Vorhersagebänder für einen Vetrauensbereich von 95% berechnen. Eine Residuenanalyse war auch noch gefragt. Das war alles kein Problem. Die Durchführung wurde mir dem Programm "R" gemacht.

Bei den Messwerten und dem Blindwert ist die Standardabweichung bekannt

Ich muss zugeben noch nicht so viel Anhnung von Statistik zu haben und weiß auch nicht wie ich meine Frage besser ausdrücken soll.
Ich habe keine Ahnung wo ich da anfangen soll zu suchen.. :?

Wäre cool wenn mir jemand helfen könnte!
Vielen Dank
samiegirl :D
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

in R ?

na so (am Beispiel des ALLBUS):

Code: Alles auswählen

library(foreign, pos=4)
Datenmatrix <- read.spss("C:/<path>/S3000.SAV", 
  use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
RegModel.1 <- lm(V2~V50, data=Datenmatrix)
summary(RegModel.1)
R-typisches Ergebnis (völlig unübersichtlich):

Code: Alles auswählen

Residuals:
    Min      1Q  Median      3Q     Max 
-1977.9 -1090.7  -172.9  1267.3  2262.3 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1719.16      82.47   20.85  < 2e-16 ***
V50            37.25      13.07    2.85  0.00440 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 1241 on 3227 degrees of freedom
  (5 observations deleted due to missingness)
Multiple R-squared: 0.002511,	Adjusted R-squared: 0.002202 
F-statistic: 8.124 on 1 and 3227 DF,  p-value: 0.004395 
Aber was meinst du mit "Unsicherheit eines Messwerts"?


Gruss
drfg2008
samiegirl
Beiträge: 3
Registriert: 08.03.2011, 12:46

Beitrag von samiegirl »

Ja genau so habe ich das auch gemacht. so ein unübersichtliches Ergebnis habe ich auch bekommen,-)

weiß ich auch nicht so genau. Im skript steht etwas über den "Vertrauensbereich (Unsicherheit) u". Ist bezogen auf Mittelwerte.
da drunter steht
u = (s*t)/(Wurzel(n))

da heißt: s Standardabweichung, t: studentfaktor, n: Anzahl der Messungen.

Einen t-Faktor bekommt man ja in der Residuenanalyse, oder? oder ist der t-value in deinem Beispiel was anderes? Aber woher bekomme ich eine Standardabeweichung?

eine andere Idee: wenn man die Konfidenzintervalle und die Regressionsgerade plottet bekommt man ja "Berreiche" um die Regressionsgerade. Mein Messwert ist in dieser "Kalibriergerade" ja auch enthalten bzw durch Interpolation. Diesem Wert entsprechen doch auch Werte auf den beiden Geraden unter und über der Regressionsgerade, oder? Entspricht das vielleicht dem Vertrauensbereich?

Ich hoffe ich habe mich jetzt nicht zu undeutlich ausgedrückt ,-)
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Die Lösung des Problems kann man ja iterativ angehen:

Also:

(1)
zunächst werden die Regressionskoeffizienten (und der Achsenabschnitt) der Geraden gegen 0 mit dem t-Test getestet. D.h. wenn sie signifikant von 0 verschieden sind, besteht die Annahme eines linearen Einflusses.

(2)
Die Regressionsgerade (im 2-Variablen Fall) geht immer durch die beiden Mittelwerte von "X" und "Y".

(3)
Um diese Regressionsgerade, die aus einer Stichprobe berechnet wurde, wird ein KI gelegt, das mit Wahrscheinlichkeit p (meist 95%) die Schar aller möglichen Geraden enthält, die bei Stp.-Ziehungen unter sonst gleichen Bedingungen, entstehen könnten und die Regression der Grundgesamtheit schätzen.

(4) Die Residualanalyse dient eigentlich nur der Prüfung auf Normalverteilung.


Mit der Formel u = (s*t)/(Wurzel(n) stehe ich momentan etwas auf dem Schlauch, denn das Konfidenzintervall für b[yx] ist: b[yx] +- (s [yx]^2 *t[alpha/2] )/ (s[x] * n^1/2)

Das ist zwar sehr ähnlich, aber nicht exakt identisch. Vielleicht also eine Approximation für das KI des b-Koeffizienten der Regressionsgeraden für den Fall, dass sich s [yx]^2 und s[x] gegeneinander kürzen lassen.

-> Also wahrscheinlich das KI des b-Koeffizienten.

Gruß
drfg2008
samiegirl
Beiträge: 3
Registriert: 08.03.2011, 12:46

Beitrag von samiegirl »

Hallo,

Danke für deine schnelle Antwort. Es ist mir einiges klarer geworden. Mit der Formel die du angegeben hast komme ich grad nicht klar. Ich habe aber eine Idee. Das gehört zwar eher in ein R-Forum aber vielleicht kannst du mir da hier trotzdem helfen?:)

> w = 1/(Standardabweichung^2)
> regrw = lm(y~x, weights = w)
> abline(coef(regrw))
> prediction.w = predict(regrw, level = 0.95,
+ interval = "predict")
> prediction.w.lower = prediction.w[,2]
> prediction.w.upper = prediction.w[,3]
> lines(x, prediction.w.lower)
> lines(x, prediction.w.upper)

Das habe ich bis jetzt gemacht. Mit dem Programm kann ich mir ja über die eingabe von "regrw" die Geradengleichung der Regressionsgerade anzeigen lassen. Darüber habe ich mir aus dem wert der Probe (Y-wert) den x-Wert berechnet(einfach Dreisatz). In der Zeichung habe ich die Konfidenzintervalle eingezeichnet. Darüber müsste man doch eigentlich die "Unsicherheit" (vermutlich meint er die Standardabweichung) berechnen können? Ganz einfach geht das mit dem Befehl "confint(regrw, level = 0.95)". Aber das ist ja mit predict nicht vergleichbar.

Grüße, samiegirl
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Mit der Formel die du angegeben hast komme ich grad nicht klar.
u = (s*t)/(Wurzel(n) stehe ich momentan etwas auf dem Schlauch, denn das Konfidenzintervall für b[yx] ist: b[yx] +- (s [yx]^2 *t[alpha/2] )/ (s[x] * n^1/2)

Das sind praktisch die gleichen Formeln, nur ist deine mit "Wurzel" geschrieben, was in meinem Fall als n^1/2 geschrieben wurde ("hoch 1/2" ist nämlich gleich der Quadratwurzel). Der t-Wert wird in meinem Fall nur mit alpha/2 ergänzt, was man weglassen könnte. Und für den Falls dass s [yx]^2 sich gegen s[x] 'kürzen' lässt, wären die Formeln identisch.

Gruß
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten