Berechnung der Unsicherheit eines Messwertes (P=95%)

Beitrag von **samiegirl** » 08.03.2011, 13:09

Hallo,

wie kann ich die Unsicherheit eines Messwertes (ohne bekannte Standardabweichung) bestimmen?

Wir haben in einer Aufgabe 5 Messwerte+1 Bildwert bekommen. Die sollten wir graphisch gegeneinander auftragen, Regressionsgeraden einfügen und die Vorhersagebänder für einen Vetrauensbereich von 95% berechnen. Eine Residuenanalyse war auch noch gefragt. Das war alles kein Problem. Die Durchführung wurde mir dem Programm "R" gemacht.

Bei den Messwerten und dem Blindwert ist die Standardabweichung bekannt

Ich muss zugeben noch nicht so viel Anhnung von Statistik zu haben und weiß auch nicht wie ich meine Frage besser ausdrücken soll.
Ich habe keine Ahnung wo ich da anfangen soll zu suchen..

Wäre cool wenn mir jemand helfen könnte!
Vielen Dank
samiegirl

Beitrag von **drfg2008** » 08.03.2011, 13:27

in R ?

na so (am Beispiel des ALLBUS):

Code: Alles auswählen

library(foreign, pos=4)
Datenmatrix <- read.spss("C:/<path>/S3000.SAV", 
  use.value.labels=TRUE, max.value.labels=Inf, to.data.frame=TRUE)
RegModel.1 <- lm(V2~V50, data=Datenmatrix)
summary(RegModel.1)

R-typisches Ergebnis (völlig unübersichtlich):

Code: Alles auswählen

Residuals:
    Min      1Q  Median      3Q     Max 
-1977.9 -1090.7  -172.9  1267.3  2262.3 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1719.16      82.47   20.85  < 2e-16 ***
V50            37.25      13.07    2.85  0.00440 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 1241 on 3227 degrees of freedom
  (5 observations deleted due to missingness)
Multiple R-squared: 0.002511,	Adjusted R-squared: 0.002202 
F-statistic: 8.124 on 1 and 3227 DF,  p-value: 0.004395

Aber was meinst du mit "Unsicherheit eines Messwerts"?

Gruss

Beitrag von **samiegirl** » 08.03.2011, 14:49

Ja genau so habe ich das auch gemacht. so ein unübersichtliches Ergebnis habe ich auch bekommen,-)

weiß ich auch nicht so genau. Im skript steht etwas über den "Vertrauensbereich (Unsicherheit) u". Ist bezogen auf Mittelwerte.
da drunter steht
u = (s*t)/(Wurzel(n))

da heißt: s Standardabweichung, t: studentfaktor, n: Anzahl der Messungen.

Einen t-Faktor bekommt man ja in der Residuenanalyse, oder? oder ist der t-value in deinem Beispiel was anderes? Aber woher bekomme ich eine Standardabeweichung?

eine andere Idee: wenn man die Konfidenzintervalle und die Regressionsgerade plottet bekommt man ja "Berreiche" um die Regressionsgerade. Mein Messwert ist in dieser "Kalibriergerade" ja auch enthalten bzw durch Interpolation. Diesem Wert entsprechen doch auch Werte auf den beiden Geraden unter und über der Regressionsgerade, oder? Entspricht das vielleicht dem Vertrauensbereich?

Ich hoffe ich habe mich jetzt nicht zu undeutlich ausgedrückt ,-)

Beitrag von **drfg2008** » 08.03.2011, 15:36

Die Lösung des Problems kann man ja iterativ angehen:

Also:

(1)
zunächst werden die Regressionskoeffizienten (und der Achsenabschnitt) der Geraden gegen 0 mit dem t-Test getestet. D.h. wenn sie signifikant von 0 verschieden sind, besteht die Annahme eines linearen Einflusses.

(2)
Die Regressionsgerade (im 2-Variablen Fall) geht immer durch die beiden Mittelwerte von "X" und "Y".

(3)
Um diese Regressionsgerade, die aus einer Stichprobe berechnet wurde, wird ein KI gelegt, das mit Wahrscheinlichkeit p (meist 95%) die Schar aller möglichen Geraden enthält, die bei Stp.-Ziehungen unter sonst gleichen Bedingungen, entstehen könnten und die Regression der Grundgesamtheit schätzen.

(4) Die Residualanalyse dient eigentlich nur der Prüfung auf Normalverteilung.

Mit der Formel u = (s*t)/(Wurzel(n) stehe ich momentan etwas auf dem Schlauch, denn das Konfidenzintervall für b[yx] ist: b[yx] +- (s [yx]^2 *t[alpha/2] )/ (s[x] * n^1/2)

Das ist zwar sehr ähnlich, aber nicht exakt identisch. Vielleicht also eine Approximation für das KI des b-Koeffizienten der Regressionsgeraden für den Fall, dass sich s [yx]^2 und s[x] gegeneinander kürzen lassen.

-> Also wahrscheinlich das KI des b-Koeffizienten.

Gruß

Beitrag von **samiegirl** » 09.03.2011, 10:12

Hallo,

Danke für deine schnelle Antwort. Es ist mir einiges klarer geworden. Mit der Formel die du angegeben hast komme ich grad nicht klar. Ich habe aber eine Idee. Das gehört zwar eher in ein R-Forum aber vielleicht kannst du mir da hier trotzdem helfen?:)

> w = 1/(Standardabweichung^2)
> regrw = lm(y~x, weights = w)
> abline(coef(regrw))
> prediction.w = predict(regrw, level = 0.95,
+ interval = "predict")
> prediction.w.lower = prediction.w[,2]
> prediction.w.upper = prediction.w[,3]
> lines(x, prediction.w.lower)
> lines(x, prediction.w.upper)

Das habe ich bis jetzt gemacht. Mit dem Programm kann ich mir ja über die eingabe von "regrw" die Geradengleichung der Regressionsgerade anzeigen lassen. Darüber habe ich mir aus dem wert der Probe (Y-wert) den x-Wert berechnet(einfach Dreisatz). In der Zeichung habe ich die Konfidenzintervalle eingezeichnet. Darüber müsste man doch eigentlich die "Unsicherheit" (vermutlich meint er die Standardabweichung) berechnen können? Ganz einfach geht das mit dem Befehl "confint(regrw, level = 0.95)". Aber das ist ja mit predict nicht vergleichbar.

Grüße, samiegirl

Beitrag von **drfg2008** » 09.03.2011, 14:55

Mit der Formel die du angegeben hast komme ich grad nicht klar.

u = (s*t)/(Wurzel(n) stehe ich momentan etwas auf dem Schlauch, denn das Konfidenzintervall für b[yx] ist: b[yx] +- (s [yx]^2 *t[alpha/2] )/ (s[x] * n^1/2)

Das sind praktisch die gleichen Formeln, nur ist deine mit "Wurzel" geschrieben, was in meinem Fall als n^1/2 geschrieben wurde ("hoch 1/2" ist nämlich gleich der Quadratwurzel). Der t-Wert wird in meinem Fall nur mit alpha/2 ergänzt, was man weglassen könnte. Und für den Falls dass s [yx]^2 sich gegen s[x] 'kürzen' lässt, wären die Formeln identisch.

Gruß