Regressionsanalyse mit Messungenauigkeit
-
- Beiträge: 5
- Registriert: 20.01.2011, 17:00
Regressionsanalyse mit Messungenauigkeit
Hallo,
Ich habe zwei Datenmengen X und Y, mit welchen ich eine Regressionsanalyse durchführen will.
Dabei haben die X und Y-Werte eine gewisse Messungenauigkeit
(DeltaX,DeltaY), die bei allen Werten gleich gross ist. Ich möchte gerne
eine Analyse machen, welche diese Ungenauigkeit miteinbezieht.
Y=(Steigung+/-Delta1)*X + (Konstante +/-Delta2)
Es handelt sich in diesem Fall somit um einen Fit und nicht um ein Regression.
Siehe dazu: http://de.wikipedia.org/wiki/Ausgleichungsrechnung
Ist dies mit SPSS möglich?
Besten Dank für Eure Hilfe
Ich habe zwei Datenmengen X und Y, mit welchen ich eine Regressionsanalyse durchführen will.
Dabei haben die X und Y-Werte eine gewisse Messungenauigkeit
(DeltaX,DeltaY), die bei allen Werten gleich gross ist. Ich möchte gerne
eine Analyse machen, welche diese Ungenauigkeit miteinbezieht.
Y=(Steigung+/-Delta1)*X + (Konstante +/-Delta2)
Es handelt sich in diesem Fall somit um einen Fit und nicht um ein Regression.
Siehe dazu: http://de.wikipedia.org/wiki/Ausgleichungsrechnung
Ist dies mit SPSS möglich?
Besten Dank für Eure Hilfe
-
- Beiträge: 165
- Registriert: 05.07.2009, 21:10
-
- Beiträge: 5
- Registriert: 20.01.2011, 17:00
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
Fit
Leider fehlt die Fragestellung. Keine Verfahrensdiskussion ohne Fragestellung.
Du beschreibst eigentlich nichts anderes, als das, was als sog. bias bezeichnet wird, also ein systematischer Fehler. Der Zufallsvariablen wird nur eine Konstante hinzuaddiert: X+c. Bei einer Signifikanzprüfung der UVs mittels t-Vtlg. bei einer mult. linearen Regressionsanalyse spielt das natürlich keine Rolle, da eine Konstante C keine Variabilität besitzt.
Aber was ist die Fragestellung?
Du beschreibst eigentlich nichts anderes, als das, was als sog. bias bezeichnet wird, also ein systematischer Fehler. Der Zufallsvariablen wird nur eine Konstante hinzuaddiert: X+c. Bei einer Signifikanzprüfung der UVs mittels t-Vtlg. bei einer mult. linearen Regressionsanalyse spielt das natürlich keine Rolle, da eine Konstante C keine Variabilität besitzt.
Aber was ist die Fragestellung?
drfg2008
-
- Beiträge: 5
- Registriert: 20.01.2011, 17:00
Bei meiner Messunsicherheit der X und Y Variabeln handelt es sich nicht um einen systematischen Fehler. Denn der Fehler ist normalverteilt mit einer bestimmten Standardabweichung für X und Y (Standardabweichung ist bei allen X und allen Y Werten gleich).
Meine Fragestellung lautet:
In welchem Bereich schwankt die Konstante (k) und die Steigung (a) der linearen Regression? (Y = a*X +k)
Ich hoffe meine Frage wird so etwas klarer?
Besten Dank für Eure Mithilfe
Meine Fragestellung lautet:
In welchem Bereich schwankt die Konstante (k) und die Steigung (a) der linearen Regression? (Y = a*X +k)
Ich hoffe meine Frage wird so etwas klarer?
Besten Dank für Eure Mithilfe
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
RE:
o.k. dann war das ein Mißverständnis.
Zufallsvariablen haben immer eine "Meßungenauigkeit". Sie schwanken um ihren 'wahren' Wert. Bei einer Regressionsanalyse, im einfachsten Fall:
Y=b1X1 + C (in Matrix Schreibweise) wird der Achsenabschnitt C bei einer Regression mit entsprechenden Konfidenzintervall geschätzt. Jedenfalls macht das SPSS in seinem Output automatisch. Gleiches gilt für X.
SPSS rechnet z.B. die nicht standardisierten Koeffizienten (also mind. ein UV und den Achsenabschnitt - falls gewünscht-) und gibt dazu die Standardfehler aus.
Als Beispiel (aus Bühl: Einführung in SPSS Cholesterin Studie)
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT chol1
/METHOD=ENTER chol0.
Um den genauen Schwankungsbereich der Zufallsvariablen zu errechnen, musst du nur noch das KI dazu berechnen. Dazu gibst du eine Wahrscheinlichkeit vor (meist 95%). SPSS gibt mit der o.dargestellten Syntax auch die KIs für beide UVs mit Untergrenze und Obergrenze aus. Das läuft über /STATISTICS COEFF OUTS CI(95) R ANOVA
Ist das deine Frage?
Zufallsvariablen haben immer eine "Meßungenauigkeit". Sie schwanken um ihren 'wahren' Wert. Bei einer Regressionsanalyse, im einfachsten Fall:
Y=b1X1 + C (in Matrix Schreibweise) wird der Achsenabschnitt C bei einer Regression mit entsprechenden Konfidenzintervall geschätzt. Jedenfalls macht das SPSS in seinem Output automatisch. Gleiches gilt für X.
SPSS rechnet z.B. die nicht standardisierten Koeffizienten (also mind. ein UV und den Achsenabschnitt - falls gewünscht-) und gibt dazu die Standardfehler aus.
Als Beispiel (aus Bühl: Einführung in SPSS Cholesterin Studie)
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT chol1
/METHOD=ENTER chol0.
Um den genauen Schwankungsbereich der Zufallsvariablen zu errechnen, musst du nur noch das KI dazu berechnen. Dazu gibst du eine Wahrscheinlichkeit vor (meist 95%). SPSS gibt mit der o.dargestellten Syntax auch die KIs für beide UVs mit Untergrenze und Obergrenze aus. Das läuft über /STATISTICS COEFF OUTS CI(95) R ANOVA
Ist das deine Frage?
drfg2008
-
- Beiträge: 5
- Registriert: 20.01.2011, 17:00
Super! Besten Dank für die schnelle Antwort.
Mein Problem ist jetzt nur noch, dass ich die Messungenauigkeit von X und Y als Standardabweichung kenne und diese in die Regressionsanalyse einbeziehen möchte. (z.B alle X-Werte haben eine Genauigkeit (in Standardabweichungen) von +/- 2 Einheiten und Y von +/- 3 Einheiten). Ist es möglich dies zu integrieren?
Mein Problem ist jetzt nur noch, dass ich die Messungenauigkeit von X und Y als Standardabweichung kenne und diese in die Regressionsanalyse einbeziehen möchte. (z.B alle X-Werte haben eine Genauigkeit (in Standardabweichungen) von +/- 2 Einheiten und Y von +/- 3 Einheiten). Ist es möglich dies zu integrieren?
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
RE
Also, dann war das doch kein Missverständnis?
Zitat: "Dabei haben die X und Y-Werte eine gewisse Messungenauigkeit
(DeltaX, DeltaY), die bei allen Werten gleich gross ist. "
Das heißt doch, dass jeder einzelne (klein:) xi - Wert und (klein:) yi - Wert eine konstante Abweichung besitzt. Das wäre der systematische Fehler, der beim Messen auftritt. Wenn als Beispiel, die Stoppuhr A einen Fehler von 0,1 Sek. und die Stoppuhr B einen Fehler von 0,2 Sek. besitzt, dann wäre das der jeweilige systematische Fehler für A und B. Und die kann man ganz einfach durch Subtraktion herausrechnen, falls der systematische Fehler genau bekannt ist. In deinem Fall ist er in Form von Standardabweichungen gemessen worden.
Wenn allerdings, was ich eher glaube, die Messung von A eine Genauigkeit von +- 2 Standardabweichungen und die Messung von B eine Genauigkeit von +- 3 Stbw. aufweist, dann gilt eben keine Konstante für jeden einzelnen Wert, sondern es handelt sich um eine Zufallsvariable und die schwankt zufällig mit plus/minus 2 bzw. 3 Stbw.
Zitat: "Dabei haben die X und Y-Werte eine gewisse Messungenauigkeit
(DeltaX, DeltaY), die bei allen Werten gleich gross ist. "
Das heißt doch, dass jeder einzelne (klein:) xi - Wert und (klein:) yi - Wert eine konstante Abweichung besitzt. Das wäre der systematische Fehler, der beim Messen auftritt. Wenn als Beispiel, die Stoppuhr A einen Fehler von 0,1 Sek. und die Stoppuhr B einen Fehler von 0,2 Sek. besitzt, dann wäre das der jeweilige systematische Fehler für A und B. Und die kann man ganz einfach durch Subtraktion herausrechnen, falls der systematische Fehler genau bekannt ist. In deinem Fall ist er in Form von Standardabweichungen gemessen worden.
Wenn allerdings, was ich eher glaube, die Messung von A eine Genauigkeit von +- 2 Standardabweichungen und die Messung von B eine Genauigkeit von +- 3 Stbw. aufweist, dann gilt eben keine Konstante für jeden einzelnen Wert, sondern es handelt sich um eine Zufallsvariable und die schwankt zufällig mit plus/minus 2 bzw. 3 Stbw.
drfg2008
-
- Beiträge: 5
- Registriert: 20.01.2011, 17:00
sorry, hab mich zu unverständlich ausgedrückt.
Es handelt sich bei mir nicht um einen systematischen Fehler.
Meine X-Werte können mit einer Messgenauigkeit von z.B. 2cm (Standardabweichung) ermittelt werden. Dies bedeutet, dass der gemessene Wert kleiner oder grösser als der wahre Wert sein kann. Genau das Gleiche gilt bei den Y-Werten (z.B. 3cm).
Kann man diese Messungenauigkeit nicht in die Regressionsanalyse integrieren?
Besten Dank
Es handelt sich bei mir nicht um einen systematischen Fehler.
Meine X-Werte können mit einer Messgenauigkeit von z.B. 2cm (Standardabweichung) ermittelt werden. Dies bedeutet, dass der gemessene Wert kleiner oder grösser als der wahre Wert sein kann. Genau das Gleiche gilt bei den Y-Werten (z.B. 3cm).
Kann man diese Messungenauigkeit nicht in die Regressionsanalyse integrieren?
Besten Dank