Z-Werte und Normalverteilung

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Moses
Beiträge: 4
Registriert: 30.04.2011, 22:48

Z-Werte und Normalverteilung

Beitrag von Moses »

Hallo Freunde der Statistik

folgende Situation: Ich habe einen Messparameter bei zwei Gruppen erhoben, Patienten (n=40) und gesunde Kontrollen (n=140). Die Kontrollen sollen meine Normwerte darstellen und sind nach Transformation normalverteilt. Jetzt m?chte ich gerne wissen, wie weit meine Patientendaten von den Kontrolldaten abweichen und zwar im Rahmen einer Z-Wert-Berechnung nach dem Schema: (PatMesswert - MittelwertKontrollen) / SDKontrollen.
Die Frage: Die PatMesswerte habe ich auch entsprechend transformiert, nur sind die leider nicht normalverteilt (sind auch in der rohform nicht normalverteilt). Kann ich trotzdem ohne Weiteres die Z-Werte berechnen ??

?ber Antwort freut sich

Moses
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Jetzt m?chte ich gerne wissen, wie weit meine Patientendaten von den Kontrolldaten abweichen

eine Rückfrage: Warum benutzt du nicht den t-Test. Der ist robust gegen Verletzungen der Modellvoraussetzungen, bei ungleich großen Stichproben einsetzbar und über G* Power könnte dann auch die Effektgröße abgeschätzt werden.

Gruß
drfg2008
Moses
Beiträge: 4
Registriert: 30.04.2011, 22:48

Beitrag von Moses »

Die beiden Gruppen vergleiche ich auch mittels t-test und auch varianzanalytisch bzw. über nicht-parametrische Verfahren.

In Vorpublikationen werden halt auch die Patienten gegen die Kontrollen als Z-Werte dargestellt. (In der Einleitung habe ich nur eine Variable erwähnt, tatsächlich sind es 13. Es ergibt sich später ein ganzes Z-Profil anhand dessen einzelne Patienten bzw. Erkrankungen identifizierbar werden sollen).

Normalerweise ist es doch so: Es gibt eine Normstichprobe. Ich habe einzelne Patienten, die über eine Z-Wert Berechnung mit der Normstichprobe verglichen werden können. Bislang hatte ich mir keine Gedanken darüber gemacht, ob der Messparameter der Patienten normalverteilt sein muss, damit ich die obige Z-Wert-Berechnung durchführen kann. Aber wie ist da der Sachverhalt ??

Gruß und schönen 1.Mai
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re2

Beitrag von drfg2008 »

Die PatMesswerte habe ich auch entsprechend transformiert

Die Autoren Eid, Gollwitzer und Schmitt beschreiben folgende Transformation:

X(t)= 0,5 ln((1+X/1-X) für linksschiefe Verteilungen und entsprechende für stark rechtsschiefe Verteilungen. Dadurch werden die ZV zwar nicht exakt N~verteilt, allerdings folgt die so berechnete Verteilung (nach Angaben der Autoren) approximativ einer Normalverteilung. Damit bliebe nur das Problem, dass auch die Vergleichsstichprobe mit N=140 relativ klein ist und daher noch entsprechende Schwankungen aufweist.

Gruß
drfg2008
Moses
Beiträge: 4
Registriert: 30.04.2011, 22:48

Beitrag von Moses »

Wäre es denn legitim, wenn die Variable in der Patientenstichprobe nach Eid et al. transformiert wird, während sie in der Kontrollstichprobe einfach log transformiert bleibt ?? Wenn man also unterschiedlich transformiert, um Normalverteilung herzustellen.
(In diesem Zusammenhang habe ich auch von einem Box-Cox-Verfahren gehört zum Finden einer optimalen Transformation...aber habe ich noch nie angewandt...)

Gruesse
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re2

Beitrag von drfg2008 »

SPSS hat bereits fertige Programme zum Umwandeln in Normalverteilung, die ganz gut zu sein scheinen.

-> Transformieren -> Rangfolge bilden -> Rangtyp: Normalrangwerte


Zwei Simulationsbeispiele

Code: Alles auswählen

input program.
loop a =1 to 100000 by 1.
end case.
end loop. 
end file.
end input program.
exe.

*----------- Gleichverteilung --------------------.

COMPUTE zv1=RV.UNIFORM(1,1000).
EXECUTE.

GRAPH
  /HISTOGRAM=zv1.


RANK VARIABLES=zv1 (A)
  /NORMAL
  /PRINT=NO
  /TIES=MEAN
  /FRACTION=BLOM.

GRAPH
  /HISTOGRAM=Nzv1.


NPAR TESTS
  /K-S(NORMAL)=Nzv1
  /MISSING ANALYSIS.


* -------- schiefe Verteilung --------------.

COMPUTE zv2=RV.EXP(12).
EXECUTE.

FORMATS zv2 (f8.4).

GRAPH
  /HISTOGRAM=zv2.


RANK VARIABLES=zv2 (A)
  /NORMAL
  /PRINT=NO
  /TIES=MEAN
  /FRACTION=BLOM.

GRAPH
  /HISTOGRAM=Nzv2.

NPAR TESTS
  /K-S(NORMAL)=Nzv2
  /MISSING ANALYSIS.

Habe mal auf einer amerikanischen Plattform die Frage gepostet:

Es gibt ab Version 19 die Box-Cox Transformation unter

Transform>Prepare Data for Modeling>Interactive

(da ich hier nur die 17 habe, kann ich nichts weiter dazu beitragen)

Literatur gibt es auch:

http://epm.sagepub.com/content/55/4/625.abstract
http://en.wikipedia.org/wiki/Power_transform
http://faculty.chass.ncsu.edu/garson/PA765/assumpt.htm
http://eom.springer.de/B/b110790

Die Frage ist natürlich immer, was versteht man davon.

Gruß
drfg2008
Moses
Beiträge: 4
Registriert: 30.04.2011, 22:48

Beitrag von Moses »

Das ist sehr guter Input!!
Diese Rangfolge-Methode führt jedoch dazu, dass die beiden Verteilungen (Patienten und Kontrollen) ziemlich perfekt normalverteitl mit Mittelwert 0 und SD=1 sind, so dass sie nahezu identisch sind und nicht mehr vergleichbar sind. Diese Rangfolgenbildung und Schätzung von Z-Werten wird sich für verschiedenen Daten angepasst. Leider hilft es mir nicht weiter.
Was mir ein stück weit noch geholfen hat ist, dass ich mal verschiedenen grundsätzliche Transformationen systematisch auf beide Stichproben angewendet habe. Jetzt bleibe ich immer noch in der Situation, dass in der Patientenstichprobe die Skew noch etwa 1,5 ist bei einem nicht so dollen Q-Q Plot, während in der Kontrollstichprobe diese Parameter gut ausschauen. Dies habe ich dann mit der normalen Log-Transformation erzielt. (Ich glaube die Box-Cox-Sache würde die Basis für die Log-Transformation mathematisch so generieren, dass eine (Annäherung an) Normalverteilung herauskommt; aber ich vermute, dass das Verfahren dann unterschiedliche Basen für meine Stichproben generieren würde und die Vergleichbarkeit dann nicht mehr gegeben ist.)

Auf jeden Fall vielen Dank nochmals für die Mühe und die Rückmeldungen, drfg2008!!

Viele Grüße
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Jetzt m?chte ich gerne wissen, wie weit meine Patientendaten von den Kontrolldaten abweichen und zwar im Rahmen einer Z-Wert-Berechnung nach dem Schema: (PatMesswert - MittelwertKontrollen) / SDKontrollen.
Das kannst Du doch ohne weiteres mit Deinen Originaldaten machen, da ist die Verteilungsform egal. Zumal fraglich ist, was Du eigentlich in Händen hast, nachdem Du eine mehr oder minder exotische oder sogar Flächentransformation durchgeführt hast. Du kannst dann keine Aussagen über die eigentlichen Messungen mehr treffen, nur über transformierte Messungen.
jake2042
Beiträge: 27
Registriert: 21.05.2011, 14:54

Re: Z-Werte und Normalverteilung

Beitrag von jake2042 »

Hallo Moses,

mit seiner Bemerkung:
»Das kannst Du doch ohne weiteres mit Deinen Originaldaten machen, da ist die Verteilungsform egal.«


hat Generalist vollkommen recht. Was mir aber noch auffällt, ist, dass Deine z-Werte-Berechnung gar keine ist. Nach Benninghaus 1989:215 berechnen sich die z-Werte für die Variable x nach der folgenden Formel (Code bitte in das große Fenser auf der Seite http://www.matheboard.de/formeleditor.php kopieren und auf den Button »Vorschau« klicken):

z_{x_{i}}=\frac{x_{i}-\bar{x}}{s_{x}}

Übertragen auf Deinen Fall heißt das, dass Du z-Werte für die Patientengruppe und z-Werte für die Kontrollgruppe berechnen musst. Wenn ich folgende Abkürzungen benutze:

i-ter z-Wert der Patientengruppe = Pz(x)(i)
i-ter Wert der Patientengruppe = Px(i)
Mittelwert der Patientengruppe = Pm
Standardabweichung der Patientengruppe = Psd
i-ter z-Wert der Kontrollgruppe = Kz(x)(i)
i-ter Wert der Kontrollgruppe = Kx(i)
Mittelwert der Kontrollgruppe = Km
Standardabweichung der Kontrollgruppe = Ksd

dann ergibt sich:

Pz(x)(i) = (Px(i) – Pm)/Psd für die Patientengruppe und
Kz(x)(i) = (Kx(i) – Km)/Ksd für die Kontrollgruppe

mit dem Ergebnis, dass beide Gruppen den Mittelwert 0 und die Standardabweichung 1 besitzen. Das ist immerhin das Ziel und die Aufgabe einer Transformation in z-Werte. Dann stellt sich aber die Frage:Wie soll denn unter diesen Umständen noch auf signifikante Mittelwertunterschiede getestet werden?

Viele Grüße
jake2042

Literatur

Benninghaus, Hans, (6)1989: Statistik für Soziologen 1. Deskriptive Statistik. (= Studienskripten zur Soziologie 22) Stuttgart:Teubner
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten