vergleich median stichprobe mit literatur - welcher test?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
kiligonzales
Beiträge: 4
Registriert: 25.09.2012, 11:27

vergleich median stichprobe mit literatur - welcher test?

Beitrag von kiligonzales »

hallo,

ich habe einen datensatz zu einer frühgeborenen-population von 500 fällen mit mehreren metrischen variablen (geburtsgewicht etc.), die nicht normalverteilt sind, sowie nominale (sagt man das so?) variablen (geschlecht; überlebt/verstorben).

ich möchte herausfinden, ob sich "meine" population signifikant von einer anderen (3000 fälle) unterscheidet, von der ich jedoch keinen datensatz habe, sondern der literatur lediglich die mediane (samt standardabweichung) bzw. die anteile (beim geschlecht) entnehmen kann.

ein beispiel: in meiner population beträgt das mediane geburtsgewicht 680g (SD 130g), in der vergleichspopulation ist der median 660g (sd 110g).

wie kann ich testen, ob der unterschied signifikant ist? es handelt sich ja nicht um 2 unabhängige stichproben, da das eine eben gar keine stichprobe ist, oder? mit dem wilcoxon test komme ich doch da nicht weiter?
oder könnte ich nicht-normalverteilte zufallszahlen generieren lassen mit dem median der population, deren datensatz ich nicht habe?

wenn mir jemand sagen könnte, welchen test (zur verfügung steht spss19) ich benutzen muss, wäre das toll!

vielen dank im voraus,
beste grüße,
kilian
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

steht dort wirklich "mediane" , und ist dann aber die Standardabweichung S angegeben worden?

Ansonsten ließe sich das über den t-Test berechnen (falls nicht Median, sondern arithm. Mittel).

Beide Datensätze sind Stichproben unterschiedlicher Größe.
drfg2008
kiligonzales
Beiträge: 4
Registriert: 25.09.2012, 11:27

Beitrag von kiligonzales »

hey, danke für die rasche antwort! und asche auf mein haupt - das sind wohl wirklich die mittelwerte!
es steht tatsächlich gar nicht da, was es ist. aber da die standard deviation angegeben ist, sind es wohl die mittelwerte.

(ich bin recht sicher, dass keine normalverteilung vorliegt, weil das ein Bereich extremer Frühgeburten ist und bei der definition der population einfach ein grenzwert gezogen wurde: kleiner als 750g. die leichtesten kinder wiegen 400g. es wird also viel mehr fälle geben mit knapp 750g als mit gut 400g, weil ersteres eben nicht ganz so selten vorkommt. und durch die ausreisser nach unten wird der mittelwert heruntergezogen. ich hatte eigentlich gedacht, dass man gerade deswegen den median angibt und ggf. 5./95. perzentile oder so, um eine population hinsichtlich einer nicht normalverteilten größe zu beschreiben. darin lag mein fehler.)

dann probiere ich es gleich mit dem t-test. ich nehme an, man kann spss vermitteln, dass es dann den mittelwert des eigenen datensatzes mit einem vorgegeben wert vergleichen soll? also dass ich da den mittelwert der anderen population, von der ich keinen datensatz habe, manuell eintragen kann?
muss erst ins rechenzentrum, um spss nutzen zu können. sage dann nochmal bescheid, ob es geklappt hat.

vielen dank in jedem fall schon mal!
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

ich nehme an, man kann spss vermitteln, dass es dann den mittelwert des eigenen datensatzes mit einem vorgegeben wert vergleichen soll? also dass ich da den mittelwert der anderen population, von der ich keinen datensatz habe, manuell eintragen kann?
Leider nicht. Es reicht auch ein einfaches Excel Sheet. Schau' beim Welch-Test nach. Der ist einfacher zu rechnen:

http://en.wikipedia.org/wiki/Welch%27s_t_test

Muss also manuell berechnet werden aus den S , Mean, N der beiden Gruppen.
drfg2008
kiligonzales
Beiträge: 4
Registriert: 25.09.2012, 11:27

Beitrag von kiligonzales »

danke!

1. leider habe ich von excel sehr wenig ahnung, gerade wenn es darum geht, da selbstständig formeln einzugeben. (lernt man leider im medizinstudium gar nicht und sonst habe ich es noch nicht gebraucht.)
2. ob ich den welch-test komplett verstanden habe, weiss ich auch nicht sicher (ich müsste gemäß den formeln t und v ausrechnen und dann einen weiteren test durchführen, um den p-wert zu erhalten? für v brauche ich schon v1, weiss aber nicht, was ich dafür einsetzen muss. "vi = Ni-1, the degrees of freedom associated with the ith variance estimate" verstehe ich noch nicht)

beides könnte man vielleicht ändern und ich will sicher nicht undankbar erscheinen, aber vielleicht ginge es angesichts eines gewissen zeitdrucks doch mit spss einfacher, über das ich inzwischen in der version 20 auch zuhause verfüge.


da kann ich 1. auswählen:

compare means - one sample t-test. dann kann ich einen vergleichswert manuell eingeben und die variable auswählen. spss berechnet mir die differenz des mittelwerts in meinem datensatz mit dem vergleichswert und ich bekomme einen p-wert ausgespuckt, der zumindest nicht absurd klingt.
aber ich habe den verdacht, dass spss eine normalverteilung unterstellt, oder?

2. kann ich auswählen:

a) nonparametric tests - one sample - test observed distribution against hypothesized (kolmogorov - smirnov). dann muss ich für die hypothetischen daten angeben, wie sie verteilt sind: normal, uniform, exponentiell, poisson. das passt alles nicht, oder? poisson habe ich nicht komplett nachvollzogen, aber scheint mir nicht zuzutreffen.

b) nonparametric tests - independent samples.
dann kann ich aber nur zwischen tests wählen, die 2 oder mehr samples haben, muss noch mediane eingeben etc., scheint alles nicht zu passen.


irgendwelche ideen dazu? tut mir leid, dass ich auf den excel-vorschlag vorerst nicht groß eingegangen bin - ich hoffe halt, ich kann mich darum drücken und bin an die spss-benutzeroberfläche (ich weiss, ernsthafte statistiker brauchen sowas nicht) zumindest etwas gewöhnt.

sollte ich das deswegen auch besser im spss-bereich posten? andererseits ist ja die inhaltliche frage eher grundsätzlich: ob der one-sample t-test ok ist oder bei den nonparametrischen einer dabei sein könnte.

danke abermals im voraus!
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

http://graphpad.com/quickcalcs/ttest1/?Format=SD
Bei "Choose data entry format" sollte die Option "Enter mean, SD and N"
eingestellt sein, bei "Choose a test" gegebenenfalls die Option "Welch's
unpaired t test"
kiligonzales
Beiträge: 4
Registriert: 25.09.2012, 11:27

Beitrag von kiligonzales »

yeah, ich bin so gut wie doktor:-) - das scheint echt geklappt zu haben! tausend dank!
tolles forum! werde ich empfehlen, wenn mich mal jemand fragt. und die verlinkte seite ebenfalls! was wäre die welt ohne internet..?

danke nochmal euch beiden,
beste grüße
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten