NEWBIE braucht Hilfe

Beitrag von **supermario** » 11.06.2019, 12:07

Hallo Forum,
ich habe als Informatiker meiner Freundin zugesagt, Ihr im empirischen Teil Ihrer Arbeit zu helfen - hatte aber bislang recht wenig mit statistischen Verfahren zu tun.
Folgende Probleme:
Wir haben einen Fragebogen erstellt, der folgende Variablen untersuchen soll:
8 Fragen (Rating-Skala), deren Summe F_SUM maximal 24 ergeben kann.
Ein Eintrittsalter in Monaten (metrisch)
Ein aktuelles Alter (Ordinal skaliert) (5;0-5;5).
Die Frage lautet, ob das Eintrittsalter einen Einfluss auf die erreichten Punkte aus den Fragen ergeben. Referenzwerte haben wir aufgrund der Altersklassen des aktuellen Alters.
Die Summe aus den 8 Items ist total links-schief, eine Normalverteilung ist nicht vorhanden. Das Eintrittsalter in Monaten geht von 8 bis 72 Monate, auch kene Normalverteilung. Über eine Klassierung mit SPSS habe ich eine annähernde NV hinbekommen. Wenn meine Hypothese (H0) nun der Art lautet: Das Eintrittsalter hat keinen Einfluss auf die erreichten Punkte, wie verifiziere ich sowas am besten.
Bisher hatte ich mein Eintrittsalter (EA) nach Augenmaß, sinnig eingeteilt (1-jährig, 2-jährig...) Damit habe ich keine Signifikanz hinbekommen. Die Fälle liegen eben auch alle (N=121) im Mittelwert bei ca. 18.
Was ich bereits versucht habe: Normalverteilung zu erreichen mit den gängigen Mitteln (SQRT,LGN...) kein Erfolg. Dann eben ohne Normalverteilung, da Stichprobe nicht soooo klein ist, gehts auch so?!
Meine Idee zu Beginn war, eine Korrelation (Pearson) der metrischen Variablen Eintrittsalter und Punkte. Nicht signifikant, keine NV. Die Kollegen Kedall-Tau und Sperman halfen auch nicht weiter.
Kreuztabelle CHI^2 brachte uns auch nicht wirklich weiter. Gestern habe ich dann das Eintrittsalter einmal anders klassiert und mal nicht gegen Summe der Punkte, sondern gegen die 8 Items aus dem Fragenkatalog auf Korrelation geprüft (hier hatte ich bei manchen Fragen Signifikanz). Freu

Das Punkt-/Streudiagramm lässt aber wenig Zusammenhang vermuten (y=19,34-0,01*x) - leider.
Ein weitere Ansatz könnte, so denken wir, der Kruskal-Wallis Test sein. Hier kann ich, mit den klassierten Eintrittsaltrer und der Summe der Punkte die Nullhypothese verwerfen, die Verteilung der Summe ist über die Gruppen nicht gleich. Bei 3 Eintrittsaltergruppen habe ich eine Signifikanz.
So, ich hoffe die Problemstellung ausreichend beschrieben zu haben. Bin ich auf dem richtigen Weg, geht man so was gaaanz anders an? Freue mich über jeden Hinweis oder Tip, haben leider nur noch ne Woche bis zur Abgabe der Arbeit ^^

Danke
Mario

Beitrag von **dutchie** » 11.06.2019, 18:25

hallo mario

wenn man zahlen lange genug foltert, gestehn sie was man hören will...

Es geht ja darum irgendwie empirisch die wirklichkeit abzubilden,
und nicht so lange rumprobieren bis es signifikant ist...
das ergebnis hängt auch von der methode ab..ok
all das, was du schreibst sind im kern andere verfahren, die eigentlich nicht vergleichbare ergebnisse
produzieren....ich lasse das Ergebnis gelten das sig wird?? und die anderen nicht sigs lasse ich unter den tisch fallen
nicht gut!

du musst die signifikanz von der größe des Zusammenhangs unterscheiden.

beide variablen sind metrisch--> beschreibung der größe des zusammenhangs über Pearson.
p der signifikanz braucht NV, du kannst mit pearson beschreiben und mit Spearman p ergänzen..
also angeben p Pearson und p Spearman...fertig, wenn das deutlich nicht sig. ist die verteilung irgenwann auch egal!

wenn du am skaleniveau rumschraubst oder tranformierst, veränderst du die Hypothesen!!!
wenn links schief --warum ist das so, das beschreiben...
stichprobe repräsentativ?

supermario hat geschrieben:Freu Das Punkt-/Streudiagramm lässt aber wenig Zusammenhang vermuten (y=19,34-0,01*x) - leider

warum leider?
dann ist das so! fertig.. nicht signifikantes ist genauso interessant! warum auch nicht!

wenn es aber so sein muss, das es korrelieren muss ..Weil es so ist...
ist dein Modell eventuell nicht vollständig ist, da fehlt vielleicht ein Moderator oder eine zusätzliche UV...

oder die schiefe verhindert nicht nur eine valides p, sondern auch ein sinvolles r aufgrund eingeschränkter Variabilität.
da fehlen die VP, mit niedrigen werten, auf die es ankommt!
wenn du Depressivität erklären willst, und korrelierst... braucht du Depressive!!
wenn die fehlen in der stichprobe ... keine Korrelation! nicht weil kein zusammenhang bestünde!

warum fehlen die in deiner stichprobe?...dies zu klären wäre wichtiger!
Weil es sie nicht gibt (z.B unzufriedene Mitarbeiter)?, oder weil ich sie nicht erwischt habe?
oder weil die sich verweigern, teilnahme? rüchlaufquote? Online befragung?

Das was du schreibst kommt oft vor, weil die verwendeten Fragebögen, oft eigenbau,
schlecht konstruiert sind...die zustimmungsneigung ist bei allen item zu groß...
darauf eingehen ... und nicht auf die Zahlen dreinschlagen

mit item korrelieren find ich ist eine gute idee..
da kann man inhaltlich differenzieren, fall man an der validität des gesamtscores zweifelt!
und die verteilung mancher Items ist vielleicht normaler...
aber ändere nicht die methode bleib bei Pearson!

summ summarum: du hast kein statistisches Zahlenproblem?
sondern eher ein methodisches...

gruß
dutchie

Beitrag von **supermario** » 11.06.2019, 18:51

Hallo dutchie,
zunächst einmal vielen Dank für Deine Ausführungen. Ja, das hatte ich meiner Freundin auch versucht zu erklären, auch kein Zusammenhang ist ein Ergebnis. Da die 8 Items aus einem standardisierten Screening sind, die Altersklassen so auch sinnig, wir Geschlecht, Sprache übernommen haben und nur noch das Eintrittsalter in Monaten hinzugefügt haben (ist eben Thema der Arbeit), denke ich schon, dass das Datenerhebunsginstrument an sich valide ist

Wenn ich alle Daten so belasse, wie sie sind, also Eintrittsalter (8 - 79 Monate), Punkte(7 - 24) und Bivariat korreliere (Pearson) liege ich bei .718 (mit -,032). Wenn ich mein Eintrittsalter gruppiere, und den Kruskal-Wallis bemühe: 8-17 Monate sowie 18-28 Monate, 8-17 sowie 40-70. Damit kann ich die Nullhypothese ablehnen und doch sagen, dass das Eintrittsalter einen Einfluss auf die Summe der Punkte aus den 8 Itmes hat, oder nicht?! Inhaltlich zielen die Items alle auf ein Thema ab - unterschiede darin sind für mich nur schwer erkennbar, dazu bin ich zu wenig emotionsregulations-Experte

Beitrag von **dutchie** » 12.06.2019, 14:57

hallo

was ist .718 und was -.032
p =.718 und r = -.032?

also der H test prüft ja nicht auf linearen Zusammenhang sondern auf unterschied!
du macht aus dem Eintrittsalter 4 geordnete (Was dem H Test nicht interessiert) Kategorien..
und es wird signifikant...?
Wenn der H test sig. wird kannst du sagen es gibt unterschiede zwischen den Kategorien in den Punkten
oder auch vom zusammenhnag reden, aber ihn nicht näher beschreiben, insofer ist das wenig gewinn.
Zusammenhang: linear oder monoton negativ oder positiv...
kann es sein das der Zusammenhang nichtlinear ist, wenn Pearson nicht sig. und dein H Test sig.?
das wiederspricht sich in gewissser weise..
Also Frage: ist der H test sig. und wie verhalten sich die Mittelwerte der Punte in Abhängigkeit von den Kategorien?
Der H Test ist robust gegen ausreißer Pearson nicht, spielt das eine rolle?

gruß
dutchie

Statistik-Tutorial Forum

NEWBIE braucht Hilfe

NEWBIE braucht Hilfe

Re: NEWBIE braucht Hilfe

Re: NEWBIE braucht Hilfe

Re: NEWBIE braucht Hilfe