Erstellung abhängiger Variable für Mehrebenenanalyse

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
stefan80
Beiträge: 3
Registriert: 11.01.2013, 01:03

Erstellung abhängiger Variable für Mehrebenenanalyse

Beitrag von stefan80 »

Hallo, beim suchen im Netz habe ich nix genaues gefunden und bin zum Glück auf dieses Forum gestoßen. Wie die Uhrzeit zeigt suchen auch Personen noch nachts um 1:45 für Lösungen bei ihren Statistikproblemen. Ich brauche dringend Hilfe für meine Abschlussarbeit an der Uni. Habe schon das Forum durchforstet, aber nichts genaues gefunden.

Ich möchte eine abhängige Variable aus verschiedenen Items zur Wahrnehmung von physischen und sozialen Verfallserscheinungen (wie bspw. heruntergekomme Häuserfassaden oder herumlungernde Jugendliche) im eigenen Stadtviertel durch Personen aus einer Befragung (N=3000) bilden. Ziel soll sein zu überprüfen in welchen Stadtteilen diese als Problem, ich welchen Stadtteilen diese Verfallserscheinungen als kein Problem wahrgenommen werden.
Die Items haben alle die gleichen Wertelabels {1=gar kein Problem 2=geringes Problem 3=mittleres Problem 4=ziemliches Problem 5=großes Problem}...und entstammen einer Item-batterie des Fragebogens.
Ich habe mit diesen Items, Korrelations- und danach explorative Faktorenanalysen gerechnet, KMO-Tests (MSA-Werte) Reliabilitäten und Kommunalitäten der Items die auf einen den einen extrahierten Faktor laden überprüft, "schlechte" Items (5 der 12 Items) entfernt und dann eine Faktorenanalyse mit der reduzierten Item-Anzahl durchgeführt. Alle Items laden auf einen Faktor, Kommunalitäten sind größer 0,4, Eigenwerte und Varianzaufklärung sind auch durchweg überzeugend.

Da ich den Faktor / die Items als abhängige Variable zur Nutzung für Mehrebenenmodelle (L1=Befragungsdaten, L2=offizielle Stadtteildaten aus) verwenden möchte, bin ich mir unsicher ob ich den extrahierten Faktor als Anderson-Rubin-Faktorwert speichern speichern und verwenden sollte (da z-standardisierung = Informationsverlust), oder stattdessen die genutzten 7 Items der Faktorenanalyse als Mittelwert-Index (new_var = mean (var1, var2, var3 etc...) speichern sollte.

Ich habe gelesen dass man bei Regressionsanalysen nicht unbedingt mit Faktorwerten als av rechnen sollte, zudem ist die interpretierbarkeit der Daten dadurch ebenfalls geringer, da ja nur etwas zur richtung (bzw. ob überdurchschnittlich oder unterdurchschnittlich viele verfallsanzeichen wahrgenommen werden) sagen kann. (A-R-Faktorwert hat Mittelwert von 0 und Bereich von +3 bis -3)

Da die 7 einbezogenen Variablen ja jeweils 5 gleiche Ausprägungen aufweisen, können sie ja auch als quasi metrisch angesehen werden und wären bei Erstellung eines Indices (Mittelwert-Index) ja wie eine metrische Variable zu behandeln und daher für Mehrebenenanalysen zu verwenden.

Zudem kann die AV als Mittelwertindex bei der Deskription besser beschrieben werden (Kreuztabellen usw.).

Was meint ihr dazu? Vorteile, Nachteile oder habe ich etwas übersehen bzw. falsch verstanden?


Ich bitte dringend um Eure Mithilfe. Danke vielmals im voraus

Gruß Stefan

PS Die Stadtteile sind bereits anhand von Strukturmerkmalen in 3 Gruppen geclustert. (bevorteilte, normale, problem) - Stadtteile. Falls die Hilfe bei einer Erklärung wieso ich besser den Faktorwert oder den Mittelwert-Indix berechneten sollte. (evtl. noch ne dritte Lösung)

Danke Danke Danke.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Zu dieser Frage gibt es hier jemanden, der sich besser auskennt als ich. Deshab nur eine kurze Anmerkung: Bei Faktorwerten (z.B. Regressions-, Anderson-Rubin oder Bartlettverfahren) gehen, soweit mir das geläufig ist, die Items nur entsprechend ihrer Ladung in den Faktorwert ein. Dem steht dann jedoch das Kontrukt des Designs, oder besser: dessen Wahrnehmung in der Interpretation, gegenüber. Das kann zu einem Problem werden, wenn einzelne Items mit nur (relativ) geringer Ladung zum Faktorwert beitragen, dies aber nicht berücksichtigt wird. Eine inhaltliche Interpretation, die von Gleichwertigkeit der Items ausgeht, wäre dann verzerrt. In bestimmten Bereichen angewandter Statistik würde ich jedenfalls einer klareren inhaltlichen Interpretierbarkeit gegenüber einer mathematisch fehlerfreien Modellbildung den Vorrang geben. Außerdem ließe sich mit der Summe der Items auch inhaltlich leichter umgehen. Etwa wenn es um Zustimmungs- oder Ablehnungsfragen geht, da die Summe der Erwartungswerte gleich Erwartungswert der Summe ist. Daher kann ich bei einer Summe von Skalen(-werten) im Sinne einnes objektiven Maßes auch den Punkt bestimmen, ab dem zugestimmt oder abgelehnt wird. Das ist bei Faktorwerten nicht der Fall, denn diese sind 'normiert' und stellen daher eher relative Bezüge her.

Aber wie gesagt, hier gibt es jemanden, der sich besser auskennt.
drfg2008
stefan80
Beiträge: 3
Registriert: 11.01.2013, 01:03

ok, dank dir drfg

Beitrag von stefan80 »

du bist doch ersteller dieser sehr gut gemachten Youtube Videos oder? SInd echt klasse. Haben mir bisweilen schon mehrfach geholfen. ;-))

Evtl. würde mich auch noch interessieren ob es eine inhaltliche Begründung für die Wahl/Erstellung entweder von Faktorwerten bzw. Mittelwert-Indices gibt.

Du weisst nicht reinzufällig wer der Experte auf den du dich beziehst ist? (Zwecks Board-Mail)

Ich tendiere auch eher zur Erstellung von Mittelwert-Indices, würde mich aber gerne rückversichern- :-)

Bin für jede Antwort/Anregung/Kritik sehr dankbar.

Gruss Stefan
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ja genau. Freue mich, dass die Videos, die an zwei Nachmittagen entstanden sind, sig. positive Effekte zur Folge haben ; -)

Für wissenschaftliche Arbeiten kommen als Zitat nur etablierte und anerkannte Quellen in Frage, keine Statistik Tutorials. Leider wüsste ich keine solche Quellen. Lienert / Raatz gelten zwar als die Klassiker in der Testtheorie, haben jedoch dazu nichts mir bekanntes publiziert. Andere Autoren leider auch nicht.

Einen Nachteil hat die Summenbildung allerdings auch: Der Faktor einer Faktorenanalyse bezieht sich sprachlichwissenschaftlich betrachtet nur auf den gemeinsamen Nenner der Bedeutungen der einzelnen Items (siehe Semantik, Literatur: Schulte-Sasse [1]). Die einfache Summenbildung berücksichtigt das nicht.


[1]
http://www.amazon.de/exec/obidos/ASIN/3 ... ikforum-21
drfg2008
stefan80
Beiträge: 3
Registriert: 11.01.2013, 01:03

Sonst niemand

Beitrag von stefan80 »

eine weitere Meinung zu dieser Thematik?

drfg sprach von Experten hier im Forum die mir möglichweise noch mehr Input geben können.

Freiwillige vor ;-)

Ich freue mich über jegliche Anregungen.
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Faktorwerte sind Mist. Die Gewichtungen sind stichprobenabhängig
und pseudo-präzise. Die mit den Scores durchgeführten weiteren
Analysen sind nicht gescheit replizierbar. Anschaulich ist es natürlich
auch nicht. Braucht kein Mensch.
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten