Lineare Regression mit nicht normalverteilten V.?

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
PhilLe
Beiträge: 18
Registriert: 04.08.2011, 18:32

Lineare Regression mit nicht normalverteilten V.?

Beitrag von PhilLe »

Hallo allerseits,

Ich habe ein paar Daten manuell aus einem Online Social Network gesammelt um diese jetzt zu analysieren. ich würde gerne eine Lineare Regression über eine Abhängige und mehrere Unabhängige Variablen machen.
Hier stoße ich leider mit meinen Statistik Grundkentnissen an meine Grenzen.

Die Abhängige Variablen sind:
- die Anzahl an "likes" zu einem Beitrag, Verhältnisskaliert.
- die Anzahl an Kommentaren zu einem Beitrag, Verhältnisskaliert.

Unabhängige Variablen sind:
- die Anzahl an Zeichen in einem Beitag; Verhältnisskaliert.
- ob in dem Beitrag Hyperlinks enthalten sind, oder nicht; Nominalskaliert.
(ggf. die Anzahl an Links, was Verhältnisskaliert wäre).
- ob in dem Beitrag Videos enthalten sind, oder nicht; Nominalskaliert.
(ggf. die Anzahl an Videos, was Verhältnisskaliert wäre).
- die Anzahl an "Freunden" der Person die den Beitrag veröffentlicht hat; Verhältnisskaliert.
- die Uhrzeit zu der der Beitrag veröffentlicht wurde,; Intervallskala.
- der Wochentag an dem der Beitrag veröffentlicht wurde; Nominalskaliert.


Was muss ich nun beachten um eine Lineare Regression über eine der Abhängigen Variablen (z.b. likes) und die Unabhängigen Variablen durchzuführen?
Stellt es ein Problem dar, dass nicht alle Variablen verhältnisskaliert sind?
Auch normalverteilt sind die Variablen nicht. Muss ich die Variablen für eine Lineare Regression transformieren?

SPSS steht mir zur Verfügung.

Schonmal vielen vielen Dank im voraus für die Hilfe. Viele Grüße, Phil
PhilLe
Beiträge: 18
Registriert: 04.08.2011, 18:32

Beitrag von PhilLe »

Hi,

ich wäre euch wirklich sehr verbunden, wenn ihr mir etwas auf die Sprünge helfen könntet :)

Und wenn nicht zum Thema, dann bitte warum eine Antwort überflüssig ist ... ist die Fragestellung zu trivial? versteht man mein Problem nicht? Irgendwelche gravierenden Fehler in der Fragestellung die euch abgeschreckt haben? ...

Danke ;) Grüße!
Elch
Beiträge: 5
Registriert: 09.08.2011, 16:27

Beitrag von Elch »

Hmmm, also ich hab da auch leider nur ein paar Kenntnisse drüber. Bei Regression ist es auf jeden Fall wichtig die eingangs und Ausgangswerte zu normieren um möglichst "flache" koeffizienten zu erhalten. Transformieren musst du die Variablen allerdings meines Wissens nach nicht.
PhilLe
Beiträge: 18
Registriert: 04.08.2011, 18:32

Beitrag von PhilLe »

Also, zu der ursprünglich Frage bin ich schon ein bisschen weiter gekommen:

Die unahängigen Variablen die ich als "nominalskaliert" angegeben habe sind eigentlich Dummy-Variablen und dichotom. Man kann mit ihnen wie mit rang (oder sogar metrisch?) skalierten Variablen rechnen.

Beachtet werden bei einer multiplen LR muss:

dass ein linearer zusammenhang zwischen der AV und den UV besteht (kann visuell in einem Streudigram geprüft werden),

dass bei den Variablen Homoskedastizität (gleichheit der Varianz) vorliegt,

entgegen meiner Vermutung ist Normalverteiltheit Variablen keine Voraussetzung,

hingegen ist Normalverteilung der Residuen (nach der LR) eine Voraussetzung (aber nur bei kleinen n?)

Liegt jetzt doch Heteroskedastizität vor, dann kann man diese wohl über transformation der Variablen beseitigen. Was (und ob) das für einen Effekt auf die Aussagekraft des Modells später hat, dass habe ich noch nicht verstanden.

Hier habe ich eine ziemlich gute und sehr ausführliche Hilfestellung gefunden:

http://home.arcor.de/sigmatraugott/Skri ... ssion.html
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten