Hallo allerseits,
Ich habe ein paar Daten manuell aus einem Online Social Network gesammelt um diese jetzt zu analysieren. ich würde gerne eine Lineare Regression über eine Abhängige und mehrere Unabhängige Variablen machen.
Hier stoße ich leider mit meinen Statistik Grundkentnissen an meine Grenzen.
Die Abhängige Variablen sind:
- die Anzahl an "likes" zu einem Beitrag, Verhältnisskaliert.
- die Anzahl an Kommentaren zu einem Beitrag, Verhältnisskaliert.
Unabhängige Variablen sind:
- die Anzahl an Zeichen in einem Beitag; Verhältnisskaliert.
- ob in dem Beitrag Hyperlinks enthalten sind, oder nicht; Nominalskaliert.
(ggf. die Anzahl an Links, was Verhältnisskaliert wäre).
- ob in dem Beitrag Videos enthalten sind, oder nicht; Nominalskaliert.
(ggf. die Anzahl an Videos, was Verhältnisskaliert wäre).
- die Anzahl an "Freunden" der Person die den Beitrag veröffentlicht hat; Verhältnisskaliert.
- die Uhrzeit zu der der Beitrag veröffentlicht wurde,; Intervallskala.
- der Wochentag an dem der Beitrag veröffentlicht wurde; Nominalskaliert.
Was muss ich nun beachten um eine Lineare Regression über eine der Abhängigen Variablen (z.b. likes) und die Unabhängigen Variablen durchzuführen?
Stellt es ein Problem dar, dass nicht alle Variablen verhältnisskaliert sind?
Auch normalverteilt sind die Variablen nicht. Muss ich die Variablen für eine Lineare Regression transformieren?
SPSS steht mir zur Verfügung.
Schonmal vielen vielen Dank im voraus für die Hilfe. Viele Grüße, Phil
Lineare Regression mit nicht normalverteilten V.?
-
- Beiträge: 18
- Registriert: 04.08.2011, 18:32
-
- Beiträge: 18
- Registriert: 04.08.2011, 18:32
Hi,
ich wäre euch wirklich sehr verbunden, wenn ihr mir etwas auf die Sprünge helfen könntet
Und wenn nicht zum Thema, dann bitte warum eine Antwort überflüssig ist ... ist die Fragestellung zu trivial? versteht man mein Problem nicht? Irgendwelche gravierenden Fehler in der Fragestellung die euch abgeschreckt haben? ...
Danke
Grüße!
ich wäre euch wirklich sehr verbunden, wenn ihr mir etwas auf die Sprünge helfen könntet

Und wenn nicht zum Thema, dann bitte warum eine Antwort überflüssig ist ... ist die Fragestellung zu trivial? versteht man mein Problem nicht? Irgendwelche gravierenden Fehler in der Fragestellung die euch abgeschreckt haben? ...
Danke

-
- Beiträge: 5
- Registriert: 09.08.2011, 16:27
-
- Beiträge: 18
- Registriert: 04.08.2011, 18:32
Also, zu der ursprünglich Frage bin ich schon ein bisschen weiter gekommen:
Die unahängigen Variablen die ich als "nominalskaliert" angegeben habe sind eigentlich Dummy-Variablen und dichotom. Man kann mit ihnen wie mit rang (oder sogar metrisch?) skalierten Variablen rechnen.
Beachtet werden bei einer multiplen LR muss:
dass ein linearer zusammenhang zwischen der AV und den UV besteht (kann visuell in einem Streudigram geprüft werden),
dass bei den Variablen Homoskedastizität (gleichheit der Varianz) vorliegt,
entgegen meiner Vermutung ist Normalverteiltheit Variablen keine Voraussetzung,
hingegen ist Normalverteilung der Residuen (nach der LR) eine Voraussetzung (aber nur bei kleinen n?)
Liegt jetzt doch Heteroskedastizität vor, dann kann man diese wohl über transformation der Variablen beseitigen. Was (und ob) das für einen Effekt auf die Aussagekraft des Modells später hat, dass habe ich noch nicht verstanden.
Hier habe ich eine ziemlich gute und sehr ausführliche Hilfestellung gefunden:
http://home.arcor.de/sigmatraugott/Skri ... ssion.html
Die unahängigen Variablen die ich als "nominalskaliert" angegeben habe sind eigentlich Dummy-Variablen und dichotom. Man kann mit ihnen wie mit rang (oder sogar metrisch?) skalierten Variablen rechnen.
Beachtet werden bei einer multiplen LR muss:
dass ein linearer zusammenhang zwischen der AV und den UV besteht (kann visuell in einem Streudigram geprüft werden),
dass bei den Variablen Homoskedastizität (gleichheit der Varianz) vorliegt,
entgegen meiner Vermutung ist Normalverteiltheit Variablen keine Voraussetzung,
hingegen ist Normalverteilung der Residuen (nach der LR) eine Voraussetzung (aber nur bei kleinen n?)
Liegt jetzt doch Heteroskedastizität vor, dann kann man diese wohl über transformation der Variablen beseitigen. Was (und ob) das für einen Effekt auf die Aussagekraft des Modells später hat, dass habe ich noch nicht verstanden.
Hier habe ich eine ziemlich gute und sehr ausführliche Hilfestellung gefunden:
http://home.arcor.de/sigmatraugott/Skri ... ssion.html