GNU R : Problem mit verallgemeinertem linearem Modell

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Pik-Bube
Beiträge: 3
Registriert: 09.08.2012, 11:30

GNU R : Problem mit verallgemeinertem linearem Modell

Beitrag von Pik-Bube »

Hallo alle zusammen,
Ich habe folgendes Problem. Und zwar betrachte ich ein verallgemeinertes lineares Modell, bei dem die Werte poissonverteilt sind. Und zwar rel. einfach
Y=beta1 + X*beta2

Das Problem ist, dass es in dem Datensatz vorkommt, dass für gewisse (empirische) Werte aus X mehrere Werte Y zugeordnet sind.
Womit man ja nicht mehr einfach die Funktion glm() aus GNU R anwenden kann. Meine frage ist jetzt, wie ich dieses Problem umgehen kann. Denn ich habe im Skript und im Internet nichts dazu gefunden. (Um ehrlich zu sein weiß ich auch nicht ganz genau wie ich das Problem in wenigen Worten ausdrücken kann.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

das ist aber keine R-Plattform hier
drfg2008
Pik-Bube
Beiträge: 3
Registriert: 09.08.2012, 11:30

re

Beitrag von Pik-Bube »

Das war auch mehr als allgemeine Frage gedacht, denn SPSS hat das selbe Problem und wenn man es per Hand ausrechnen möchte funktioniert das auch nicht. Daher bin ich an einer allgemeinen Lösung interessiert und nicht direkt an dem Programmcode
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Y=beta1 + X*beta2
Wenn das Modell nur aus einer UV (beta2), dem Intercept (beta1) besteht, wie können dann mehr als eine AV vorhergesagt werden?

-> Wurden Messwiederholungen zu verschiedenen Zeitpunkten vorgenommen?

(Ob Poisson- oder N~Vtlg. würde hier keinen Unterschied machen.)
drfg2008
Pik-Bube
Beiträge: 3
Registriert: 09.08.2012, 11:30

Beitrag von Pik-Bube »

Wenn das Modell nur aus einer UV (beta2), dem Intercept (beta1) besteht, wie können dann mehr als eine AV vorhergesagt werden?
Es wurde an verschiedenen Arealen gewisse Blumen gepflanzt und dann gezählt wie viele Bienen sich dort niederlassen. Wobei hier die Anzahl der gesetzten Blumen von Interesse ist, daher kommt es zu Stande, dass einmal die selbe Anzahl gepflanzt wurde und zum sich zum anderem auf verschiedenen Arealen die gleiche Anzahl Bienen niedergelassen hat.

Wobei wir erst einmal von einem einfachem linearem Zusammenhang ausgehen sollen. Und von Poissonverteilung, da sich ja immer nur mal Bienen niederlassen.

Ich hab nochmal genauer geschaut und festgestellt, dass bei dem Datensatz den ich habe sich ein Problem ergibt, wenn ich zusätzlich die Linkfunktion mit Identity angebe (um das ganze linear zu machen und nicht logarithmisch). Dann gibt das Programm zwar Werte heraus, sagt aber gleichzeitig, dass mehrere male NaNs (not a Number) erzeugt wurden und teilweise abgebrochen wurde, weil der Algorithmus nicht konvergiert. Das Problem habe ich nicht, wenn ich entweder die Linkfunktion "weglasse" (also bei log bleibe) oder wenn ich das ganze als Normalverteilt ansehe.

Ich habe jetzt auch mal einen kleineren vergleich gemacht mit ausgedachten Werten, wo solche Dopplungen vorkommen und da gibt es keinerlei Probleme.

kann es vielleicht daran liegen, dass die Designmatrix keinen maximalen Rang hat und das damit hier der numerische Algorithmus intern nicht konvergiert?[/quote]
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Es wurde an verschiedenen Arealen gewisse Blumen gepflanzt und dann gezählt wie viele Bienen sich dort niederlassen.
Was aber ist die Fragestellung.

Sollte für die Fragestellung nur aus diesem Grund die Poisson Verteilung angnommen werden, wäre das Vorgehen nicht unbedingt richtig, denn es geht um die Normalverteilung der Residuen (nicht der ZV). Poisson (großes N kleines p, die Verteilung seltener Ereignisse) wird bei SPSS über das verallg. Lin. Modell berechnet. Dann wären die Blumen die Faktoren. Das liefe dann auf die Fragestellung hinaus, ob es Unterschiede bzgl. der Blumen -> Bienen gibt.
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten