ich beschäftige mich für meine Diplomarbeit mit einem relativ großen Datensatz: 217 Variablen (kann auf 86 gekürzt werden) und ca. 56.000 Fälle. Pro ID kann ich ca. 80 Fälle für den gesamten Untersuchungszeitraum (6 Wochen) ausmachen bzw. 4-17 Fälle für 1 Tag.
Wenn ich nun versuche die Fälle zu verknüpfen (zumindest für 1 Untersuchungstag) kommen bei der Umstrukturierung viel zu viele Variablen dabei heraus (mehrere Tausend).
Mache ich irgendetwas falsch bzw. könnt Ihr mir sagen welche Möglichkeiten ich habe die Variablen anschließend oder vorher zusammen zu führen?

Muss ich alle anderen Variablen, die nicht für meine Fragestellung interessant sind löschen? Kann ich die Variablen aggregieren, so dass die einzelnen Wertigkeiten jedoch nicht verloren gehen (über einen anderen Weg als Multiplikation mit 1000,100,10 und anschließender Addition)? Oder kann ich die nach der Umstrukturierung entstandenen neuen Variablen irgendwie zusammen fassen?
Beispiel: 4 Beobachtungen für 1 ID an 1 Tag. Eine Variable ist die Nr. der Beobachtung im Tagesablauf, Umstrukturierung der 4 Fälle, indem man sie alle der 1 ID zuordnet. Nach der Umstrukturierung 4 Variablen Nr Beobachtung 1, Nr. Beoachtung 2, Nr. Beobachtung 3 und Nr. Beobachtung 4. Kann man die dann irgendwie wieder zusammenfassen? Oder einer anderen Variable zuordnen? Oder vorher irgendetwas zusammenfassen?
Bin im Moment ziemlich ratlos und hoffe, dass mir jemand helfen kann.
Vielen Dank schon einmal im voraus
