Probleme beim Datensätze zusammenfügen
-
- Beiträge: 7
- Registriert: 29.08.2013, 11:19
Probleme beim Datensätze zusammenfügen
Hallo Leute,
ich möchte mit SPSS (Ver. 21) zwei Datensätze zusammenfügen. Der eine Datensatz enthält neue Variablen, die zu den jeweiligen Fällen des anderen Datensatzes hinzugefügt werden sollen. Gleichzeitig enthalten beide Datensätze jedoch auch zusätzlich unterschiedliche Fälle.
Ich öffne einen der Datensätze, klicke auf Daten --> Datensätze zusammenfügen --> Variablen hinzufügen, wähle die Datei aus, die die hinzuzufügenden Variablen enthält, klicke „Fälle nach Schlüsselvariable (Verwaltungsnummer) abgleichen“ und markiere „Beide Dateien liefern Fälle“.
Der neue Datensatz enthält nun zwar die Spaltenüberschriften der neu hinzugefügten Variablen, die Spalten werden jedoch nicht ausgefüllt.
Meine Vermutung ist, dass dies an den teilweise unterschiedlichen Fällen der beiden Datensätze liegt. Denn gleicht man die Fälle 1:1 an, so funktioniert das Hinzufügen der neuen Variablen und die Spalten werden ausgefüllt.
Allerdings ist es bei großen Datensätzen doch unmöglich, alle Fälle aus beiden Datensätzen per Hand auf Übereinstimmung zu überprüfen.
Gibt es also einen anderen Lösungsweg? Was mache ich falsch?
Ich hoffe sehr, dass ihr mir helfen könnt.
ich möchte mit SPSS (Ver. 21) zwei Datensätze zusammenfügen. Der eine Datensatz enthält neue Variablen, die zu den jeweiligen Fällen des anderen Datensatzes hinzugefügt werden sollen. Gleichzeitig enthalten beide Datensätze jedoch auch zusätzlich unterschiedliche Fälle.
Ich öffne einen der Datensätze, klicke auf Daten --> Datensätze zusammenfügen --> Variablen hinzufügen, wähle die Datei aus, die die hinzuzufügenden Variablen enthält, klicke „Fälle nach Schlüsselvariable (Verwaltungsnummer) abgleichen“ und markiere „Beide Dateien liefern Fälle“.
Der neue Datensatz enthält nun zwar die Spaltenüberschriften der neu hinzugefügten Variablen, die Spalten werden jedoch nicht ausgefüllt.
Meine Vermutung ist, dass dies an den teilweise unterschiedlichen Fällen der beiden Datensätze liegt. Denn gleicht man die Fälle 1:1 an, so funktioniert das Hinzufügen der neuen Variablen und die Spalten werden ausgefüllt.
Allerdings ist es bei großen Datensätzen doch unmöglich, alle Fälle aus beiden Datensätzen per Hand auf Übereinstimmung zu überprüfen.
Gibt es also einen anderen Lösungsweg? Was mache ich falsch?
Ich hoffe sehr, dass ihr mir helfen könnt.
-
- Beiträge: 7
- Registriert: 29.08.2013, 11:19
Der Variablenname, der in beiden Datensätzen identisch ist, ist die Verwaltungsnummer. Diese Variable enthält Fälle, die zum Teil in beiden Datensätzen, zum Teil aber nur in einem der beiden Datensätze enthalten sind.
Füge ich nun neue Variablen (nicht neue Fälle) aus den einen Datensatz in den anderen Datensatz ein, werden zwar die Variablenüberschriften (Name, Geburstag, usw.) hinzugefügt, nicht jedoch der Inhalt der Variablen. Dieser fehlt bei sämtlichen Fällen, also auch denjenigen, die in beiden Datensätzen vorhanden wären.
Füge ich nun neue Variablen (nicht neue Fälle) aus den einen Datensatz in den anderen Datensatz ein, werden zwar die Variablenüberschriften (Name, Geburstag, usw.) hinzugefügt, nicht jedoch der Inhalt der Variablen. Dieser fehlt bei sämtlichen Fällen, also auch denjenigen, die in beiden Datensätzen vorhanden wären.
-
- Beiträge: 346
- Registriert: 25.09.2012, 15:04
-
- Beiträge: 7
- Registriert: 29.08.2013, 11:19
Aufsteigend sortiert habe ich.
Fälle hinzufügen habe ich auch bereits probiert.
Dann passiert folgendes:
Es werden alle Fälle aus dem einen Datensatz mitsamt den neuen Variablen in den anderen Datensatz hinzugefügt.
Der Datensatz sieht damit wie folgt aus:
Für Fälle, die nur in Datensatz 1 vorhanden sind:
Variablen aus Datensatz 1 sind ausgefüllt, die aus Datensatz 2 nicht (logisch).
Für Fälle, die nur in Datensatz 2 vorhanden sind:
Variablen aus Datensatz 1 sind leer, die aus Datensatz 2 sind ausgefüllt (logisch).
Für Fälle, die in Datensatz 1 und 2 vorhanden sind:
Sie erscheinen nun jeweils zweimal, einmal nur mit den Informationen aus Datensatz 1, einmal mit ausschließlich den Informationen aus Datensatz 2...
Damit kann man unmöglich etwas berechnen. Ich hätte gerne, dass bei der dritten Option die jeweiligen Fälle nur einmal auftauchen, jedoch die Informationen aus beiden Datensätzen enthalten.
Fälle hinzufügen habe ich auch bereits probiert.
Dann passiert folgendes:
Es werden alle Fälle aus dem einen Datensatz mitsamt den neuen Variablen in den anderen Datensatz hinzugefügt.
Der Datensatz sieht damit wie folgt aus:
Für Fälle, die nur in Datensatz 1 vorhanden sind:
Variablen aus Datensatz 1 sind ausgefüllt, die aus Datensatz 2 nicht (logisch).
Für Fälle, die nur in Datensatz 2 vorhanden sind:
Variablen aus Datensatz 1 sind leer, die aus Datensatz 2 sind ausgefüllt (logisch).
Für Fälle, die in Datensatz 1 und 2 vorhanden sind:
Sie erscheinen nun jeweils zweimal, einmal nur mit den Informationen aus Datensatz 1, einmal mit ausschließlich den Informationen aus Datensatz 2...
Damit kann man unmöglich etwas berechnen. Ich hätte gerne, dass bei der dritten Option die jeweiligen Fälle nur einmal auftauchen, jedoch die Informationen aus beiden Datensätzen enthalten.
-
- Beiträge: 346
- Registriert: 25.09.2012, 15:04
Wenn du in SPSS bei Daten --> Dateien zusammenfügen --> Fälle hinzufügen das letzte Fenster erreicht hast (dort wo man die Variablen auswählt), stehen dann die Variablen im linken Bereich (Nicht gepaarte Variablen) oder im rechten Bereich (Variablen in der neuen Arbeitsdatei)?
Was meinst du eigentlich mit Verwaltungsnummern???
Was meinst du eigentlich mit Verwaltungsnummern???
-
- Beiträge: 7
- Registriert: 29.08.2013, 11:19
Verwaltungsnummer ist die Variable, die in meinen beiden Datensätzen vorkommt und eigentlich dafür zuständig sein sollte, dass SPSS richtig verknüpft.
Wenn ich das mache, was du sagst, dann stehen sämtliche Variablen im linken Bereich (manche haben ein * dahinter, manche ein +), nur die Verwaltungsnummer steht im rechten Fenster. Ich könnte nun alle Variablen ins rechte Fenster schieben, aber dann passiert das, was ich oben unter "Fälle zusammenfügen" beschrieben habe.
Wenn ich das mache, was du sagst, dann stehen sämtliche Variablen im linken Bereich (manche haben ein * dahinter, manche ein +), nur die Verwaltungsnummer steht im rechten Fenster. Ich könnte nun alle Variablen ins rechte Fenster schieben, aber dann passiert das, was ich oben unter "Fälle zusammenfügen" beschrieben habe.
-
- Beiträge: 346
- Registriert: 25.09.2012, 15:04
Ok, damit hat sich meine Vermutung bestätigt -> deine VariablenNAMEN sind NICHT identisch! Schau dir doch bitte noch einmal in der Variablenansicht die Spalte "Name" in beiden Datensätze an, dann solltest du auch die Unterschiede erkennen.
SPSS kann erstmal nur die Variablen zusammenführen die auch identische Namen haben.
Du kannst jetzt im letzten Fenster ("Daten --> Dateien zusammenfügen --> Fälle hinzufügen das letzte Fenster erreicht hast (dort wo man die Variablen auswählt)") aber auch Variablen mit unterschiedlichem Namen auswählen und sagen, dass diese ein "Paar" sein sollen. Dann hast du auch die Werte aus beiden Datensätzen in einer Variablen stehen.
SPSS kann erstmal nur die Variablen zusammenführen die auch identische Namen haben.
Du kannst jetzt im letzten Fenster ("Daten --> Dateien zusammenfügen --> Fälle hinzufügen das letzte Fenster erreicht hast (dort wo man die Variablen auswählt)") aber auch Variablen mit unterschiedlichem Namen auswählen und sagen, dass diese ein "Paar" sein sollen. Dann hast du auch die Werte aus beiden Datensätzen in einer Variablen stehen.
-
- Beiträge: 7
- Registriert: 29.08.2013, 11:19
Die Variablennamen können doch aber gar nicht identisch sein, da der eine Datensatz andere Variablen enthält als der andere. Das ist doch genau der Punkt, dass ich die Variablen des einen Datensatzes in den anderen einfügen möchte.
Einzig die Verwaltungsnummer kommt in beiden Datensätzen vor, und die ist identisch.
Beispiel:
Datensatz 1 enhält Name, Adresse und Tel-Nr.
Datensatz 2 enthält Name, Hobby und Beruf.
Es gibt Namen, die sowohl nur in Datensatz 1 als auch nur in Datensatz 2 als auch in beiden Datensätzen vorkommen.
Ich will, dass Hobby und Beruf aus Datensatz 2 zu den jeweiligen Namen in Datensatz 1 hinzugefügt werden und somit die Informationen Adresse, Tel-Nr., Hobby und Beruf zu den jeweiligen Namen enhalten sind, die in beiden Datensätzen vorkommen..
Das funktioniert nicht, da zwar die Überschriften Hobby und Beruf hinzugefügt werden, die Informationen dazu jedoch nicht übertragen werden.
Einzig die Verwaltungsnummer kommt in beiden Datensätzen vor, und die ist identisch.
Beispiel:
Datensatz 1 enhält Name, Adresse und Tel-Nr.
Datensatz 2 enthält Name, Hobby und Beruf.
Es gibt Namen, die sowohl nur in Datensatz 1 als auch nur in Datensatz 2 als auch in beiden Datensätzen vorkommen.
Ich will, dass Hobby und Beruf aus Datensatz 2 zu den jeweiligen Namen in Datensatz 1 hinzugefügt werden und somit die Informationen Adresse, Tel-Nr., Hobby und Beruf zu den jeweiligen Namen enhalten sind, die in beiden Datensätzen vorkommen..
Das funktioniert nicht, da zwar die Überschriften Hobby und Beruf hinzugefügt werden, die Informationen dazu jedoch nicht übertragen werden.
-
- Beiträge: 346
- Registriert: 25.09.2012, 15:04
-
- Beiträge: 7
- Registriert: 29.08.2013, 11:19
Okey, jetzt sind alle Variablen korrekt in dem Datensatz (also alle Spaltenüberschriften mit der richtigen Definition), es sind jedoch keinerlei Werte enthalten. Der Datensatz ist quasi leer.
Ahh, hab's grad herausgefunden. Der execute-Befehl hat gefehlt. Schreibt man den dazu, funktionierte es auf einmal. Oo
Vielen vielen Dank! Das war echt eine schwere Geburt...
Ahh, hab's grad herausgefunden. Der execute-Befehl hat gefehlt. Schreibt man den dazu, funktionierte es auf einmal. Oo
Vielen vielen Dank! Das war echt eine schwere Geburt...
-
- Beiträge: 21
- Registriert: 23.03.2009, 12:28
Execute ...
Kleiner Tipp:
In solchen Fällen (wenn z. B. Execute fehlt) zeigt SPSS rechts unten in einer Art Statusanzeige an: "Offene Transformationen". Das ist ein Alarmzeichen!
(Andere Hinweise an dieser Stelle sind z. B. "Gewichtung aktiv" oder "Filter aktiv".)
In solchen Fällen (wenn z. B. Execute fehlt) zeigt SPSS rechts unten in einer Art Statusanzeige an: "Offene Transformationen". Das ist ein Alarmzeichen!
(Andere Hinweise an dieser Stelle sind z. B. "Gewichtung aktiv" oder "Filter aktiv".)
"Wieso interpretieren? Das Ergebnis steht doch schon da!"
"Die Zahlen sprechen nicht für sich selbst ..."
"Die Zahlen sprechen nicht für sich selbst ..."