Probleme beim Datensätze zusammenfügen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Probleme beim Datensätze zusammenfügen

Beitrag von Fenia »

Hallo Leute,

ich möchte mit SPSS (Ver. 21) zwei Datensätze zusammenfügen. Der eine Datensatz enthält neue Variablen, die zu den jeweiligen Fällen des anderen Datensatzes hinzugefügt werden sollen. Gleichzeitig enthalten beide Datensätze jedoch auch zusätzlich unterschiedliche Fälle.

Ich öffne einen der Datensätze, klicke auf Daten --> Datensätze zusammenfügen --> Variablen hinzufügen, wähle die Datei aus, die die hinzuzufügenden Variablen enthält, klicke „Fälle nach Schlüsselvariable (Verwaltungsnummer) abgleichen“ und markiere „Beide Dateien liefern Fälle“.

Der neue Datensatz enthält nun zwar die Spaltenüberschriften der neu hinzugefügten Variablen, die Spalten werden jedoch nicht ausgefüllt.

Meine Vermutung ist, dass dies an den teilweise unterschiedlichen Fällen der beiden Datensätze liegt. Denn gleicht man die Fälle 1:1 an, so funktioniert das Hinzufügen der neuen Variablen und die Spalten werden ausgefüllt.

Allerdings ist es bei großen Datensätzen doch unmöglich, alle Fälle aus beiden Datensätzen per Hand auf Übereinstimmung zu überprüfen.

Gibt es also einen anderen Lösungsweg? Was mache ich falsch?

Ich hoffe sehr, dass ihr mir helfen könnt.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Die Daten aus beiden Datensätzen stehen nur in denjenigen Variablen, die auch in bei den Datensätzen identische Namen haben.
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Beitrag von Fenia »

Der Variablenname, der in beiden Datensätzen identisch ist, ist die Verwaltungsnummer. Diese Variable enthält Fälle, die zum Teil in beiden Datensätzen, zum Teil aber nur in einem der beiden Datensätze enthalten sind.

Füge ich nun neue Variablen (nicht neue Fälle) aus den einen Datensatz in den anderen Datensatz ein, werden zwar die Variablenüberschriften (Name, Geburstag, usw.) hinzugefügt, nicht jedoch der Inhalt der Variablen. Dieser fehlt bei sämtlichen Fällen, also auch denjenigen, die in beiden Datensätzen vorhanden wären.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Dann benutzt du scheinbar die falsche Prozedur, nimm doch mal "Fälle hinzufügen" (hier kann man auch die Variablen auswählen) und nicht "Variablen hinzufügen".

Ein wichtige Voraussetzung ist dabei, dass beide Datensätze aufsteigend sortiert sind.
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Beitrag von Fenia »

Aufsteigend sortiert habe ich.

Fälle hinzufügen habe ich auch bereits probiert.

Dann passiert folgendes:
Es werden alle Fälle aus dem einen Datensatz mitsamt den neuen Variablen in den anderen Datensatz hinzugefügt.

Der Datensatz sieht damit wie folgt aus:
Für Fälle, die nur in Datensatz 1 vorhanden sind:
Variablen aus Datensatz 1 sind ausgefüllt, die aus Datensatz 2 nicht (logisch).

Für Fälle, die nur in Datensatz 2 vorhanden sind:
Variablen aus Datensatz 1 sind leer, die aus Datensatz 2 sind ausgefüllt (logisch).

Für Fälle, die in Datensatz 1 und 2 vorhanden sind:
Sie erscheinen nun jeweils zweimal, einmal nur mit den Informationen aus Datensatz 1, einmal mit ausschließlich den Informationen aus Datensatz 2...

Damit kann man unmöglich etwas berechnen. Ich hätte gerne, dass bei der dritten Option die jeweiligen Fälle nur einmal auftauchen, jedoch die Informationen aus beiden Datensätzen enthalten.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Sind denn in beiden Datensätzen die Namen der Variablen (Nicht die Labels/Beschriftung) wirklich identisch?
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Beitrag von Fenia »

Ja, alles identisch, es sind genau die selben Verwaltungsnummern. Auch die Variablendefinition ist gleich, also selber Typ, Spaltenformat, Dezimalstellen usw...
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Wenn du in SPSS bei Daten --> Dateien zusammenfügen --> Fälle hinzufügen das letzte Fenster erreicht hast (dort wo man die Variablen auswählt), stehen dann die Variablen im linken Bereich (Nicht gepaarte Variablen) oder im rechten Bereich (Variablen in der neuen Arbeitsdatei)?

Was meinst du eigentlich mit Verwaltungsnummern???
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Beitrag von Fenia »

Verwaltungsnummer ist die Variable, die in meinen beiden Datensätzen vorkommt und eigentlich dafür zuständig sein sollte, dass SPSS richtig verknüpft.

Wenn ich das mache, was du sagst, dann stehen sämtliche Variablen im linken Bereich (manche haben ein * dahinter, manche ein +), nur die Verwaltungsnummer steht im rechten Fenster. Ich könnte nun alle Variablen ins rechte Fenster schieben, aber dann passiert das, was ich oben unter "Fälle zusammenfügen" beschrieben habe.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Ok, damit hat sich meine Vermutung bestätigt -> deine VariablenNAMEN sind NICHT identisch! Schau dir doch bitte noch einmal in der Variablenansicht die Spalte "Name" in beiden Datensätze an, dann solltest du auch die Unterschiede erkennen.

SPSS kann erstmal nur die Variablen zusammenführen die auch identische Namen haben.
Du kannst jetzt im letzten Fenster ("Daten --> Dateien zusammenfügen --> Fälle hinzufügen das letzte Fenster erreicht hast (dort wo man die Variablen auswählt)") aber auch Variablen mit unterschiedlichem Namen auswählen und sagen, dass diese ein "Paar" sein sollen. Dann hast du auch die Werte aus beiden Datensätzen in einer Variablen stehen.
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Beitrag von Fenia »

Die Variablennamen können doch aber gar nicht identisch sein, da der eine Datensatz andere Variablen enthält als der andere. Das ist doch genau der Punkt, dass ich die Variablen des einen Datensatzes in den anderen einfügen möchte.

Einzig die Verwaltungsnummer kommt in beiden Datensätzen vor, und die ist identisch.

Beispiel:
Datensatz 1 enhält Name, Adresse und Tel-Nr.
Datensatz 2 enthält Name, Hobby und Beruf.
Es gibt Namen, die sowohl nur in Datensatz 1 als auch nur in Datensatz 2 als auch in beiden Datensätzen vorkommen.

Ich will, dass Hobby und Beruf aus Datensatz 2 zu den jeweiligen Namen in Datensatz 1 hinzugefügt werden und somit die Informationen Adresse, Tel-Nr., Hobby und Beruf zu den jeweiligen Namen enhalten sind, die in beiden Datensätzen vorkommen..

Das funktioniert nicht, da zwar die Überschriften Hobby und Beruf hinzugefügt werden, die Informationen dazu jedoch nicht übertragen werden.
Frido
Beiträge: 346
Registriert: 25.09.2012, 15:04

Beitrag von Frido »

Probiere doch mal das hier:

MATCH FILES
/FILE = 'C:\Datensatz 1.sav'
/FILE = 'C:\Datensatz 2.sav'
/BY Verwaltungsnummer.

Wenn dann die Werte nicht richtig zugeordnet sind, dann sind es wahrscheinlich nicht die gleichen "Verwaltungsnummern".

Und vorher noch die Datensätze sorieren.
Fenia
Beiträge: 7
Registriert: 29.08.2013, 11:19

Beitrag von Fenia »

Okey, jetzt sind alle Variablen korrekt in dem Datensatz (also alle Spaltenüberschriften mit der richtigen Definition), es sind jedoch keinerlei Werte enthalten. Der Datensatz ist quasi leer.

Ahh, hab's grad herausgefunden. Der execute-Befehl hat gefehlt. Schreibt man den dazu, funktionierte es auf einmal. Oo

Vielen vielen Dank! Das war echt eine schwere Geburt...
Wolf Riepl
Beiträge: 21
Registriert: 23.03.2009, 12:28

Execute ...

Beitrag von Wolf Riepl »

Kleiner Tipp:

In solchen Fällen (wenn z. B. Execute fehlt) zeigt SPSS rechts unten in einer Art Statusanzeige an: "Offene Transformationen". Das ist ein Alarmzeichen!

(Andere Hinweise an dieser Stelle sind z. B. "Gewichtung aktiv" oder "Filter aktiv".)
"Wieso interpretieren? Das Ergebnis steht doch schon da!"
"Die Zahlen sprechen nicht für sich selbst ..."
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten