Umfangreiche Gruppierung in SPSS

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
xu.sha
Beiträge: 5
Registriert: 14.04.2011, 20:57

Umfangreiche Gruppierung in SPSS

Beitrag von xu.sha »

Hallo ihre Wissenden,

ich brauche Hilfe bei der Gruppierung von Daten im SPSS.
Ausganslage:
Ich habe einen ENORM großen Datensatz, weswegen manuelle Gruppierung / Bildung neuer Variablen unmöglich ist. Ca. 200müssen nach 2 Kriterien in ca 30 Gruppen eingeteilt werden.

Bsp:
Var XY
8010289
8010245
8010212
8020289
8020212
8020227
8010273
......

Gruppierung erstes Kriterium:
Alle zahlen mit Endung 89 und 27 - Firma A
Alle Werte mit Endung 45 - Firma B
Alle Werte mit Endung 12 und 27 - Firma C
.....

Gruppierung zweites Kriterium:
Alle Werte mit 1 an dritter Stelle - Standort 1
Alle Werte mit 2 an dritter Stelle - Standort 2

Die Firmen-Gruppen und die Standort-Gruppen solten einzeln analysierbar sein.


Habt ihr eine Idee?
Ich bin totaler Anfänger und freu mich über jeden Rat!

Danke schon einmal!!!
VG
xu.sha
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Variable XY sollte eine String-Variable sein.
Dann kann man Bedingungen mit "SUBSTRING" (den Befehl bitte recherchieren) erzeugen.

Beispielsweise:
IF(SUBSTRING(VariableXY,6,2)="89" OR SUBSTRING(VariableXY,6,2) ="27") Firma = "A" .
xu.sha
Beiträge: 5
Registriert: 14.04.2011, 20:57

Beitrag von xu.sha »

Hallo Generalist,

vielen Dank für die Antwort.
Verstehe ich es richtig dass ich jeden Wert (also die Endung 89 bzw 27) einzeln aufnehmen muss? Da ich ja ca 200 Werte habe, die gruppiert werden müssen, würde es vermutlich seeehr lange dauern... :(

Gibt es eine Möglichkeit, die Gruppierung automatiseiert vorzunehmen?

Ich habe dazu in Excel bereits eine Gruppierung
Spalte A: Werte
Spalte B: Endungen
Spalte C: Gruppe (also Firma)

Vielleicht ist es ja möglich, auf diese "Vorsortierung" zu verweisen?

Besten Dank nochmals,

Grüße
xu.sha
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Ich habe einen ENORM großen Datensatz, weswegen manuelle Gruppierung / Bildung neuer Variablen unmöglich ist. Ca. 200müssen nach 2 Kriterien in ca 30 Gruppen eingeteilt werden.
Meinst du 200 oder 200 Mio. ?

Gruß
drfg2008
xu.sha
Beiträge: 5
Registriert: 14.04.2011, 20:57

Beitrag von xu.sha »

Hi!

Der gesamte Datensatz hat fast 400mio Fälle.

Bei der Gruppierung geht es aber um 200 Ausprägungen, welche in Gruppen sortiert werden sollen.

VG
xu.sha
Beiträge: 5
Registriert: 14.04.2011, 20:57

@ Generalist

Beitrag von xu.sha »

Hallo Generalist,

nach längerem Suchen werde ich aus der Substring-Funktion nicht schlauer....
Kannst Du mir vllt noch einen Hint geben, wo ich diese Funktion überhaupt ansetzten muss - über diese Syntax-Datei (??) oder über "Variablen umcodieren" oder irgendwie ganz anders?

Sorry - ich bin leider absoluter Neuling und muss mich graad von Null auf 100 da reinarbeiten :(

Vielen Danl dir!
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Es scheint unumgänglich, dass Du Dir ein Buch oder ein online-Tutorial oder dergleichen zuführst, in dem die grundlegenden Elemente der Programmbedienung erläutert werden.
xu.sha
Beiträge: 5
Registriert: 14.04.2011, 20:57

Beitrag von xu.sha »

Hallo Generalist,

da hast Du sicher recht, ich bin auch dabei mir Bücher zu besorgen. Leider muss bei uns immer alles sooo schnell gehen, deswegen hab ich es erstmal ohne versucht.

Vielen Dank für die Hilfe! Wenn ich etwas weiter gekommen bin, werde ich hier im Forum sicher noch die eine oder andere Frage stellen.

Viele Grüße

Xenia
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten