Anzahl identischer Fälle zählen gruppiert

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
Antworten
Thoro
Beiträge: 4
Registriert: 12.10.2011, 09:41

Anzahl identischer Fälle zählen gruppiert

Beitrag von Thoro »

Hallo zusammen,

kennt jemand einen Syntaxbefehl oder eine Vorgehensweise, um einen SPSS-Datensatz nach identischen Fällen nach Kategorien zu durchsuchen und deren Anzahl in einer Variablen auszugeben?

Mein großer Datenfile sieht in etwa so aus:

Jahr Name
2001 Karl
2001 Hans
2001 Fritz
2001 Karl
2001 Peter
2001 Fritz
2001 Peter
2001 Karl
2001 Josef
2001 Josef
2002 Thomas
2002 Karl
2002 Josef
2002 Josef
2002 Karl
2002 Josef
2002 Josef
2002 Fritz
2002 Peter
2002 Peter
2003 Heinz
2003 Karl
2003 Rainer
2003 Fritz
2003 Peter
2003 Fritz
2003 Peter
2003 Josef
2003 Thomas
2003 Josef

und so soll es aussehen, wenn es fertig ist.

Jahr.....Name.....Anzahl der Namen pro Jahr
2001.....Karl..... 5
2001.....Hans.....5
2001.....Fritz..... 5
2001.....Karl..... 5
2001.....Peter....5
2001.....Fritz..... 5
2001.....Peter....5
2001.....Karl..... 5
2001.....Josef.....5
2001.....Josef.....5
2002.....Thomas.6
2002.....Karl..... 6
2002.....Josef.....6
2002.....Josef.....6
2002.....Karl..... 6
2002.....Josef.....6
2002.....Josef.....6
2002.....Fritz..... 6
2002.....Peter.....6
2002.....Peter.....6
2003.....Heinz.....7
2003.....Karl..... 7
2003.....Rainer...7
2003.....Fritz..... 7
2003.....Peter.....7
2003.....Fritz..... 7
2003.....Peter.....7
2003.....Josef.....7
2003.....Thomas.7
2003.....Josef.....7

Mit "Aggregieren" bekomme ich immer nur die komplette Anzahl pro Jahr heraus, aber ich will die Anzahl der Namen pro Jahr ausgegeben haben.
Danke und Grüße
Thomas
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Jahr UND Name als break Variablen. Mannomann...
Skuz
Beiträge: 141
Registriert: 25.07.2008, 19:08

Beitrag von Skuz »

So ganz sicher, was du willst, bin ich nicht, aber ich bin mir ziemlich sicher, dass du dein Ziel mit einer Kombination von IF- und SELECT IF - Befehl hinbekommst (ggf noch mit Hilfe eine Schleife oder OMS-Befehl).
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

genau wie Generalist beschrieben hat:
DATASET DECLARE break.
AGGREGATE
/OUTFILE='break'
/BREAK=Jahr Name
/N_BREAK=N.
Ganz ohne selct - if - OMS und sonstiges.
Ergebnis:

2001 Fritz 2.0
2001 Hans 1.0
2001 Josef 2.0
2001 Karl 3.0
2001 Peter 2.0
2002 Fritz 1.0
2002 Josef 4.0
2002 Karl 2.0
2002 Peter 2.0
2002 Thomas 1.0
2003 Fritz 2.0
2003 Heinz 1.0
2003 Josef 2.0
2003 Karl 1.0
2003 Peter 2.0
2003 Rainer 1.0
2003 Thomas 1.0

Gruß
drfg2008
Thoro
Beiträge: 4
Registriert: 12.10.2011, 09:41

Beitrag von Thoro »

Vielen Dank für die Antworten. Leider ist das nicht die Lösung, soweit war ich auch schon. Ich suche nicht die Anzahl der gleichen Namen für das jeweilige Jahr, sondern die Anzahl der Variationen pro Jahr (siehe Dateneintrag oben). Für Hilfe wäre ich dankbar.
Thoro
Beiträge: 4
Registriert: 12.10.2011, 09:41

Beitrag von Thoro »

Sorry, sehe gerade, dass ich das in der Variablenbezeichnung falsch benannt habe. Also korekt muss es so heißen:

Jahr.....Name.....Anzahl der Variationen pro Jahr
2001.....Karl..... 5
2001.....Hans.....5
2001.....Fritz..... 5
.....
Generalist
Beiträge: 1733
Registriert: 11.03.2010, 22:28

Beitrag von Generalist »

Soll "Anzahl der Variationen pro Jahr" auf gut Deutsch heißen: Wie viele verschiedene Namen kommen in jedem Jahre vor? Oder doch wieder was anderes? Falls Ersteres: Namensvariable "automatisch umkodieren", dann Rangfolge bilden mit der neuen Namens-Variable, dabei "Jahr" als Gruppierungsvariable. Dann die die Rangvariable aggregieren (Funktion: Maximum).
Thoro
Beiträge: 4
Registriert: 12.10.2011, 09:41

Beitrag von Thoro »

that's it. Vielen Dank
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Vielen Dank für die Antworten. Leider ist das nicht die Lösung, soweit war ich auch schon. Ich suche nicht die Anzahl der gleichen Namen für das jeweilige Jahr, sondern die Anzahl der Variationen pro Jahr (siehe Dateneintrag oben).
Deshalb ist es so wichtig, genau auf die Formulierungen zu achten.

Gruß
drfg2008
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten