Anzahl identischer Fälle zählen gruppiert
-
Thoro
- Beiträge: 4
- Registriert: 12.10.2011, 09:41
Anzahl identischer Fälle zählen gruppiert
Hallo zusammen,
kennt jemand einen Syntaxbefehl oder eine Vorgehensweise, um einen SPSS-Datensatz nach identischen Fällen nach Kategorien zu durchsuchen und deren Anzahl in einer Variablen auszugeben?
Mein großer Datenfile sieht in etwa so aus:
Jahr Name
2001 Karl
2001 Hans
2001 Fritz
2001 Karl
2001 Peter
2001 Fritz
2001 Peter
2001 Karl
2001 Josef
2001 Josef
2002 Thomas
2002 Karl
2002 Josef
2002 Josef
2002 Karl
2002 Josef
2002 Josef
2002 Fritz
2002 Peter
2002 Peter
2003 Heinz
2003 Karl
2003 Rainer
2003 Fritz
2003 Peter
2003 Fritz
2003 Peter
2003 Josef
2003 Thomas
2003 Josef
und so soll es aussehen, wenn es fertig ist.
Jahr.....Name.....Anzahl der Namen pro Jahr
2001.....Karl..... 5
2001.....Hans.....5
2001.....Fritz..... 5
2001.....Karl..... 5
2001.....Peter....5
2001.....Fritz..... 5
2001.....Peter....5
2001.....Karl..... 5
2001.....Josef.....5
2001.....Josef.....5
2002.....Thomas.6
2002.....Karl..... 6
2002.....Josef.....6
2002.....Josef.....6
2002.....Karl..... 6
2002.....Josef.....6
2002.....Josef.....6
2002.....Fritz..... 6
2002.....Peter.....6
2002.....Peter.....6
2003.....Heinz.....7
2003.....Karl..... 7
2003.....Rainer...7
2003.....Fritz..... 7
2003.....Peter.....7
2003.....Fritz..... 7
2003.....Peter.....7
2003.....Josef.....7
2003.....Thomas.7
2003.....Josef.....7
Mit "Aggregieren" bekomme ich immer nur die komplette Anzahl pro Jahr heraus, aber ich will die Anzahl der Namen pro Jahr ausgegeben haben.
Danke und Grüße
Thomas
kennt jemand einen Syntaxbefehl oder eine Vorgehensweise, um einen SPSS-Datensatz nach identischen Fällen nach Kategorien zu durchsuchen und deren Anzahl in einer Variablen auszugeben?
Mein großer Datenfile sieht in etwa so aus:
Jahr Name
2001 Karl
2001 Hans
2001 Fritz
2001 Karl
2001 Peter
2001 Fritz
2001 Peter
2001 Karl
2001 Josef
2001 Josef
2002 Thomas
2002 Karl
2002 Josef
2002 Josef
2002 Karl
2002 Josef
2002 Josef
2002 Fritz
2002 Peter
2002 Peter
2003 Heinz
2003 Karl
2003 Rainer
2003 Fritz
2003 Peter
2003 Fritz
2003 Peter
2003 Josef
2003 Thomas
2003 Josef
und so soll es aussehen, wenn es fertig ist.
Jahr.....Name.....Anzahl der Namen pro Jahr
2001.....Karl..... 5
2001.....Hans.....5
2001.....Fritz..... 5
2001.....Karl..... 5
2001.....Peter....5
2001.....Fritz..... 5
2001.....Peter....5
2001.....Karl..... 5
2001.....Josef.....5
2001.....Josef.....5
2002.....Thomas.6
2002.....Karl..... 6
2002.....Josef.....6
2002.....Josef.....6
2002.....Karl..... 6
2002.....Josef.....6
2002.....Josef.....6
2002.....Fritz..... 6
2002.....Peter.....6
2002.....Peter.....6
2003.....Heinz.....7
2003.....Karl..... 7
2003.....Rainer...7
2003.....Fritz..... 7
2003.....Peter.....7
2003.....Fritz..... 7
2003.....Peter.....7
2003.....Josef.....7
2003.....Thomas.7
2003.....Josef.....7
Mit "Aggregieren" bekomme ich immer nur die komplette Anzahl pro Jahr heraus, aber ich will die Anzahl der Namen pro Jahr ausgegeben haben.
Danke und Grüße
Thomas
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
genau wie Generalist beschrieben hat:
Ergebnis:
2001 Fritz 2.0
2001 Hans 1.0
2001 Josef 2.0
2001 Karl 3.0
2001 Peter 2.0
2002 Fritz 1.0
2002 Josef 4.0
2002 Karl 2.0
2002 Peter 2.0
2002 Thomas 1.0
2003 Fritz 2.0
2003 Heinz 1.0
2003 Josef 2.0
2003 Karl 1.0
2003 Peter 2.0
2003 Rainer 1.0
2003 Thomas 1.0
Gruß
Ganz ohne selct - if - OMS und sonstiges.DATASET DECLARE break.
AGGREGATE
/OUTFILE='break'
/BREAK=Jahr Name
/N_BREAK=N.
Ergebnis:
2001 Fritz 2.0
2001 Hans 1.0
2001 Josef 2.0
2001 Karl 3.0
2001 Peter 2.0
2002 Fritz 1.0
2002 Josef 4.0
2002 Karl 2.0
2002 Peter 2.0
2002 Thomas 1.0
2003 Fritz 2.0
2003 Heinz 1.0
2003 Josef 2.0
2003 Karl 1.0
2003 Peter 2.0
2003 Rainer 1.0
2003 Thomas 1.0
Gruß
drfg2008
-
Thoro
- Beiträge: 4
- Registriert: 12.10.2011, 09:41
-
Generalist
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Soll "Anzahl der Variationen pro Jahr" auf gut Deutsch heißen: Wie viele verschiedene Namen kommen in jedem Jahre vor? Oder doch wieder was anderes? Falls Ersteres: Namensvariable "automatisch umkodieren", dann Rangfolge bilden mit der neuen Namens-Variable, dabei "Jahr" als Gruppierungsvariable. Dann die die Rangvariable aggregieren (Funktion: Maximum).
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Deshalb ist es so wichtig, genau auf die Formulierungen zu achten.Vielen Dank für die Antworten. Leider ist das nicht die Lösung, soweit war ich auch schon. Ich suche nicht die Anzahl der gleichen Namen für das jeweilige Jahr, sondern die Anzahl der Variationen pro Jahr (siehe Dateneintrag oben).
Gruß
drfg2008



