Hallo,
ich stoße gerade eine SPSS Analyse an, bin jedoch mit dem Programm noch nicht vertraut und habe nach einer 1h Suche im Netz noch keine Lösung gefunden -> daher wende ich mich mit dieser sicherlich sehr einfachen Frage an euch!
Ich habe eine Variable (Materialnummer) die aus 8 Zahlen besteht, jedoch in der Mitte durch ein Leerzeichen getrennt wird (also 4 Zahlen - Leerzeichen - 4 Zahlen).
Ich wollte eine Hierachische Clusteranalyse durchführen wobei ich drei Variablen brauche. Eine Davon ist meine Materialnummer. Diese woltle ich daher in Numerisch umwandeln (damit ich sie als Variable in die Clusteranalyse bringen kann) dies geht jedoch nicht solange ein Leerzeichen zwischen den Zahlen steht!
Wie kann ich "automatisch" das Leerzeichen bei meinen Daten entfernen??
Vielen Dank
Leerzeichen aus Variabler entfernen
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
hallo,
die richtige seite wäre für dich gewesen:
http://pascal.kgw.tu-berlin.de/gnom/Leh ... ionen.html
zu finden mit den suchwörtern: spss funktionen
du kannst mit 2 funktionen deine neue materialnummer erstellen.
transformieren, berechnen: zielvariable z.b. xxx --> format auf string umstellen.
dann folgende formel eingeben (feld rechts):
CONCAT(SUBSTR(material,1,3),SUBSTR(material,5))
aus einer variablen material wird nun ein teil geschnitten, der von der 1. stelle bis zur dritten reicht (falls das leerzeichen auf der 4. sitzt, sonst halt die stelle davor angeben); und es wird ein teil geschnitten, der von der 5. stelle bis zum ende reicht. diese 2 teile setzt die funktion concat zu einer variablen zusammen.
danach sollte man die entstehende variable in das format numerisch umwandeln können.
sollte die variablenbildung nicht funktionieren, dann müssen vielleicht noch leerzeichen vorne und oder hinten abeschnitten werden (ltrim, rtrim).
die richtige seite wäre für dich gewesen:
http://pascal.kgw.tu-berlin.de/gnom/Leh ... ionen.html
zu finden mit den suchwörtern: spss funktionen
du kannst mit 2 funktionen deine neue materialnummer erstellen.
transformieren, berechnen: zielvariable z.b. xxx --> format auf string umstellen.
dann folgende formel eingeben (feld rechts):
CONCAT(SUBSTR(material,1,3),SUBSTR(material,5))
aus einer variablen material wird nun ein teil geschnitten, der von der 1. stelle bis zur dritten reicht (falls das leerzeichen auf der 4. sitzt, sonst halt die stelle davor angeben); und es wird ein teil geschnitten, der von der 5. stelle bis zum ende reicht. diese 2 teile setzt die funktion concat zu einer variablen zusammen.
danach sollte man die entstehende variable in das format numerisch umwandeln können.
sollte die variablenbildung nicht funktionieren, dann müssen vielleicht noch leerzeichen vorne und oder hinten abeschnitten werden (ltrim, rtrim).
-
- Beiträge: 8
- Registriert: 04.11.2008, 21:08
Super vielen Dank!
Habe lange danach gesucht es aber nicht gefunden! Jetzt habe ich aber noch ein Problem -> das direkt darauf entstanden ist! Ich habe meine 8 Stellige Materialnummer (nun ohne Leerzeichen) in eine Numerische Variable umgewandelt. Das Problem ist jedoch das er mir nun meine 0 die am Anfang jeder Materialnummer steht, einfach weg-gekürzt hat!!
Ich suche nun schon seit ca. 1,5h nach der Lösung finde sie aber nicht - vermute es bedarf eines Tricks?
Wäre sehr dankbar für eine erneute Hilfe!
Ich bin SPSS anfänger, habe zwar Bücher dazu - jedoch helfen sie auf die schnelle nicht wirklich.
Habe lange danach gesucht es aber nicht gefunden! Jetzt habe ich aber noch ein Problem -> das direkt darauf entstanden ist! Ich habe meine 8 Stellige Materialnummer (nun ohne Leerzeichen) in eine Numerische Variable umgewandelt. Das Problem ist jedoch das er mir nun meine 0 die am Anfang jeder Materialnummer steht, einfach weg-gekürzt hat!!
Ich suche nun schon seit ca. 1,5h nach der Lösung finde sie aber nicht - vermute es bedarf eines Tricks?
Wäre sehr dankbar für eine erneute Hilfe!
Ich bin SPSS anfänger, habe zwar Bücher dazu - jedoch helfen sie auf die schnelle nicht wirklich.
-
- Beiträge: 8
- Registriert: 04.11.2008, 21:08
ein kleiner Nachtrag noch!
Eigentlich versuche ich eine hierarchische Clusteranalyse durchzuführen.
Die Ausgangsdaten sind eine Tabelle, bei der auf der Y-Achse die Kunden (Kundennummer) und in der X-Achse die Materialien (besagte Materialnummer) sowie die gekauften Stückzahlen sind.
Über diese Daten möchte ich eine hierachische Clusteranalyse durchführen. Dabei gibt es ja die Unterscheidung der Cluster nach Fälle und Variablen. Wobei ich es so verstanden habe das wenn ich Fälle wähle die Cluster anhand der Kunden (also Y-Achse) gebildet werden und wenn ich Variablen wähle anhand der Materialien und Stückzahlen gebildet werden.
Ist mein Vorgehen soweit Korrekt? Bzw. benötige ich hierzu überhaupt 3 Variablen und müssen die Numerisch sein?
Eigentlich versuche ich eine hierarchische Clusteranalyse durchzuführen.
Die Ausgangsdaten sind eine Tabelle, bei der auf der Y-Achse die Kunden (Kundennummer) und in der X-Achse die Materialien (besagte Materialnummer) sowie die gekauften Stückzahlen sind.
Über diese Daten möchte ich eine hierachische Clusteranalyse durchführen. Dabei gibt es ja die Unterscheidung der Cluster nach Fälle und Variablen. Wobei ich es so verstanden habe das wenn ich Fälle wähle die Cluster anhand der Kunden (also Y-Achse) gebildet werden und wenn ich Variablen wähle anhand der Materialien und Stückzahlen gebildet werden.
Ist mein Vorgehen soweit Korrekt? Bzw. benötige ich hierzu überhaupt 3 Variablen und müssen die Numerisch sein?
-
- Beiträge: 939
- Registriert: 13.05.2008, 10:52
man könnte sich damit helfen, kommazahlen zu erzeugen. dann wird die null zwar auch abgeschnitten, aber die zahlen ansich bleiben eindeutig.
CONCAT(SUBSTR(material,1,1),",",SUBSTR(material,2,2)
,SUBSTR(material,5))
"," setzt das komma zwischen stelle 1 und den rest.
mit clusteranalyse kenn ich mich nicht aus.
CONCAT(SUBSTR(material,1,1),",",SUBSTR(material,2,2)
,SUBSTR(material,5))
"," setzt das komma zwischen stelle 1 und den rest.
mit clusteranalyse kenn ich mich nicht aus.