Bestimme Werte auswählen

Fragen und Diskussionen rund um die Arbeit mit SPSS. Für allgemeine Statistik-Themen, die nicht mit SPSS zusammenhängen, bitte das Statistik-Forum nutzen.
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Bestimme Werte auswählen

Beitrag von mocca »

In meiner Arbeit wurden 100 Gegenstände miteinander verglichen, dafür wurden, je nachdem wie ähnlich sie waren, Ähnlichkeitskoeffizienten vergeben.
Totale Ähnlichkeit: 1
überhaupt keine Ähnlichkeit: 0

Wenn nun ein Gegenstand sozusagen "mit sich selbst" verglichen wurde, gab es eine 1, da ja alles übereinstimmt.
Wurde nun Gegenstand beispielsweise 1 mit Gegenstand 3 verglichen, hätte das z.b. einen Ähnlichkeitswert von 0,8 ergeben können, d.h. die Gegenstände waren sich schon sehr ähnlich aber eben nicht komplett ähnlich.
Diese Tabelle eben habe ich erhalten, die nun wie folgt aussieht:
die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100.
Ein Beispiel: Wenn man nun auf Fall 10 sieht, dort wo er sich mit Varibale 10 "kreuzt", steht dort eine 1, denn in diesem Feld wurde ja wiedermals ein Gegenstand mit dem selben verglichen...

Somit erhalte ich in meiner Tabelle 100*100 Werte.
Wenn man sich die Tabelle ansieht, hat natürlich jeder Fall und Variable genau einmal den Wert 1, dort wo sich die beiden sozusagen "kreuzen".
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegentstand 1 verglichen wurde) nach rechts unten (wo Gegenstand 100 mit Gegenstand 100 verglichen wurde).

Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht, alle Werte darunter sind ja sozusagen doppelt, da sie ja schon mal verglichen wurden.
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

kurz gesagt:

Wie kann ich identische Werte aus einer Variablen identifizieren und anschließend aussortieren?
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Was auch möglich wäre, wenn man es schaffen könnte, aus der ersten Variable den ersten Wert, aus der zweiten Variable die ersten zwei Werte, usw. auszuwählen.
Das wäre dann der kleine Gauß, würde mich ans Ziel bringen!
Nur wie?

Niemand eine Idee?
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Ok, der Weg mit den identischen Werten klappt nicht.
Ich muss versuchen, irgendwie in der ersten Variable den ersten Wert wie oben beschrieben usw. auszuwählen,dann klappt das.

Gibt es dafür vll eine Syntax-Anweisung?
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Hat niemand eine Idee, wie ich das lösen könnte?

Auch wenn ihr sagt "das geht nicht" würde es mir helfen!
Dann kann ich das so dem Betreuer sagen... ;)
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

in den Variablen Gegenstände von 1 bis 100, einfach die Ziffern.
in den Fällen die selben Ziffern für die Gegenstände, also auch 1 bis 100.
Der Vergleich von z.b. 2 mit 2 ergibt natürlich 1, vollkommen identisch, das selbe für alle anderen identischen Ziffern.
Vergleich von Ziffer 1 mit Ziffer 3 beispielsweise ergibt 0,8.

ein Grund, weshalb bislang keine Antwort kam, liegt wohl in der Qualität der Darstellung des Problems. Für mich absolut nicht verständlich. Warum ergibt ein "Vergleich 2 mit 2" = 1 und 1 mit 3 soll 0,8 ergeben. Und was hat das mit dem "kleinen Gauß" zu tun, also mit der Summenformel.

Vielleicht lässt sich das Rätsel lösen.

Gruß
drfg2008
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Verzeihung!

Ich versuche es nochmal.

In meiner Arbeit wurden 100 Gegenstände miteinander verglichen, dafür wurden, je nachdem wie ähnlich sie waren, Ähnlichkeitskoeffizienten vergeben.
Totale Ähnlichkeit: 1
überhaupt keine Ähnlichkeit: 0

Wenn nun ein Gegenstand sozusagen "mit sich selbst" verglichen wurde, gab es eine 1, da ja alles übereinstimmt.
Wurde nun Gegenstand beispielsweise 1 mit Gegenstand 3 verglichen, hätte das z.b. einen Ähnlichkeitswert von 0,8 ergeben können, d.h. die Gegenstände waren sich schon sehr ähnlich aber eben nicht komplett ähnlich.
Diese Tabelle eben habe ich erhalten, die nun wie folgt aussieht:
die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100.
Ein Beispiel: Wenn man nun auf Fall 10 sieht, dort wo er sich mit Varibale 10 "kreuzt", steht dort eine 1, denn in diesem Feld wurde ja wiedermals ein Gegenstand mit dem selben verglichen...

Somit erhalte ich in meiner Tabelle 100*100 Werte.
Wenn man sich die Tabelle ansieht, hat natürlich jeder Fall und Variable genau einmal den Wert 1, dort wo sich die beiden sozusagen "kreuzen".
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegentstand 1 verglichen wurde) nach rechts unten (wo Gegenstand 100 mit Gegenstand 100 verglichen wurde).

Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht, alle Werte darunter sind ja sozusagen doppelt, da sie ja schon mal verglichen wurden.

Die Gauß`sche Summenformel deshalb, weil für mich nun in der ersten Variable der erste Wert, in der zweiten die ersten beiden, in der dritten Variable die ersten 3 usw...gültig sind und in die Berechnung einfließen sollen.

Ich hoffe das war etwas verständlicher? Sorry...
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100
also eine 100x100 Matrix
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegenstand 1 verglichen wurde) nach rechts unten
also die Hauptdiagonale

Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht
also in der oberen Dreiecksmatrix (was ja selbstverständlich ist, da die untere Dreiecksmatrix einfach nur die Spiegelung der oberen sein kann)

Die Gauß`sche Summenformel deshalb, weil für mich nun in der ersten Variable der erste Wert, in der zweiten die ersten beiden, in der dritten Variable die ersten 3 usw...gültig sind und in die Berechnung einfließen sollen.

Die Gauß'sche Suppenformel bezieht sich nur auf die Menge der Ganzen Zahlen (siehe Beweis der vollständigen Induktion). Wie bekomme ich das mit 0,8 zusammen?
Wie kann ich identische Werte aus einer Variablen identifizieren und anschließend aussortieren?
Tja, und hier bleibt unklar, worauf du hinaus willst. Alles was mir spontan dazu einfällt ist, dass das Vorgehen dem Matrix = In – Befehl entspricht. Wenn man nämlich die Faktorenanalyse berechnen möchte, kann man die Korrelations-Matrix auch separat eingeben. Und Werte von 0,8 die auch noch Ähnlichkeiten darstellen sollen, erwecken bei mir solche Assoziationen. Aber wie gesagt, keine Ahnung was du damit willst.

Gruß
drfg2008
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Vielen Dank für deine Antwort und deine Ergänzungen.

Das mit dem Wert von 0,8 war nur ein Beispielwert, völlig belanglos, es könnte irgendein Wert zwischen 0 und 1 sein.
Ich wollte damit nur sagen, dass in dieser 100*100 Matrix ausschließlich Werte zwischen 0 und 1 stehen, mit bis zu 5 Dezimalstellen.

Genau, das ist de facto eine Spiegelung der "oberen" Werte an der Hauptdiagonalen.

Nun suche ich eine Lösung, die Werte unterhalb der Hauptdiagonalen zu löschen, damit ich nur die oberen Werte weiterverarbeiten kann, da Sie ja nur das Spiegelbild darstellen wie du gesagt hast.

Was ich bisher versucht habe:
Habe alle Variablen, die 100 Stück, in eine einzige zusammengeführt.
Somit habe ich eine Varibale mit 100*100 Werte erhalten.
Dann habe ich die doppelten Fälle ermittelt, da es ja nur ein Spiegelbild ist und jeder Wert 2 mal vorkommen müsste....
Einige Werte kommen jedoch mehr als 2 mal vor, d.h. ich komme mit dieser Prozedur nicht ans Ziel...oder?
Die Werte kommen deshalb mehr als 2 mal vor, da einige verschiedene Vergleiche die gleichen Ähnlichkeitskoeffizienten ergaben, also in der oberen Dreiecksmatrix.
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

du willst aus einer (m,n) Matrix mit m = n = 100 die untere Dreiecksmatrix löschen.

Das geht über eine Schleifenprogrammierung. Auf Raynald's SPSS tools findest du Programmierbeispiele:

http://www.spsstools.net/SampleSyntax.htm

Gruß
drfg2008
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Habe mich auf der Seite umgesehen, jedoch weiß ich nicht so recht, welchen Code ich dazu brauche. Mit dem Stichwort "loop" finde ich 3 Codebeispiele, die mir aber alle völlig fremd sind.

Könntest du mir nochmal weiterhelfen?
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

du müsstest zwei Schleifen ineinander verschachteln, beginnend mit m = 1 bis 100 und n = 1 bis 100, mit m Zeilen und n Spalten. Immer wenn m>n ist, soll der Wert gelöscht werden.

Das löscht die untere Dreiecksmatrix.

Gruß
drfg2008
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Wäre das dann im Prinzip eine Select if - Anweisung?

Könnte das funktionieren wenn man sagt :

select if (m>n).

Wie ist in Spss die x-Koordinate und y-Koordinate definiert?
Mit m und n geht es jedenfalls nicht...

Sorry, ich kenn mich einfach zu wenig aus...
drfg2008
Beiträge: 2391
Registriert: 06.02.2011, 19:58

re

Beitrag von drfg2008 »

Könnte das funktionieren wenn man sagt :
select if (m>n).
kreativ, aber keine Lösung.
Habe mich auf der Seite umgesehen, jedoch weiß ich nicht so recht, welchen Code ich dazu brauche. Mit dem Stichwort "loop" finde ich 3 Codebeispiele, die mir aber alle völlig fremd sind.

Auf Raynald's habe ich unter dem Stichwort loop jedefalls bei Hundert aufgehört zu zählen

http://search.freefind.com/find.html?id ... query=loop

Gruß
drfg2008
mocca
Beiträge: 13
Registriert: 23.08.2011, 07:38

Beitrag von mocca »

Oh, das sind tatsächlich eine ganze Menge.

Dann suche ich da mal...

Nachtrag:

Nach intesiver Suche bin ich leider nicht viel weiter als vorher... das sieht zwar alles ganz interessant aus, aber ich kann mein Problem leider immer noch nicht lösen...
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten