Bestimme Werte auswählen
-
mocca
- Beiträge: 13
- Registriert: 23.08.2011, 07:38
Bestimme Werte auswählen
In meiner Arbeit wurden 100 Gegenstände miteinander verglichen, dafür wurden, je nachdem wie ähnlich sie waren, Ähnlichkeitskoeffizienten vergeben.
Totale Ähnlichkeit: 1
überhaupt keine Ähnlichkeit: 0
Wenn nun ein Gegenstand sozusagen "mit sich selbst" verglichen wurde, gab es eine 1, da ja alles übereinstimmt.
Wurde nun Gegenstand beispielsweise 1 mit Gegenstand 3 verglichen, hätte das z.b. einen Ähnlichkeitswert von 0,8 ergeben können, d.h. die Gegenstände waren sich schon sehr ähnlich aber eben nicht komplett ähnlich.
Diese Tabelle eben habe ich erhalten, die nun wie folgt aussieht:
die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100.
Ein Beispiel: Wenn man nun auf Fall 10 sieht, dort wo er sich mit Varibale 10 "kreuzt", steht dort eine 1, denn in diesem Feld wurde ja wiedermals ein Gegenstand mit dem selben verglichen...
Somit erhalte ich in meiner Tabelle 100*100 Werte.
Wenn man sich die Tabelle ansieht, hat natürlich jeder Fall und Variable genau einmal den Wert 1, dort wo sich die beiden sozusagen "kreuzen".
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegentstand 1 verglichen wurde) nach rechts unten (wo Gegenstand 100 mit Gegenstand 100 verglichen wurde).
Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht, alle Werte darunter sind ja sozusagen doppelt, da sie ja schon mal verglichen wurden.
Totale Ähnlichkeit: 1
überhaupt keine Ähnlichkeit: 0
Wenn nun ein Gegenstand sozusagen "mit sich selbst" verglichen wurde, gab es eine 1, da ja alles übereinstimmt.
Wurde nun Gegenstand beispielsweise 1 mit Gegenstand 3 verglichen, hätte das z.b. einen Ähnlichkeitswert von 0,8 ergeben können, d.h. die Gegenstände waren sich schon sehr ähnlich aber eben nicht komplett ähnlich.
Diese Tabelle eben habe ich erhalten, die nun wie folgt aussieht:
die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100.
Ein Beispiel: Wenn man nun auf Fall 10 sieht, dort wo er sich mit Varibale 10 "kreuzt", steht dort eine 1, denn in diesem Feld wurde ja wiedermals ein Gegenstand mit dem selben verglichen...
Somit erhalte ich in meiner Tabelle 100*100 Werte.
Wenn man sich die Tabelle ansieht, hat natürlich jeder Fall und Variable genau einmal den Wert 1, dort wo sich die beiden sozusagen "kreuzen".
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegentstand 1 verglichen wurde) nach rechts unten (wo Gegenstand 100 mit Gegenstand 100 verglichen wurde).
Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht, alle Werte darunter sind ja sozusagen doppelt, da sie ja schon mal verglichen wurden.
-
mocca
- Beiträge: 13
- Registriert: 23.08.2011, 07:38
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
in den Variablen Gegenstände von 1 bis 100, einfach die Ziffern.
in den Fällen die selben Ziffern für die Gegenstände, also auch 1 bis 100.
Der Vergleich von z.b. 2 mit 2 ergibt natürlich 1, vollkommen identisch, das selbe für alle anderen identischen Ziffern.
Vergleich von Ziffer 1 mit Ziffer 3 beispielsweise ergibt 0,8.
ein Grund, weshalb bislang keine Antwort kam, liegt wohl in der Qualität der Darstellung des Problems. Für mich absolut nicht verständlich. Warum ergibt ein "Vergleich 2 mit 2" = 1 und 1 mit 3 soll 0,8 ergeben. Und was hat das mit dem "kleinen Gauß" zu tun, also mit der Summenformel.
Vielleicht lässt sich das Rätsel lösen.
Gruß
drfg2008
-
mocca
- Beiträge: 13
- Registriert: 23.08.2011, 07:38
Verzeihung!
Ich versuche es nochmal.
In meiner Arbeit wurden 100 Gegenstände miteinander verglichen, dafür wurden, je nachdem wie ähnlich sie waren, Ähnlichkeitskoeffizienten vergeben.
Totale Ähnlichkeit: 1
überhaupt keine Ähnlichkeit: 0
Wenn nun ein Gegenstand sozusagen "mit sich selbst" verglichen wurde, gab es eine 1, da ja alles übereinstimmt.
Wurde nun Gegenstand beispielsweise 1 mit Gegenstand 3 verglichen, hätte das z.b. einen Ähnlichkeitswert von 0,8 ergeben können, d.h. die Gegenstände waren sich schon sehr ähnlich aber eben nicht komplett ähnlich.
Diese Tabelle eben habe ich erhalten, die nun wie folgt aussieht:
die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100.
Ein Beispiel: Wenn man nun auf Fall 10 sieht, dort wo er sich mit Varibale 10 "kreuzt", steht dort eine 1, denn in diesem Feld wurde ja wiedermals ein Gegenstand mit dem selben verglichen...
Somit erhalte ich in meiner Tabelle 100*100 Werte.
Wenn man sich die Tabelle ansieht, hat natürlich jeder Fall und Variable genau einmal den Wert 1, dort wo sich die beiden sozusagen "kreuzen".
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegentstand 1 verglichen wurde) nach rechts unten (wo Gegenstand 100 mit Gegenstand 100 verglichen wurde).
Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht, alle Werte darunter sind ja sozusagen doppelt, da sie ja schon mal verglichen wurden.
Die Gauß`sche Summenformel deshalb, weil für mich nun in der ersten Variable der erste Wert, in der zweiten die ersten beiden, in der dritten Variable die ersten 3 usw...gültig sind und in die Berechnung einfließen sollen.
Ich hoffe das war etwas verständlicher? Sorry...
Ich versuche es nochmal.
In meiner Arbeit wurden 100 Gegenstände miteinander verglichen, dafür wurden, je nachdem wie ähnlich sie waren, Ähnlichkeitskoeffizienten vergeben.
Totale Ähnlichkeit: 1
überhaupt keine Ähnlichkeit: 0
Wenn nun ein Gegenstand sozusagen "mit sich selbst" verglichen wurde, gab es eine 1, da ja alles übereinstimmt.
Wurde nun Gegenstand beispielsweise 1 mit Gegenstand 3 verglichen, hätte das z.b. einen Ähnlichkeitswert von 0,8 ergeben können, d.h. die Gegenstände waren sich schon sehr ähnlich aber eben nicht komplett ähnlich.
Diese Tabelle eben habe ich erhalten, die nun wie folgt aussieht:
die Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100.
Ein Beispiel: Wenn man nun auf Fall 10 sieht, dort wo er sich mit Varibale 10 "kreuzt", steht dort eine 1, denn in diesem Feld wurde ja wiedermals ein Gegenstand mit dem selben verglichen...
Somit erhalte ich in meiner Tabelle 100*100 Werte.
Wenn man sich die Tabelle ansieht, hat natürlich jeder Fall und Variable genau einmal den Wert 1, dort wo sich die beiden sozusagen "kreuzen".
Diese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegentstand 1 verglichen wurde) nach rechts unten (wo Gegenstand 100 mit Gegenstand 100 verglichen wurde).
Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht, alle Werte darunter sind ja sozusagen doppelt, da sie ja schon mal verglichen wurden.
Die Gauß`sche Summenformel deshalb, weil für mich nun in der ersten Variable der erste Wert, in der zweiten die ersten beiden, in der dritten Variable die ersten 3 usw...gültig sind und in die Berechnung einfließen sollen.
Ich hoffe das war etwas verständlicher? Sorry...
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
also eine 100x100 Matrixdie Variablen waren die Werte 1-100, ebenso waren die Fälle die Werte 1-100
also die HauptdiagonaleDiese Linie von Einsen verläuft nun bildlich betrachtet von links oben in der Tabelle (wo Gegenstand 1 mit Gegenstand 1 verglichen wurde) nach rechts unten
also in der oberen Dreiecksmatrix (was ja selbstverständlich ist, da die untere Dreiecksmatrix einfach nur die Spiegelung der oberen sein kann)Die Sache ist nun die, dass im Prinzip nur die Werte für mich gültig sind, die überhalb dieser schräg verlaufenden "linie" von Einsen steht
Die Gauß`sche Summenformel deshalb, weil für mich nun in der ersten Variable der erste Wert, in der zweiten die ersten beiden, in der dritten Variable die ersten 3 usw...gültig sind und in die Berechnung einfließen sollen.
Die Gauß'sche Suppenformel bezieht sich nur auf die Menge der Ganzen Zahlen (siehe Beweis der vollständigen Induktion). Wie bekomme ich das mit 0,8 zusammen?
Tja, und hier bleibt unklar, worauf du hinaus willst. Alles was mir spontan dazu einfällt ist, dass das Vorgehen dem Matrix = In – Befehl entspricht. Wenn man nämlich die Faktorenanalyse berechnen möchte, kann man die Korrelations-Matrix auch separat eingeben. Und Werte von 0,8 die auch noch Ähnlichkeiten darstellen sollen, erwecken bei mir solche Assoziationen. Aber wie gesagt, keine Ahnung was du damit willst.Wie kann ich identische Werte aus einer Variablen identifizieren und anschließend aussortieren?
Gruß
drfg2008
-
mocca
- Beiträge: 13
- Registriert: 23.08.2011, 07:38
Vielen Dank für deine Antwort und deine Ergänzungen.
Das mit dem Wert von 0,8 war nur ein Beispielwert, völlig belanglos, es könnte irgendein Wert zwischen 0 und 1 sein.
Ich wollte damit nur sagen, dass in dieser 100*100 Matrix ausschließlich Werte zwischen 0 und 1 stehen, mit bis zu 5 Dezimalstellen.
Genau, das ist de facto eine Spiegelung der "oberen" Werte an der Hauptdiagonalen.
Nun suche ich eine Lösung, die Werte unterhalb der Hauptdiagonalen zu löschen, damit ich nur die oberen Werte weiterverarbeiten kann, da Sie ja nur das Spiegelbild darstellen wie du gesagt hast.
Was ich bisher versucht habe:
Habe alle Variablen, die 100 Stück, in eine einzige zusammengeführt.
Somit habe ich eine Varibale mit 100*100 Werte erhalten.
Dann habe ich die doppelten Fälle ermittelt, da es ja nur ein Spiegelbild ist und jeder Wert 2 mal vorkommen müsste....
Einige Werte kommen jedoch mehr als 2 mal vor, d.h. ich komme mit dieser Prozedur nicht ans Ziel...oder?
Die Werte kommen deshalb mehr als 2 mal vor, da einige verschiedene Vergleiche die gleichen Ähnlichkeitskoeffizienten ergaben, also in der oberen Dreiecksmatrix.
Das mit dem Wert von 0,8 war nur ein Beispielwert, völlig belanglos, es könnte irgendein Wert zwischen 0 und 1 sein.
Ich wollte damit nur sagen, dass in dieser 100*100 Matrix ausschließlich Werte zwischen 0 und 1 stehen, mit bis zu 5 Dezimalstellen.
Genau, das ist de facto eine Spiegelung der "oberen" Werte an der Hauptdiagonalen.
Nun suche ich eine Lösung, die Werte unterhalb der Hauptdiagonalen zu löschen, damit ich nur die oberen Werte weiterverarbeiten kann, da Sie ja nur das Spiegelbild darstellen wie du gesagt hast.
Was ich bisher versucht habe:
Habe alle Variablen, die 100 Stück, in eine einzige zusammengeführt.
Somit habe ich eine Varibale mit 100*100 Werte erhalten.
Dann habe ich die doppelten Fälle ermittelt, da es ja nur ein Spiegelbild ist und jeder Wert 2 mal vorkommen müsste....
Einige Werte kommen jedoch mehr als 2 mal vor, d.h. ich komme mit dieser Prozedur nicht ans Ziel...oder?
Die Werte kommen deshalb mehr als 2 mal vor, da einige verschiedene Vergleiche die gleichen Ähnlichkeitskoeffizienten ergaben, also in der oberen Dreiecksmatrix.
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
du willst aus einer (m,n) Matrix mit m = n = 100 die untere Dreiecksmatrix löschen.
Das geht über eine Schleifenprogrammierung. Auf Raynald's SPSS tools findest du Programmierbeispiele:
http://www.spsstools.net/SampleSyntax.htm
Gruß
Das geht über eine Schleifenprogrammierung. Auf Raynald's SPSS tools findest du Programmierbeispiele:
http://www.spsstools.net/SampleSyntax.htm
Gruß
drfg2008
-
mocca
- Beiträge: 13
- Registriert: 23.08.2011, 07:38
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
kreativ, aber keine Lösung.Könnte das funktionieren wenn man sagt :
select if (m>n).
Habe mich auf der Seite umgesehen, jedoch weiß ich nicht so recht, welchen Code ich dazu brauche. Mit dem Stichwort "loop" finde ich 3 Codebeispiele, die mir aber alle völlig fremd sind.
Auf Raynald's habe ich unter dem Stichwort loop jedefalls bei Hundert aufgehört zu zählen
http://search.freefind.com/find.html?id ... query=loop
Gruß
drfg2008
-
mocca
- Beiträge: 13
- Registriert: 23.08.2011, 07:38



