Clustervariablen gewichten

Fragen und Diskussionen rund um die Statistik und deren Anwendung.
Antworten
Marius12!
Beiträge: 6
Registriert: 12.01.2022, 12:38

Clustervariablen gewichten

Beitrag von Marius12! »

Hallo zusammen,

ich hoffe es kann mir jemand helfen.
Ich versuche von verschiedenen Logistikstandorten, die Rahmenbedingungen mit denen sie arbeiten müssen, zu clustern. Die Kriterien die ich auswähle ( Entfernungen zu Kunden (km), Fahrzeitzeit zu Kunden etc.) haben Auswirkungen auf die Transportkosten. Jedoch haben nicht alle Kriterien den gleichen Einfluss auf die Transportkosten (Zeit ist höher zu bewerten als gefahrene km). Kann ich diese Kriterien in einer Clusteranalyse unterschiedlich gewichten und wenn ja wo muss die Gewichtung stattfinden? Im Endeffekt sollen dann die Standorte die die ähnliche Entfernung oder Zeit zu den Kunden haben, in einem Cluster sein ( unter Berücksichtgigung der Gewichtung)

Wäre über jede Hilfe dankbar :)
dutchie
Beiträge: 2767
Registriert: 01.02.2018, 10:45

Re: Clustervariablen gewichten

Beitrag von dutchie »

Hallo Marius,

..normal ist man bemüht in eine CA den Einfluss jeder Variable
so zu gestalten, dass jede Variable denselben Einfluss hat.
..durch standardisieren z.B.
Weil durch die Einheiten (km, Anzhal, stunde) die Variablen eine andere numerischen Spanne abdecken.
du müsstest die Variablen also erst gleichschalten durch Standardisierung und dann gewichten.

..ob das sinn macht kann ich dir nicht sagen :(

einen speziellen button, der das bewirkt kenn ich nicht, hängt auch von der software ab,
du könntest die Variablen direkt beeinflussen oder bei Summation der Distanzmaße gewichten,
aber wie willst du dann gewichten? 1/3 zu 2/3???

du könntest eine Regression vorschalten, um die Gewichte zu bestimmen

gruß
dutchie
Marius12!
Beiträge: 6
Registriert: 12.01.2022, 12:38

Re: Clustervariablen gewichten

Beitrag von Marius12! »

Hallo dutchie,

Zunächst einmal vielen Dank für deine Antwort. Ich mach das mit keinem Programm sondern mit Excel für meine Bachelorarbeit. Ich suche somit eigentlich nur eine Bestätigung (Literatur bisher nix gefunden) ob man die Variablen gewichten könnte. Bin leider echt kein Mathe/Statistik Ass und somit ich frag ich mich ob sowas geht.

Die Variablen korrelieren untereinander nicht. Es sollen Transportkosten analysiert werden. Jedoch sind an den Logistikstandorten unterschiedliche Platzverhältnisse, die Distanz und Km zu Kunden ist je Standort auch unterschiedlich. Also alle Variablen stehen nur in Verbindung zur Fragestellung welchen Einfluss sie auf die Transportkosten haben. Untereinander herrschen keine Abhängigkeit zwischen Variablen. Es gibt halt Gesamttransportkosten und der größte Kostenblock ist Personal(=Zeit). Also will ich die zeitbasierten Variablen höher gewichten um dann innerhalb der Cluster zu schauen, wie hoch die Kosten sind.

Ich will somit eher die Standorte in einem Cluster haben, die in bestimmten Variablen ähnlicher zueinander sind. Wenn ich alles gleich lasse, könnten Standorte in ein Cluster gepackt werden, die in den „unwichtigeren“ Kriterien total ähnlich sind, in den für die Transportkosten am wichtigsten total unähnlich. Trotzdem würde man eher die Standorte in ein Cluster packen weil eben keine Gewichtung vorliegt.
dutchie
Beiträge: 2767
Registriert: 01.02.2018, 10:45

Re: Clustervariablen gewichten

Beitrag von dutchie »

Hallo,

..ich versteh dein problem nicht wirklich :(
Marius12! hat geschrieben:
13.01.2022, 16:22
Ich suche somit eigentlich nur eine Bestätigung (Literatur bisher nix gefunden) ob man die Variablen gewichten könnte.
Wenn es dafür eine Verwendung gibt warum nicht.
Wie willst du clustern ohne Programm,"..mit der Hand?"
Marius12! hat geschrieben:
13.01.2022, 16:22
Also will ich die zeitbasierten Variablen höher gewichten
ok, aber wie hoch mal 2 mal 3 mal 4?

Aber ..wozu Cluster bilden, mir scheint es geht erstmal darum festzustellen, welche Variablen wie
auf die Transportkosten wirken, vielleicht gehen bei dir die Methoden durcheinander.
hast du denn alle Variablen schon miteinander korreliert oder eine lin. Regression gemacht?

Ich könnte mir denken, es geht auch darum, festzustellen, welche Standorte höhere Kosten produzieren als erwartet.

gruß
dutchie
Marius12!
Beiträge: 6
Registriert: 12.01.2022, 12:38

Re: Clustervariablen gewichten

Beitrag von Marius12! »

Hallo

Nehmen wir an ich hab Transportkosten von 50 mio euro für alle Logistikstandorte

35 Mio davon sind personalkosten für Transport sprich 70%
10 mio kraftstoffkosten sprich 20%
5 mio mautkosten 10%
(Das sind Daten die mir aus dem Controlling vorliegen)
Sprich bei der Distanzbildung zwischen den Objekten sollen gewissen Variablen höher bewertet werden.

Meine Objekte sind die Logistikstandorte A, B, C, D.
Meine Variablen sind durchschnittliche Beladezeit am Lager/Logistikstandort, durchschnittliche fahrzeit zu den Kunden, und durchschnittliche entladezeit bei den Kunden (zeit spiegelt sich in personalkosten wieder), durchschnittlich gefahrene maut km zu kunden je standort und durchschnittlicher verbrauch zu kunden je standort ( Kraftstoff = verbrauch je gefahrenen Km)

All diese Variablen beeinflussen die Transportkosten und sind je Logistikstandort verschieden. Ich will schauen welche standorte die ähnlichen Merkmale haben und innerhalb der Cluster dann die Kosten vergleichen.

Ich sag dann bespielsweise, dass Standort A und C die gleichen Rahmenbedingungen haben und schau mir dann die Kosten an.

Kosten A: 10 mio
Kosten C: 15 Mio

Beide sind in einem Cluster haben die gleichen Vorraussetzungen. Wieso werden dann bei C mehr kosten gezahlt?
Das ist so mein Vorhaben vereinfacht ausgedrückt. Dazu dann die Gewichtung gemäß dem Einfluss auf die Transportkosten

Ich erhebe die Daten, standartisiere sie mittel Z Transformation, berechne die euklidische Distanz für die Distanzmatrix und dann bilde ich anhand single, complete linkage oder ward verfahren die cluster. Funktioniert das nicht so ohne Programm? Es sind insgesamt nur 10 Objekte die geclustert werden sollen

Kann man dich alternativ auch telefonisch erreichen? Oder per teams? Dann könnte man es besser erklären
dutchie
Beiträge: 2767
Registriert: 01.02.2018, 10:45

Re: Clustervariablen gewichten

Beitrag von dutchie »

Hallo Marius
Marius12! hat geschrieben:
13.01.2022, 18:39
Ich erhebe die Daten, standartisiere sie mittel Z Transformation, berechne die euklidische Distanz für die Distanzmatrix und dann bilde ich anhand single, complete linkage oder ward verfahren die cluster. Funktioniert das nicht so ohne Programm? Es sind insgesamt nur 10 Objekte die geclustert werden sollen
..nicht ganz, nachdem sich das erste Cluster gebildet hat, müssen dieDistanzen neu berechenet werden...
es gibt bestimmt kostenlose software die das macht, ich glaub PSPP kann das.

Aber für mich klingt das komisch,
du siehst doch bei jedem Standort wie sich die Gesamtkosten prozentual
auf die Bereiche verteilen, wenn das jetzt nur 10 sind, sieht man doch wer beim Beladen trödelt.

..gut du willst vermutlich deine Methode auf eine größeren Anzahl von Standorten verallgemeinern.

für mich klingt das ganze eher nach einer Regression..
und wenn das eine BA ist vielleicht nochmal nach Methoden recherchieren

gruß
dutchie
Marius12!
Beiträge: 6
Registriert: 12.01.2022, 12:38

Re: Clustervariablen gewichten

Beitrag von Marius12! »

Hallo dutchie,

Genau die Distanzen würde ich dann immer neu berechnen. Ist ja quasi meine Eigenleistung für die BA.

Laut Controlling seh ich nur die Gesamtkosten je Standort.
Aktuell seh ich nur, das Standort A mehr Transportkosten produziert als Standort C. Allerdings kann das ja auch seine Gründe haben wie die Fahrzeit zu den Kunden die pro Tag einfach länger dauert, oder weil der LKW pro Tag um die Ware zu beliefern mehrmals umdocken muss. Das ist aus den Gesamtkosten ja nicht ersichtlich.

Deswegen will ich die Standorte ja gruppieren und mir dann innerhalb der Gruppe die Kosten anschauen. Innerhalb der Gruppe seh ich dann ja, dass beide Standorte unterschiedliche Kosten haben obwohl bei dem Transport zu den Kunden täglich im durchschnitt die gleichen Anforderungen gelten. Also seh ich dass ein Standort dann mehr Kosten beansprucht und schlechter wirtschaftet mit den Ressourcen. Insgesamt sollen 12 Standorte gruppiert werden.

Würde das nicht so mit der Clusteranalyse funktionieren? Und wieso soll ich eine Regression machen, was würde das bringen?
Ich bin etwas verunsichert :(
dutchie
Beiträge: 2767
Registriert: 01.02.2018, 10:45

Re: Clustervariablen gewichten

Beitrag von dutchie »

Marius12! hat geschrieben:
14.01.2022, 09:38
Deswegen will ich die Standorte ja gruppieren und mir dann innerhalb der Gruppe die Kosten anschauen.
nur weil die in einem Cluster landen haben die nicht identische Werte.

wenn du ein Streudagramm machst siehst du den Zusammenhang zwischen x und y
die kosten steigen linear mit der Zeit z.B. ein funktionaler Zusammehang,
jeder punkt ist ein standort... jetzt siehst du welcher standort drüberliegt
also mehr kostet als aufgrund der zeit zu erwarten war...

das kannst du ja zusätzlich machen

spiel rum...ich will dir das clustern ja nicht ausreden,
...aber clustern mit der Hand ist keine Eigenleistung, da verrechnet man sich doch nur...
überprüf das zumindest mit PSPP

gruß
dutchie
Marius12!
Beiträge: 6
Registriert: 12.01.2022, 12:38

Re: Clustervariablen gewichten

Beitrag von Marius12! »

Hallo dutchie,

Vielen Dank für deine Antworten. Genau man hätte cluster die nicht exakt sie gleichen Werte im Ausgang hatten aber eben ähnliche. Innerhalb der Cluster soll dann ein Internes Benchmarking erfolgen Man müsste dann schauen wie die Kosten sich innerhalb des Cluster in Relation zum „1 Platzierten“ innerhalb der Gruppe verändern.

Mit excel funktioniert das eigentlich ganz gut. Man berechnet ja nur die distanzen vom jeweils neugebildeten Cluster zu den ürbigen Einzel- Cluster.

Macht es denn in deinen Augen Sinn, Standorte nach deren Rahmenbedingungen zu clustern? Also können Clusteranalysen dafür verwendet werden? Ich war davon überzeugt dass es geht aber bin so ein bisschen durch die Diskussion hier ins Zweifeln gekommen
dutchie
Beiträge: 2767
Registriert: 01.02.2018, 10:45

Re: Clustervariablen gewichten

Beitrag von dutchie »

Hallo,

probiers einfach aus, wenn du bekommst was du willst ist doch alles ok.
Du denkst aber in clustern kategorial!
Du machst gleich was unterschiedlich ist...

wenn du einen 1. Platzierten hast, wozu muss der noch in einem Cluster stecken.

gruß
dutchie
Marius12!
Beiträge: 6
Registriert: 12.01.2022, 12:38

Re: Clustervariablen gewichten

Beitrag von Marius12! »

Die Unterschiede sind im Durchschnitt zwischen den Standorten nicht mega groß. Ich will damit quasi nur herausfinden, welche Standorte man bei den geringen Unterschieden die natürlich auf Durchschnittswerten basieren eher zusammengehören und wo man quasi die Trennung schafft ob der Standort beispielsweise in Cluster 1 oder schon in Cluster 2 gehört. Die Clusteranalyse schafft ja Homogenität innerhalb der Gruppen

Wenn man sich nämlich aktuell nur die Transportkosten anschauen würde, wüsste man gar nicht ob es noch Optimierungspotenzial gibt, weil man nicht wüsste welche standorte man eher miteinander vergleichen kann. Diese Gruppierung erhoff ich mir aus der Analyse
Anzeige:Statistik und SPSS: Die besten Bücher
Als Buch oder E-Book - Jetzt bestellen
spss datenanalyse
SPSS - Moderne Datenanalyse - Jetzt bestellen!
statistik datenanalyse
Statistik - Der Weg zur Datenanalyse - Jetzt bestellen!
Antworten