Liebe Freunde der Statistik,
ich bin kein Fachmann für Statistik und würde mich sehr über eure Hilfe freuen. Mein Wissen begrenzt sich in diesem Gebiet auf Grundkenntnisse im Bereich der Verteilungstypen (Binomial-, Poisson-, Exponential-, Normal- und Weibullverteilung), Konfidenzintervalle und statistische Tests. Diese Kenntnisse könnten mich bei dem vorliegenden bereits helfen, allerdings ist hier (nach meiner Einschätzung) eine Kombination vieler Aspekte notwendig. Derzeit habe ich noch keine Idee für ein konkretes Vorgehen.
Mir liegt eine große Datenmenge von Zuverlässigkeitsdaten vor, die ich gerne auf deren Einflussfaktoren analysieren möchte. Die Daten enthalten Zuverlässigkeitsinformationen über einzelne Komponenten, die in verschiedenen Anlagen verbaut sind. Jeder Eintrag umfasst eine ausgetauschte Komponente. Es handelt sich hierbei um sehr langlebige Anlagen, die bei Bedarf durch neue Komponenten instandgesetzt werden. Konkret liegen die folgenden Parameter vor:
• Einbauort: Einbauplatz für gleichartige Teile. Bsp. Glühbirne: An dieser Stelle kann sowohl eine 60 Watt Birne von Osram als auch von Philipps verbaut werden
• Materialnummer: Bezeichnung des Materials. Entweder 60 Watt Osram oder 60 Watt Philipps
• Anlagentyp: Anlagenmodell in dem die Komponente verbaut ist
• Betreiber der Anlage: Nutzer der Anlage
• Anlagenalter: Das Alter der Anlage, nicht der ausgetauschten Komponente
• Betriebsdauer der Komponente bis zum Ausfall
• Arbeitszyklen der Komponente bis zum Ausfall
• Kalendarische Zeit zwischen den Ausfällen
Ziel: Aussagen von möglichst genauen Zuverlässigkeitskennwerten / Welche Einflussfaktoren beschreiben die Zuverlässigkeit am besten? / Möglichkeiten der Clusterung?
Meine bisherigen Überlegungen und Fragen zu Methoden und Vorgehen:
• Mit welchem Verteilungstyp lässt sich die Zuverlässigkeit am besten beschreiben? / Welchen Typ von Ausfallverhalten habe ich?
• Ist die Verteilung überhaupt so ausschlaggebend?
• Kann ich Clusterungen vornehmen?
• Wie weit muss ich die Daten aufgliedern, um möglichst genau Kennwert zu bekommen?
• Durch welche Einflussfaktoren, wird die Zuverlässigkeit am besten beschrieben?
• Einbauort:
o Haben die unterschiedlichen Materialnummern ein signifikant unterschiedliches Ausfallverhalten?
• Materialnummer:
o Muss ich jedes Material einzeln betrachten?
o Welche Verteilung liegt vor?
• Anlagentyp:
o Hat der Anlagentyp, in dem die Komponenten verbau sind, einen signifikanten Einfluss auf das Ausfallverhalten der Teile?
• Betreiber der Anlage:
o Hat der Betreiber, der die Anlage betreibt, einen signifikanten Einfluss auf das Ausfallverhalten der Teile?
• Anlagenalter:
o Hat das Alter (nicht der Komponente) der Anlage einen signifikanten Einfluss das Ausfallverhalten?
• Betriebsdauer, Arbeitszyklen oder kalendarische Zeit der Komponente bis zum Ausfall
o Welcher dieser Einflussfaktoren beschreibt das Ausfallverhalten am besten?
o Oder eine Kombination?
Ich wäre sehr dankbar für alle Hilfestellungen zu einer konkreten Vorgehensweise.
Nach der theoretischen Erarbeitung würde ich das Projekt in SPSS umsetzen wollen. Mir liegt die aktuellste Premium Version 20 vor.
Vielen Dank für eure Hilfe!
Auswertung Zuverlässigkeitsdaten / Bewertung Einflussfakoren
-
- Beiträge: 5
- Registriert: 17.10.2012, 18:05
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Ich gehe einmal von diesen Variablen als Prädiktoren (UV) aus:
Diese Fragestellung ist identisch mit Fragestellungen aus der Medizin ("welches sind die Ursachen für Überleben/Nicht-Überleben"). Das Verfahren hier muss eine Zeitkomponente berücksichtigen. Die Verteilung spielt dabei keine Rolle.
Lösung: Cox-Regression. Ggf. graphische Darstellung über Kaplan-Meier. Beachten, dass die nominalen Zufallsvariablen zuerst dummycodiert (0-1) werden müssen.
Die Cox-Regression benötigt den Status des Gegenstandes (überlebt / nicht überlebt), die Zeit (Verteilung nicht relevant) sowie die Kovariaten. Das wären dann die UV (siehe oben). Wobei wie schon gesagt die nominalen ZV zuerst 0-1 dummy codiert werden müssen.
Da wir ein SPSS lastiges Tutorial sind, hier noch ein Literaturhinweis: Achim Bühl. Gute, einfache Darstellung der Thematik mit Beispielslösung.
Und als AV dann die Überlebenszeit jeweils für ein bestimmtes Bauteil. Wichtig: nach Ausfall des Bauteils, wird es nicht erneut Gegenstand der Messung (wird es nicht repariert und wieder eingesetzt).• Einbauort: Einbauplatz für gleichartige Teile. Bsp. Glühbirne: An dieser Stelle kann sowohl eine 60 Watt Birne von Osram als auch von Philipps verbaut werden
• Materialnummer: Bezeichnung des Materials. Entweder 60 Watt Osram oder 60 Watt Philipps
• Anlagentyp: Anlagenmodell in dem die Komponente verbaut ist
• Betreiber der Anlage: Nutzer der Anlage
• Anlagenalter: Das Alter der Anlage, nicht der ausgetauschten Komponente
• Betriebsdauer der Komponente bis zum Ausfall
• Arbeitszyklen der Komponente bis zum Ausfall
• Kalendarische Zeit zwischen den Ausfällen
Diese Fragestellung ist identisch mit Fragestellungen aus der Medizin ("welches sind die Ursachen für Überleben/Nicht-Überleben"). Das Verfahren hier muss eine Zeitkomponente berücksichtigen. Die Verteilung spielt dabei keine Rolle.
Lösung: Cox-Regression. Ggf. graphische Darstellung über Kaplan-Meier. Beachten, dass die nominalen Zufallsvariablen zuerst dummycodiert (0-1) werden müssen.
Die Cox-Regression benötigt den Status des Gegenstandes (überlebt / nicht überlebt), die Zeit (Verteilung nicht relevant) sowie die Kovariaten. Das wären dann die UV (siehe oben). Wobei wie schon gesagt die nominalen ZV zuerst 0-1 dummy codiert werden müssen.
Da wir ein SPSS lastiges Tutorial sind, hier noch ein Literaturhinweis: Achim Bühl. Gute, einfache Darstellung der Thematik mit Beispielslösung.
drfg2008
-
- Beiträge: 5
- Registriert: 17.10.2012, 18:05
Hallo drfg2008,
vielen Dank für deine Antwort. Die Cox-Regression könnte mir helfen. Ich habe mir die Thematik kurz angelesen. Allerdings hatte ich eher (gerade beim ersten Versuch) eher an ein sequentielles Vorgehen gedacht, was sich aus einfachen Verfahren zusammensetzt und so für mich aber auch für andere nachvollziehbar bleibt!
Beispiel: Unterscheidet sich die Zuverlässigkeit der Bauteile für ein Einbauort? --> Ja/Nein/ggf. Bildung von Clustern --> Für Anlagenbetreiber? --> Ja/Nein/ggf. Bildung von Clustern --> usw.
Zu diesem Punkt:
vielen Dank für deine Antwort. Die Cox-Regression könnte mir helfen. Ich habe mir die Thematik kurz angelesen. Allerdings hatte ich eher (gerade beim ersten Versuch) eher an ein sequentielles Vorgehen gedacht, was sich aus einfachen Verfahren zusammensetzt und so für mich aber auch für andere nachvollziehbar bleibt!
Beispiel: Unterscheidet sich die Zuverlässigkeit der Bauteile für ein Einbauort? --> Ja/Nein/ggf. Bildung von Clustern --> Für Anlagenbetreiber? --> Ja/Nein/ggf. Bildung von Clustern --> usw.
Zu diesem Punkt:
Eínige der Bauteile werden wieder instandgesetzt. Für eine schnelle Reparatur werden zunächst auf Lager liegende Bauteile verbaut. Das defekte Bauteil wird instandgesetzt und dann im Lager deponiert. [/quote]Wichtig: nach Ausfall des Bauteils, wird es nicht erneut Gegenstand der Messung (wird es nicht repariert und wieder eingesetzt).
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Die Problematik weist eine Zeitkomponente auf. Daher werden 'einfache Verfahren' hier nicht greifen oder sogar zu völlig falschen Ergebnissen führen, auch wenn sie ggf. leichter verständlich sein mögen.
Den Begriff des Ausfalls eng definieren und wieder eingesetzte Bauteile aus dem Datensatz entfernen. Ein Bauteil hat sein 'Leben' beendet nach dem ersten Ausfall.
Ansonsten ggf. in der brancheneigenen Literatur recherchieren, oder DIN / ISO / IEEE Vorschriften zur Messung verwenden (falls vorhanden).
Den Begriff des Ausfalls eng definieren und wieder eingesetzte Bauteile aus dem Datensatz entfernen. Ein Bauteil hat sein 'Leben' beendet nach dem ersten Ausfall.
Ansonsten ggf. in der brancheneigenen Literatur recherchieren, oder DIN / ISO / IEEE Vorschriften zur Messung verwenden (falls vorhanden).
drfg2008
-
- Beiträge: 5
- Registriert: 17.10.2012, 18:05
-
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
Jede Branche hat ihre Vorgehensweisen. In der Medizin, und nur darauf bezieht sich mein Beispiel, wird die Cox Regression eingesetzt. Diese ist unabhängig von einer a priori bekannten Verteilung.
Wenn aus Forschungen eine Verteilung der Ausfälle a priori bekannt ist, dann sind natürlich noch andere Verfahren denkbar.
Bei SPSS kämen dann z. B. die sog. "verallgemeinerten linearen Modelle" in Frage, falls bspw. die AV einer Poisson, Gamma, Binomial oder Neg.Bin. Verteilung folgen. Unter "Curve Estimation" können auch Exponentialverteilungen per Regression geschätzt werden.
Mit Zeitkomponente ist die Zeit bis zum ersten Ausfall gemeint. Diese wäre dann die AV.
Wenn aus Forschungen eine Verteilung der Ausfälle a priori bekannt ist, dann sind natürlich noch andere Verfahren denkbar.
Bei SPSS kämen dann z. B. die sog. "verallgemeinerten linearen Modelle" in Frage, falls bspw. die AV einer Poisson, Gamma, Binomial oder Neg.Bin. Verteilung folgen. Unter "Curve Estimation" können auch Exponentialverteilungen per Regression geschätzt werden.
Mit Zeitkomponente ist die Zeit bis zum ersten Ausfall gemeint. Diese wäre dann die AV.
drfg2008