Cluster-based forecasting (K-Means) sinnvoll/ mit SAP IBP?
Hallo zusammen, ich schreibe gerade meine Masterarbeit für mein Business-Analytics-Studium und habe ein wenig Schwierigkeiten mit dem Thema und der Umsetzung. Die Arbeit geht um Bedarfsplanung und -prognose für ein Produktionsunternehmen. Ich habe daran gearbeitet, die Prognosen des Unternehmens mit Machine-Learning-Algorithmen in Python zu verbessern. Dazu habe ich beispielsweise eine Produktgruppe ausgewählt und begonnen, die Bedarfszeitreihen mit K-Means zu clustern. Dazu habe ich jede Zeitreihe mit Merkmalen wie ADI (Average Demand Interval) und CV² (Squared Coefficient of Variation) beschrieben, um Materialien mit ähnlichem Nachfrageverhalten zu gruppieren. Allerdings konnte ich keinen Silhouette Score von mehr als 0,38 erreichen. Ist das ein akzeptables Ergebnis für das Clustering von Daten aus der Praxis? Zusätzlich habe ich manuell zwei weitere Cluster hinzugefügt: einen für Materialien, die nur einmal gekauft wurden, und einen für Materialien mit einer Zeitreihe von weniger als 12 Monaten. Meine größte Herausforderung besteht nun darin, herauszufinden, wie ich dies in SAP IBP implementieren kann, wo die Prognosen des Unternehmens erstellt werden. Ich erwäge, die Cluster-ID als benutzerdefiniertes Attribut in die Stammdaten hochzuladen. Würde mir dies ermöglichen, Prognosen auf Cluster-Basis durchzuführen, sodass ich die besten Prognosemethoden für jede Gruppe vorhersagen und empfehlen kann? Und kann ich die Auswirkung dieses Ansatzes mit einer Metrik wie MAPE (Mean Absolute Percentage Error) messen, um ihn mit der bisherigen Prognosemethode zu vergleichen? Ich wäre für jede Hilfe, Idee oder Empfehlung sehr dankbar. Auch ob dieser Ansatz sowohl für meine Abschlussarbeit als auch für das Unternehmen sinnvoll ist. Vielen Dank im Voraus, Viele Grüße von mir und meinem Impostor-Syndrom. 😊