Nisa Eski

data_analyst
Nisa Eski
Wirtschaftsinformatik
Hochschule Albstadt-Sigmaringen

Hallo zusammen, während meiner Tätigkeit im Werk39 war ich mit der Erstellung meiner Bachelorthesis beschäftigt, die nicht zu den eigentlichen Projekten im Werk39 zählte. Trotzdem war ich sehr gespannt drauf, einen Einblick in ein Innovation Lab, wie das Werk39 zu erhalten.


Aufgrund der Corona Pandemie befand ich mich jedoch bereits nach einem Monat im Homeoffice und musste meine Thesis daher von zuhause weiterschreiben. Dennoch ermöglichten Anwendungen, wie Microsoft-Teams einen effektiven Austausch innerhalb des Bereichs. Somit konnte ich trotz Homeoffice einen tiefen Einblick in die einzelnen Projekte und in die allgemeine Arbeitsweise im Werk39 gewinnen.

bachelor_thesis

Meine Arbeit thematisierte, die „Konzeption und prototypische Umsetzung einer Methodik, für das Stammdatenmanagement im Kontext des E-Business der Aesculap AG“. Hierbei lag der Schwerpunkt auf der Identifikation möglicher Stammdatenfehler, die der allgemeinen Datenqualität schaden und somit das Risiko für weitere Probleme erhöhen. Um eine solche Fehleranalyse durchzuführen, habe ich zwei unterschiedliche Umsetzungsmöglichkeiten, wie einen Algorithmus und eine Machine Learning Lösung entwickelt und getestet. Somit lernte ich in den sechs Monaten verschiedene Techniken und Methoden für die unterschiedlichsten Datenverarbeitungs- und Datenanalyseprozesse kennen.

such_algorithmus

Der erste Teil meiner Bachelorarbeit fokussierte sich auf die Entwicklung eines Algorithmus, der mit der Programmiersprache Python generiert wurde.
Python war mir bereits aus dem Studium bekannt. Allerdingst ermöglichte mir der Aufenthalt im Werk39, meine bisherigen Kenntnisse um einiges zu erweitern. Ich erlernte relativ neue Python Bibliotheken, wie z. B. die FuzzyWuzzy Funktion, die es ermöglicht Abweichungen zwischen Zeichenketten zu erkennen. Somit lernte ich in kurzer Zeit neue Funktionen kennen, mit denen unterschiedliche Datenanalysen durchgeführt werden können. Letztendlich entwickelte ich einen Suchalgorithmus, der es ermöglicht Fehler in den Stammdaten zu identifizieren.

machine_learning

Im zweiten Teil der Arbeit habe ich versucht eine alternative Möglichkeit anhand von Machine Learning zu entwickeln, der die Stammdatenfehler ebenfalls aufdecken soll.
Da mir die Anwendung von Machine Learning zu Beginn meines Projekts unbekannt war, habe ich zunächst eine intensive Analyse über mögliche Lösungsansätze durchgeführt. Somit war ich in kurzer Zeit in der Lage, unterschiedliche Methoden des Machine Learnings, wie z. B. Fast-Text und K-Mean-Clustering zu testen und voneinander abzuwägen.
Jedoch kamen wir zur Erkenntnis, dass Machine Learning keine zielführende Lösung für eine Fehleranalyse in den Stammdaten der Aesculap AG ist.

power_automate

Abschließend wurde die Entwicklung eines prototypischen Workflows geplant, der mögliche Stammdatenfehler mit Hilfe der entwickelten Methodik identifiziert und anschließend eine Verantwortliche Rolle für eine Verbesserung der Daten informiert. Der Workflow soll letztendlich eine Möglichkeit darstellen, mit der die Datenqualität der Aesculap AG verbessert werden kann.
Hierfür erzeugte ich zunächst eine API, mit der der Suchalgorithmus angewendet wird. Mit Hilfe der erstellten API und der Power Automate Anwendung von Microsoft wurde der prototypische Workflow letztendlich erzeugt. Nun kann er zukünftig im Stammdatenmanagement für die Optimierung der Datenqualität betrachtet und weiterentwickelt werden.

fazit

Die Zeit im Werk39 ermöglichte mir im Allgemeinen, mein Wissen aus unterschiedlichen Bereichen weiterzuentwickeln. Außerdem war es sehr interessant für mich, neue Technologien, wie Machine Learning Methoden kennenzulernen.
Schließlich freute es mich sehr, meine fertige Bachelorarbeit der gesamten Aesculap AG bereitzustellen.