Machine Learning (ML) bietet großes Potenzial, wenn es darum geht, die Prozesse im Unternehmen wirkungsvoll zu unterstützen. Bei einem gemeinsamen Hackathon von SAP und IBsolution (18. bis 20. Oktober) hatten die teilnehmenden Unternehmen die Chance, den Einsatz von ML in der Personalplanung zu validieren. Das Ziel der Veranstaltung war die Entwicklung eines Modells, das auf der Basis von Algorithmen automatisiert Vorhersagen dazu trifft, ob ein Mitarbeiter das Unternehmen in den kommenden zwölf Monaten verlassen wird. Der HR-Bereich eignet sich in besonderer Weise für den Einsatz von Machine Learning, da dort eine Vielzahl an Daten zu den Mitarbeitern – Stellenwechsel innerhalb des Unternehmens, Zeiterfassung, absolvierte Weiterbildungen etc. – verfügbar ist. Zudem ist es möglich, die Daten mit SAP HANA Cloud zu anonymisieren und zu pseudonymisieren, sodass nur berechtigte Personen alle Attribute sehen können.

 


 

Erstellen Sie mit der SAC auch als Business-Anwender ML-basierte Prognosen
Mehr zur SAP Analytics Cloud erfahren

 


 

Business Case: Prognosen über Mitarbeiterfluktuation

Beim Hackathon waren die Unternehmen Zeiss, Testo Industrial Services, Bundeswehr, Bosch Rexroth und Syskron, die Digitalisierungs-Unit der Krones AG, dabei. Die einzelnen Teams nutzten die Gelegenheit, sich mit den innovativen Technologien für das Machine Learning vertraut zu machen. Im Vorfeld hatten SAP und IBsolution einen Business Case definiert, den es für die Teilnehmer des Hackathons zu bearbeiten galt. In dessen Mittelpunkt stand ein HR Business Analyst, der vorhersagen möchte, welche Mitarbeiter das Unternehmen in den kommenden zwölf Monaten verlassen könnten. Eine solche Prognose würde den Führungskräften die Möglichkeit geben, rechtzeitig Gegenmaßnahmen einzuleiten, um eine unerwünschte Personalfluktuation zu verhindern.

 

Der Machine-Learning-Hackathon von SAP und IBsolution im Video

 

Der Analyst geht davon aus, dass Machine Learning versteckte Muster in den Mitarbeiterdaten aufdecken kann, die wertvolle Erkenntnisse hinsichtlich des potenziellen Abschieds eines Mitarbeiters aus dem Unternehmen liefern. Die Daten können in der SAP Data Warehouse Cloud (DWC) aufbereitet und die Vorhersagemodelle entweder mit den Smart-Predict-Funktionalitäten der SAP Analytics Cloud (SAC) oder mit den SAP HANA Machine-Learning-Funktionalitäten direkt auf der Datenbank erstellt werden. Die Prognosen, welche die ML-Modelle liefern, möchte der HR Business Analyst innerhalb eines SAC-Dashboards visualisieren, damit das Management sie leicht konsumieren kann und in die Lage versetzt wird, schnelle Entscheidungen zu den Mitarbeitern zu treffen. Dafür kann auf die Daten, die bei der Modellvalidierung anfallen, zugegriffen werden, um beispielsweise zu erkennen, welche Spalten im Datensatz das Ergebnis wie beeinflussen.

 

SAP HANA Machine Learning als Basis

Der erste Schritt für die Bewältigung der Aufgabenstellung bestand darin, die vorhandenen Daten in die SAP DWC, in die SAP HANA Cloud-Datenbank oder direkt in die SAP Analytics Cloud zu laden und so aufzubereiten, dass sie für Machine Learning genutzt werden konnten. Zudem machten manche Teams von der Möglichkeit Gebrauch, die Daten über Joins mit Informationen aus anderen Datensätzen anzureichern. Spalten, die Daten von unzureichender Qualität enthielten, wurden mithilfe von Projektionen ausgeblendet, um Verzerrungen zu vermeiden.

 

Das Bauen der Machine-Learning-Modelle erfolgte mithilfe der in SAP HANA integrierten Funktionen für das maschinelle Lernen: Automated Predictive Library (APL) und Predictive Analysis Library (PAL). Hierfür boten sich grundsätzlich zwei Lösungsansätze: Entweder verwendeten die Teilnehmer die Predictive-Szenarien der SAC, die für Citizen Data Scientists geeignet sind, also für Mitarbeiter aus den Fachabteilungen ohne technischen Hintergrund, oder es erfolgte ein direkter Zugriff auf die SAP HANA Cloud Machine-Learning-Pakete APL und PAL mittels Python oder R über die gewohnte Umgebung eines Data Scientists wie Jupyter Notebooks oder RStudio.

 

Wie sich APL und PAL unterscheiden

Während APL automatisch das beste Modell mit den besten Parametern anhand der Daten auswählt, verfolgt PAL einen flexibleren Ansatz und gibt dem Data Scientist beispielsweise die Option, das Modell frei zu wählen und weitere Einstellungen an den Modellparameter vorzunehmen.
Wichtig ist zu erwähnen, dass die SAC Predictive-Szenarien die APL in der SAP HANA Cloud verwenden – die gleiche Funktion, die sich auch der Data Scientist zunutze machen kann. Im Falle einer binären Klassifizierung von Daten bietet die APL oft die besten Ergebnisse, da dort ausgereifte Verfahren wie das Gradient Boosting zur Verfügung stehen. In manchen Fällen liefern aber andere Algorithmen ein besseres Ergebnis, zum Beispiel ein Random Forest, der es erforderlich machen kann, dass ein Data Scientist das Ganze direkt auf der SAP HANA umsetzt, statt den Weg über die SAC zu gehen.

 

Teams präsentieren ihre Ergebnisse

Die abschließenden Ergebnispräsentationen machten deutlich, dass sich die Teilnehmer in den drei Hackathon-Tagen intensiv mit dem vorgegebenen Business Case und den Machine-Learning-Funktionalitäten der SAP HANA Cloud auseinandergesetzt haben. So ist es gelungen, Vorhersagemodelle zu entwickeln, die prognostizieren, ob ein Mitarbeiter das Unternehmen in den kommenden zwölf Monaten verlassen wird. Darüber hinaus nahmen die Teilnehmer auch viele wertvolle Anregungen mit, welche Potenziale das maschinelle Lernen auch für andere Unternehmensbereiche bereithält und wie sich diese Potenziale heben lassen.

 

Erstellen Sie mit der SAC auch als Business-Anwender ML-basierte Prognosen

Mehr zur SAP Analytics Cloud erfahren

 

Weitere interessante Beiträge: