Schnelle und fundierte Entscheidungen verhelfen Unternehmen zu wirtschaftlichem Erfolg. Die SAP Data Warehouse Cloud und die SAP Analytics Cloud ermöglichen einen einfachen Zugriff auf Informationen und Erkenntnisse, um daraus die richtigen Schlüsse zu ziehen. Stellen Cloud-Lösungen also die ausschließliche Zukunft in der Business-Intelligence-Welt von SAP dar? Im Interview blickt Fabian Hartje, Head of Product Management for Data Warehousing bei SAP, voraus und skizziert die Entwicklungen, die Reporting, Analytics und Planung künftig prägen werden.
Fabian Hartje: Die steigende Anzahl an Datenquellen und das stetig wachsende Datenvolumen sind aus meiner Sicht die Ursachen für viele Herausforderungen, denen sich Unternehmen stellen müssen. Beide Faktoren haben eine zunehmende Zahl von Analysten im Unternehmen zur Folge. Denn nur wer es schafft, die Qualität der Informationen beizubehalten bzw. zu verbessern, wird sich auf lange Sicht einen Wettbewerbsvorteil verschaffen. Die IT-Abteilung wächst in der Regel nicht im gleichen Maße mit, sodass ein Ungleichgewicht entsteht. Es geht darum, Daten und notwendige Informationen zeitgerecht bereitzustellen. Gelingt dies nicht, sind wachsende Schatten-IT-Landschaften die Folge oder die eigentliche Geschäftslogik wandert in die konsumierenden Tools ab und wird immer schwieriger zu managen.
Häufig haben Unternehmen gleich mehrere datenkonsumierende Tools im Einsatz. Das sind nicht nur Reporting-Tools, sondern beispielsweise auch kundenspezifische Apps, die ebenfalls einen Informationsbedarf haben. Das Ergebnis: Die Geschäftslogik wird dupliziert und bei notwendigen Änderungen nicht an allen Stellen nachgezogen.
Für die Planung stellen sich die gleichen Fragen: Auf welche Datenbasis greife ich zurück? Nutze ich geschäftsbereichsübergreifend die gleichen Dimensionen und Planungsstrukturen? Sind die Ergebnisse verschiedener Planungsversionen und Pläne überhaupt noch vergleichbar? Bei vielen Kunden erkenne ich den Bedarf und den Willen, eine zentrale Datenplattform bereitzustellen. Diese muss aber den genannten Herausforderungen gerecht werden. Sprich: Sie muss die Balance zwischen Freiheit, Kontrolle, Sicherheit und Vertrauen herstellen.
Fabian Hartje: Vereinfacht gesagt, müssen Daten und Informationen für alle Stakeholder im Unternehmen verständlich, nachvollziehbar und nutzbar sein. Wertvolle Erkenntnisse werde ich nur gewinnen, wenn ich frei mit den Daten arbeiten und Modelle wiederverwenden kann, ohne das Rad jedes Mal neu zu erfinden.
Um ein freies Arbeiten mit Daten und Modellen zu erreichen, ist das Wissen um die Daten und deren Inhalte unerlässlich. Aus meiner Sicht spielen die Metadaten und somit die Semantik bzw. der Kontext eine übergeordnete Rolle. Heißt im Umkehrschluss: Ein Unternehmen muss sicherstellen, dass alle Stakeholder auf das Wissen zugreifen und es mit relevanten Informationen anreichern können. Dafür ist es zwingend erforderlich, Zugriff auf das semantische Wissen in den jeweiligen Quellsystemen zu haben, um Daten im richtigen Kontext zu nutzen.
Für die Modellierung muss ebenfalls sichergestellt sein, dass das semantische Wissen und die erzielte Anreicherung weitergeführt werden und so Durchgängigkeit erzielt wird. Auch aufseiten der Datenmodellierung gilt es, eine Governance zu etablieren, um das Maximale aus den Daten herausholen zu können. Es ist empfehlenswert, von Anfang an eine Schichtenarchitekur aufzubauen und zu verhindern, dass anwendungsfallspezifische Aspekte in den generischen Schichten modelliert werden. Dies bedingt eine Trennung von Datenintegration und Geschäftslogik.
Das Ziel muss eine größtmögliche Offenheit beim Zugriff auf die Daten und Informationen sein – vom klassischen Reporting über Analytics bis hin zu Data Science. So stellen Unternehmen sicher, dass jeder mit dem gleichen Wissen arbeitet und es mit den gewonnenen Erkenntnissen anreichert, um daraus die richtigen Schlüsse zu ziehen.
Fabian Hartje: Generell gibt es drei mögliche Lösungen: SAP Data Warehouse Cloud, SAP BW/4HANA und SAP HANA for SQL Data Warehousing. Je nach Präferenz – Cloud oder on-premise – ergeben sich bestimmte Pfade, die SAP-Bestandskunden, aber auch Neukunden einschlagen können. Bei einer Cloud-Präferenz haben Unternehmen die Wahl zwischen SAP BW/4HANA und SAP Data Warehouse Cloud. Ein hybrides Data-Warehousing-Szenario ergänzt SAP BW/4HANA mit SAP Data Warehouse Cloud. Diese Option hat ihre Stärken beispielsweise bei der Öffnung in Richtung der Fachabteilung, bei der Datenintegration von Nicht-SAP Quellen und bei Self-Service-Szenarien.
SAP Data Warehouse Cloud ist ein Cloud-only-Produkt und bringt die klassischen Vorteile einer SaaS-Lösung mit sich, zum Beispiel mit Blick auf Skalierbarkeit und Elastizität. Wie schon erwähnt, zielt SAP Data Warehouse Cloud auf disparate und heterogene Systemlandschaften ab, die es im Unternehmen zu integrieren gilt, und schließt den organisatorischen „Whitespot“ zwischen den Zuständigkeiten von Business & IT und deren Tooling. Um das zu erreichen, stellt SAP Data Warehouse Cloud einen eigenen Layer für die Geschäftslogik-Modellierung (Business Layer), Tooling für das Integrieren externer Daten und Standard-Content bereit.
Wer eine On-premise-Lösung bevorzugt, hat die Wahl zwischen SAP HANA for SQL Data Warehousing und SAP BW/4HANA. Die erste Option verfolgt einen agilen, flexiblen und datenbankgetriebenen Data-Warehousing-Ansatz und zielt auf Unternehmen ab, deren Ressourcen-Skillset stark im SQL-Umfeld liegt. Mit SAP BW/4 HANA haben Unternehmen die Möglichkeit, eine voll integrierte Data-Warehouse-Lösung zu etablieren. Sie punktet mit Standard-Content und Data Tiering, um den Daten-Footprint aktiv managen zu können.
Fabian Hartje: Darauf gibt es keine Standardantwort. Diese Frage muss jedes Unternehmen entlang mehrerer Dimensionen und Aspekte individuell für sich beantworten. Zum Beispiel ist relevant, welchen Freiheitsgrad und welche Flexibilität ich in meinem Unternehmen benötige. Das reicht von der Administration über die Erweiterbarkeit bis hin zur vollen Kontrolle über die Parametrisierung. In Bezug auf die Cloud muss ich mich zwischen Software-as-a-Service und Platform-as-a-Service entscheiden. Eine weitere Dimension ist das Thema Sicherheit und Regularien. Abhängig davon, welche Daten ich in meinem Unternehmen generiere und verarbeite, muss ich unter Umständen jederzeit auskunftsfähig über den Ablageort meiner Daten sein. Hier kann ein hybrider Ansatz Vorteile bieten, um Konformität mit den geltenden Regularien herzustellen.
Eine der grundlegendsten Entscheidungsdimensionen ist aus meiner Sicht, ob ich überhaupt die erforderlichen Erfahrungen und Fähigkeiten im Unternehmen habe, um ein Data Warehouse on-premise zu bauen und zu betreiben. Kann ich Sicherheit, Verfügbarkeit und Skalierbarkeit gewährleisten? Cloud-Provider liefern diese Elemente direkt mit. Das bedeutet, das Unternehmen kann sich auf die tatsächlichen Aufgaben wie Datenbereitstellung, Modellierung, Performance etc. fokussieren.
Außerdem relevant: Kann ich meine Bedarfe im Unternehmen realistisch einschätzen? Sind sie fix oder brauche ich die Möglichkeit eines flexiblen Wachstums? Herrscht Unklarheit über die künftigen Bedarfe, spricht das für eine Cloud-Lösung. Auch der Zeitraum, in dem das System verfügbar sein muss, ist nicht unerheblich. Ist ausreichend Zeit vorhanden, um Hardware zu beschaffen und das komplette System aufzusetzen, oder muss möglichst zeitnah eine Lösung bereitstehen? Gerade für diese Frage spielen die Use Cases und der Umfang, den ich abbilden möchte, eine wichtige Rolle. Für Unternehmen, die mit einzelnen Anwendungsfällen und Geschäftsbereichen starten wollen, stellt sich zwangsläufig die Budgetfrage. Bei einer Cloud-Lösung kann ich mit einzelnen Use Cases loslegen und durch Skalierbarkeit und Elastizität mein System über die Zeit problemlos anpassen, anstatt sofort mit dem gesamten Umfang und den vollen Kosten starten zu müssen.
Fabian Hartje: In Kundengesprächen stellen wir vermehrt fest, dass es den Wunsch nach einer zentralen „Plattform“ für jegliche Art von Unternehmensdaten gibt. Die Landschaften der Unternehmen sind äußerst heterogen – sowohl vertikal, das heißt, es sind mehrere identische Systeme, beispielsweise mehreren ERP-Systeme, vorhanden, als auch horizontal, also mit Blick auf die Vielzahl der Systeme. Daher bedarf es einer Schicht, welche die angesammelte Komplexität abstrahiert. Im Unterschied zu einem klassischen Data-Warehousing-Ansatz, der Daten aus einer Vielzahl von Quellen in einer recht statischen, wohldefinierten Schichtenarchitektur konsolidiert und für Auswertungszwecke zur Verfügung stellt, gehen die heutigen Anforderungen eher in Richtung Agilität, semantische Integration und einfache Anbindung externer Datenquellen. Dahinter steht immer das Ziel, fachbereichs- und industriespezifische Probleme zu lösen und Entscheidungen zu unterstützen.
Darüber hinaus sehe ich verschiedene Entwicklungsfelder, deren Bedeutung künftig zunehmen wird: In Sachen Konnektivität ist das Verständnis der angebundenen Daten ein absoluter Schlüssel zum Erfolg, um Daten erfolgreich in Information zu verwandeln. Getrieben von heterogenen Systemlandschaften und externen Daten von Lieferanten oder Datenanbietern, stehen bei der Daten-Interaktion Themen wie Harmonisierung, Bereinigung und das regelbasierte Zusammenbringen von disparaten Daten im Mittelpunkt. Angesichts der riesigen Datenmengen ist es eine Utopie, die Daten vor der Modellierungsarbeit an einer Stelle zu zentralisieren, sodass mehr Flexibilität gefragt ist. Vor diesem Hintergrund kommt der Datenvirtualisierung eine bedeutende Rolle zu. Gleichzeitig müssen Unternehmen auch die Aspekte Antwortzeiten, Systemlast und Egress-Kosten im Blick behalten. Neben der reinen Modellierung gewinnt das Zugänglichmachen von Daten und Informationen immer stärker an Bedeutung. Die Fähigkeit, die in der Modellierung verankerte Geschäftslogik für Mensch und Maschine lesbar und verarbeitbar zu machen, bezeichne ich gerne als „Responsibility to provide“. Diese wollen wir im Konkreten durch einen Katalog erreichen, der sich über alles hinwegspannt − von Analytics über das Data Warehouse bis hin zu den Quellsystemen.
Und schließlich wird die Grenze zwischen Data Warehousing und Analytics mehr und mehr aufweichen (müssen). Daraus folgt, dass die Integration zwischen einem heutigen Data Warehouse und einem Analytics-Tool so nahtlos und reibungsfrei wie möglich funktionieren muss – und zwar nicht nur in Bezug auf die User Experience, sondern auch mit Blick auf das Zusammenspiel von Konnektivität, Modellierung und Administration.