Meine Kollegen aus dem Bereich Business Processes haben ein Reifegradmodell zur Bewertung der unternehmensweiten Datenqualität entwickelt. Dieser Modellansatz bietet anhand eines Fragebogens die Möglichkeit, den Reifegrad für die verschiedenen Dimensionen des Data Quality Management (DQM) zu ermitteln. Auf dieser Basis lassen sich dann individuelle Lösungsansätze zur Verbesserung der Datenqualität erarbeiten.
Was ist Datenqualität?
Bevor wir uns darauf stürzen, die Datenqualität anhand des von uns entwickelten Reifegradmodells einzuschätzen, gilt es zunächst, ein einheitliches Verständnis des Begriffs „Datenqualität“ zu schaffen. In Bezug auf die Datenqualität hinterfragen wir, inwieweit sich Daten bzw. Stammdaten zur Erfüllung eines bestimmten Zwecks eignen. Dazu bewerten wir sie über eindeutige Kriterien, beispielsweise ihre Genauigkeit oder ihre Aktualität. Eine ausführliche Definition findet ihr in diesem Online-Lexikon.
In der Praxis stellt sich die Situation so dar, dass nahezu alle Geschäftsprozesse Stammdaten benötigen, um zum Beispiel Transaktionen auszuführen oder betriebliche Aktivitäten zu unterstützen. Dabei gilt natürlich auch hier: Je höher die Qualität der Daten, umso bessere Ergebnisse erzielen die Prozesse und desto geringer ist die Fehlerquote. Verallgemeinernd können wir also feststellen, dass qualitativ hochwertige Daten eine grundsätzliche Voraussetzung dafür sind, dass Unternehmen ihre monetären und nicht-monetären Geschäftsziele verwirklichen oder gar übertreffen.
„Je mehr informationsverarbeitende Systeme ein Unternehmen einsetzt und je mehr Daten es sammelt, desto wichtiger wird die Qualität dieser Daten. Unternehmen schaffen sich heute Wettbewerbsvorteile, indem sie qualitativ hochwertige Informationen vorhalten bzw. diese insbesondere für Management-Entscheidungen schneller zur Verfügung zu stellen.”
Steffen Pietsch, Vice President Geschäftsprozesse bei IBsolution
Data Quality Management unterstützt Unternehmen dabei, ihre Daten aufzuwerten und konsistent vorzuhalten. Es überwacht und steuert die Qualität der Daten und ermöglicht, Unregelmäßigkeiten so früh wie möglich zu identifizieren und zu beheben.
Auswirkungen von schlechter Datenqualität
Generell unterscheiden wir vier verschiedenen Kategorien der Auswirkungen von schlechter Datenqualität:
-
Finanzielle Auswirkungen
-
Auswirkungen auf Zuversicht und Zufriedenheit
-
Auswirkungen auf die Produktivität
-
Auswirkungen auf Risiko und Zustimmung
Vor allem vor dem Hintergrund einer wachsenden Informationstechnologie und dem Thema Big Data werden sich die daraus resultierenden Begleiterscheinungen noch potenzieren. Studien aus dem Jahr 2002 zeigen, dass bereits zur Jahrtausendwende zahlreiche Top-Banken Defizite im Bereich des Datenmanagements aufwiesen. Zwar sind das Ausmaß und die Bedeutung von schlechter Datenqualität mehr oder weniger bekannt, dennoch tendieren die meisten Unternehmen dazu, die Lösung des Problems darauf zu beschränken, die Dokumentation zu hinterfragen oder an der ausgewählten Software zu zweifeln. Doch wie verhalten sich Daten in einem Unternehmen und wie kann man schlechter Datenqualität aktiv entgegenwirken?
Aus unserer Erfahrung zeigt sich, dass sich Unternehmen hier in der Regel mit einem Dilemma biblischen Ausmaßes konfrontiert sehen, da die Auswirkungen von schlechter Datenqualität meist zu umfassend sind, um sie in einem einzigen Projekt zu beseitigen. Daher empfehlen wir ein schrittweises Vorgehen, zum Beispiel anhand der folgenden Fragen:
-
Welche Daten fehlen oder sind unbrauchbar?
-
Welche Daten stehen im Konflikt?
-
Welche Aufzeichnungen sind Duplikate?
-
Welche Kopplungen fehlen?
-
In welchem Ausmaß beeinträchtigen fehlerhafte Daten meine Organisation?
Ihr solltet nicht davor zurückschrecken, die notwendigen Prozesse im Bereich Datenqualität und Enterprise Data Management einzuführen. Und natürlich müssen innerhalb dieser Prozesse die Rollen und Kompetenzen der Beteiligten sinnvoll definiert sein.
Reifegradmodell
Das von uns entwickelte Reifegradmodell bietet eine Art Ad-hoc-Standortbestimmung in Bezug auf die Qualität und die etablierten Prozesse von Stammdaten. Es liefert verlässliche Anhaltspunkte zum tatsächlichen Qualitätsniveau und trägt maßgeblich dazu bei, reaktive Problemlösungen zu vermeiden.
Auf der Basis unserer Projekterfahrung und diverser Modellansätze haben wir sogenannte Qualitätsdimensionen definiert, die der Klassifizierung der vielfältigen Aspekte in Bezug auf die Datenqualität dienen.
-
Richtlinien
-
Maßnahmen
-
Verwaltung
-
Standards
-
Technologie
-
Performance Management
Jeder dieser Dimensionen haben wir spezifische Anforderungen und individuelle Maßnahmen zugeordnet. Die individuellen Ausprägungen dieser Qualitätsdimensionen werden anhand eines Fragebogens erfasst und ausgewertet.
Hinsichtlich der Ergebnisbewertung unterscheiden wir je nach Komplexität der Dimension vier verschiedene Reifegrade:
Initial:
-
Datenqualitätsaktivitäten sind reaktiv
-
Erwartungen nicht dokumentiert
-
Fähigkeiten zur Identifikation von Erwartungen an Datenqualität vorhanden
Defined:
-
Dimensionen von Datenqualität sind identifiziert und dokumentiert
-
Erwartungswerte assoziieren mit den Dimensionen
-
Format sowie Semantik sind in Regeln für Datenqualität festgelegt
-
Methoden, um Auswirkungen auf das Unternehmen zu erkennen, sind erforscht
Managed:
- Validität von Daten wird prozessgestützt inspiziert und überwacht
- Analyse der Auswirkungen von Datenfehlern auf das Unternehmen sind üblich
- Datenassessments werden zyklisch durchgeführt
Optimized:
- Benchmarks in Bezug auf Datenqualität sind definiert
- Überwachung von Anforderungen an Datenqualität in Bezug auf individuelle Performance-Ziele
- Kontrolle der Datenvalidierung sind in Geschäftsprozesse integriert
Die einzelnen Dimensionen werden anhand der oben genannten Reifegrade bewertet und die Ergebnisse in einem Netzdiagramm dargestellt. Anhand dieser Darstellung lässt sich auf einen Blick feststellen, in welchen Bereichen der Datenqualität und der Enterprise-Data-Management-Prozesse noch nachgebessert werden muss. Da jeder Qualitätsdimension konkrete Maßnahmen zugeordnet sind, lassen sich Ad-hoc-Lösungsansätze ermitteln, die zur Verbesserung der Datenqualität beitragen und die vorhandenen Herausforderungen angehen.
Welche Maßnahmen das im Einzelnen sind, ist sowohl vom Reifegrad der jeweiligen Dimension als auch vom Unternehmen selbst individuell abhängig.
Zusammenfassung & Ausblick
Abschließend lässt sich zusammenfassen, dass die Kollegen ein wirklich umfangreiches Rahmenwerk zur Messung des Reifegrads der Stammdatenqualität erstellt haben. Viele derart umfangreiche Methoden wirken überladen und geben keine konkreten Handlungsempfehlungen. Hier haben es die Kollegen hingegen geschafft, konkrete und praxisnahe Maßnahmen zu definieren, die sich in anderen Projekten bereits bewährt haben.