Unternehmen transformieren von datengenerierenden zu datengesteuerten Organisationen. Es stehen stets mehr Daten zur Verfügung und die Technologie, die diese Daten zu brauchbaren Erkenntnissen umformt, ist weithin zugänglich. Daten werden immer wichtiger und damit auch die Qualität der Daten. Daten bieten den Unternehmen enorme Chancen, denn die Entscheidungen, die getroffen werden müssen, basieren auf zuverlässigen Informationen. Allerdings muss man etwas dafür tun!
In diesem Artikel wird beschrieben, wie die Qualität der Daten bewertet und die Datenqualität strukturell verbessert werden kann.
Brauchbare Daten
Thomas C. Redman beschreibt in seinem Buch „Data Driven”, dass das Verfügen über zuverlässige und korrekte Daten eines der wichtigsten Betriebsvermögen darstellt. Die Daten, die eine Organisation über ihre Kunden und Produkten besitzt, sind einzigartig und ermöglichen es ihr, die richtigen Strategien zu entwickeln und Entscheidungen zu treffen, die die Leistung des Unternehmens verbessern. Diese Daten müssen selbstverständlich korrekt sein und auf richtige Weise in Informationen umgewandelt werden. Nur auf Basis von korrekten Daten können weise Beschlüsse genommen und Wissen aufgebaut werden. (Sehen Sie hierzu nebenstehende DIKW-Pyramide)
DIKW pyramide
Datenqualität hängt von der Nachfrage ab
Laut Redman hängt die Qualität der Daten vollständig von der Nachfrage des Nutzers ab. Ein mit den Füßen gemessener Abstand ist für ein Spiel ausreichend. Für die Montage eines Küchenschranks, ist diese Art von Messung jedoch nicht von ausreichender Qualität.
Die Aspekte der Datenqualität
Die Brauchbarkeit von Daten wird nicht nur durch die Genauigkeit (Akkuratheit) des Wertes bestimmt, es gibt noch weitere wichtige Teilaspekte, die bei der Frage eine Rolle spielen, ob Daten dazu geeignet sind, eine Antwort auf Ihre Geschäftsfrage geben zu können.
Die Zuverlässigkeit eines Datenwertes bildet den Grad, in dem der Wert die Realität widerspiegelt. Wenn für eine Person bei Geschlecht „Mann” angegeben wird, kann das korrekt sein, der Wert „Birne“ ist allerdings zweifelhaft.
Damit kommen wir zum Teilaspekt Beständigkeit. Wenn es innerhalb einer Organisation eine Vereinbarung darüber gibt, welche die möglichen Werte des Merkmals ‚Geschlecht‘ sind (Mann/Frau/Unbekannt) und welcher Dateneigner mithilfe welches Generierungsprozesses diese Information registriert hat, dann sind wir einen Schritt weiter. Wir können diese Information überprüfen und hinterfragen.
Der Teilaspekt Verfügbarkeit schließlich bestimmt, ob eine Information für den Benutzer auffindbar ist und ob er/sie diese Information verwenden darf.
Fällt auch nur einer dieser Teilaspekte unter den nötigen Standard, leidet die Brauchbarkeit darunter. Achten Sie also auf die drei Teilaspekte.
Die Aspekte der Datenqualität
Beständigkeit
Wie kann nun die Datenqualität strukturell verbessert werden? In vielen Fällen wird mit dem Inhalt der Daten begonnen. Viel klüger ist es jedoch, wenn man mit dem Fundament beginnt. Machen Sie die Funktion der Daten innerhalb des Unternehmens dauerhaft, indem Sie auf die folgenden Komponenten achten:
- Datendefinitionen - welche Daten verwenden wir innerhalb der Organisation? Wie werden sie beschrieben und welche technischen und funktionalen Anforderungen sollten sie erfüllen? Die Datendefinitionen werden in einem Geschäftsdatenmodell festgelegt.
- Wer ist der Dateneigentümer? Wer stellt die Datendefinitionen fest? Hier wird die Funktion des Data Stewards wichtig. Der Data Steward ist verantwortlich für die Umsetzung von Data Governance in den Prozessen, die dafür sorgt, dass die Daten – sowohl ihr Inhalt als auch die Metadaten – den Anforderungen entsprechen.
- Bestimmen Sie, durch welchen Prozess die Daten aufgezeichnet, aktualisiert, überprüft und schließlich wieder entfernt
Dieses Fundament bildet die Grundlage für die Anwendung von Daten innerhalb der Organisation.
Zuverlässigkeit
Das korrekte Erfassen der Objekteigenschaften in den Systemen ist oft eine Arbeit, die durch den Menschen erfüllt werden muss. Die Vereinbarungen, die unter dem Titel Beständigkeit gemacht werden, sind bei der Validierung der aufgezeichneten Daten sehr nützlich. Auf Basis von Definitionen und Anforderungen kann der ACCU-Test durchgeführt werden. Dieser Test kontrolliert die Daten in Hinblick auf die im Folgenden beschriebenen Aspekte Actuality, Correctness, Completeness, und Unicity:
- Aktualität: sind die Daten auf dem neuesten Stand und spiegeln sie die aktuelle Situation wider?
- Korrektheit: entsprechen die Daten den Anforderungen wie Domänenwerte, Format und Geschäftsregeln?
- Vollständigkeit: wurden alle Daten ausgefüllt und es gibt einen gültigen Verweis auf Referenzwerte?
- Einzigartigkeit: Gibt es doppelt registrierte Daten (innerhalb von Applikationen und anwendungsübergreifend)?
Es gibt eine Vielzahl von Modellen, die die Merkmale der Datenqualität beschreiben, wobei sie sich stark in ihrer Detailliertheit unterscheiden. Die Norm ISO/IEC 25012 erfasst beispielsweise 15 verschiedene Merkmale (siehe unten).
Die 15 Merkmale der ISO/IEC 25012
Verfügbarkeit
Sie können Ihre Daten noch so gut in Ordnung haben, wenn diese aber nicht zugänglich sind oder für einen gewissen Zeitraum nicht verwendet werden können, dann wird das letztendliche Ziel - eine bessere Unternehmensleistung - nicht erreicht. Die IT-Abteilung erleichtert es den Anwendern, indem sie Daten zur Verfügung stellt und den Benutzern die richtigen Tools anbietet, um Daten in Information umzusetzen.
Im Normalfall stellt der Benutzer die Frage: „Haben wir diese Daten im Haus und wenn ja, wo finde ich sie?“ Eine Antwort dazu bietet ein Geschäftsdatenmodell und ein Data Steward. Die Daten erhält der Benutzer dann bei einem Datawarehouse oder einem Data Lake, und kann sich dann mit den Daten an die Arbeit begeben.
Datenmigration - Impuls für die Datenqualität
Die Datenqualität spielt bei den von Data eXcellence durchgeführten Datenmigrationen eine wichtige Rolle. Die Implementation eines neuen Systems mit der zugehörigen Datenmigration ist der perfekte Moment, um die Datenrichtlinien festzulegen – ein weiterer wichtiger Aspekt - und zusätzlich auf Datenqualität zu achten. Data eXcellence berät und unterstützt bei der strukturellen Verbesserung der Datenqualität, denn mit einer höheren Datenqualität haben Ihre Daten mehr Wert!