Falsche Daten haben für die Unternehmen oftmals rechtliche Konsequenzen. Daher müssen sie für jede Kontrolle, egal ob sie auf Basel-II-Kriterien, den Sarbanes-Oxley-Regeln oder anderen Regularien basiert, gerüstet sein. Diese gesetzlichen Anforderungen sind oftmals eine große Belastung für Mittelständler. Doch wenn Unternehmen die Einhaltung dieser Regularien sicherstellen wollen, müssen sie entsprechende Data-Governance-Initiativen in die Wege leiten.
Ein sich oft wiederholendes Problem aus der Praxis bei Mittelständlern besteht darin, dass unterschiedliche Bereiche eines Unternehmens für die Qualität der eigenen Daten verantwortlich sind und jede Einheit dann mit der zentralen IT-Abteilung des Unternehmens kooperiert. Gemeinsam definierte Datenqualitätsregeln wurden dann oftmals von der IT für jede Anwendung oder Datenquelle umgesetzt. Doch im Rahmen dieses Prozesses nehmen Änderungen im Implementierungsprozess oftmals Wochen oder gar Monate in Anspruch, wobei die Finanzabteilung dann in vielen Fällen keinen Einfluss auf diesen Prozess hat. Gefragt ist also eine Lösung, die nach einer kurzen Implementierungszeit zuverlässige Daten liefert und gleichzeitig alle bei der Kontrolle der Datenqualität relevanten Mitarbeiter und Abteilungen von vornherein beteiligt. Doch am wichtigsten für diesen Prozess ist die zugrundeliegende Methodik.
Grundlage für Datenqualität ist die richtige Methodik
Aus der unternehmerischen Erfahrung heraus entwickelte das Softwarehaus Data Flux eine Methodik für Datenqualität und Data Governance, die gerade mittelständischen Unternehmen von rechtlich kritischen Fahrwassern fernzuhalten. Die Methodik besteht aus fünf Komponenten: das Datenprofiling, die Datenqualität, die Datenintegration, die Datenanreicherung und zuletzt die Datenkontrolle.
Ziel des Datenprofiling ist es, ein genaues Bild vom aktuellen Zustand der Daten zu ermitteln. Es wird geprüft, ob die Strukturierung der Daten den vorgesehenen Strukturen im Unternehmen entspricht und ob die vorhandenen Daten zu den korrespondierenden Metadaten passen. Dann wird geprüft, ob die Datenwerte vollständig, genau und eindeutig sind und ob sie entsprechend der geltenden Regeln standardisiert sind. Und auch die Datenbeziehungen werden unter die Lupe genommen. Dabei wird untersucht, ob die Daten in allen Datensätzen die erforderliche Zuordnung der spezifizierten Schlüsselbeziehungen aufweisen. Bestehen abgeleitete Relationen über Tabellen und Datenbanken hinweg? Gibt es redundante Daten?
Mittels Datenprofiling erhalten die Anwender analytische Informationen über die Stärken und Schwächen ihrer Unternehmensdaten. Daraus lassen sich die weiteren Maßnahmen für eine Verbesserung der Datenqualität ableiten. Die gewonnenen Informationen bilden dann den Ausgangspunkt für den zweiten Teil der Methodik, die Verbesserung der Datenqualität. In diesem Schritt beginnt schon der Aufbau der Qualitätsdaten. Es werden hauptsächlich Fehler korrigiert, Informationen standardisiert und Daten unternehmensweit validiert.
Ein gültiges Datenmuster
Dabei empfehlen sich insbesondere die folgenden häufig angewandten Vorgehensweisen: Zunächst werden bei der Datenstandardisierung vielfältige Permutationen von Daten herausgefiltert und korrigiert. Zum Beispiel kann „Charlton Corporation“ in derselben Datenquelle als „Charlton GmbH“ und „Charlton“ auftauchen. Im nächsten Schritt geht es um die Musterstandardisierung. Dabei wird ein für alle Tabellen gültiges Datenmuster erstellt.