Direkt zum Inhalt wechseln
SIRIUS Consulting & Training GmbH
Suche
Leider wurden zu dem Suchbegriff keine Beiträge gefunden.
Datenqualität ist mehr als Fehlerfreiheit

Datenqualität ist mehr als Fehlerfreiheit

Wie gut es mit der Datenqualität in einer Organisation bestellt ist, dafür gibt es nach gängiger betriebswirtschaftlicher Darstellung 15 Dimensionen. Sie werden aufgeteilt auf vier Kategorien: Systemunterstützung, Inhärenz, Darstellungsbezug und Zweckabhängigkeit.

Verfügbarkeit (oder auch Zugänglichkeit) ist neben der Bearbeitbarkeit eine der beiden Dimensionen der Systemunterstützung. Damit Daten schnell bearbeitet und zugänglich gemacht werden können, muss man zunächst für einen performanten Datenaustausch zwischen den Systemen sorgen. Ein Beispielszenario: Nach telefonischem Geschäftsabschluss eines Wertpapierhandelsgeschäfts bearbeitet das Back Office das Geschäft anhand der handgeschriebenen Angaben auf dem Händlerticket. Leider ist der Name des Kunden nicht lesbar, nur die Kundennummer steht zur Verfügung. Wenn dann das Kundenstammdatensystem zur Verfügung steht und der Name darin sofort ermittelbar ist, können wir von Zugänglichkeit sprechen – einer der Bausteine für Datenqualität ist erfüllt.

Statistisches Bundesamt oder Wetterfee? Inhärent ist, was glaubwürdig ist

Zur Inhärenz zählen neben der vielzitierten Fehlerfreiheit außerdem Objektivität, Glaubwürdigkeit und hohes Ansehen. Informationen sind objektiv, wenn sie streng sachlich und wertfrei sind. Glaubwürdigkeit trägt ebenfalls zur Datenqualität bei. Sind die aktuell vorliegenden Informationen vertrauenswürdig und als zuverlässig angesehen? So wird eine vom Statistischen Bundesamt herausgegebene Informationsbroschüre zur Bevölkerungsentwicklung eine hohe Glaubwürdigkeit besitzen. Ganz unbenommen davon, ob die Daten nun auch zugleich vollständig, fehlerfrei, eindeutig auslegbar, aktuell oder verständlich sind. Aufzeichnungen von Wetterdaten aus unbekannter Quelle dürften im Gegenzug weniger glaubwürdig sein.

Benjamin Schnepper, Business Unit Manager MDM

„Wie schnell werden meine Daten angezeigt? Sind sie auch für alle verständlich? Und überhaupt: Bringt ihr Vorhandensein irgendeinen nennenswerten Wert? All dies sind Aspekte der Datenqualität, die über die reine Frage nach Fehlerfreiheit weit hinausreichen.“

– Benjamin Schnepper, Business Unit Manager Master Data Management

Auf den Darstellungsbezug kommt es an

Wenn im Kultfilm „Matrix“ der Operator auf seinem Bildschirm sofort versteht, welches Bild sich hinter den grünen Schriftzeichen verbirgt, alle anderen aber nur kryptische Zahlenkolonnen sehen, sind wir bei einer weiteren Dimension der Datenqualität, nämlich der Verständlichkeit. Daten können noch so korrekt sein, die Anwender:innen müssen sie auch verstehen, sonst gibt es ein Problem mit der Datenqualität. Verständlichkeit gehört deshalb zur Kategorie des Darstellungsbezugs, neben Übersichtlichkeit, einheitlicher Darstellung und eindeutiger Auswertbarkeit als weiteren Dimensionen.

Übersichtlichkeit bedeutet: Die wichtigsten Informationen zu einem Kunden sollten sofort erkennbar sein. Telefonnummer und E-Mail gehören daher auf die erste Seite des Kundendatensatzes. Informationen, die man nicht ständig benötigt (z.B. die Branche), können nachgelagert folgen.

Eindeutige Auslegbarkeit besagt, dass ein Wert immer dasselbe aussagen muss. Jeder Kunde, jedes Material besteht aus Attributen. Werte, die einem Attribut zugeordnet sind, müssen für das ganze Unternehmen die gleiche Aussage haben. Eng verwandt damit ist die einheitliche Darstellung: Für die Geschlechterunterteilung ist „m/w/d“ ebenso gängig und korrekt wie „m/f/x“. Die Kategorie der Inhärenz ist damit erfüllt. Damit nun  auch der Darstellungsbezug stimmt, muss man sich darauf einigen, welche der beiden Unterteilungen man verwendet –und dies dann auch einheitlich im gesamten Unternehmen anwenden.

Die Darstellung verbessern, dazu gehört auch, – gerade in internationalen Unternehmen – Daten in verschiedenen Sprachen zur Verfügung zu stellen. Der Aufwand dazu mag nicht unerheblich sein. Jedoch lohnt er, denn dies trägt erheblich zur Verbesserung der Datenqualität bei.

Wann sind Daten überhaupt zweckmäßig?

Sobald man an einem Datensatz arbeitet, sollten in diesem Moment nur die Daten angezeigt werden, die man benötigt und auf die man auch Zugriff haben darf. Angemessener Umfang, Vollständigkeit, Aktualität, Relevanz und Wertschöpfung sind die Dimensionen, die damit zur Kategorie der Zweckabhängigkeit gehören. Beispiel Personalstammdaten: Die HR-Software muss Gehaltsinformationen enthalten, damit die HR-Abteilung weiß, was auszuzahlen ist. Stellt man Beschäftigtendaten jedoch in einer Teilmenge im ERP-System dar, müssen Angaben zum Gehalt dort selbstverständlich ausgeblendet werden.

Die einzelnen Dimensionen der Kategorien sind eng verwandt, die Unterschiede nur graduell. So auch bei der Zweckmäßigkeit: Was unterscheidet etwa angemessenen Umfang von Vollständigkeit, was die Relevanz von der Wertschöpfung? Der Umfang ist angemessen, wenn die Menge der verfügbaren Information den gestellten Anforderungen genügt. Vollständig sind Informationen dann, wenn sie nicht fehlen und zu den festgelegten Zeitpunkten in den jeweiligen Prozessschritten zur Verfügung stehen. Relevant ist eine Information, sofern sie den Anwender:innen notwendige Informationen liefert. Wertschöpfung geht einen Schritt weiter. Sie sagt etwas darüber aus, ob die Datennutzung zur quantifizierbaren Steigerung einer monetären Zielfunktion führen kann.

Relevant, wertschöpfend oder beides?

Wertschöpfung heißt konkret: Gibt es überhaupt einen Grund, weshalb Daten zu einem Kunden oder Material erfasst werden? Braucht man die postalische Adresse eines Kunden, dem man nie etwas per Post schicken wird? Im Sinne der Übersichtlichkeit wäre die Adresse zumindest nur unter „ferner liefen“ aufzuführen. Bei der Zweckabhängigkeit kommen dann schon Fragen auf. Sinnlose Informationen zu sammeln, bringt dem Unternehmen nichts, kostet nur Zeit und resultiert in Datenwust. Informationen sollten deshalb immer dahingehend geprüft werden, ob sie zur Prozesssteuerung verwendet werden können. Oder ob sie am Ende, bei Auswertungen, dazu beitragen, Umsätze des Kunden einer Branche zuzuordnen. Ist dies der Fall, ist Zweckmäßigkeit gegeben.

Fazit: den Fokus weiten!

In unseren Datenmanagementprojekten stellen wir immer wieder fest: Unternehmen denken zumeist vorrangig an Inhärenz von Daten. Systemunterstützung hingegen und auch andere Dimensionen werden gerne vernachlässigt, dabei sind sie ebenso wichtige Faktoren für hohe Datenqualität. Wenn es zu lange dauert, Daten anzulegen, sie zu verändern oder anzuzeigen, weil es beim Austausch zwischen den Systemen klemmt, leidet die Datenqualität nicht minder, als wenn sie voller Fehler wären, siehe Helpdesk-Szenario oben. Den Fokus weiten heißt es also. Je größer er ist, desto besser werden automatisch die Daten.

Titelbild: © Sinenkiy/Getty Images

Benjamin Schnepper

Benjamin Schnepper Director Engineerung & Operations @ German Edge Cloud