DATENQUALITÄT
Was bedeutet Datenqualität?

Dieses Thema haben wir in unserem letzten Blog schon kurz gestreift, hier möchten wir ein wenig genauer darauf eingehen. Wenn man unsere IT Erfahrung so zusammenrechnet, wird man wohl auf mehrere hundert Jahre kommen, vielleicht sogar auf ein ganzes Millennium. Was auch immer in dieser Zeit diskutiert wurde, ein Thema war immer dabei, aber gewiss nicht deshalb, weil es zeitlos ist: die Daten.

Egal, wo man hinkommt, egal, mit wem man spricht, immer heißt es, die Daten seien schlecht. Dabei spielt es keine Rolle, ob es um eine Datenübernahme geht/ging oder um eine Datenquelle für Analysen oder Marketingaktivitäten. Wenn man das über so viele Jahre hört, dann sind zwei Fragen ziemlich offensichtlich:

– was sind denn überhaupt gute Daten?
– wie kann man sicherstellen, dass sie nicht „schlecht“ werden?

Was sind gute Daten?

Man könnte lange darüber philosophieren, was gut oder schlecht per se überhaupt bedeutet. Auf der anderen Seite sind Daten ja kein Menü, das schmecken soll, und kein hergestellter Gegenstand, an dem man anhand von ISO festgelegten Parametern die Qualität der Produktion messen kann. Es sind einfach nur Daten. Daher kann es meines Erachtens weder gut noch schlecht geben.

Bei Daten geht es immer um den Zusammenhang oder das Ökosystem, in dem sie sich befinden. Beides ist sehr entscheidend für eines der beiden Kriterien. Daten sind Informationen, und Informationen leben davon, interpretiert zu werden. Ist die Interpretation schlüssig und hat man das Gefühl, die Information ist für den angedachten Zweck nützlich, dann sind die Daten offensichtlich gut, andersherum sind sie schlecht. Und da es eine „UND“-Verbindung zwischen zwei Bedingungen ist, und eine solche Verbindung nur dann logisch wahr ist, wenn beide wahr sind, ist es seltener gegeben, dass Daten gut sind, als schlecht.

Doch schauen wir uns mal die Punkte kurz im Einzelnen an.

Schlüssigkeit

Ein einzelner Datensatz sagt nichts aus, er macht erst Sinn in einer Kette weiterer Informationen. Z.B. ein Name und eine Adresse sind interessant, aber doch nur ein Name und ein Adresse. Beides bekommt erst dann eine Bedeutung, wenn sie innerhalb eines Angebots, eines Auftrags oder einer Bestellung verwendet werden. Und viel mehr noch, wenn Zahlungen zu den Vorgängen verbucht wurden. Dies ist natürlich nur ein sehr einfaches Beispiel. Erst, wenn diese Form der Zusammenhänge nachvollzogen werden kann, dann erscheinen die Daten als schlüssig.

Dabei gibt es immer wieder einen Status, d.h. ein zusammenfassendes Signal, wie wir einen aktuellen Status bewerten sollen. Dieser muss ebenfalls schnell ersichtlich sein und nachvollzogen werden können, nur dann erscheint das Ganze schlüssig und somit richtig. Dies ist dann allerdings schon die Vorstufe zum nächsten Punkt.

Interpretation

Die Schlüssigkeit bezieht sich auf die Verarbeitung einzelner Vorgänge. Natürlich geschieht hier auch eine Form der Analyse, indem Informationen zusammengefasst und weitergereicht werden. Man denke z.B. nur an den saldierten OPOS pro Kunde, an den Gesamtumsatz eines Jahres, etc. die direkt in einer Kundenmaske angezeigt werden.

Doch die eigentliche Interpretation geschieht in den Statistiken und Berichten. Hier werden sinnabhängig große Datenmengen konsolidiert, gruppiert und angezeigt. Erst wenn das Ergebnis verständlich und ausreichend ist, sind die Daten entsprechend gut.

Nutzen

Die Abgrenzung der einzelnen Punkte ist natürlich schwierig, da alles sehr nahe beieinander liegt. Analysen allein sind natürlich auch hilfreich und notwendig. Doch in diesem Punkt ist ein wesentlicher Teil der Weiterverarbeitung gemeint.

Per se ist ein System wie Odoo eine recht umfangreiche Datenkrake, die nicht nur hilft, Daten innerhalb von Abteilungen zu übergeben, die nächsten notwendigen Schritte zu steuern und am Ende transparent zu machen, sondern auch für den Vertrieb und für das Marketing aufzubereiten.

Die Kenntnis der Kundenbasis ist in beiden Fällen ein sehr essentieller Teil. Schauen wir uns an warum.

Vertrieb

Guter Kunde, schlechter Kunde. Wieviel Aufmerksamkeit schenke ich wem? Wer hat Priorität? Wieviel schuldet mir der Kunde? Das sind wichtige Fragen im Vertrieb. Wenn ein Kunde anruft und ich verfüge schon über die entsprechenden Daten, dann spare ich mir sozusagen Porto und muss nicht telefonisch hinterherlaufen.

Marketing

Hier steigert sich meist schon die Komplexität, denn das Marketing benötigt für Newsletter, Kampagnen oder Messen entsprechend größere Datenmengen, die einem sehr dedizierten Zweck zugeführt werden sollen. Das wiederum bedeutet, dass Kundenprofile und Transaktionen gleichermaßen nach unterschiedlichen Kriterien abgefragt werden, was a) eine komplexe Abfrage erforderlich macht und b) zusätzlich an unterschiedlichsten Stellen gezielt gefiltert werden muss.

Erst dann, wenn eine große Datenmenge ermittelt und nach der Maßnahme Erfolg erzielt werden kann, waren wiederum die Daten gut.

Qualitätsprozesse

Nun stellt sich natürlich die Frage, wie hält man die Daten „sauber“?

Die Frage ist, was kann alles schief laufen? Fasst man die Möglichkeiten zusammen, kommt man gewiss auf folgende Optionen:

– zu wenige oder unvollständige Informationen
– falsche Informationen
– falsch bearbeitete Vorgänge

Gehen wir auf diese Punkte ein und überlegen, welche Mittel zu ihrer Vermeidung in Frage kommen.

Zu wenige oder unvollständige Informationen

Dies geschieht oft innerhalb der Adresse, aber auch an vielen anderen Stellen. Das erste Mittel, das jedem hier in den Kopf kommt, ist die Einführung von Pflichtfeldern. Dies ist sicherlich ein gutes Mittel in einer Fachanwendung, denn hier befindet man sich einem kleinen abgegrenzten Raum, in dem vielleicht das Pflichtfeld durchaus Sinn macht. Doch in einem integrierten System ist es sehr schwer zu unterscheiden, ob eine Information fehlt, weil jemand vergessen hat, sie anzugeben, oder ob die Information fehlt, weil sie zum Zeitpunkt der Anlage noch nicht bekannt war.

Bleiben wir in dem Fallbeispiel „Adresse“. Hier ist es natürlich auch durchaus möglich, dass es sich um eine Anfrage per Email handelt, in der eine Signatur fehlt. Daher konnte die Adresse nicht vollständig angelegt werden. Gäbe es hier Pflichtfelder, wie wäre der Fall zu lösen? Natürlich könnte man irgendetwas eintragen, doch damit wäre der Sinn der Pflichtfelder auch nicht erfüllt.

Aus technischer Sicht ist es einfacher zu prüfen, ob etwas leer ist und womöglich befüllt sein muss, als zu prüfen, ob es befüllt UND richtig befüllt wurde. Daher ist es besser, keine Angabe zu erzwingen.

Eine Alternative könnte sein, dass man an der Statusänderung eines Vorganges eine Prüfung integriert und den Benutzer auf einen Sachverhalt hinweist. Bleiben wir im vorherigen Fall, sollte spätestens bei einer Auftragsbestätigung eine Adresse bekannt sein. Danach kann man prüfen, ob Felder befüllt wurden, und einen entsprechenden Hinweis geben.

Wie schaut also der Lösungsvorschlag aus (zumindest in Odoo):
Es werden keine Pflichtfelder erzwungen, sondern

  1. man setzt für jede Plausibilitäts-Prüfung einen Filter, der die gewünschten Kriterien umfasst, und eine Benutzergruppe prüft regelmäßig, ob sich Datensätze darin verfangen, und bearbeitet diese.
  2. ein weiteres Mittel wäre, an wesentlichen Eckpunkten innerhalb des Prozesses gezielt die Maschine prüfen zu lassen und Meldungen auszuwerfen.
  3. nichts ersetzt den Menschen besser als der Mensch. D.h. das Mittel, das Odoo hier selbst beschreitet, ist, dass in solchen Fällen alle wesentlichen Informationen direkt in einer Maske weitestgehend zentral angezeigt werden, so dass der Benutzer diese schnell selbst auf Vollständigkeit prüfen kann. Nehmen wir das Beispiel der Steuer-ID, die einmal pro Jahr geprüft werden sollte. Odoo löst diesen Fall so, dass die Steuernummer unterhalb der Rechnungsadresse direkt angezeigt wird. D.h. die Arbeitsanweisung ist, die Steuernummer vor Bestätigung der Rechnung manuell zu prüfen.

WICHTIG:

An dieser Stelle muss man natürlich auch zusätzlich vermerken, dass jedes zusätzliche, neue Feld genau überlegt werden sollte. Denn je mehr Felder, desto größer ist schlichtweg die Wahrscheinlichkeit einer unvollständigen Erfassung.

Falsche Informationen

Wie schon im vorigen Absatz angemerkt, ist es technisch deutlich schwieriger, eine Information als „falsch“ zu identifizieren. Technik kann nur eine Abstraktion der Realität abbilden, demnach ist es schwierig zu bewerten, ob diese falsch oder kurios – aber natürlich erklärbar – ist.

Hier kann man eigentlich nur mit Plausibilitäts-Prüfungen arbeiten. Wie oben beschrieben, ist das wohl beste Mittel, dies in Odoo zu realisieren, indem auch hier pro Prüfungstyp ein vorgefertigter Filter angelegt wird, der nach vorgegebenen Kriterien selektiert und die Daten zur manuellen Prüfung anzeigt. Auch sollte regelmäßig überprüft werden, ob nicht in der Zwischenzeit weitere Prüfungstypen hinzugekommen sind.

Das beste Tool ist hier die Gruppierung in Odoo. D.h. wer nach Land oder Stadt gruppiert, merkt schnell, ob „weitere Länder“ hinzugekommen sind.

Falsch bearbeitete Vorgänge

Gerade wenn der Vorgang komplexer wird, vielleicht sogar irgendwo etwas schief gelaufen ist, man bereits versucht hat, das Problem zu korrigieren, und auch das keine Lösung gebracht hat, ist die Wahrscheinlichkeit groß, dass jeder folgende Schritt weiter ins Unglück führt.

Wie kann man dieses Problem identifizieren? Dies ist meist am allerschwierigsten, denn meist sind die Vorgänge abgeschlossen und tauchen nur durch Zufall auf. Kommt es häufig vor, dann gibt es natürlich ein Schulungsthema. Oder man muss die Frage stellen, ob die Prozess- bzw. Bearbeitungskette nicht schlichtweg fragwürdig ist. Sonst sind diese Fälle jedoch eher die Ausnahme, was sie allerdings schwieriger in der Auffindung macht.

Natürlich kann man sagen, das kommt vor und so ist es. Doch es empfiehlt sich schon ein solches Problem nicht ganz abzuwinken. Die Zeit verändert Prozesse und Betrachtungen, d.h. eine regelmäßige Prüfung sollte schon stattfinden, wenn auch nur, um zu gewährleisten, dass Systeme kontinuierlich richtig genutzt werden.

Die Lösung hier ist, über Berichte und Statistiken Daten unterschiedlich zu konsolidieren. Am Ende sollten keine Abweichungen auftreten oder die Abweichungen sollten zumindest erklärbar sein bzw. erwartet werden. Ist das nicht der Fall, lohnt sich eine Fehlersuche, in den meisten Fällen stößt man dann am Ende auf fehlerhafte Vorgänge.

Fazit

Die Aufgabe der IT ist es zu unterstützen. Betrachtet man die Entwicklung der Automobilbranche, fährt das Auto noch nicht wirklich selbständig, auch wenn uns das immer suggeriert wird, oder in nur sehr abgrenz-, kontrollier- und vorhersehbaren Szenarien. In den meisten Fällen gibt es auch hier nach so vielen Jahren der gezielten Entwicklung nur Instrumente, die dem Menschen zusätzliche Informationen geben oder ihn unterstützen.

D.h. wer die Datenqualität erhöhen möchte, findet die Lösung nicht in der Programmierung, sondern in der Organisation der Prozesse. Leider kann Odoo daran auch wenig ändern.

15 September, 2020
artikel teilen
kategorien
Bearbeiten
Archiv
Anmelden to leave a comment
EINGEMAUERT
Risiken klassischer Systeme
Top