Voor organisaties zijn de negatieve gevolgen van slechte datakwaliteit groot, maar gelukkig ook goed te bestrijden. Er wordt al lang en veel over het onderwerp gesproken, maar in de praktijk wordt er te weinig aandacht besteed aan het in-shape houden van een belangrijke productiefactor: data.
Verstoringen van productieprocessen, onbetrouwbare informatie op overzichten, ontevreden klanten en retourzendingen zijn voor ondernemers herkenbare problemen die veel geld kosten. Vaak is dit te relateren aan het gebruik van onjuiste data (data-ROT). Door een organisatie meer data-minded te maken en aandacht te besteden aan datakwaliteitbeleid, kan een organisatie deze problemen voorkomen, kosten besparen en nieuwe mogelijkheden ontdekken.
Dit artikel beschrijft het belang van datakwaliteit en geeft u tips die kunnen worden toegepast om te gaan bouwen en vertrouwen op uw data.
Verborgen kosten versus nieuwe kansen
Redundante, Onbetrouwbaar en Triviale (ROT) data verstoort uw bedrijfsvoering en levert veel praktische problemen met bijbehorende kosten. Specialisten (DAMA, Gartner en Thomas Redman) geven aan dat organisaties hoge, soms moeilijk te kwantificeren, kosten maken om problemen met datakwaliteit te herstellen. IBM heeft geschat dat de jaarlijkse kosten als gevolg van datakwaliteit in de VS ruim 3 triljoen dollar bedragen.
Naast materiële gevolgen zoals compliance-boetes, kosten van retourzendingen, niet correct verzonden factureren en de uren die medewerkers besteden om fouten te herstellen, zijn er ook verborgen kosten. Denk aan reputatieschade, verloren inkomsten door gemiste kansen en het niet goed functioneren van samenwerking in een keten. Deze verborgen kosten zijn door organisaties vaak moeilijk te kwantificeren. Thomas Redman past de ‘regel van 10’ toe, die stelt dat het voltooien van een taak tien keer zo veel arbeid kost wanneer die taak start met slechte data.
Betrouwbare en beschikbare data bieden ook nieuwe kansen. Op basis van correcte, gecontroleerde informatie, kunt u moeiteloos voldoen aan compliance-verplichtingen, de productiviteit van processen optimaliseren en sales gerichter aansturen. Het positieve effect van een betere klantbediening, het verhogen van het werkplezier en een betere samenwerking van de medewerkers, moet zeker niet alleen als bijvangst worden bestempeld.
Een complicerende factor is, dat de ‘veroorzaker’ van slechte data (dataproducent) doorgaans niet de ‘lasthebber’ (datagebruiker) is. Er is sprake van een uitgesteld effect. Dit maakt het belangrijk om aan te geven wat het gemeenschappelijk belang van datakwaliteit is en dat databeleid gericht moet zijn op een intensieve samenwerking.
Datakwaliteitmanagement
Datakwaliteitmanagement is een proces dat data op orde houdt - dus niet slechts een project om data eenmalig op orde te brengen. Datakwaliteitmanagement heeft 4 aspecten:
Persoon en Organisatie. Heldere visie van het management op data. Goed getrainde en databewuste medewerkers die hun rol volwassen kunnen uitvoeren.
Proces. Procesbeschrijvingen voor invoeren, controleren, verbeteren en verwerken van data, als basis van het gegevensbeheer.
Techniek. De inzet van tools & technieken om processen en medewerkers optimaal te ondersteunen en de datakwaliteit permanent te monitoren.
Data governance. De afspraken omtrent data-architectuur, datadefinities en verantwoordelijkheden binnen de data-lifecycle.
Mensen in data-driven organisaties weten dat het delen van data essentieel is voor het bedrijfsresultaat en dat samenwerking de basis is om dat te realiseren. Het verzamelen en onderhouden van data is en blijft mensenwerk en vraagt gemotiveerde medewerkers.
Data governance maakt deze samenwerking mogelijk en ondersteunt het optimale (her)gebruik van data. Data governance is een verzameling principes, werkwijzen en afspraken die een hoge kwaliteit data moeten garanderen gedurende de levenscyclus van uw gegevens.
Afbeelding: De DAMA-DMBOK2 Guide Knowledge Area Wheel
Think big, act small
Datakwaliteitmanagement is een breed werkveld, dat zich langzaam maar zeker moet ontwikkelen en niet als big-bang geïntroduceerd kan worden. ‘Think big, act small’ is het devies. Start met het oplossen van concrete problemen, die aantoonbaar veroorzaakt worden door incorrecte of incomplete data, goed oplosbaar zijn en zichtbaar resultaat opleveren.
Doorloop vervolgens de volgende 5 stappen:
Data-intake en strategie. Breng de eigenschappen van het proces en bijbehorende (meta)data in beeld en stel vast welke doelen u wilt bereiken. Bepaal de stakeholders, benoem hun rollen en verantwoordelijkheden en betrek de organisatie bij de besluitvorming.
Bepaal de datakwaliteitsregels en de drempelwaarde. Stel vast aan welke normen de gegevens moeten voldoen en wat de drempelwaarde voor ‘goed’ is. Bijvoorbeeld: voor een bezorgproces is het noodzakelijk om het afleveradres te kennen. De norm is dat de postcode en het huisnummer in 99,9 procent van de gevallen correct zijn.
Bepaal de kwaliteit van het gegeven. Toets de data aan gestelde normen en bepaal of de drempelwaarde wordt behaald. Bijvoorbeeld: bepaal van adressen of het postcodeformaat (9999XX) correct is en het huisnummer een bruikbaar getal bevat. Controleer vervolgens of het adres bestaat op basis van de postcodetabel.
Verbeter geconstateerde afwijkingen. Zoek op basis van de bevindingen van 3) uit wat de correcte waarden moeten zijn en pas de bron van de gegevens aan. Minstens zo belangrijk is het vaststellen van de oorzaak van de vervuiling. Zijn de instructies van het inwinproces niet afdoende? Zijn er wellicht mogelijkheden om controle op de invoer beter te faciliteren op basis van referentiedata?
Monitoren en controleren. Herhaal bovengenoemde stappen en meet permanent of:
- geconstateerde afwijking correct worden opgelost
- nieuwe afwijkingen optreden (de kraan staat nog niet goed dicht)
- de drempelwaarden zijn behaald en eventueel moeten worden bijgesteld
Bij de uitvoering is het belangrijk om behaalde successen te communiceren. Dit verbetert het draagvlak bij de medewerkers en stimuleert ze om nieuwe issues onder de aandacht te brengen en samen op te lossen.
Specialist in datakwaliteit
Data eXcellence is ervaren in het analyseren en het verbeteren van data. Met onze kennis en producten kunnen we u niet alleen adviseren maar ook praktisch ondersteunen bij de uitvoering van een datakwaliteitproject.