Data kwaliteit in een bedrijfscontext kan gedefinieerd wordt als de data die goed genoeg is om voor een bepaald doel te dienen. De juiste kwaliteit van data kan je klanten helpen overtuigen om net jouw producten via één van jouw kanalen te kopen. Het streven naar kwalitatieve data heeft als doel om data-driven beslissingen te stimuleren omdat slechte data kwaliteit of foutieve data jouw informatie praktisch onbruikbaar maakt. In dit artikel leer je meer over de verschillende aspecten wanneer we spreken over data kwaliteit.
De verschillende aspecten van data kwaliteit
Ondanks de verhoogde belangrijkheid van data en data kwaliteit zien we dat zowel het onderhoud van data als de kwaliteit van data beneden alle peil is. Het is een probleem dat verschillende grote en kleine bedrijven ondervinden en dat rechtstreeks of onrechtstreeks hun business en/of processen (negatief) beïnvloeden. Het laatste decennium hebben bedrijven de uitdagingen verstaan van het hebben en onderhouden van data kwaliteit en zijn hier vervolgens ook gestart met de integratie van hun master data strategie in hun algemene bedrijfsstrategie.
In feite is het onderhouden van data kwaliteit vaak een complexe job omdat je vaak de context moet kennen waarin de data gebruikt wordt. Er zijn wel een verschillende aspecten dat een bedrijf in acht kan nemen om verschillende data kwaliteitsuitdagingen het hoofd te bieden.
De verschillende aspecten van data kwaliteit
De volledigheid van data verwijst naar het feit dat alle informatie ingevuld is. Dit betekent niet dat de data gevalideerd is op zijn juistheid of nauwkeurigheid. Het geeft de eindgebruiker een overzicht welke data er nog ontbreekt. Vaak kunnen er regels gedefinieerd worden voor specifieke data velden. Het is zelfs mogelijk om bepaalde data velden als belangrijker te beschouwen door een gewicht aan het overeenkomstig data veld te hangen. Zo kunnen bijvoorbeeld product beschrijvingen voor de website zwaarder doorwegen dan de kleur van het product. In dat voorbeeld kunnen we een gewicht van 50% aan het veld voor website beschrijvingen hangen en minder gewicht bv. 25% aan dat van de kleur informatie.
De meeste PIM of MDM oplossingen laten de eindgebruikers toe om een set van validatie types te definiëren voor een specifiek type data. Zo is het mogelijk om het data type van een bepaald data veld te beperken tot bv. een lijst van waardes. Hiermee kan de eindgebruiker enkel en alleen een waarde uit de lijst kiezen. De eindgebruiker heeft dus niet de mogelijkheid om andere waardes te kiezen of in te vullen waardoor de kans op menselijke fouten gereduceerd wordt. Verder is het mogelijk om er voor te zorgen at bepaalde acties in de PIM of MDM oplossing niet uitgevoerd kunnen worden tenzij de data voldoet aan de standaarden bepaald door jouw organisatie. Hiermee kan bv. vermeden worden dat data geïmporteerd wordt die niet conform de geldende regels zijn.
Je wilt natuurlijk unieke data in je systeem hebben een geen duplicaten. Ook hiervoor kunnen er bepaalde validatie regels opgezet worden die naar bepaalde data types kijken om het unieke karakter van een product te bepalen. GTINs zijn hiervan een voorbeeld. Dit type van code wordt bepaald door bv. GS1 en zorgt voor een globale unieke definitie van jouw product. Voor het merk, leverancier en klant informatie kunnen namen en extra velden gebruikt worden. De gebruiker zal op basis van de uniekheidsregels geïnformeerd worden dat zijn data niet uniek is en bijgevolg niet kan opgeslagen worden in je PIM of MDM systeem. Deduplicatie van data kan in verschillende stappen tijdens de data setup plaatsvinden bijvoorbeeld tijdens de import van data of in het systeem zelf.
Daar de eindgebruiker binnen jouw bedrijf de data informatie voor verschillende systemen in één centraal systeem, namelijk PIM of MDM, beheert ontstaat er als direct gevolg dat je data over deze verschillende kanalen consistent gebruikt wordt. Zowel interne als externe gebruikers kunnen toegang krijgen tot deze centraal beheerde data zodat ze dezelfde data informatie gebruiken over de verschillende kanalen. Daarnaast is de eindklant van jouw organisatie misschien nog het meest gebaat met deze consistentie tijdens zijn customer journey op zoek naar de meest accurate data om zijn product keuze te bepalen.