De term gouden record is een kernbegrip binnen Master Data Management (MDM). Maar wat is het juist? En waarom is het zo belangrijk voor de volledigheid en compleetheid van de gegevens? Ontdek het in de blog.
PIM en de foodsector: het belang van een golden record!
Wat is een golden record binnen Master Data Management?
Golden Record is een fundamenteel concept binnen Master Data Management (MDM) dat the single source of truth oftewel enige bron van waarheid identificeert en definieert. De waarheid wordt opgevat als gegevens waarvan men vertrouwt dat ze zowel nauwkeurig als correct zijn (door validaties). Wanneer master data wordt opgebouwd uit ongelijksoortige gegevensbronnen, doen zich vaak problemen voor met dubbele records, onvolledige waarden binnen een record en records met een slechte gegevenskwaliteit. Het golden record principe binnen MDM lost deze problemen op door dubbele waarde te corrigeren, door waarden te verstrekken wanneer een waarde misschien niet bestaat, en door de gegevenskwaliteit binnen een record te verbeteren. Het verhoogt de data kwaliteit. De belangrijkste overweging bij het creëren en onderhouden van het Gouden Record is het matchen en samenvoegen van records die in verschillende gegevensbronnen zijn gecreëerd. Bij food bijvoorbeeld kan een golden record principe van enorm belang zijn om de data van meerdere leveranciers en andere bronnen samen te krijgen in één consumenten view. Een goed MDM-systeem zal functionaliteit bevatten om zoveel mogelijk automatisch gelijksoortige records samen te voegen.
Brongegevens uit meerdere systemen
De eerste vraag bij data uit meerdere bronnen is wanneer spreken we over hetzelfde product, over dezelfde klant. Hiervoor moet een match algoritme aangemaakt worden die zoveel mogelijk gelijkaardige records automatisch kan vinden. Bij producten is dit meestal een EAN/GTIN code, maar bij andere entiteiten zoals een persona is dit veel complexer.
Wanneer gelijkaardige records uit verschillende systemen verschillende waarden hebben, moet één van de records worden gekozen als het correcte record. Bijvoorbeeld: een supermarktketen krijgt eenzelfde product aangeleverd van verschillende leveranciers, hieraan is ook telkens data gekoppeld. Bij de ene leverancier is de marketingtekst het best, terwijl de andere leverancier dan weer de beste productfoto’s aanlevert. In het bovenstaande voorbeeld bevat elk van de drie systemen een record dat vergelijkbaar is met een record in de andere twee systemen. Maar de waarden in elk attribuut van de drie gelijkaardige records zijn niet precies dezelfde. In dit geval bevat het Golden Record een combinatie van waarden voor de meerdere bronsystemen. Tracebility blijft hier belangrijk, want we moeten kunnen achterhalen van welke leverancier of andere bron, welke data afkomstig is, wie owner is van de data (bv. allergenen, bio certificaten en andere).
Survivorship rules
Bepalen welke informatie je behoudt, bepaal je door middel van survivorship rules. Survivorship is het proces van verificatie van gegevens in elk attribuut om de “single source of truth” te identificeren, of het record dat alle correcte informatie bevat die nodig is over een klant, leverancier, product of dienst. Tijdens het matchen van records worden verschillende technieken gebruikt om de best mogelijke data te selecteren. Factoren zoals de structuur en de bron van de gegevens, de manier waarop ze worden ingevuld en het soort gegevens dat wordt opgeslagen, spelen allemaal een rol bij het instellen van de survivorship rules.
Drie basis technieken die gewoonlijk worden gebruikt om het overblijvende record te selecteren zijn:
- Meest recent: Records met datumstempel in volgorde van meest naar minst recent kunnen worden gerangschikt
- Meest voorkomend: Komt overeen met herhalende records die dezelfde informatie bevatten
- Meest volledig: Beschouwt de volledigheid van velden als een indicatie van de nauwkeurigheid van records
Deze regels worden steeds complexer en slimmer, zelfs AI kan toegepast worden een optimaal golden record te verkrijgen.
Wil je meer weten over de voordelen van het golden record principe en een MDM-systeem voor jouw ondernemen. Neem contact op met de MDM-experts van de Benelux: YellowGround!
YellowGround is dé MDM en PIM-expert van de Benelux. We vertelden al eerder dat MDM of PIM het missende ingrediënt is in de voedselsector en wat het belang van is PIM voor de food-sector. Mis deze reeks over PIM en de foodsector niet.