Ich hab in den letzten Wochen einige Vorträge und Webcasts zu den Microsoft Master Data Services gehört, bei denen häufig die beiden Begriffe Masterdaten – im deutschen auch Stammdaten – und Referenzdaten verwendet worden sind. Im folgenden ein kleiner Definitionsversuch der beiden Begriffe, da Masterdaten und Referenzdaten eigentlich nicht das gleiche sind.
Referenzdaten bezeichnen Daten
- die sich seltener verändern als Masterdaten
- die normalerweise in einer überschaubaren Größenordnung existieren
- die zur Kategorisierung von Daten verwendet werden
- die auch über Unternehmensgrenzen hinweg existieren
- deren Änderungen nicht zwangsläufig in Unternehmenshand liegen
Klassische Beispiele für Referenzdaten sind z.B. NUTS-Regionen, NACE-Codes, ISO Ländercodes, Postleitzahlen oder auch DUNS-Nummern.
Masterdaten hingegen besitzen normalerweise folgende Eigenschaften
- Unternehmensinterne Datensätze
- Änderungen unterliegen dem Unternehmen
- existieren innerhalb eines Unternehmens über Applikations- und Prozessgrenzen hinweg
- können Namen und ID’s über die Zeit verändern
- Können neue Referenzdaten erfordern
- Stellen Datensätze dar, die bei Transaktionen miteinander interagieren, jedoch keine transaktionalen Daten sind
Typische Beispiele für Masterdaten sind Kundendaten und Produkte.
Als keines Beispiel: Farben sind Referenzdaten, abzuleiten aus den Definition “Datensätze die bei Transaktionen miteinander interagieren” und “die zur Kategorisierung von Daten verwendet werden”. Um eine Bestellung aufzunehmen werden zwingend Kundendaten und Produktdaten benötigt. Farben sind, auch wenn sie für ein Produkt und einen Kauf eine hohe Relevanz haben können, aber doch nur beschreibender Natur. Ein weiterer wichtiger Unterschied zwischen den beiden Daten ist, dass Masterdaten das anlegen neuer Referenzdaten erfordern kann, umgekehrt jedoch nicht. Werden z.B. neue Produkte (Masterdaten) angelegt, so kann es notwendig sein neue Farben (Referenzdaten) anzulegen. Eine neue Farbe erfordert aber nicht die Anlage eines neues Masterdaten Datensatzes, es bewirkt maximal die Änderung eines bestehenden Datensatzes.
In Projekten ist es wichtig diese Unterschiede im Team zu kennen und nicht einheitlich von Masterdaten oder Referenzdaten zu sprechen. Im Bereich der Datenqualität würde ich hier auch die Prozesse unterschiedlich benennen, Masterdaten werden bereinigt, Referenzdaten werden standardisiert.
Ich hoffe ich konnte die Unterschiede zwischen Masterdaten und Referenzdaten genauer erklären. Natürlich freue ich mich auch über Kommentare zu dem Thema. Unabhängig davon ob es sich um Referenzdaten oder Masterdaten handelt, ändert dies nichts an der Tatsache, dass diese Daten gepflegt werden müssen 🙂