Що таке управління основними даними
Управління основними даними (Master Data Management, MDM) – це процес створення та управління даними, які організація повинна мати у вигляді єдиної еталонної копії, що називається основними даними. Зазвичай, основні дані можуть включати клієнтів, постачальників, співробітників і продукти, але можуть відрізнятися в різних галузях і навіть у різних компаніях в межах однієї галузі. MDM важлива, оскільки вона пропонує підприємству єдину версію правди. Без чітко визначених основних даних підприємство ризикує мати багато копій даних, які не узгоджуються між собою.
MDM, як правило, є більш важливим у великих організаціях. Насправді, чим більша організація, тим важливіша дисципліна MDM, оскільки більша організація означає, що в ній більше розрізнених систем, і складність забезпечення єдиного джерела істини, а також перевага наявності майстер-даних зростає з кожним додатковим джерелом даних. Особливо великий виклик у підтримці майстер-даних виникає під час злиття/поглинання. Кожна з організацій матиме свої власні основні дані, і об’єднати ці два набори даних буде непросто. Давайте подивимося на файли клієнтів: Дві компанії, ймовірно, матимуть різні унікальні ідентифікатори для кожного клієнта. Адреси та номери телефонів можуть не збігатися. Один може мати дівоче прізвище, а інший – поточне прізвище. Одна компанія може мати псевдонім (наприклад, “Білл”), а інша – повне ім’я (наприклад, “Вільям”). Все це ускладнює створення та підтримку єдиного набору основних даних.
В основі програми управління основними даними лежить визначення основних даних. Тому дуже важливо, щоб ми визначили, хто відповідає за визначення та забезпечення дотримання цього визначення. Зважаючи на важливість основних даних, слід призначити спеціальну особу або групу осіб. Як мінімум, слід визначити розпорядника даних. Відповідальною стороною також може бути група – наприклад, комітет з управління даними або рада з управління даними.
Управління основними даними vs. зберігання даних
Виходячи з попередніх обговорень, здається, що управління майстер-даними та сховища даних мають багато спільного. Наприклад, процес трансформації та очищення даних дуже схожий на процес ETL у сховищах даних, і фактично вони можуть використовувати ті ж самі інструменти ETL. У реальному світі нерідко можна побачити, як MDM і сховище даних потрапляють в один і той же проект. З іншого боку, важливо виділити основні відмінності між ними:
1) Різні цілі
Основною метою сховища даних є багатовимірний аналіз даних, тоді як основною метою MDM є створення і підтримка єдиного джерела істини для певного виміру в організації. Крім того, MDM вимагає вирішення першопричини неузгодженості метаданих, оскільки основні дані повинні бути якимось чином передані назад до системи-джерела. У сховищах даних усунення першопричини не завжди потрібне, оскільки може бути достатньо просто мати узгоджене уявлення на рівні сховища даних, а не забезпечувати узгодженість на рівні джерела даних.
2) Різні типи даних
Управління основними даними застосовується лише до сутностей, а не до транзакційних даних, тоді як сховище даних включає дані, які є як транзакційними, так і нетранзакційними за своєю природою. Найпростіший спосіб зрозуміти це полягає в тому, що MDM впливає лише на дані, які існують в розмірних таблицях, а не в таблицях фактів, в той час як в середовищі сховища даних існують як розмірні таблиці, так і таблиці фактів.
3) Різні потреби у звітності
У сховищах даних важливо надавати кінцевим користувачам відповідні типи звітів, використовуючи відповідний тип інструменту для полегшення аналізу. У MDM потреби у звітності дуже відрізняються – набагато важливіше мати можливість надавати звіти про управління даними, якість даних і відповідність вимогам, ніж звіти, що базуються на аналітичних потребах.
4) Де використовуються дані
У сховищі даних це “єдине джерело істини” зазвичай використовується лише для додатків, які мають прямий доступ до сховища даних, або для додатків, які мають доступ до систем, що отримують свої дані безпосередньо зі сховища даних. Здебільшого це не зачіпає оригінальні джерела даних. З іншого боку, в управлінні основними даними нам часто потрібно мати стратегію для повернення копії основних даних до системи-джерела. Це створює проблеми, які не існують у середовищі сховищ даних. Наприклад, як нам синхронізувати дані з першоджерелом? Раз на день? Раз на годину? Як ми обробляємо випадки, коли дані були змінені під час процесу очищення? І скільки модифікацій потрібно внести у вихідну систему, щоб вона могла використовувати основні дані? Ці питання представляють деякі з викликів, з якими стикається MDM. На жаль, на них немає простої відповіді, оскільки рішення залежить від багатьох факторів, специфічних для організації, таких як кількість систем-джерел, наскільки легко/дорого модифікувати систему-джерело, і навіть від внутрішньої політики організації.
🚀Долучайтесь до нашої спільноти Telegram:
🚀Долучайтесь до нашої спільноти FaceBook: