Різні люди мають різні визначення сховища даних. Найпопулярніше визначення належить Біллу Інмону (Bill Inmon), який дав наступне:
Сховище даних – це предметно-орієнтоване, інтегроване, змінне в часі та енергонезалежне зібрання даних для підтримки процесу прийняття управлінських рішень.
Предметно-орієнтоване: Сховище даних можна використовувати для аналізу певної предметної області. Наприклад, “продажі” можуть бути конкретною темою.
Інтегроване: Сховище даних інтегрує дані з декількох джерел даних. Наприклад, джерело А і джерело Б можуть мати різні способи ідентифікації продукту, але в сховищі даних буде лише один спосіб ідентифікації продукту.
Часовий варіант: у сховищі даних зберігаються історичні дані. Наприклад, зі сховища даних можна отримати дані за 3 місяці, 6 місяців, 12 місяців або навіть старіші дані. Це контрастує з транзакційною системою, де часто зберігаються лише найсвіжіші дані. Наприклад, транзакційна система може зберігати останню адресу клієнта, тоді як сховище даних може зберігати всі адреси, пов’язані з клієнтом.
Енергонезалежність: Щойно дані потрапляють до сховища даних, вони не змінюються. Отже, історичні дані в сховищі даних ніколи не повинні змінюватися.
Ральф Кімбалл надав більш стисле визначення сховища даних:
Сховище даних – це копія даних про транзакції, спеціально структурована для запитів та аналізу.
Це функціональний погляд на сховище даних. Кімбалл не розглядав, як будується сховище даних, як це робив Інмон; скоріше, він зосередився на функціональності сховища даних.
🚀Долучайтесь до нашої спільноти Telegram:
🚀Долучайтесь до нашої спільноти FaceBook:
Розгорнуто про типи сховищ даних (за форматом збереження, видами інфраструктури та ієрархіями даних) можна прочитати українською в цьому матеріалі: https://wiseit.com.ua/corporate-data-storage-guide-forms-types-and-architectures/