Розмірна модель даних найчастіше використовується в системах зберігання даних. Вона відрізняється від 3-ї нормальної форми, яка зазвичай використовується в системах транзакційного (OLTP) типу. Як ви можете собі уявити, одні й ті ж самі дані будуть зберігатися по-різному в розмірній моделі, ніж у моделі 3-ї нормальної форми.
Щоб зрозуміти, що таке розмірне моделювання даних, давайте визначимо деякі терміни, які зазвичай використовуються в цьому типі моделювання:
Вимір: Категорія інформації. Наприклад, часовий вимір.
Атрибут: Унікальний рівень в межах виміру. Наприклад, Місяць – це атрибут у часовому вимірі.
Ієрархія: Специфікація рівнів, що відображає зв’язок між різними атрибутами у вимірі. Наприклад, одна з можливих ієрархій у часовому вимірі: Рік → Квартал → Місяць → День.
Таблиця фактів: Таблиця фактів – це таблиця, яка містить показники, що нас цікавлять. Наприклад, такою мірою може бути сума продажів. Цей показник зберігається в таблиці фактів з відповідною деталізацією. Наприклад, це може бути сума продажів по магазинах за днями. У цьому випадку таблиця фактів міститиме три стовпці: стовпчик дати, стовпчик магазину і стовпчик суми продажів.
Пошукова таблиця: Таблиця пошуку надає детальну інформацію про атрибути. Наприклад, таблиця пошуку для атрибута “Квартал” міститиме список усіх кварталів, доступних у сховищі даних. Кожен рядок (кожен квартал) може мати кілька полів, одне для унікального ідентифікатора, який ідентифікує квартал, і одне або кілька додаткових полів, які визначають, як цей конкретний квартал буде представлений у звіті (наприклад, перший квартал 2001 року може бути представлений як “Q1 2001” або “2001 Q1”).
Розмірна модель включає в себе таблиці фактів і таблиці пошуку. Таблиці фактів з’єднуються з однією або декількома таблицями пошуку, але таблиці фактів не мають прямих зв’язків одна з одною. Виміри та ієрархії представлені таблицями пошуку. Атрибути – це неключові стовпці в таблицях пошуку.
При розробці моделей даних для сховищ даних / вітрин даних найчастіше використовуються схеми типу “зірка” і “сніжинка“.
Використання зірки чи сніжинки значною мірою залежить від особистих уподобань та потреб бізнесу. Особисто я віддаю перевагу сніжинкам, коли є бізнес-кейс для аналізу інформації саме на цьому рівні.
🚀Долучайтесь до нашої спільноти Telegram:
🚀Долучайтесь до нашої спільноти FaceBook:
One thought on “Вимірна модель даних”