ETL

Опис завдання

Процес ETL (вилучення, перетворення, завантаження) зазвичай займає найбільше часу, і він може легко зайняти до 50% циклу впровадження сховища даних або навіть більше. Причиною цього є те, що потрібен час, щоб отримати вихідні дані, зрозуміти необхідні стовпці, зрозуміти бізнес-правила, а також зрозуміти логічну та фізичну моделі даних.

Вимоги до часу

1 – 6 тижнів.

Результати

  • Документ відображення даних
  • ETL-скрипт / ETL-пакет в інструменті ETL

Можливі підводні камені

Існує тенденція приділяти цьому етапу занадто мало часу на розробку. Це може виявитися самогубством для проекту, оскільки кінцеві користувачі, як правило, терпітимуть менше форматування, довший час виконання звітів, меншу функціональність (нарізка і нарізка кубиками) або меншу кількість наданих звітів; одна річ, яку вони не терпітимуть, – це невірна інформація.

Друга поширена проблема полягає в тому, що деякі люди роблять процес ETL складнішим, ніж це необхідно. При розробці ETL першочерговою метою має бути оптимізація швидкості завантаження без шкоди для якості. Однак іноді цього не дотримуються. Бувають випадки, коли метою проектування є охоплення всіх можливих майбутніх застосувань, незалежно від того, чи є вони практичними, чи просто плодом чиєїсь уяви. Коли це відбувається, продуктивність ETL страждає, а часто і продуктивність всієї системи зберігання даних.

ОРИГІНАЛ СТАТТІ:ETL

🚀Долучайтесь до нашої спільноти Telegram:

🚀Долучайтесь до нашої спільноти FaceBook:

Posted in DBTagged

Leave a Reply

Your email address will not be published. Required fields are marked *