Що робить успішним проект з аналітики даних?

Фото від Carlos Muza на Unsplash

Якщо ви намагаєтеся вийти на шлях аналітики даних без оплачуваного досвіду у цій області, вам, можливо, раджено “робити проекти”. Але що робить проект успішним? Що вразить менеджера з найму?

Є кілька речей, які слід мати на увазі при роботі над проектом:

  • Демонструйте навички, необхідні для посади, яку ви хочете отримати.
  • Доведіть, що ви можете відповісти на актуальні питання за допомогою даних.
  • Переконайтеся, що те, що ви робите, легко зрозуміло.

Але як це виглядає на практиці?

Демонструйте потрібні навички

Якщо менеджер з найму шукає кандидата з навичками у SQL та Tableau, то наявність лише проектів із Python не сигналізуватиме, що у вас є необхідні навички.

Відвідайте кілька оголошень про роботу для посад, які вас цікавлять. Які навички найчастіше вимагають? Саме ці навички ви хочете продемонструвати у своєму портфоліо.

Зазвичай ви знайдете, що різні компанії можуть вимагати різні навички для однієї й тієї ж посади. Якщо ви спрямовуєте свої зусилля на роль Дата Аналітика, можливо, буде потрібно володіти такими навичками, як:

  • Excel
  • SQL
  • Tableau, Power BI чи Looker
  • Python чи R
  • Інструменти, специфічні для галузі, такі як Salesforce, Amplitude, Google Analytics і т.д.
  • Хмарні інструменти, такі як AWS чи Azure
  • Статистичний аналіз, регресія, тестування гіпотез, прогностичне моделювання а потім порівнюйте все вищезазначене (метрики конверсії та рейтингові метрики) за різними категоріями та демографічними ознаками, щоб визначити, де можна знайти більше цінності.

Тому важливо розглядати вакансії, які є найбільш актуальними для вас, і визначити певні закономірності. У кінцевому підсумку це те, що робить Дата Аналітика! Знаходження закономірностей у хаосі інформації. Розгляньте це як завдання для аналізу.

Ще одне питання — чи слід робити окремий проект для кожної навички, чи ж об’єднати всі навички в один проект?

Правильна відповідь — робіть те, що має сенс для вашого проекту. Точно так само ви будете діяти на роботі — визначати правильний інструмент чи інструменти для вирішення проблеми. Іноді ви працюватимете в SQL + Excel. Або SQL + Tableau. Або просто в Python. Або просто в Excel. Так далі.

Доведіть, що ви можете відповісти на актуальні питання за допомогою даних

Одна з поширених помилок серед початківців полягає в тому, що вони вважають будь-який аналіз даних чи візуалізацію за вдалі.

Але це не так.

Ви хочете переконатися, що ви надаєте аналіз, який насправді розповідає історію і вирішує проблему.

“Метрики самовдоволення” — це загальний термін у цій галузі. Це щось, що може виглядати вражаюче, але насправді не відповідає жодним корисним питанням або не надає конкретних висновків для подальших дій.

Дуже поширеним є в маркетингу або аналітиці продукту число відвідувань, користувачів або клієнтів. Це може бути величезне вражаюче число.

Але що це нам говорить? Чи це те, що нас насправді цікавить?

Маркетинг та аналітика продукту, як правило, більше цікавлять метрики конверсії — скільки з них насправді зробили щось цінне?

Часто “цінне” означає віддати нам гроші чи інформацію.

Який відсоток користувачів або відвідувань …

  • Розмістили замовлення
  • Здійснили пожертву
  • Записалися на участь у членстві
  • Підписалися на електронний лист або список контактів
  • Завантажили мобільний додаток
  • Та інше

Інші корисні метри — це метри на основі рейтингів

  • Яка середня вартість замовлень?
  • Скільки товарів у середньому в одному замовленні?
  • Як часто цей користувач повертається, щоб зробити інше замовлення?
  • Яка вартість життєвого циклу нового клієнта?
  • Як довго користувачі залишаються учасниками (і, ймовірно, сплачують членський внесок), порівняно з тими, хто відмовляється (покидає/припиняє/скасовує)?
  • Скільки підписників на електронну пошту або користувачів мобільного додатка у кінцевому підсумку роблять замовлення чи стають платними учасниками?
  • Та інше.

А потім порівнюйте все вищезазначене (метрики конверсії та рейтингові метрики) за різними категоріями та демографічними ознаками, щоб визначити, де можна знайти більше цінності.

Переконайтеся, що це легко зрозуміти

Ще одна поширена помилка, яку я бачу серед початківців, — це намагання вмістити занадто багато інформації, а також використання візуальних елементів, які не є ефективними.

Перш ніж створювати візуальні елементи або навіть зачіпати дані, подумайте про проблему, яку ви намагаєтеся вирішити. Подумайте про питання, які можуть виникнути у вашої аудиторії. Розгляньте рішення, які вони прийматимуть на основі вашого аналізу.

І переконайтеся, що ваш результат орієнтований на все це, особливо на останню частину — які рішення чи дії вони здійснять на основі вашої роботи?

Ваша інформаційна панель може мати кілька вкладок — вам не потрібно вміщувати кожен візуальний елемент на одну вкладку. Або, якщо ви узагальнюєте в PowerPoint, відводьте одну ідею/питання на один слайд.

  • Розділіть ваші візуальні елементи за категоріями, питаннями, які вони вирішують, або іншою спільністю.
  • Не використовуйте більше одного візуального елемента для передачі однієї й тієї ж інформації — виберіть найкращий візуальний елемент.
  • Акцентуйте увагу на тому, що відповідає на важливе питання, не просто візуалізуйте кожен окремий показник даних, який у вас є.

Також важливо правильно вибирати візуальні елементи. Якщо вам подобається чи ні, “базові” елементи зазвичай найкращі — гістограми, діаграми розсіювання, лінійні графіки зазвичай найкраще передають ідею.

Кругові діаграми, бульбашкові діаграми та карті-дерева рідко є хорошою ідеєю. Людському оці буде важко визначити розмір у цих візуальних елементах — впорядкована гістограма, як правило, легше сприймається.

Який візуальний елемент найшвидше передає, як розподіляється цей бюджет? Ви можете швидко визначити, на що витрачено найбільше? Найменше?

Також подумайте про те, що ви ставите на вісь X, вісь Y, як ви впорядковуєте свої вісі, чи використовуєте ви подвійні вісі, масштаб ваших вісей, як ви використовуєте кольори, мітки та інше.

  • Може виглядати стильно, якщо ви намагаєтеся вмістити кілька точок даних в один візуальний елемент, але чи легко це зрозуміти?
  • Якщо ви використовуєте подвійні вісі, чи зрозуміло, яке значення на якій вісі? Чи потрібно вам вмістити обидві ці точки даних в один візуальний елемент?
  • Якщо ваша вісь X є категоріальною — як ви її сортуєте? Що має найбільший сенс? Впорядковування за кількістю зазвичай розповідає кращу історію, ніж впорядкування за алфавітом.
  • Чи читабельні ваші мітки? Ваша аудиторія знає, що означає або представляє кожна мітка?
  • Якщо ви використовуєте кольори, чи є вони відрізняємі? Пам’ятайте про дальтонізм.
  • Чи мають кольори сенс? “Зелений” зазвичай означає добре, а “червоний” — погано.
  • Не використовуйте кольори просто заради кольорів, якщо вони не представляють нічого значущого.

(Колись я проведу цілу серію про хороші та погані візуальні елементи — а поки що я починаю більше говорити про це в своєму інформаційному бюлетені.)

Підсумуйте роботу

Багато портфельних проєктів, що я їх бачу, полягають в тому, що хтось створив інформаційну панель або провів аналіз та візуалізацію у блокноті Python… але то що? Які висновки? Що ви вивчили? Які наслідки може мати ваша робота?

Як тільки ви отримаєте роботу, найважливіша частина ваших проєктів — це не всі технічні аспекти.

Це частина “та от чому?”.

Зазвичай це виражається під час презентації, супроводжуваної слайдами у PowerPoint. Якщо ви робите портфельний проєкт, ви можете створити презентацію PowerPoint, яка резюмує вашу роботу, зберегти її у форматі PDF і завантажити в репозиторій GitHub. Або Google Drive. Або ви можете використовувати файл README в GitHub для цієї мети. Або ви також можете написати про це блоговий пост.

Але, яким би способом ви не обрали, саме це є найціннішим. Резюме. Висновки. Рекомендації.

Деякі рекомендації, які важливо враховувати:

Вам потрібно розповісти історію. Ви хочете включити деяку комбінацію наступного, залежно від проєкту, вам може не знадобитися все це:

  • Яка проблема перед вами стоїть і яку ви намагаєтеся вирішити?
  • Яка мета? Який результат ми хочемо отримати в кінці? Чи є які-небудь компроміси?
  • Які випадки використання для цього результату? Як бізнес буде використовувати його?
  • Яка моя методологія? (Використані дані та техніки.)
  • Які ключові висновки з експлорації даних та візуалізації? (Вам не обов’язково включати кожний візуальний елемент, який ви створюєте — вибирайте ті, які є найбільш важливими.)
  • Які мої рекомендації? (Чого ви очікуєте від людини, яка працюватиме з цією інформацією? Які бізнес-рішення вони повинні приймати? Не припускайте, що це очевидно.)
  • Які наступні кроки? (Якщо у вас було більше часу або якщо є фаза 2, що буде далі? Куди рухається проєкт звідси?)

Зазвичай у вас буде кілька різних версій презентації — довга версія, коли у вас достатньо часу пройти через всі пункти вище, і Коротке резюме, коли у вас є лише 2–5 хвилин для презентації перед керівництвом. Ви можете створити презентацію PowerPoint для довшої версії і завантажити чи посилатися на неї, але використовуйте Коротке резюме в README свого репозиторію на GitHub або вгорі свого блогового поста.


Хочете приклади хороших проєктів? Перегляньте переможні проєкти з конкурсу з візуалізації даних DataConnect.

Додавайте ще ресурси у коментарях!


Потрібна додаткова допомога?

Перегляньте мій пост щодо кроків виконання проєкту з обробки даних, безкоштовні ресурси для отримання датасетів, або запишіть час зі мною, якщо ви хочете отримати відгуки щодо свого проєкту чи портфелю.

Також перегляньте мій безкоштовний інформаційний бюлетень для отримання більше ресурсів для кар’єри в галузі аналітики даних.

ОРИГІНАЛ СТАТТІ:What makes a good data analytics project?

АВТОР СТАТІ:Maggie @DataStoryteller

🚀Долучайтесь до нашої спільноти Telegram:

🚀Долучайтесь до нашої спільноти FaceBook:

Leave a Reply

Your email address will not be published. Required fields are marked *