Чем отличается аналитик данных (Data Analyst) от Data Scientist
По мнению экспертов IDC и Seagate, к 2025 году общий объем данных на плане увеличится до 175 зеттабайт. На фоне таких огромных цифр особенно востребованными становятся две профессии – аналитик данных (Data Analyst) и исследователь данных (Data Scientist). С чем работают эти специалисты и какая разница между ними, будем подробно разбираться в статье. Кстати, недавно центр профориентации ПрофГид разработал точный тест на профориентацию, который сам расскажет, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте.
С чем работает Data Analyst
Тест Кем стать: Data Scientist или Data Analyst?
Data-driven («управляемый данными») подход к ведению бизнеса использует все больше компаний. Корпорации и фирмы, которые анализируют информацию о своих клиентах и рыночных процессах, хорошо знают, как что работает, и используют это знание для получения прибыли. На основе данных специалисты могут не только прогнозировать изменения климата или результаты выборов, но и оптимизировать рабочие процессы, определять пожелания и предпочтения потенциальных покупателей.
Данные, на основе которых принимаются решения, собирает Data Analyst.
Аналитик не просто собирает информацию, он:
- оценивает широкий спектр данных, отбирает существенные для принятия решений;
- обрабатывает их, визуализирует и предоставляет заказчикам или руководству;
- разрабатывает рекомендации, как действовать на основе полученных данных, предлагает концепции ведения бизнеса.
Data Analyst должен хорошо разбираться в основных инструментах анализа данных и уметь работать с большим объемом разнородной информации.
С чем работает Data Scientist
Специалисты по Data Science имеют дело с различными источниками информации, используя для обработки данных самые передовые методы. Они могут автоматизировать алгоритмы машинного обучения или разработать программы моделирования прогнозов как структурированных, так и неструктурированных данных. Эта профессия считается более продвинутой, чем Data Analyst, и, соответственно, более высокооплачиваемой.
Хорошему исследователю данных нужны:
- знание математических и статистических методов обработки информации;
- IT-навыки, особенно программирование на языке сценариев Python;
- умение пользоваться графическими инструментами визуализации данных.
Желательно знание предметной области, для которой делается аналитика. Но разбираться во всем и сразу невозможно, поэтому «погружение в предмет» приходит с опытом работы в конкретной сфере деятельности (например, в здравоохранении, цифровом маркетинге или розничной торговле).
Лучше, в чем разница между Data Analyst и Data Scientist, покажет круг их обязанностей.
Что делает Data Analyst
Основная задача аналитика данных – анализировать и оценивать информацию, обобщать результаты в ясной и понятной форме. Полученные необработанные данные Data Analyst преобразовывает в подходящий формат и представляет их руководству. Также в его обязанности входит обслуживание и очистка информационных баз компании. Через равные промежутки времени аналитик ищет возможные ошибки и исправляет их. В зону его ответственности также входит оценка того, какие данные вообще могут быть обработаны.
Таким образом, в круг задач Data Analyst входит:
- определение целей анализа данных совместно с руководством компании или руководителями соответствующих подразделений;
- сбор структурированной и неструктурированной информации из внешних и внутренних источников;
- внедрение соответствующих систем для организации и моделирования данных;
- анализ и интерпретация закономерностей полученной информации, определение корреляций и тенденций;
- обобщение результатов в отчетах и презентациях;
- очистка баз данных, анализ и исправление ошибок.
Аналитики тесно сотрудничают с разработчиками и программистами компании для создания баз данных.
Что делает Data Scientist
Если проводить сравнение с аналитиками данных, которые работают больше как журналисты-расследователи, Data Scientist гораздо больше сосредоточен на разработке продукта (модели прогнозирования), чем на консультировании. Тем не менее эти специалисты также обязаны формулировать для руководства коммерческие рекомендации.
В повседневные задачи дата-сайентиста, в частности, входит:
- сбор, очистка и обработка «сырых» данных;
- разработка прогностических моделей и машинных алгоритмов для оперирования с большими объемами информации;
- создание инструментов визуализации данных, информационных панелей и отчетов;
- разработка инструментов и процессов для мониторинга и анализа точности данных;
- написание программ для автоматизации сбора и обработки информации.
По сути, Data Scientist′ы – это разработчики, которые используют расширенное программирование, делают прогнозы и дают рекомендации с почти идеальной точностью.
Итак, в чем отличие дата-аналитика от дата-сайентиста
- Суть работы Data Analyst (аналитика) заключается в визуализации результатов сбора и обработки данных и формулировании выводов на их основе. Специалист по Data Science (исследователь) должен уметь делать то же самое, но еще и обладать большими техническими знаниями и уметь программировать.
- Аналитик работает с меньшими объемами данных. Дата-сайентист исследует и систематизирует гораздо больше информации из разных источников, которые не связаны между собой, разрабатывает модели машинного обучения.
- Итог работы дата-аналитика всегда один – это эффективное бизнес-решение, принятое с его подачи. Результат работы дата-сайентиста – модель машинного обучения, которую можно использовать в бизнесе и в науке.
- У дата-аналитика и дата-сайентиста разные временные рамки для выполнения работы. Data Analyst делает отчет за несколько дней и несколько раз за неделю, а Data Scientist может работать над одним проектом полгода и больше. Это обусловлено тем, что отчеты аналитика нужны бизнесу для принятия оперативных решений, а модели, которые создает сайентист, сначала надо обучить, чтобы они выдавали эффективные прогнозы и действительно помогали решать проблемы.
- Data Analyst и Data Scientist работают с данными из прошлого, но главное отличие состоит в том, что опираясь на них, дата-аналитик помогает бизнесу принимать решения здесь и сейчас, а дата-сайентист нацелен на будущее и помогает выстроить стратегию развития.
Сравнение Data Analyst и Data Scientist
Навыки |
Data Analyst |
Data Scientist |
Программирование |
Не требуется |
Обязательно, Python |
Математика/статистика |
Необходимо |
Обязательно |
Визуализация, графические навыки |
Продвинутый уровень, инструменты BI, PowerPoint, инструменты для построения дашбордов |
Программирование на языке Python |
Машинное обучение |
Не нужно |
Обязательно |
Big Data, Spar, Hadoop |
Редко |
Обязательно |
Гибкие навыки |
Продвинутые |
Базовый уровень |
Что касается зарплаты Data Analyst и Data Scientist: она у них достаточно высокая. Но поскольку специалист по данным несет большую ответственность, чем аналитик, и обладает более широкими навыками, получает он значительно больше. Зарплата Data Analyst в зависимости от нанимающей компании варьируется от 100 до 250 тысяч рублей в месяц, специалист по Data Science может получать 350–450 тысяч рублей и выше.