Data Scientist и Data Analyst: кто они и стоит ли вам учиться этим профессиям? — Edvisor

Data Scientist и Data Analyst: кто они и стоит ли вам учиться этим профессиям?

На первый взгляд эти профессии очень похожи, даже в названии у них есть общее "data". Оба они работают с большими объемами данных и используют схожие инструменты, но задачи ставят перед собой разные. Edvisor разобрался в тонкостях и готов рассказать, кому подходят эти профессии и что необходимо знать, чтобы стать аналитиком данных или data scientist. Итак, кто эти специалисты: Data Scientist и Data Analyst? Разберемся по-порядку.

Data Scientist

Data Scientist — это специалист по работе с огромными объемами неструктурированной информации. Проще всего представить, что кроется за этой формулировкой, если вспомнить работу ученого. Он делает опыты, выявляет закономерности, делает выводы. Результат работы дата-сайентиста, в отличии от ученого, не новый том энциклопедии, а модель или алгоритм. Эти модели нужны, чтобы делать прогнозы. Мы сталкиваемся с ними ежедневно.
Например, программы, которые прогнозируют погоду или спрос на товары, решают выдавать или нет кредит, рекомендуют фильмы и музыку – все это дело рук дата-сайентистов. Алгоритмы, разработанные Data Scientist, подбирают оптимальные маршруты для водителей такси. Это позволяет компании получать прибыль, делая поездки дешевле. Благодаря дата-сайентисту Джонатану Голдману соцсеть LinkedIn получила миллионы новых просмотров. Он построил модель, которая подсказывала владельцу аккаунта, кто из пользователей сайта может оказаться его знакомым.

Создавать подобные модели дата-сайентистам помогают:
● математическая статистика,
● методы машинного обучения и нейросетей,
● программирование и другие инструменты.

Необходимые знания

Профессия Data Science в большей степени подойдет для людей с аналитическим и математическим складом ума.

Дата-сайентист должен обладать знаниями в следующих областях:
● математика, чтобы строить алгоритмы и писать код;
● статистика – необходима для сбора и систематизации информации;
● программирование (в частности язык Python), чтобы писать код, который станет итогом всей работы.

Еще дата-сайентистам необходимо понимать принципы машинного обучения, без которых невозможно будет проверить, работает ваша модель или нет. Кроме прочего, важно знать отрасль, в которой работает специалист. Ведь если, например, вы не понимаете процессов в банковской деятельности, то как вы сможете решить задачу по оптимизации работы?
Также очень пригодится знание английского языка и умение работать в команде, так как придется общаться с сотрудниками смежных специальностей.
Эти специалисты должны быть трудолюбивыми, внимательными, скрупулезными, целеустремленными, усидчивыми.

Чем занимается

Работа Data Scientist заключается в том, что он:
● собирает огромные массивы данных, структурирует, размечает (спам или нет, клиент платежеспособен или недостаточно),
● преобразует в более удобный формат,
● проводит машинное обучение, которое подтверждает или опровергает выдвинутую гипотезу.

Если все проходит успешно, то на основе этих данных составляется модель. На следующих этапах ее проверяют на эффективность, безопасность, контролируемость. Прошедшую все этапы модель встраивают в бизнес-процесс.
Ошибки в работе дата-сайентистов могут дорого стоить компании. Например, плохая скоринговая модель может привести к тому, что ненадежные заемщики получат кредиты и не смогут возвращать деньги. Банк понесет колоссальные убытки. И наоборот, процессы, построенные на больших данных, могут сэкономить деньги там, где человек не догадался бы.

Data Scientist — профессия будущего, но и сегодня она уже очень востребована. По данным крупнейших HR-компаний, в 2020 году каждая третья компания в России искала в штат дата-сайентиста. Количество вакансий в Data Science выросло на 433% всего за три года.

Посмотрите, какие направления обучения предлагают компании по этой специальности.

Data Analyst

Data Analyst — это коллега Data Scientist, который также собирает, обрабатывает и интерпретирует данные, но с другой целью. Часто дата-аналитики являются теми людьми, которые ставят задачи дата-сайентистам.
Главной целью Data Analyst является экономический эффект. Специалист проводит А/B-тесты и строит модели, позволяющие оценить перспективы того или иного проекта в бизнесе, управлении и науке. Естественно, представители этой профессии должны прекрасно разбираться в бизнес-процессах и знать продукт, который производит компания.

Необходимые знания

Профессия Data Analyst, как и Data Scientist, подойдет для людей с аналитическим складом ума. Специалисту пригодятся знания в области математики и статистики, чтобы собирать и интерпретировать данные. Бизнес-аналитики любят и умеют работать с цифрами, они внимательны, коммуникабельны, не лишены творческого начала, при этом прекрасно ладят с программным кодом, базами данных и системами аналитики, такими как Google Analytics.

Как уже говорилось, Data Analyst должен знать сферу, в которой работает компания. Ему должны быть понятны все процессы и продукты.
Знание языков программирования (Python или R) необходимо для работы с базами данных. Дата-аналитик должен уметь писать запросы к базам данных SQL, иначе нужную информацию не получить. Также ему потребуется навык визуализации, чтобы оформить свои выводы с помощью понятного дашборда (Tableau, Power BI, Amplitude).

Чем занимается

Дата-аналитики специализируются на сборе данных. На основании собранной информации эти специалисты отвечают на различные вопросы бизнеса. Например, можно оценить эффективность программы адаптации новых сотрудников на основе данных об увольнении до конца испытательного срока. Они могут также выяснить, какие товары и в какое время лучше всего покупают.
Выяснить отношение клиентов на то или иное запланированное изменение дата-аналитикам помогает А/B-тестирование.

A/B-тестирование — инструмент, применяемый для проведения оценки эффективности. Смысл метода заключается в сравнении показателей одной тестовой группы с другой с целью определения лучшего варианта.

Посмотрите, какие направления обучения предлагают компании по этой специальности.

Data Scientist и Data Analyst: в чем разница?

Специальности Data Analyst и Data Scientist во многом похожи, однако это все же не одно и то же. Первый ищет ответы для решения глобальной экономической задачи, а второй – создает инструменты, позволяющие, в том числе, эту задачу решить.

Data Analyst vs Data Scientist

Критерии сравнения

Data Scientist

Data Analyst

Чем занимается

Ищет закономерности в данных, строит полезные модели

Ищет возможности для улучшения бизнес-показателей

С чем работает

Данные (структурированные и нет): графики, таблицы, текст, аудио, видео

Структурированные данные: таблицы или текст

Теоретическая база

Статистика, теория вероятностей, линейная алгебра, высшая математика, алгоритмы, теория информации, методы извлечения информации, машинное обучение, программирование, аппаратное и программное обеспечение баз данных и вычислительных сред

Математическая статистика, теория вероятностей, методы извлечения информации, способы визуализация данных, базы данных, бизнес-анализ

Основные инструменты

Библиотеки и программы обработки данных, алгоритмов, машинного обучения, визуализации

Библиотеки и программы обработки данных, математической статистики и визуализации

Сфера деятельности

Изучение потребностей бизнеса, подготовка обработки данных, создание и тестирование моделей на принципах машинного обучения, визуализация закономерностей, внедрение моделей

Изучение потребностей бизнеса, подготовка обработки данных, создание и тестирование гипотез на принципах математической статистики, визуализация результатов анализа данных и тестирования гипотез, внедрение успешных гипотез

Распределение рабочего времени

Общение с заказчиками – 10%, подготовка данных – 50%, моделирование – 20%, внедрение – 10%, эксплуатация – 10%

Общение с заказчиками – 30%, подготовка данных – 30%, анализ – 30%, внедрение – 10%

В заключении приведем простой пример.

Представьте себе организацию, в которой работают и дата-сайентист, и дата-аналитик. Скажем, онлайн-кинотеатр. Работа Data Scientist будет заключаться в том, чтобы создать модель, которая на основании данных о предпочтениях пользователей выдаст рекомендации по фильмам, которые им могут понравиться.
Data Analyst в этой же организации будет решать более глобальные задачи, такие как увеличение количества пользователей. Свои выводы аналитик сделает на основании изучения данных о самых популярных запросах, положении компании на рынке, политике конкурентов и многих других факторах.

Если вы хотите изучить одну из этих специальностей или углубить свои знания, посмотрите, какие курсы сегодня представлены в онлайн-университетах.

И что с этим делать?
Мы знаем, как сложно определиться с обучением и найти свой путь. Поэтому создали Edvisor — агрегатор онлайн-образования с удобным фильтром, отзывами выпускников и механизмами сравнения. Мы поможем вам выбрать курс, один и самый подходящий.
Да, помогите мне