Публикации NEWHR

Какие технологии используют продуктовые и дата-аналитики

В исследовании продуктовых и дата-аналитиков NEWHR Data стремилась воссоздать портрет людей из этих специальностей: как они ищут работу, чем на этой работе занимаются, к кому прислушиваются и так далее.
В предыдущей статье мы писали о навыках и аналитической культуре. В этой — расскажем о технологиях, которые используют опрошенные нами аналитики.

Абсолютное большинство продуктовых и дата-аналитиков используют:

  • Языки программирования (88%)
  • BI-платформы и средства визуализации (87%)
  • Системы управления базами данных, системы распределённых вычислений (77%)

Значимые доли аналитиков также применяют мобильную и веб-аналитику (30%) и библиотеки машинного обучения (29%).

А вот конкретные инструменты, которые задействуют респонденты:

Языки программирования

Рабочими языками программирования аналитиков являются Python (93% использующих языки программирования) и SQL (89%). Значительно реже используются R (7%) и JavaScript (5%). Остальные языки не имеют значения, хотя их и упомянули отдельные респонденты.

BI-платформы и средства визуализации

Среди указанных аналитиками инструментов нет таких, которые применяло бы явное большинство.
  • Даже самые популярные Power BI (39%) и Tableau (36%) применяют немногим более трети опрошенных, которые применяют BI вообще.
  • Пятая часть работает с Apache Superset (23%), столько же — с DataLens (20%).
  • Реже используются Looker (12%), Google Data Studio (10%), Redash (10%), Metabase (8%) и Qlik Sense (6%).

СУБД, системы распределённых вычислений

Всего аналитики назвали 32 системы, с которыми они работают.
  • Большинство используют PostgreSQL (59%) и ClickHouse (57%). Остальные инструменты очень разнообразны и применяются в зависимости от технологического стека, выбранного компанией.
  • Каждый пятый работает с MySQL (20%) и Google BigQuery (18%).
  • Есть ещё с десяток систем данных, которые применяет значимое число аналитиков (4-14%).
  • Остальные, вплоть до самописных, применяются крайне редко.

ML-библиотеки

Наши респонденты упомянули 14 разных ML-библиотек. Из них семь имеют значимое распространение.
  • Подавляющее большинство пользуется Scikit-learn (86%).
  • Широко распространены CatBoost (47%) и XGBoost (39%).
  • Довольно распространёнными можно назвать LightGBM (24%) и PyTorch (21%).
  • Редкими — TensorFlow (15%) и Keras (7%).

Узнать больше

А вот что ещё есть в нашем исследовании продуктовых и дата-аналитиков:
  • Динамика зарплат
  • Рейтинг и антирейтинг работодателей среди российских компаний
  • Списки экспертов, за которыми следят аналитики
Исследования