Какие технологии используют продуктовые и дата-аналитики
В исследовании продуктовых и дата-аналитиков NEWHR Data стремилась воссоздать портрет людей из этих специальностей: как они ищут работу, чем на этой работе занимаются, к кому прислушиваются и так далее.
В предыдущей статье мы писали о навыках и аналитической культуре. В этой — расскажем о технологиях, которые используют опрошенные нами аналитики.
Абсолютное большинство продуктовых и дата-аналитиков используют:
Языки программирования (88%)
BI-платформы и средства визуализации (87%)
Системы управления базами данных, системы распределённых вычислений (77%)
Значимые доли аналитиков также применяют мобильную и веб-аналитику (30%) и библиотеки машинного обучения (29%).
А вот конкретные инструменты, которые задействуют респонденты:
Языки программирования
Рабочими языками программирования аналитиков являются Python (93% использующих языки программирования) и SQL (89%). Значительно реже используются R (7%) и JavaScript (5%). Остальные языки не имеют значения, хотя их и упомянули отдельные респонденты.
BI-платформы и средства визуализации
Среди указанных аналитиками инструментов нет таких, которые применяло бы явное большинство.
Даже самые популярные Power BI (39%) и Tableau (36%) применяют немногим более трети опрошенных, которые применяют BI вообще.
Пятая часть работает с Apache Superset (23%), столько же — с DataLens (20%).
Реже используются Looker (12%), Google Data Studio (10%), Redash (10%), Metabase (8%) и Qlik Sense (6%).
СУБД, системы распределённых вычислений
Всего аналитики назвали 32 системы, с которыми они работают.
Большинство используют PostgreSQL (59%) и ClickHouse (57%). Остальные инструменты очень разнообразны и применяются в зависимости от технологического стека, выбранного компанией.
Каждый пятый работает с MySQL (20%) и Google BigQuery (18%).
Есть ещё с десяток систем данных, которые применяет значимое число аналитиков (4-14%).
Остальные, вплоть до самописных, применяются крайне редко.
ML-библиотеки
Наши респонденты упомянули 14 разных ML-библиотек. Из них семь имеют значимое распространение.
Подавляющее большинство пользуется Scikit-learn (86%).
Широко распространены CatBoost (47%) и XGBoost (39%).
Довольно распространёнными можно назвать LightGBM (24%) и PyTorch (21%).
Редкими — TensorFlow (15%) и Keras (7%).
Узнать больше
А вот что ещё есть в нашем исследовании продуктовых и дата-аналитиков:
Динамика зарплат
Рейтинг и антирейтинг работодателей среди российских компаний