⚠︎ Архивная вакансия
Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете  найти актуальные похожие вакансии

Senior/Middle Data Scientist

Прямой работодатель  Магнит ( magnit.ru )
Москва, Россия
Миддл • Сеньор
Аналитика, Data Science, Big Data • Data scientist • Аналитик • Data Science • Machine Learning • Python • R • Hadoop • Data Analysis • FMCG/Потребительские товары • Торговля и общепит
6 ноября 2020
Удаленная работа • Работа в офисе
Опыт работы от 1 года до 3х лет
Работодатель  Магнит
Описание вакансии

Мы развиваем собственный Аналитический центр Data Science и Machine learning , и приглашаем в команду Data Scientist на ключевые проекты.

Работа ведется в командах до 15 человек, включает в себя бизнес-аналитиков, data scientist, data engineer, руководитель направления.

Наши задачи:

  • Разработка статистических моделей/алгоритмов и их реализация на R, Python;
  • Оптимизация инструментов и подходов к решению задач;
  • Прогнозирование промо продаж компании до различных разрезов;
  • Прогнозирование регулярных продаж компании до различных разрезов;
  • Разработка рекомендательных систем на основе данных карт лояльности компании.

Ожидания:

  • Умение писать понятный и воспроизводимый код;
  • Опыт работы с данными (на примере минимум 3х библиотек python);
  • Опыт работы с данными посредством SQL (на примере одной СУБД: Teradata, MS SQL, Postgres, Oracle);
  • Опыт работы с распределенными системами (HADOOP, Azure) посредством Spark, Kafka;
  • Опыт создания классов, декораторов и функций в Python;
  • Опыт работы с данными и оперирования ими, оптимизация и сжатие данных, опыт работы с матрицами;
  • Опыт тюнинга моделей машинного обучения и подбора функций потерь, оптимизатора и функций активации в рамках решения задач машинного обучения;
  • Опыт использования блендинга, стекинга и ансамблирования различных моделей машинного;
  • Опыт использования сложных структур нейросетей, в том числе сверточных и рекурентных;
  • Опыт сокращения времени обучения моделей с минимальной потерей точности;
  • Умение делегировать/дробить проект на задачи для других участников команды проекта;
  • Понимание устройства нейросетей и опыт использования простых моделей нейросетей (плюсом будет использование одной из реализаций нейросетей от Google);
  • Понимание функций потерь, оптимизаторов в моделях машинного обучения;
  • Понимание функций обратного вызова для оптимизации моделей машинного обучения;

Мы предлагаем:

  • Огромный масштаб бизнеса: торговля (более 20 тыс. объектов, 4 формата), логистика (>6000 машин, >35 РЦ), производства, почти 300 тыс. сотрудников. Партнерства с почтой, фармдистрибуцией и пр;
  • Уникальная кросс-форматная программа лояльности (внедрение): данные по 15-20% всех расходов половины населения РФ. Коллаборации с партнерами;
  • Современная платформа данных: Teradata, SPSS, стек Hadoop, Tableau, QlikView;
  • Объемы основных транзакционных данных 120+ ТБ;
  • Объемы в Hadoop (в разработке) 1,5 ПБ;
  • Прототипы аналитики в реальном времени, высоконагруженные сервисы;
  • Участие в разработке цифровых продуктов (моб. приложение, оборудование в магазинах и пр.);
  • Возможность работы в облаках для прототипирования решений;
  • Возможность выбора задач;