Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете найти актуальные похожие вакансии

Data Engineer

Прямой работодатель Datanomica.org ( datanomica.org )

Москва, Россия

Миддл

Аналитика, Data Science, Big Data • Scala • SQL • Apache Spark • Hadoop • Hive • Data Analysis • Банковская и страховая сфера • Системная интеграция

2 апреля 2021

Работа в офисе
Опыт работы от 1 года до 3х летот 200 000 до 270 000 ₽

Работодатель Datanomica.org

Короткая ссылка: gkjb.ru/hTGG

Описание вакансии

О проекте

Платформа монетизации чеков развивает продукт поиска совпадений и разбора неструктурированных текстовых данных фискальных чеков с целью их ранжирования по различным аналитическим разрезам.

Цель проекта:

предоставить клиенту информацию о деталях покупки, совершенной с использованием банковской карты;
накапливать данные о фискальных чеках клиентов для последующего анализа и построения поведенческих моделей в лаборатории искусственного интеллекта.

Обязанности

проектирование и разработка аналитических витрин данных для целей отчетности и моделирования на стеке Hadoop + Spark;
анализ исходных данных в различных системах и форматах для решения бизнес-задач (оценка структуры, качества, полноты и применимости данных);
мониторинг и оптимизация процессов сборки витрин;
контроль качества загружаемых данных, разработка автоматизированных инструментов для оценки качества данных;
разработка и поддержка сопроводительной документации и спецификаций данных, развитие и поддержка базы знаний по вопросам работы с данными;
предоставление экспертной поддержки внутренним потребителям (data analysts, data scientists) по вопросам, связанным с использованием данных.

Требования

не менее 1 года работы в качестве Data Engineer / Data Analyst / ETL Developer;
знание SQL на продвинутом уровне (аналитические функции, подзапросы, хранимые процедуры, оптимизация производительности);
опыт работы с большими объемами данных с использованием стека технологий Big Data (Hadoop, Spark, Hive/Impala);
знание основных понятий и концепций из области Data Warehousing. Желателен опыт разработки витрин данных;
знание Scala является преимуществом;
знание Python является преимуществом;
знание розничного банковского бизнеса является преимуществом;
знание Apache Flink приветствуется;
знание Apache Airflow приветствуется;
опыт работы по Agile (Scrum, Kanban, и т.д.) приветствуется.

Основной тех. стек

Hadoop (Hive/Impala/Oozie)
Apache Spark
Scala
Java

Условия

задача с достижимым результатом, понятным заказчиком и рынком. Достаточная свобода действий, инструментарий и необходимые ресурсы;
участие в проекте на стадии его зарождения с применением передовых технологических подходов — возможности дальнейшего развития и карьерного роста;
работа по методологии Scrum;
конкурентная заработная плата по результатам собеседования в зависимости от опыта, знаний и пожеланий;
профессиональный коллектив в сфере обработки данных;
возможность обучения и развития за счет компании.

Специализация
Аналитика, Data Science, Big Data Scala SQL Apache Spark Hadoop Hive
Отрасль и сфера применения
Data Analysis Банковская и страховая сфера Системная интеграция
Уровень должности
Миддл