Team Lead / Senior Site Realibility Engineer / Senior SRE (Kubernetes)
Прямой работодатель Группа компаний Криптонит ( kryptonite.ru )
Опыт работы от 3 до 5 лет
Мы разрабатываем аналитическую платформу на базе Kubernetes и компонентов из экосистемы Hadoop. Платформа поставляется как готовое продуктовое решение для установки внутри организаций-партнеров для безопасной работы со своими данными.
Мы ищем SRE с опытом внедрения и эксплуатации платформ контейнеризации и/или виртуализации. Мы готовы гибко обсуждать функции, роли и наименование позиции в зависимости от опыта и квалификации кандидата.
Чем предстоит заниматься:
- Автоматизация механизмов развертывания и настройки операционной системы, платформы оркестрации контейнеров и инфраструктурных сервисов.
- Автоматизация всех рутинных/повторяющихся процессов, реализация концепции Infrastructure as Code, обеспечение воспроизводимости и повторяемости результата.
- Проектирование аппаратной составляющий платформы, подбор и планирование аппаратных ресурсов, настройка и администрирование серверов и сетевого оборудования.
- Проектирование программной составляющий платформы, тестирование и доработка существующих решений, интеграция компонентов друг с другом.
- Анализ требований, оценка трудоёмкости реализации, участие в разработке технических спецификаций и заданий, архитектурный надзор над инженерно-техническими решениями.
- Создание и поддержка инфраструктуры для непрерывной интеграции и доставки компонентов платформы.
- Обеспечение реализации требований по информационной безопасности и защите данных в рамках платформы.
- Проведение нагрузочного тестирования платформы, тестирования отказоусточивости, отработка нештатных ситуаций.
- Участие в создании документации и инструкций по установке, настройки и эксплуатации платформы.
- Обучение и наставничество коллег-администраторов и разработчиков.
Что от Вас ожидаем:
- Экспертные знания и опыт эксплуатации инфраструктуры на базе Linux от 3-х лет.
- Опыт внедрения и эксплуатации платформ контейнеризации и/или виртуализации (Ванильный Kubernetes, OpenShift, CoreOS Tectonic, Rancher, Cloud Foundry, OpenStack OpenNebula, Mesos или аналогичных по сложности) от 1 года.
- Уверенное понимание устройства контейнеров, cgroups, namespaces в Linux.
- Уверенное владение инструментами автоматизации (Ansible, Chef, Salt, Puppet и д.р.).
- Уверенное понимание основ построения масштабируемых отказойстойчивых систем и приложений.
- Способность быстро находить причины проблем с доступностью/скоростью работы и устранять их, в т.ч. на уровне операционной системы и «железа».
- Коммуникабельность, умение находить компромиссы и аргументировано отстаивать свою точку зрения.
Будет плюсом:
- Общее понимание работы сетевых протоколов, протоколов маршрутазиции, топологий устройства сетей.
- Опыт эксплуатации систем управления базами данных (ClickHouse, ElasticSearch, Cassandra и д.р.).
- Опыт эксплуатации технологий обработки больших данных (Hadoop, Spark, Kafka и д.р.).
- Общие представления об процессах data engineering (получение, обработка, хранение, анализ данных).
- Интерес к технологиям обработки данных на GPU (CUDA, OpenCL).
- Интерес к технологиям машинного обучения (TensorFlow, H2O, SciKit).
- Техническое лидерство и опыт управления командой.
Что мы предлагаем:
- Работу в развивающейся технологической компании.
- Интересные задачи (исследовательские и прикладные), работа в команде исследователей и разработчиков.
- Комфортные рабочие места в современном офисе с видом на канал (БЦ класса «А» в 7 мин. от м. Павелецкая), оснащение новым it-оборудованием, зона отдыха.
- Оформление в соответствии с ТК РФ.
- Заработную плату на уровне лидеров индустрии (обсуждается индивидуально и зависит от опыта и компетенций кандидата).
- График работы: пн-пт (с 10 до 19); возможно согласование индивидуального графика с руководителем и совмещение с научной и/или преподавательской деятельностью.
- Соцпакет: отпуск