Инженер по машинному обучению
Прямой работодатель TWIN ( twin24.ai )
Опыт работы от 3 до 5 летот 200 000 ₽
Что нужно будет делать:
Вы будете решать задачи в области NLP, NLU, NER и TTS сначала для русского, а затем для английского и других языков. Например: нормализация/предварительная обработка и классификация текста, извлечение именованных сущностей, анализ тональности текста, исправление опечаток, расстановка ударений, перевод слов в фонемы, обработка дат, чисел и сокращений. Так же, в зависимости от опыта, могут быть более глубокие задачи по синтезу речи и/или по общей оптимизации производительности нейронных сетей
Требования:
- опыт решения NLP задач для русского языка не менее 3 лет и/или в TTS не менее 1-2 лет;
- понимание принципов ML/DL, базовых алгоритмов машинного обучения и архитектур нейронных сетей для решения NLP и/или TTS задач;
- хорошее владение Python, включая опыт работы с популярными библиотеками ML (TensorFlow / PyTorch, NumPy, Sklearn, PyMorphy2, Pandas и т. д.);
- опыт разработки текстовых парсеров (для нормализации чисел, расшифровки сокращений, удаления мусора и т. д.);
- опыт разработки, тестирования и вывода моделей в production;
- умение оценить качество построенной модели, понимание плюсов / минусов той или иной метрики под конкретную задачу;
- опыт настройки и использования Linux для машинного обучения (включая запуск моделей на GPU);
- опыт работы с Docker, Docker Compose и написания собственных Docker-файлов;
- опыт работы с Git и Jira;
- способность самостоятельно решать проблему и предлагать различные решения;
- любовь к ведению документации, комментированию кода и code review;
- высшее техническое / математическое образование;
- английский на уровне чтения CS-статей (уровень B1 и выше).
Будет плюсом:
- опыт работы с библиотеками Rasa NLU, spaCy, fasttext, ONNX Runtime;
- опыт разработки масштабируемых RESTful веб-серверов с различными ML моделями (с использованием Flask/FastAPI);;
- опыт оптимизации производительности ML моделей;
- наличие собственных проектов с открытым исходным кодом, связанных с NLP и/или TTS".
Условия:
- удалённая работа (по методологии scrum);
- есть возможность работать в коворкинге в центре г. Екатеринбург;
- гибкий график работы;
- доступ к мощным GPU для обучения тяжёлых моделей и экспериментов;
- возможности к внедрению разных новых интересных и классных штук;