Senior Data scientist (Deep Learning)
Прямой работодатель МегаФон ( megafon.ru )
Опыт работы от 3 до 5 лет
Мы в поисках Senior Data scientist в нашу команду, формат работы удаленный по РФ.
О проекте:
Мы разрабатываем аналитические сервисы на базе искусственного интеллекта для банковской сферы, страховых компаний, электронной коммерции, ритейла и туризма. Среди разработок — сервисы для оценки рисков, лидогенерация для развития коммерции и бизнеса предприятий, геоаналитика в области туризма и городской среды, а также другие продукты с использованием Big Data.
Стек:
Spark + Scala - это наше все. В последнее время активно развиваются глубокие модели (Soft Trees, Tabular GAN, Siemese Networks, etc.), примерно поровну PyTorch/TF2
Distributed XGBoost/LightGBM, много ансамблируем
Airflow/Kubernetes/Docker и серьезный акцент на правильный MLOps
Какие задачи необходимо решать:
- Cоздание, внедрение и доработка новых глубоких моделей для скоринга, поведенческого моделирования, а также мультимодальных (смс + поведение). По уровню -- начиная от Alfabattle2 и выше
- Эксперименты с методами обучения и конденсации глубоких сетей (Graph Convolutional Networks для подавления фрода и тп.)
- Построение гибридных моделей (аналог Wide&Deep)
- Тюнинг обучаемых параметров GPT-2* и GPT-3* семейств на новых модальностях, изучение transfer learning в FinTech домене
- Улучшение качества существующих моделей (глубоких и обычных)
- ELT, CI/CD и реализация bullet proof пайплайнов
- Анализ больших данных, нахождение wow инсайтов и красивое изображение их. Мы - это голос данных!
Для решения этих задач требуется:
- Высшее образование, знания в области математики, теории вероятности, мат. статистики
- Широкий кругозор в области технологий машинного обучения в целом, знание текущих SOTA архитектур, актуальных архитектур нейронных сетей
- Опыт работы с Pytorch, Tensorflow или Mxnet, а также опыт обучения production ready GAN моделей
- Будет плюсом опыт участия в профильных конференциях, соревнованиях, опыт решения задач anti fraud с упором на deep модели, наличие публикаций на Arxiv или популярные Github репозитории