Senior/Middle Data scientist
Прямой работодатель Магнит ( magnit.ru )
Опыт работы от 3 до 5 лет
Наша команда разрабатывает передовые ИТ решения и разворачивает инфраструктуру
для самой крупной розничной сети в стране, обеспечиваем работоспособность более
22 000 объектов.
Нам есть чем гордиться:
- Более 2500 ИТ специалистов по всей стране;
- Разработано более 800 информационных систем и сервисов;
- Более 100 ИТ проектов;
- Применяются десятки различных технологий, от Enterprise платформ для центральных высоконагруженных сервисов Oracle/Java EE до наименее ресурсоемких – FB, Python;
- Ведется разработка приложений, работающих с различным оборудованием (касс, весов,ТСД, мобильных устройств и не только);
- Активно используем и внедряем облачные технологии (Microsoft Azure, Office 365 и др.);
- "It для людей" – Magnit tech, митапы, тренинги, кибер-лига, лайфхаки.
D&A в Магните – опытная команда, которая сейчас работает над созданием D&A продуктов нового поколения в компании Магнит.
Мы ищем в эту команду профессионала уровня Senior, с амбициями и креативными идеями, готового применять свои знания в ML/статистике /математике в реалиях retail бизнеса.
Чем предстоит заниматься:
Прогнозировать промо продажи компании до различных разрезов
Прогнозировать регулярные продажи компании до различных разрезов
Разрабатывать рекомендательные системы на основе данных карт лояльности компании
- Обучать и направлять младших DS
- Предлагать свои идеи и решения
- Тестировать гипотезы, генерируемые как внутри команды так и бизнесом
- Работать по принципам Agile/Scrum
Нам важно:
Умение писать понятный и воспроизводимый код;
Опыт работы с данными (на примере минимум 3х библиотек python), владение SQL (на примере одной СУБД: Teradata, MS SQL, Postgres, Oracle);
Опыт работы с распределенными системами (HADOOP, Azure) посредством Spark, Kafka;
Опыт создания классов, декораторов и функций в Python;
Опыт работы с данными и оперирования ими, оптимизация и сжатие данных, опыт работы с матрицами;
Опыт тюнинга моделей машинного обучения и подбора функций потерь, оптимизатора и функций активации в рамках решения задач машинного обучения;
Опыт использования блендинга, стекинга и ансамблирования различных моделей машинного;
Опыт использования сложных структур нейросетей, в том числе сверточных и рекурентных
Опыт сокращения времени обучения моделей с минимальной потерей точности;
Умение самостоятельно вести задачу, умение объяснить получаемые результаты, адаптация подхода к решению задач под условия бизнеса;
Умение делегировать/дробить проект на задачи для других участников команды проекта;
Понимание устройства нейросетей и опыт использования простых моделей нейросетей (плюсом будет использование одной из реализаций нейросетей от Google);
Понимание функций потерь, оптимизаторов? функций обратного вызова для оптимизации моделей машинного обучения;
Что мы предлагаем:
- Возможность работать full-time удаленно!
- Современные платформы работы с данными: Teradata, стек Hadoop, Tableau, QlikView;
- Объемы основных транзакционных данных 120+ ТБ;
- Объемы в Hadoop (в разработке) 1,5 ПБ;
- Дружескую атмосферу и поддержку команды профессиональных и активных коллег
- Комфортные рабочие места
- Кофе‑комнаты в каждом корпусе
- Два бесплатных спортзала на территории офиса и залы для групповых занятий
- Две стильные Кофе‑Лавки на прилегающей территории
- Удобная бесплатная автостоянка и закрытая велопарковка
- Корпоративные медицинские кабинеты
- Современная столовая с завтраками, обедами и ужинам