Senior ML-инженер
Прямой работодатель ЦИАН ГРУПП ( cian.ru )
Опыт работы более 5 лет
О нас
Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.
Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков.
Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.
Ежемесячная аудитория превышает 18,7 млн уникальных пользователей.
Офисы компании расположены в Москве, Петербурге и Новосибирске, есть возможность выбрать любой режим посещения или работать вовсе удаленно фулл-тайм.
О команде
С 2016 года в Циан живет команда ML. Сейчас в ней 23 человека (DS, DE, MLOps и др.). Внутри ML есть три кроссфункциональных стрима:
- moderation
- ranking
- platform
И сейчас нам нужен +1 Senior ML-инженер в команду модерации (антифрода).
Ребята из команды антифрода любым способом пытаются сделать так, чтобы за каждой карточкой объекта стоял реальный объект: анализируют фотографии, описание и многое другое 🤓
Какие роль есть в команде модерации: PM, Product manager, Tech Lead, ML dev, Python dev, C# dev, DA
Задачи
Основная задача ML-инженера - разработка моделей машинного обучения на Python, проектирование архитектуры приложений.
Проекты
- разработка моделей поиска нарушений в объявлениях на основе данных объявления, картинок и текстов;
- разработка и поддержка моделей поиска по аудиозаписям.
Стек
- Пишем преимущественно на python (numpy, scipy, pandas, sklearn, keras, pytorch), у DE есть немного задач на scala/java;
- Активно пользуем экосистему Hadoop (spark и pyspark, phoenix/hbase, hive, kafka), у нас свой кластер;
- Несколько активных джобов на Spark streaming;
- Два сервака с gpu;
- Luigi + самописные дополнения к Luigi для шедулинга тасок;
- Для технических метрик - Grafana, для бизнес метрик - Superset;
- Микросервисы на Tornado.
Мы видим на этой позиции человека, который
- пишет легко читаемый и поддерживаемый код на Python, знает способы тестирования и имеет опыт работы с многопоточностью / асинхронщиной;
- имеет продвинутый уровень в SQL: оконные функции, оптимизация запросов;
- имеет базовое знание NoSQL: зачем нужно, как работает, таких как Redis, Mongo и тд.
- имеет опыт в Apache стеке: HDFS / Kafka / Spark;
- может в классический ML: бустинги, линейные модели;
- имеет базовые знания в NLP: трансформеры, tf-idf;
- имеет базовые знания CV: классификация, детекция, сегментация;
- DL: PyTorch / TensorFlow;
- умеет хорошо построить валидацию, проверить результаты и отвалидировать бизнес-смысл;
- выводил over / near realtime код в продакшн.
Что мы предлагаем
- Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;
- Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;
- Плюшки: ДМС с первого дня (стоматология, госпитализация, полис ВЗР), ежегодная компенсация спорта, 5 day off в год, помимо основного отпуска.