⚠︎ Архивная вакансия
Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете  найти актуальные похожие вакансии

Senior ML-инженер

Прямой работодатель  ЦИАН ГРУПП ( cian.ru )
Москва, Россия
Миддл • Сеньор
Аналитика, Data Science, Big Data • Data scientist • Инженер • Data Science • Machine Learning • Python • SQL • Hadoop • Hive • PostgreSQL • Spark • Desktop • Natural Language Processing (NLP) • WEB
18 мая 2022
Удаленная работа
Опыт работы более 5 лет
Работодатель  ЦИАН ГРУПП
Описание вакансии

О нас

Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.

Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков.

Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.

Ежемесячная аудитория превышает 18,7 млн уникальных пользователей.

Офисы компании расположены в Москве, Петербурге и Новосибирске, есть возможность выбрать любой режим посещения или работать вовсе удаленно фулл-тайм.

 

О команде

С 2016 года в Циан живет команда ML. Сейчас в ней 23 человека (DS, DE, MLOps и др.). Внутри ML есть три кроссфункциональных стрима:

  • moderation
  • ranking
  • platform

И сейчас нам нужен +1 Senior ML-инженер в команду модерации (антифрода).

Ребята из команды антифрода любым способом пытаются сделать так, чтобы за каждой карточкой объекта стоял реальный объект: анализируют фотографии, описание и многое другое 🤓

Какие роль есть в команде модерации: PM, Product manager, Tech Lead, ML dev, Python dev, C# dev, DA

 

Задачи

Основная задача ML-инженера - разработка моделей машинного обучения на Python, проектирование архитектуры приложений.

Проекты

  • разработка моделей поиска нарушений в объявлениях на основе данных объявления, картинок и текстов;
  • разработка и поддержка моделей поиска по аудиозаписям.

Стек

  • Пишем преимущественно на python (numpy, scipy, pandas, sklearn, keras, pytorch), у DE есть немного задач на scala/java;
  • Активно пользуем экосистему Hadoop (spark и pyspark, phoenix/hbase, hive, kafka), у нас свой кластер;
  • Несколько активных джобов на Spark streaming;
  • Два сервака с gpu;
  • Luigi + самописные дополнения к Luigi для шедулинга тасок;
  • Для технических метрик - Grafana, для бизнес метрик - Superset;
  • Микросервисы на Tornado.

 

Мы видим на этой позиции человека, который

  • пишет легко читаемый и поддерживаемый код на Python, знает способы тестирования и имеет опыт работы с многопоточностью / асинхронщиной;
  • имеет продвинутый уровень в SQL: оконные функции, оптимизация запросов;
  • имеет базовое знание NoSQL: зачем нужно, как работает, таких как Redis, Mongo и тд.
  • имеет опыт в Apache стеке: HDFS / Kafka / Spark;
  • может в классический ML: бустинги, линейные модели;
  • имеет базовые знания в NLP: трансформеры, tf-idf;
  • имеет базовые знания CV: классификация, детекция, сегментация;
  • DL: PyTorch / TensorFlow;
  • умеет хорошо построить валидацию, проверить результаты и отвалидировать бизнес-смысл;
  • выводил over / near realtime код в продакшн.

 

Что мы предлагаем

  • Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;
  • Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;
  • Плюшки: ДМС с первого дня (стоматология, госпитализация, полис ВЗР), ежегодная компенсация спорта, 5 day off в год, помимо основного отпуска.