Разработчик на С++ или Java в Крипту

Наша команда разрабатывает систему, которая каждый день анализирует десятки миллиардов происходящих в интернете событий и составляет из них анонимизированные профили пользователей и устройств. С помощью этих профилей другие сервисы Яндекса могут эффективнее взаимодействовать с пользователями, учитывать их интересы, улучшать персонализацию, качественно анализировать данные.

Наш стек: технологии Яндекса Logbroker, YT, YQL, RTMR и их опенсорсные аналоги Kafka, Hadoop, Spark, Hive, Storm.

Какие задачи вас ждут

  • разрабатывать конвейер обработки больших данных (как batch, так и stream processing) и системы их интеллектуальной агрегации;
  • анализировать данные, разрабатывать инфраструктуру их обработки;
  • применять распределённые алгоритмы;
  • разрабатывать метрики качества;
  • оптимизировать качество при помощи эвристик или методов машинного обучения.

Мы ждём, что вы

  • разрабатывали на C++ или Java, готовы писать на различных языках программирования;
  • знаете классические алгоритмы и структуры данных, алгоритмы на графах;
  • работали с реляционными или нереляционными базами данных, знаете SQL или аналоги;
  • обрабатывали большие данные, умеете оценивать их качество, знакомы с математической статистикой.

Будет плюсом, если вы

  • знаете Python;
  • работали с инфраструктурой на основе систем Hadoop, Spark или их аналогов;
  • знаете основы машинного обучения;
  • применяли облачную инфраструктуру.
Спасибо за отклик!

Мы свяжемся с вами в течение недели.

Fri Feb 09 2024 12:47:58 GMT+0300 (Moscow Standard Time)