Ежедневно нам поступают сотни тысяч сигналов об изменениях в окружающем мире: люди оставляют фидбэк, операторы колл-центра актуализируют данные о наиболее важных компаниях, поступает поток информации из интернета, от партнёров и владельцев организаций. Мы решаем разнообразные задачи интеллектуального сбора, обработки, анализа, верификации огромного объёма противоречивых данных, ищем пути масштабирования и повышения эффективности производства.
Пишем на C++ 20 (с некоторыми ограничениями) и на Python 3.10. Используем модель данных на базе protobuf-сообщений. Данные храним в PostgreSQL и в таблицах в нашем внутреннем MapReduce-кластере.
Разрабатываем бэкенд для работы с данными на внутреннем фреймворке на C++. Много внимания уделяем качеству кода и покрытию тестами. Пишем юнит-тесты и интеграционные тесты (pytest, gtest). Сами строим метрики качества сервисов и анализируем накопленные данные.
Мы свяжемся с вами в течение недели.