⚠︎ Архивная вакансия
Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете  найти актуальные похожие вакансии

Data Engineer (remote)

Агентство / HR ресурс  NEW.HR ( new.hr )
Москва, Россия
Миддл • Сеньор
Аналитика, Data Science, Big Data • Инженер • Python • SQL • Apache Spark • Hadoop • SaaS/PaaS
18 января
Релокация • Удаленная работа
Опыт работы от 3 до 5 лет
4 000 $
Агентство  NEW.HR
Описание вакансии

Платформа по автоматизации партнерского маркетинга в тревел. Мы помогаем брендам найти своих клиентов, а владельцам тревел-площадок эффективно монетизировать свой трафик.

Наша команда дата инженеров помогает аналитикам делать свою работу. Мы обеспечиваем доставку данных в единое хранилище для аналитики и поддерживаем инструменты для их обработки и презентации.

Стек:

  • Мы используем Apache Impala на базе Apache Hadoop для хранения и обработки данных.
    Основной источники данных – Kafka, БД и разные APIs. Используем самописный оркестратор и фреймворк на базе Python для работы с загрузкой и трансформации данных.
  • Идет миграция на новую платформу на базе LakeHouse архитектуры - Spark, Trino, AWS S3, DeltaLake format, DBT, Kafka, Airbyte.
  • Тестирование и сборка производятся на CI сервере (Jenkins). Деплой в Kubernetes. Настройкой серверов и разворачиванием баз мы не занимаемся. Это делает отдельная команда инфраструктуры.

Что нужно будет делать?

  • Основная задача дата инженеров в аналитике — поддерживать ее работоспособность.
    • Подключение новых источников и разработка/модернизация data pipelines
    • Отправка/обмен данными с внешними и внутренними сервисами
    • Работа над качеством данных
    • Настройка/поддержка аналитического окружения
  • Модернизация текущей дата платформы вместе с Core командой дата инженеров.
  • Участие в принятии архитектурных решений для новой дата платформы.

Что мы ждем от тебя?

  • Опыт работы инженером данных от 3 лет;
  • Отличное знание Python, SQL;
  • Умение строить streaming и batch пайплайны;
  • Опыт работы c Apache Spark, Apache Airflow, Trino будет большим плюсом;
  • Опыт работы с Kubernetes, Terraform будет плюсом;
  • Опыт работы с AWS приветствуется;
  • Самостоятельность и ответственность;
  • Умение коммуницировать с разными командами;
  • Желание развиваться и выстраивать процессы вокруг себя;

Мы предлагаем:

  • Достойный оклад, 4000$;
  • Удаленную работу, с возможностью работать из любой точки мира;
  • Возможность релокации.

Специализация
Аналитика, Data Science, Big DataИнженерPythonSQLApache SparkHadoop
Отрасль и сфера применения
SaaS/PaaS
Уровень должности
МиддлСеньор