Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете найти актуальные похожие вакансии

Senior Data Engineer

Ума.Тех ( uma.tech )
Аккаунт зарегистрирован с email *@gpm-rtv.ru

Москва, Россия

Сеньор

Информационные технологии • Разработка • Backend • Java • Python • ML/AI • СМИ, Медиа и индустрия развлечений

29 марта 2020

Работа в офисе
Опыт работы от 3 до 5 лет250 000 ₽

Работодатель Ума.Тех

Короткая ссылка: gkjb.ru/hQfv

Описание вакансии

Мы в поисках Ведущего инженера данных в Департамент управления данными.

Задача департамента – централизованный сбор, хранение, обработка и анализ данных из всевозможных источников холдинга, с использованием передовых open-source технологий, внедрение data-driven культуры, модернизация текущих, и создание новых продуктов на основе данных.

Нам нужен технически подкованный специалист с опытом работы с большими данными, который поможет нам:

построить высокопроизводительные конвейеры обработки данных;
достигнуть высокого качества данных, загружаемых на платформу, совместно с DQA;
улучшить мониторинг полноты данных совместно с Data Analysts / Scientists;
ускорить анализ и исправление инцидентов, связанных с данными.

Вот примеры задач, которые нужно решить:

имплементация и оптимизация ETL / ELT процессов, распараллеливание обработки данных;
загрузка, фильтрация и предобработка данных из источников;
поддержка ETL / ELT процессов совместно с ML Engineers;
разработка и поддержка чеков полноты данных совместно с DQA;
поддержание высокого уровня культуры написания и тестирования кода;
контроль за CI / CD приложений платформы, помощь в реагировании на инциденты;
настройка мониторинга метрик качества данных.

Нам важно, чтобы у вас был опыт:

в разработке ПО от 3 лет на одном из языков Java / Python (если только Java, то готовность использовать python в ежедневной работе);
на позиции Data Engineer / ML Engineer/ или подобных;
под Linux (git, vim, GNU CLI tools);
с RDBMS и SQL запросами, понимание ACID;
с web frameworks (Spring / Play / Django / Flask);
с колоночными/mpp СУБД (Clickhouse / Vertica / Cassandra / Redshift / GreenPlum);
с фреймворком Spark (RDD, Streaming, SQL) и понимание работы Hadoop (MR, HDFS, HBase);
по анализу инцидентов с качеством данных в источниках;
в проектировании приложений работы с данными;
с документацией, а также владение техническим английским (B1 и выше).

Будет преимуществом, если вы:

наличие оконченных курсов AI, ML на Coursera (MIPT / HSE / Andrew Ng и подобные);
повышение качества процессов ETL / ELT pipelines на NiFi / Airflow/etc.;
опыт разработки с исп. numba и понимать разницу между CPython, Cython, PyPy.
опыт интерпретации качества полученных моделей;
опыт работы с приложениями Jupyter Notebook / Zeppelin Notebook;
знание C / C++ / Scala / Kotlin;
opensource contribution / pet projects со ссылками на BitBucket / GitHub / GitLab / архивом;
опыт проведения code review, cледование code style.

Нам важно чтобы вся команда была на одной волне, поэтому, прежде всего, мы ценим в людях:

позитивный настрой и здоровый перфекционизм;
умение слушать коллег, адекватно воспринимать критику;
грамотное изложение своих мыслей и умение отстаивать свою т.зр.;
желание оказывать влияние на продукт и архитектуру: обсуждать реализацию разрабатываемых фич, вносить свои идеи.

Условия:

Оформление по ТК РФ (график работы 5/2, гибкое начало рабочего дня);
ДМС со стоматологией после окончания испытательного срока;
Новый современный офис в центре Москвы (рядом с метро «Маяковская»).;
Профессиональное развитие (перспективные проекты, возможность принимать участие в конференция, проходить обучение);
Корпоративная жизнь, насыщенная разнообразными коллективными событиями;
Современные технологии.

Специализация
Информационные технологии Разработка Backend Java Python
Отрасль и сфера применения
ML/AI СМИ, Медиа и индустрия развлечений
Уровень должности
Сеньор

Senior Data Engineer

Ума.Тех ( uma.tech )
Аккаунт зарегистрирован с email *@gpm-rtv.ru

Вакансии от "Ума.Тех"

Еще интересные вакансии