Senior Data Engineer

Нижний Новгород, Россия

Сеньор

Аналитика, Data Science, Big Data • Аналитик • Инженер • Разработчик • Python • ClickHouse • MySQL • Spark • Vertica • PostgreSQL • Hadoop

14 февраля в 15:44

Удаленная работа • Работа в офисе
Опыт работы от 3 до 5 летот 250 000 до 300 000 ₽

Кандидат ищет работу анонимно

Короткая ссылка: gkjb.ru/g14EL

Пригласить

О себе

Текущий статус/должность: Senior Data Engineer.

Мои компетенции и опыт

О себе

Более 4 лет работаю с данными в консалтинге: прошёл путь от ad-hoc аналитики на Python до архитектора платформ и старшего инженера данных. Моя ключевая компетенция — сквозная разработка решений «под ключ»: от проектирования хранилищ до создания дашбордов, которыми заказчики пользуются ежедневно. В рамках этого процесса строю отказоустойчивые пайплайны (Airflow, dbt), работаю с PostgreSQL, ClickHouse, Python, Yandex DataLens.

Не проектирую в вакууме. Стараюсь предлагать лаконичные работающие решения под конкретную бизнес-задачу, при этом учитываю контекст: сроки, имеющиеся возможности компании, потребность в дальнейшей масштабируемости. В каждом проекте моя задача — превратить сырые данные в инструмент, который помогает принимать решения.

Не рассматриваю сферы: финтех, гэмблинг, ставки и букмекерство, алкогольные и табачные компании. Предпочитаю проекты с понятным социальным контекстом и пользой.

Обязанности:

Проектирование и разработка корпоративных хранилищ данных (DWH) под конкретные бизнес-задачи: проработка логической модели данных (выделение ключевых сущностей, их атрибутов и связей, выбор методологии — Data Vault 2.0 или многомерные модели) и её реализация в физической схеме БД (создание таблиц, индексов, партиций, настройка хранения).
Создание и поддержка ETL/ELT-пайплайнов: загрузка данных из различных источников (CRM, ERP, API, логи, Google Таблицы, Apache Kafka), обработка и трансформация данных с использованием dbt и Python-скриптов, оркестрация процессов с помощью Apache Airflow.
Разработка аналитических витрин и дашбордов в Yandex DataLens и Superset, настройка самостоятельного доступа бизнес-пользователей к данным и возможности выгрузки отчетов в необходимых форматах (Excel, CSV), обеспечение self-service аналитики.
Оптимизация производительности баз данных (PostgreSQL, ClickHouse): настройка индексов, партиционирование, инкрементальные загрузки.
Проведение ad-hoc анализа данных: написание сложных SQL-запросов (оконные функции, CTE, вложенные запросы) для оперативного извлечения и исследования данных, подготовки выгрузок под конкретные задачи бизнес-подразделений, поиска аномалий и проверки гипотез.
Внедрение практик тестирования, документирования и контроля качества данных (dbt tests, CI/CD).
Разработка на Python скриптов для обработки данных, интеграции с внешними сервисами (ASR/TTS), построение прототипов ML-моделей.
Анализ бизнес-процессов и данных, поиск точек роста, проведение исследований.
Обучение и консультирование сотрудников (10+ пользователей) по работе с BI и аналитикой, формализация требований к отчетности.
Администрирование ресурсов Яндекс.Облака.

Некоторые результаты:

С нуля разработал корпоративное хранилище данных на PostgreSQL по методологии Data Vault 2.0, интегрировав в него несколько разнородных источников данных. В рамках решения создал полноценный ETL-процесс загрузки и обработки данных, а также дашборды для аналитики и выгрузки отчетов в Yandex DataLens. Это позволило автоматизировать расчет заработной платы (ранее это был ручной труд в Google Таблицах) и сократить время формирования отчетности с нескольких дней до 5–10 минут. Бизнес при этом получил инструмент для прозрачного анализа затрат и планирования бюджета.
Построил высокопроизводительную аналитическую платформу на ClickHouse, обеспечив сбор и обработку данных из разнородных источников (БД, логи, API) с обновлением каждые 5–60 минут. Разработал более 20 дашбордов в Yandex DataLens, что позволило сотрудникам компании разного уровня самостоятельно отслеживать ключевые метрики и выгружать необходимые им отчеты.
По запросам бизнеса разработал серию дашбордов, закрывающих ключевые потребности в аналитике и отчетности. Обучил 10+ сотрудников самостоятельной работе с BI-инструментами. В результате компания перешла от эпизодических отчетов «по просьбе» к системному анализу на единой платформе данных.
Активно влиял на качество данных на стороне источников: в рамках одного из проектов участвовал в разработке CRM, формулируя требования к составу полей и логике их заполнения, что обеспечило возможность корректного расчета и анализа. В ряде других проектов также инициировал заполнение ранее отсутствовавших критических полей — это сделало возможным проведение аналитики, которая ранее была недоступна.

Дополнительную информацию вы сможете получить, зарегистрировавшись в нашем сервисе

Пригласить

Интересные кандидаты