Data Analyst / Data Scientist
Москва, РоссияМиддл
Релокация • Удаленная работа • Частичная занятость • Работа в офисе
Опыт работы от 1 года до 3х лет200 000 ₽
Опыт работы от 1 года до 3х лет200 000 ₽
Есть файл резюме (защищен)
Короткая ссылка: gkjb.ru/g12rT
О себе
На данный момент Аналитик.
Мои компетенции и опыт
Обо мне
Data Analyst с 3+ годами экспертизы в кредитном анализе, ML и разработке аналитических систем. Подтверждённый опыт построения ML-пайплайнов, деплоя production-решений и измеримого бизнес-импакта через валидацию моделей. Уверенно веду end-to-end ML проекты — от постановки задачи и feature engineering до production deploy с мониторингом.
Ищу позицию Middle Data Analyst / Data Scientist
Навыки
Technical Stack: Python, TensorFlow, PyTorch, NumPy, Pandas, Scikit-learn, XGBoost, CatBoost
Data & SQL: PostgreSQL, SQLAlchemy, Dask, A/B-тестирование, проверка гипотез
ML: CV, Classic ML, LLM, NLP, LangChain
Backend: FastAPI, Streamlit, Django, Jinja2, Selenium, BeautifulSoup
MLOps / DevOps: MLflow, Docker, nginx, Git, Metabase, Airflow
Опыт
- Credit Scoring Model: Спроектировал с нуля скоринговую модель классификации кредитных рейтингов на базе ансамбля (CatBoost / XGBoost / ExtraTrees) с анализом feature importance — финальный VotingClassifier составил F1 ~ 87% на горизонте 1–3 года.
-Document Intelligence Pipeline (OCR + LLM): Спроектировал pipeline для структурированного извлечения данных из финансовых PDF: PaddleOCR → LLM-постобработка. Превзошёл baseline в ~70% случаев по распознаванию таблиц и ключевых полей — позволил частично заменить ручную обработку документов.
- ML Platform (versioning + feature monitoring): Реализовал mlpipeline: scikit-learn + MLflow + PostgreSQL с YAML-конфигом и веб-интерфейсом. MLflow Model Registry — версионирование моделей, feature drift мониторинг, трекинг экспериментов — сократил цикл итераций и операционную нагрузку при обновлении моделей в продакшне.
- Automated Data Acquisition (CV + Parsing): Разработал CNN-классификатор (Keras / TensorFlow, accuracy 91%) для автоматизации визуальной верификации при сборе данных — полная замена ручного труда для задач извлечения данных.
- Report Generation Microservice: Спроектировал и развернул микросервис генерации аналитических отчётов (FastAPI + Jinja2 + Streamlit) с поддержкой шаблонов и автоматической подстановкой данных из БД, заменив ручную сборку документов. Время подготовки отчётов сократилось на ~70%.
- Validation & A/B Testing: Внедрил PSI, VIF, PD и A/B-фреймворк для сравнения методологий — точность валидации +8%; 5+ улучшений приняты в официальную методологию агентства.
Дополнительные достижения
Автор статей, опубликованных в журналах ВАК по теме анализа и прогнозирования кредитных рейтингов
Английский язык — подтверждён сертификатом TOEFL
Победы и призовые места в олимпиадах:
- Всероссийская олимпиада «Я — профессионал» (направления: «Математическое моделирование» нужен доступ к резюме Призер)
- Международные и всероссийские олимпиады по прикладной математике, программированию и анализу данных
- Участие и призёрство в ICPC (International Collegiate Programming Contest)
- Руководство разработкой курсов по прикладной математике и численным методам для студентов технических направлений
Есть файл резюме (защищен)
Интересные кандидаты
- сD
специалист data science, ML-разработка
relocate remote office - па
продуктовый аналитик, data scientist
relocate remote parttime office - аSoffice
- ад
- ФА
ФИНАНСОВЫЙ АНАЛИТИК / КРЕДИТНЫЙ АНАЛИТИК / СПЕЦИАЛИСТ ПО РИСКАМ (RISK ANALYST) / АНДЕРРАЙТЕР
remote office - Ссrelocate remote parttime office
- Сб
Старший бизнес системный аналитик Senior business system analyst
remote parttime - Са
Старший аналитик данных/Senior Data Analyst
remote - Са
Старший аналитик DWH/Data Analyst
relocate remote - СА
Стажёр Аналитик данных/Data Engineer
remote parttime office
Мы используем куки, потому что без кук наш сайт не работал бы, другие сайты не работали бы, да и вообще весь
интернет не работал бы
