ML/NLP/LLM-инженер (Python)

Санкт-Петербург, Россия
Джуниор • Миддл
Информационные технологии • Разработка • Backend • Python • SQL • Django • Flask • MySQL • PostgreSQL
Релокация • Удаленная работа • Частичная занятость • Работа в офисе
Опыт работы более 5 лет
Есть файл резюме (защищен)
О себе

На данный момент Главный специалист технической поддержки Управления международного сотрудничества.

Мои компетенции и опыт

Python-разработчик

Апрель 2024 — сейчас

Навыки:

- Python, NLP, промпт-инжиниринг, LLM (Ollama)

- Backend-фреймворки: FastAPI, Django, DRF, Flask

- ML/NLP-библиотеки: scikit-learn, pandas, numpy, NLTK, Gensim, TF-IDF

- Базы данных: PostgreSQL, SQLAlchemy, Alembic, asyncpg, SQL

- Инфраструктура: Docker, Docker Compose, CI/CD (GitHub Actions), Git

- Тестирование: Pytest, Unittest

- Асинхронное программирование: asyncio, Aiogram

- Визуализация: Matplotlib, Seaborn, PCA/t-SNE

 

Ключевые реализованные проекты:

Embedding Visualizer

[Gensim, scikit-learn, Matplotlib, NumPy, PCA, t-SNE]

Интерактивный инструмент для семантического анализа и визуализации векторных представлений слов (Word2Vec, GloVe). Реализованы автоматическая загрузка и кэширование предобученных моделей, поиск ближайших соседей и аналогий, 2D-визуализация векторных отношений (PCA/t-SNE) с построением семантических кластеров, а также оценка качества модели на наборе Google Analogy Test Set. Проект включает интуитивный командный интерфейс с демо-режимом, контекстной справкой и автоматическим сохранением графиков.

 

Movie Recommendation System

[scikit-learn, pandas, TF-IDF, Aiogram, Matplotlib]

End‑to‑end система рекомендации фильмов на основе текстовых данных (жанры, актерский состав). Реализованы два алгоритма (TF‑IDF + косинусная близость и взвешенный актерский состав) и два интерфейса — консольное приложение с визуализацией и полнофункциональный Telegram-бот.

 

Wallet REST API

[FastAPI, PostgreSQL, SQLAlchemy 2.0, asyncpg, Docker, Pytest]

Асинхронное высоконагруженное REST API для управления финансовыми балансами с гарантией консистентности данных при параллельных запросах. Реализованы конкурентная безопасность (транзакции READ COMMITTED, блокировки SELECT FOR UPDATE), полный CI/CD (Docker Compose, Alembic, GitHub Actions), автоматическая документация OpenAPI/Swagger, модульные и интеграционные тесты.

 

Video Analytics Bot

[Aiogram 3.7+, Ollama (Mistral 7B), PostgreSQL, asyncpg, промпт-инжиниринг]

Telegram-бот, преобразующий запросы на естественном языке в SQL-запросы к базе статистики видео. Использует локальную LLM для полной конфиденциальности и работы офлайн. Разработан детальный системный промпт, обеспечивающий стабильную генерацию SQL; асинхронная архитектура, оптимизированные индексы и пул соединений.

 

CountVectorizer Comparison

[scikit-learn, NLTK, pandas, Matplotlib, Seaborn]

Сравнительное исследование пяти методов предобработки текста (стемминг, лемматизация, удаление стоп-слов и др.) при векторизации новостных статей (датасет BBC News). Построен конвейер обработки, проведена оценка по точности, размеру словаря, скорости и плотности матрицы. Результаты визуализированы и оформлены в итоговый отчет.

 

Text Keyword Extractor

[scikit-learn, pandas, NLTK, TF-IDF]

Глубокий анализ алгоритма TF‑IDF: собственная реализация с нуля и детальное пошаговое сравнение с библиотечной версией scikit-learn. Разработан интерактивный CLI для извлечения ключевых слов, поиска документов, сравнения весов и формул. Проект демонстрирует понимание внутреннего устройства классических методов NLP и промышленных практик (NLTK, пагинация, модульная архитектура).

 

---

 

Gazprom International

Февраль 2014 — сейчас

Главный специалист технической поддержки Отдела технического перевода Управления международного сотрудничества

Особые достижения:

- разработал и внедрил в отделе систему учета трудозатрат на базе Excel, что позволило автоматизировать формирование отчетов и сократить время на их подготовку на 90%; система также повысила точность планирования загрузки переводчиков за счет использования исторических данных для прогнозирования

- внедрил в отделе систему автоматизированного перевода (CAT) Trados, с последующим переходом на отечественный Promt Translation Factory в рамках корпоративного курса на импортозамещение, что обеспечило унификацию терминологии за счет централизованных глоссариев, повышение качества и скорости перевода на 70% через переиспользование переводческих памятей, а также 100%-ную конфиденциальность корпоративных данных благодаря локальному развертыванию ПО на внутренних серверах компании

- организовал и внедрил в компании систему дистанционного письменного и устного перевода во время пандемии, что обеспечило непрерывность рабочих процессов и позволило компании выполнить 100% запланированных международных проектов без срывов сроков с сохранением операционной эффективности на прежнем уровне

Должностные обязанности:

- координация с командой разработки ПО Promt Translation Factory и управлением ИТ компании для устранения выявленных багов ПО и покрытия функционалом последующих версий ПО всех потребностей отдела

- анализ бизнес-процессов отдела и автоматизация рутинных задач (учет, отчетность, лингвистические процессы)

- техническая поддержка и администрирование корпоративного ПО для переводов

 

---

 

О себе

ML / NLP-инженер (Python) с подтвержденной квалификацией (диплом о профессиональной переподготовке, специализация Coursera по NLP и Generative AI), который видит за кодом бизнес-задачу. Специализируюсь на разработке и внедрении систем на основе больших языковых моделей (LLM) и классических методов NLP. Имею практический опыт применения машинного обучения (NLP, scikit-learn) и интеграции LLM (Ollama) для создания интеллектуальных функций.

Владею полным циклом создания production-сервисов «с нуля»: от проектирования архитектуры и бизнес-логики на Python (Django, FastAPI, Flask) и работы с базами данных (PostgreSQL, SQLAlchemy, Alembic) до контейнеризации (Docker, Docker Compose), развертывания и настройки CI/CD (GitHub Actions). Этот backend-фундамент позволяет мне не просто экспериментировать с моделями, а встраивать их в реальные, отказоустойчивые продукты.

Мой практический опыт включает полный цикл разработки — от проектирования архитектуры до работающего продукта, что подтверждают реализованные проекты. Более 12 лет работы в «Газпром Интернэшнл» сформировали системное мышление и умение решать сложные бизнес-задачи: я инициировал и внедрял IT-решения, которые дали измеримый результат (сокращение трудозатрат на 90%, повышение скорости работы на 70%).

Ищу позицию, где смогу применять свой уникальный опыт на стыке машинного обучения и промышленной разработки для создания интеллектуальных продуктов, решающих реальные проблемы бизнеса.



Есть файл резюме (защищен)


Интересные кандидаты