⚠︎ Архивная вакансия
Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете  найти актуальные похожие  вакансии

LLM Application Engineer

Прямой работодатель  Unimatch Lab ( unimatch.ai )
США
Сеньор
Информационные технологии • Разработка • Backend • Node.js • Python • ML/AI
10 декабря 2025
Удаленная работа
Опыт работы более 5 лет
4 500 $
Работодатель  Unimatch Lab
Описание вакансии

Unimatch Lab — венчурная AI‑студия из Кремниевой долины, которая за 24 месяца строит линейку из 100 вертикальных AI‑продуктов (HealthTech, LegalTech, HRTech, PropTech и др.). Ищем A‑Player LLM Application Engineer с опытом продакшн‑разработки AI‑приложений, кто умеет автономно принимать архитектурные решения, оптимизировать качество/стоимость LLM и использовать AI‑инструменты как часть рабочего процесса, а не «игрушку».

Технический профиль:

- 5+ лет в Python/Node.js (FastAPI, NestJS), уверенная работа с PostgreSQL, Redis, брокерами сообщений (Redis Streams/RabbitMQ/Kafka).

- Глубокий опыт с LangChain/LlamaIndex/AutoGen, RAG‑системами, векторными БД (ChromaDB, Pinecone, Weaviate, Qdrant), OpenAI/Anthropic/Azure OpenAI и on‑prem моделями.

- Настройка RAG‑пайтлайнов и hybrid search, промпт‑инжиниринг (Chain-of-Thought, Few‑Shot и др.), fine‑tuning через LoRA/QLoRA, работа с embeddings и интеграциями внешних API/инструментов.

Продакшн и качество:

- Продакшн‑деплой LLM (vLLM, TGI, Ollama, AWS/GCP), Docker/Kubernetes, CI/CD, MLOps (логирование, мониторинг, drift, версионирование моделей), observability (Prometheus, Grafana, Sentry).

- Unit/integration‑тесты (pytest/unittest, Jest/Supertest), валидация через Pydantic, code review и статический анализ (ESLint, Prettier, Black, Pylint).

Желательны: Notion/Slack API, Linux/SSH, serverless (Lambda/Workers/Vercel), оптимизация стоимости и latency LLM, опыт high‑load (от ~1k RPS).

Зона ответственности:

- Архитектура и разработка RAG‑систем и многошаговых AI‑агентов, интеграция LLM в продакшн‑сервисы (API‑слой, роутинг, fault‑tolerance, наблюдаемость).

- Fine‑tuning под домены, разработка и A/B‑тестирование промптов, оптимизация производительности и стоимости, сопровождение тестов.

- Участие в продуктовой и технической архитектуре, документация (API, релизы, инструкции по интеграции).

Условия:

- Доход от 4 500+ USDT/мес без жёсткого потолка, рост вместе с количеством продуктов и перформансом.

- Быстрый трек до Tech Lead и лидера продуктовой ветки из 3–5 AI‑продуктов с опционами/долей, команда A‑Players и минимальная бюрократия.

- Полностью удалённо и гибко по времени, фокус на результате и доступ к сильному AI/венчур‑нетворку.


Специализация
Информационные технологииРазработкаBackendNode.jsPython
Отрасль и сфера применения
ML/AI
Уровень должности
Сеньор