Data Science
Прямой работодатель Философия ИТ ( www.fil-it.ru )
Опыт работы от 1 года до 3х лет
Наша команда создает высоконагруженную информационную платформу для решения аналитических и исследовательских задач в области создания продуктов и услуг на мировых финансовых рынках: торговля валютой, ценными бумагами, производными финансовыми инструментами. Мы используем последние достижения в области Big Data, Highload и Machine Learning.
Этот бизнес потребляет и порождает огромное количество данных, которые должны обрабатываться c целью:
- Разработки устойчивых потоков данных и моделей машинного обучения;
- Визуализация данных с помощью BI инструментов;
- Поддержки регулярных бизнес-операций;
- Проведения Ad hoc анализа;
- Подготовки аналитической и управленческой отчетности;
Вы сможете изнутри посмотреть, как работает глобальный финансовый рынок и получить опыт работы, востребованный в финансовых организациях по всему миру. Дополнительная информация: В деп-те загружают хранилище данных, которое основано на гринплане, Делают загрузку репликаций данных для того, чтобы модели машинного обучения могли создавать прогнозы . 2-е направление постановка модели машинного обучения на поток. Все хранится в гринплане.
Модели написаны на питоне. Модели хранят свои прогнозы на гринплане.
Стек
- SQL+PL/SQL Greenplum, Teradata, MSSQL, MySQL, SQLite;
- DWH+ETL работа с хранилищами данных;
- Hadoop Hive, Impala, Spark, Oozie;
- Python pandas, numpy, pyspark;
- Machine Learning;
- Основы машинного обучения, понимание кода моделей ML на Python;
Знание одного из языков: Python, Java, Scala, предстоит работать с кодом на Python (рефакторинг).
Задачи: Рефакторинг прототипов моделей машинного обучения от команды DataScience – адаптация кода к пайплайну поставки моделей в промышленную эксплуатацию с сохранением результатов и оценки моделей в хранилище Greenplum (MLOps)