⚠︎ Архивная вакансия
Эта вакансия была перемещена в архив. Возможно она уже не актуальна и рекрутер больше не принимает отклики на эту вакансию. Вы можете  найти актуальные похожие  вакансии

Data Science

Прямой работодатель  Философия ИТ ( www.fil-it.ru )
Миддл • Сеньор
Аналитика, Data Science, Big Data • Scala • Java • Python • Data scientist • Hadoop • Apache Spark • Greenplum • Spark • Консалтинг, профессиональные услуги
19 сентября 2022
Удаленная работа
Опыт работы от 1 года до 3х лет
Работодатель  Философия ИТ
Описание вакансии

Наша команда создает высоконагруженную информационную платформу для решения аналитических и исследовательских задач в области создания продуктов и услуг на мировых финансовых рынках: торговля валютой, ценными бумагами, производными финансовыми инструментами. Мы используем последние достижения в области Big Data, Highload и Machine Learning.
Этот бизнес потребляет и порождает огромное количество данных, которые должны обрабатываться c целью:

  • Разработки устойчивых потоков данных и моделей машинного обучения;
  • Визуализация данных с помощью BI инструментов;
  • Поддержки регулярных бизнес-операций;
  • Проведения Ad hoc анализа;
  • Подготовки аналитической и управленческой отчетности;

 

 


Вы сможете изнутри посмотреть, как работает глобальный финансовый рынок и получить опыт работы, востребованный в финансовых организациях по всему миру. Дополнительная информация: В деп-те загружают хранилище данных, которое основано на гринплане, Делают загрузку репликаций данных для того, чтобы модели машинного обучения могли создавать прогнозы . 2-е направление постановка модели машинного обучения на поток. Все хранится в гринплане.
Модели написаны на питоне. Модели хранят свои прогнозы на гринплане.

 

Стек

  • SQL+PL/SQL Greenplum, Teradata, MSSQL, MySQL, SQLite;
  • DWH+ETL работа с хранилищами данных;
  • Hadoop Hive, Impala, Spark, Oozie;
  • Python pandas, numpy, pyspark;
  • Machine Learning;
  • Основы машинного обучения, понимание кода моделей ML на Python;

 

Знание одного из языков: Python, Java, Scala, предстоит работать с кодом на Python (рефакторинг). 

Задачи: Рефакторинг прототипов моделей машинного обучения от команды DataScience – адаптация кода к пайплайну поставки моделей в промышленную эксплуатацию с сохранением результатов и оценки моделей в хранилище Greenplum (MLOps)