Data Scientist

Санкт-Петербург, Россия
Миддл • Сеньор
20 сентября в 09:57
Работа в офисе
Опыт работы от 1 года до 3х лет
Работодатель: ПАО "СБЕРБАНК"
Описание вакансии

Задачи:
• Участие в постановке задачи и ее бизнес применения;
• Построение и поддержка аналитических моделей (Python + Spark и тд);
• Построение аналитических отчетов по результатам проведенной работы;
• Обеспечение четкого и подробного документирования результатов моделирования для передачи на автоматизацию.

Основные требования:
1) Опыт работы в области DS от 1 года (или профильное обучение);
2) Работа с данными
- Знание SQL, по убыванию приоритета необходимо: Простые запросы, Join'ы, агрегаты, группировки, вложенные запросы, индексы;
- Знание python: стандартные структуры данных (dict, list, set, модуль collections), pandas, numpy, h5py;
- Знакомство с форматами данных: сsv и разновидности, json, yaml, parquet, orc;
- Знакомство с bash: базовые комманды для работы с файлами и процессами (cd, cp, mv, ls, rm, grep, head, tail, tr, du, df, free, top, ps, kill, locate) - нужно для работы на кластере;
-Опыт работы с Hadoop (Hive, Spark, HBase) является плюсом.

3) Моделирование:
- Feature Enginering: - методы оценки значимости и отбора признаков, методы уменьшения размерности, приемы работы с текстом;
- Model - различать основные классы задач (регрессия, классификация, кластеризация) и уметь формулировать бизнес-задачу в их терминах. Знать основные методы и знать api по их использованию;
Знать методы работы с временными рядами;
- Python - sklearn, numpy, scipy, xgboost (в порядке убывания приоритета)

4) Evaluation:
- Различать методы оценки качества модели под основные классы задач и понимать плюсы и минусы их применения. (f1, precision, recall, roc auc, mse, rmse, silhouette..)

5) Инструменты для организации и автоматизации работы: GridSearch, pipelines, ide, git.

➕требуется владение English на уровне чтения технической документации.

Условия:
• Официальное трудоустройство, согласно ТК РФ;
• Возможность профессионального и карьерного развития;
• Премирование (квартальное, годовое);
• Социальный пакет (ДМС; санаторно-курортный отдых и т.д.);
• Корпоративное обучение;
• Активная корпоративная жизнь Банка (спортивные мероприятия, внутренние конкурсы и пр.);
• Место работы: г. Санкт-Петербург.


Специализация
Аналитика, Data Science, Big DataData scientistMachine LearningPythonSQL
Отрасль и сфера применения
ML/AINatural Language Processing (NLP)
Уровень должности
МиддлСеньор