⚠︎ Архивное резюме
Это резюме было перемещено в архив и исключено из общего списка. Оно не актуально на текущий момент

Data Scientist / Data Engineer / Data Analyst

Санкт-Петербург, Россия
Джуниор
Аналитика, Data Science, Big Data • Data scientist • Аналитик • Инженер • Исследователь • Data Science • Machine Learning • Python • MySQL • PostgreSQL • Spark
Релокация • Удаленная работа • Работа в офисе
Опыт работы от 1 года до 3х лет
О себе

На данный момент В поиске работы.

Мои компетенции и опыт

Всегда интересовался компьютерами и IT в целом. В армию шел в надежде совмещать желание служить родине и страсть к технологиям. К сожалению там это оказалось не востребовано, поэтому хочу изменить направление деятельности на Data Science.
Коммуникабельный, дисциплинированный, очень не люблю халатность в работе и срывы установленных сроков, целеустремленный, надежный, быстро обучаюсь, очень хочу развиваться как специалист, нормально воспринимаю конструктивную критику, делаю выводы и стараюсь самосовершенствоваться.
В свободное от работы время учусь играть на ударной установке.
Слежу за новостями из мира IT, мечтаю достичь уровня знаний Валерия Бабушкина, Анатолия Карпова. Для расширения понимания слежу за каналами 3Blue1Brown, SelfDu, ODS AI и многими другими. Прочитал книги Джоэла Граса : Data Science с нуля, Орельена Жерона : прикладное машинное обучение с помощью Scikit-learn и TensorFlow, Дж.Вандера Пласа : Python для сложных задач.

 

с февраля 2020 Яндекс.Практикум, Data Scientist (обучение)

Обязанности:
- извлечение данных из разных источников;
- предварительная обработка данных;
- исследовательский анализ данных;
- формулировка и проверка статистических гипотез;
- построение пайплайна подготовки данных для машинного обучения, определение подходящих метрик;
- обучение моделей, их валидация.

Результаты и достижения:
- получил сертификат о профессиональной переподготовке по специальности Data Science ( нужен доступ к резюме );
- за время обучения на Я.П. выполнил 15 проектов из разных областей Data Science;
- самостоятельно прошел ряд курсов на платформе Stepic для закрепления полученных знаний в предметной области.

Примеры реализованных проектов:
Отток клиентов банка ( нужен доступ к резюме ):
Из банка стали уходить клиенты каждый месяц.
Спрогнозирована вероятность ухода клиента из банка в ближайшее время.
Построена модель с предельно большим значением F1-меры с последующей проверкой на тестовой выборке. Доведена метрика до нужен доступ к резюме
Дополнительно измерен AUC-ROC, соотнесен с F1-мерой.
Стек технологий: python, pandas, matplotlib, numpy, sklearn, math.

Предсказание цены автомобиля ( нужен доступ к резюме ):
Сервис по продаже автомобилей с пробегом разрабатывает приложение для привлечения новых клиентов. В нём можно быстро узнать рыночную стоимость своего автомобиля.
Проанализированы данные: технические характеристики, комплектации и цены автомобилей. Построена модель для определения стоимости автомобиля с пробегом.
Использованы численные методы, приближённые вычисления, оценка сложности алгоритма, градиентный спуск.
Стек технологий: python, pandas, sklearn, numpy, LightGBM, CatBoost, XGBoost.

Определение возраста по фото ( нужен доступ к резюме ):
Сетевой супермаркет внедряет систему компьютерного зрения для обработки фотографий покупателей. Фотофиксация в прикассовой зоне поможет определять возраст клиентов, чтобы:
•Анализировать покупки и предлагать товары, которые могут заинтересовать покупателей этой возрастной группы;
•Контролировать добросовестность кассиров при продаже алкоголя.
Построена модель, которая по фотографии определит приблизительный возраст человека.
Проанализирован набор фотографий людей с указанием возраста при помощи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras.
Стек технологий: python, pandas, keras, matplotlib, ResNet50.

Исследование надёжности заёмщиков — анализ банковских данных ( нужен доступ к резюме ):
Входные данные от кредитного отдела банка — статистика о платёжеспособности клиентов.
Очищены данные от выбросов, пропусков и дубликатов, а также преобразованы разные форматы данных. Заменены типы данных на соответствующие хранящимся данным. Удалены дубликаты. Выделены леммы в значениях столбца и категоризированны данные.
Определена доля кредитоспособных клиентов.
Проанализировано влияние семейного положения и количества детей клиента на факт возврата кредита в срок.
Построена модель кредитного скоринга — специальной системы, которая оценивает способность потенциального заёмщика вернуть кредит банку.
Стек технологий: python, pandas, PyMystem3, лемматизация, SciPy, matplotlib, SciKitLearn, numpy.



Интересные кандидаты