Data scientist

Россия
Джуниор
Аналитика, Data Science, Big Data • Data scientist • Data Science • Machine Learning • Python
Удаленная работа
Опыт работы от 1 года до 3х лет
66 000 ₽
Есть файл резюме (защищен)
О себе

На данный момент Data scientist.

Мои компетенции и опыт

Проектная деятельность

NLP-project "Talk and buy":
Telegram-чат-бот с тремя интентами - в зависимости от запроса пользователя Logistic Regression (accuracy нужен доступ к резюме ) разделяет действия на: поболтать / купить / сформулировать запрос четче. Далее NLP-модель на основе fastText либо разговаривает с юзером, либо предлагает подходящие товары на Юле, либо просит конкретизировать вопрос.
нужен доступ к резюме

CV-project "Insulators defects":
DL-модель multiclass классификации (RESNET18) дефектов электрических изоляторов. Работа с файлами, устранение дисбаланса классов, обучение и валидация на PyTorch, логирование метрик и лосса, tensorboard.
нужен доступ к резюме
 

ML-project "Number of days and churn prediction":
Построение моделей регрессии и классификации, способных предсказать количество дней до следующей покупки и отток действующих посетителей сети ресторанов. EDA, устранение дисбаланса классов, генерация признаков, catboost, метрики, кросс-валидация.
нужен доступ к резюме

 

RecSys-project "Anapskiy recommender":
Рекомендательная система по подбору фильма из TMDB с фильтрацией по году / жанру / названию. Обработка базы данных фильмов при помощи TfidfVectorizer, формирование датасета с cosine_similarity, деплой модели в веб-сервис фреймворком Streamlit.
нужен доступ к резюме

REST API on Flask project "Rice for Shell":
Классификация видов риса - выбран открытый датасет (Rice Cammeo and Osmancik), реализованы ноутбуки с сервером и клиентом, собраны пайплайны, обучена логистическая регрессия, запущен сервис, построен запрос, получено успешное предсказание.
нужен доступ к резюме

 

- Работаю с фреймворками PyTorch, TensorFlow, Keras для решения задач DL по NLP (seq2seq, NER, classification, summarization, sentiment analysis, relation extraction, QA & dialog generative systems), CV (classification, detection, segmentation), CNN, RNN, LSTM, GRU, GAN, Transformers.
- Занимаюсь ML (supervised / unsupervised learning, Linear Regression, Logistic Regression, Decision Tree, Gradient Boosting, RandomForest, CatBoost, XGBoost, LightGBM, TSNE, PCA, KMeans, Scikit-learn).
- Использую библиотеки numpy, pandas, matplotlib, seaborn, plotly, bar chart race, shap, eli5 для анализа и визуализации данных, EDA.
- Разрабатываю RecSys (детерминированные алгоритмы item-item, content based / collaborative filtering, гибридные и двухуровневые модели, surprise, Matrix Factorization-based algorithm SVD).
- Реализовываю RESTful API на базе Flask.
- Парсинг / кроулинг / скрапинг данных из Интернет (requests, BeautifulSoup, XPath, selenium, scrapy, MongoDB).
- Провожу A/B-тестирование с помощью доверительных интервалов, statsmodels, z-score, p-value, Pearson & Spearman correlation.
- Использую hydra, dataclasses, Pylint, Data Engineering для создания конфигов и построения проектов в PyCharm.
- Применяю SQL, Power BI, Linux, Git, HTML/CSS, основы языка R.

 

Культурный центр "Лидер"

Москва, кцлидер.окцюва нужен доступ к резюме /

Заместитель руководителя по IT-инфраструктуре и АХЧ

Вместе с командой:
- создал и модернизировал IT-инфраструктуру: локальная вычислительная сеть, сервер, хранилище
- апгрейдил парк ПК и оргтехники
- настроил helpdesk, систему электронного документооборота, корпоративную почту и чат
- обслуживал базы данных
- устанавливал и настраивал средства криптографической защиты информации
- разрабатывал нормативную базу по информационной безопасности
- внедрял в работу государственные информационные системы.

 

Моё главное преимущество - быстрая обучаемость и эффективное вхождение в новые процессы. Потому что обладаю критическим мышлением и аналитическим складом ума.

Могу быть полезен, так как умею парсить информацию; анализировать, обрабатывать и визуализировать данные; строить, обучать и валидировать ML/DL/RecSys-модели, оценивать их эффективность; применять математику, например, для выдвижения гипотез и A/B тестирования. Работаю на Python, знаю его ML-библиотеки и DL-фреймворки, SQL, Git.

Призер хакатона Минэкономразвития "Цифровой прорыв", нужен доступ к резюме - II место.
Имею опыт участия в соревнованиях на Kaggle.

Проекты можно посмотреть тут:
нужен доступ к резюме

Портфолио и сертификаты доступны по ссылке:
нужен доступ к резюме

От компании-работодателя ожидаю интересных прикладных задач, решение которых можно будет "пощупать", от которых будет реальная польза.


Специализация
Аналитика, Data Science, Big DataData scientistData ScienceMachine LearningPython
Отрасль и сфера применения

Уровень
Джуниор

Есть файл резюме (защищен)


Интересные кандидаты