специалист Data Science

Уфа, Россия
Стажер • Джуниор
Аналитика, Data Science, Big Data • Data scientist
Удаленная работа • Работа в офисе
Опыт работы менее 1 года
55 000 ₽
Есть файл резюме (защищен)
О себе

На данный момент Программист битрикс.

Мои компетенции и опыт

Опыт в Data science

Апрель 2021 – Настоящее время — pet-проекты

Проект №1

нужен доступ к резюме - Определение вероятности попасть web-страницы на первую страницы поисковой выдачи Яндекса.

Цель проекта – пройти полный путь по работе с данными: от сбора информации до развёртывания приложения на хостинге. 

  • Сбор данных –API Яндекс.Директ, selenium для сбора контента с web-страниц
  • Анализ и обработка данных – pandas, nltk. Подсчет количества слов. Удаление стопслов. Расчёт водности, спамности текста, также плотности запросов и показатель TF-IDF.
  • Подготовка модели -sklearn, joblib, pickle. Стандартизация и upsampleданных. Использование метода бэггинга для определения вероятности попасть на первую страницу.
  • Размещение модели -Heroku, Flask, API. Приложение размещено на сервисе Heroku. Приложение и его API сделано на микрофреймворке Flask.

Помимо вероятности попасть на первую страницу, приложение выдает значения водности, спамности контента и плотности и TF-IDF запроса указанной web-страницы, а также рекомендованные значения перечисленных характеристик для выбранного поискового запроса.

Приложение нужен доступ к резюме (тариф хостинга бесплатный, поэтому первое обращение к сайту может выполняться около одной минуты)

 

Проект №2

нужен доступ к резюме - Соревнование на сайте kaggle. Предсказание клика клиентом на кнопку покупки.

Имеющиеся признаки были перемножены и просуммированы для получения дополнительных признаков.

Был использован генетический алгоритм для отбора лучших признаков.

 

Октябрь 2019 – май 2020Яндекс.Практикум «Специалист DataScience»

В ходе прохождения курсов были выполнены 15 проектов. нужен доступ к резюме
Типы решенных задач:

  • Анализ данных
  • A/B тестирование гипотез
  • Анализ временных рядов
  • Обучение моделей классификации и регрессии
  • Классификация текстовых данных
  • Определение возраста по фотографии человека

Стектехнологий:

pandas, numpy, seaborn, matplotlib, scikit-learn, statsmodels, scipy, lightgbm, catboost, xgboost, tensorflow, nltk

нужен доступ к резюме ----

Другой опыт работы:

Web-программист (Май 2017 — по настоящее время)

Делаю сайты делал на различных CMS: Битрикс, modx evo, wordpress.
Основной стек технологий:
php, javascript, html, css.

Из области Data Science в этой работе применяю python для быстрого написания программ, для изучения данных использую pandas и SQL для отбора или изменения данных в БД сайтов.

нужен доступ к резюме ----

Инженер-конструктор (Февраль 2016 — май 2017)

Работа с тех.документацией.

Используемое ПО:
Компас, P-CAD

 


Специализация
Аналитика, Data Science, Big DataData scientist
Отрасль и сфера применения

Уровень
СтажерДжуниор

Есть файл резюме (защищен)


Интересные кандидаты