специалист Data Science
Уфа, РоссияСтажер • Джуниор
Удаленная работа • Работа в офисе
Опыт работы менее 1 года55 000 ₽
Опыт работы менее 1 года55 000 ₽
Есть файл резюме (защищен)
Короткая ссылка: gkjb.ru/gRgR
О себе
На данный момент Программист битрикс.
Мои компетенции и опыт
Опыт в Data science
Апрель 2021 – Настоящее время — pet-проекты
Проект №1
нужен доступ к резюме - Определение вероятности попасть web-страницы на первую страницы поисковой выдачи Яндекса.
Цель проекта – пройти полный путь по работе с данными: от сбора информации до развёртывания приложения на хостинге.
- Сбор данных –API Яндекс.Директ, selenium для сбора контента с web-страниц
- Анализ и обработка данных – pandas, nltk. Подсчет количества слов. Удаление стопслов. Расчёт водности, спамности текста, также плотности запросов и показатель TF-IDF.
- Подготовка модели -sklearn, joblib, pickle. Стандартизация и upsampleданных. Использование метода бэггинга для определения вероятности попасть на первую страницу.
- Размещение модели -Heroku, Flask, API. Приложение размещено на сервисе Heroku. Приложение и его API сделано на микрофреймворке Flask.
Помимо вероятности попасть на первую страницу, приложение выдает значения водности, спамности контента и плотности и TF-IDF запроса указанной web-страницы, а также рекомендованные значения перечисленных характеристик для выбранного поискового запроса.
Приложение нужен доступ к резюме (тариф хостинга бесплатный, поэтому первое обращение к сайту может выполняться около одной минуты)
Проект №2
нужен доступ к резюме - Соревнование на сайте kaggle. Предсказание клика клиентом на кнопку покупки.
Имеющиеся признаки были перемножены и просуммированы для получения дополнительных признаков.
Был использован генетический алгоритм для отбора лучших признаков.
Октябрь 2019 – май 2020 — Яндекс.Практикум «Специалист DataScience»
В ходе прохождения курсов были выполнены 15 проектов. нужен доступ к резюме
Типы решенных задач:
- Анализ данных
- A/B тестирование гипотез
- Анализ временных рядов
- Обучение моделей классификации и регрессии
- Классификация текстовых данных
- Определение возраста по фотографии человека
Стектехнологий:
pandas, numpy, seaborn, matplotlib, scikit-learn, statsmodels, scipy, lightgbm, catboost, xgboost, tensorflow, nltk
Другой опыт работы:
Web-программист (Май 2017 — по настоящее время)
Делаю сайты делал на различных CMS: Битрикс, modx evo, wordpress.
Основной стек технологий:
php, javascript, html, css.
Из области Data Science в этой работе применяю python для быстрого написания программ, для изучения данных использую pandas и SQL для отбора или изменения данных в БД сайтов.
Инженер-конструктор (Февраль 2016 — май 2017)
Работа с тех.документацией.
Используемое ПО:
Компас, P-CAD
Есть файл резюме (защищен)
Интересные кандидаты
- ст
специалист технической поддержки
parttime - спremote parttime office
- сп
специалист по работе с нейросетями, аналитик
remote parttime office - сп
специалист по контекстной рекламе
remote parttime - свremote office
- пи
помощник интернет маркетолога, ppc-специалист, контекстолог
remote parttime - нсremote
- кр
копирайтер, редактор, автор, SMM-специалист
remote - ад
аналитик данных, data scientist
remote parttime office - Тп
Тренинг-менеджер/специалист по обучению персонала
remote office
Мы используем куки, потому что без кук наш сайт не работал бы, другие сайты не работали бы, да и вообще весь
интернет не работал бы