Специалист ИТ (составление датасетов)

Прямой работодатель  Localtrans.ru ( localtrans.ru )
Москва, Россия
Сеньор
Аналитика, Data Science, Big Data • ML/AI • Data Analysis
12 сентября
Удаленная работа • Частичная занятость
Опыт работы от 1 года до 3х лет
Работодатель  Localtrans.ru
Описание вакансии

Составить 11 двуязычных датасетов для обучения модели машинного перевода. Нужны датасеты для следующих языковых пар, каждый объемом примерно 1 миллион слов (от 20.000 строк):
 

  • Русский -> Английский (RU-EN)
  • Венгерский -> Английский (HU-EN)
  • Китайский -> Английский (CN-EN)
  • Арабский -> Английский (AR-EN)
  • Корейский -> Английский (KO-EN)
  • Французский -> Английский (FR-EN)
  • Испанский -> Английский (ES-EN)
  • Итальянский -> Английский (IT-EN)
  • Немецкий -> Английский (DE-EN)
  • Турецкий -> Английский (TR-EN)
  • Японский -> Английский (JP-EN)
     

Готовы рассмотреть как готовые датасеты, так и собранные с нуля через веб-краулинг + выравнивание. Также готовы разделить задачу между несколькими исполнителями.

Тематика контента: кибербезопасность. Любой профессиональный контент в этой области.


Специализация
Аналитика, Data Science, Big Data
Отрасль и сфера применения
ML/AIData Analysis
Уровень должности
Сеньор
Загрузка формы отклика...