PROMT Neural
Инновационные технологиии перевода на основе нейронных сетей
PROMT Neural
Инновационные технологии перевода на основе нейронных сетей
Нейросетевой машинный перевод:
революция на наших глазах
Еще несколько десятилетий назад слово «переводчик» ассоциировалось исключительно с человеком. Но с появлением компьютеров начал развиваться компьютерный, или машинный, перевод: сначала в интересах спецслужб, а затем – науки, бизнеса и всех, кому доступен ПК.
В наши дни машинный перевод демонстрирует беспрецедентную скорость и столь же беспрецедентное качество. С помощью современных лингвистических решений за считанные секунды можно получить связный, гладкий и абсолютно точный текст на другом языке, не требующий редактирования человеком. Эту возможность нам дает применение нейронных сетей.
Краткая история машинного перевода*
c 1950 гг.
Rule-Based MT
Машинный акцент
в переводе,
предсказуемый
результат
ОБУЧЕНИЕ ЧЕРЕЗ
СЛОВАРИ
c 2000 гг.
Statistical MT
Более гладкий
перевод, чем в RBMT,
но
непредсказуемый
результат
ОБУЧЕНИЕ ЧЕРЕЗ
ПАРАЛЛЕЛЬНЫЕ ДАННЫЕ
c 2015 гг.
Neural MT
Абсолютно
гладкий текст,
без машинного
акцента
ОБУЧЕНИЕ ЧЕРЕЗ
ПАРАЛЛЕЛЬНЫЕ ДАННЫЕ
* Machine Translation = MT
Краткая история машинного перевода*
Rule-Based MT
Машинный акцент в переводе, предсказуемый результат
ОБУЧЕНИЕ ЧЕРЕЗ СЛОВАРИ
c 1950 гг.
Statistical MT
Более гладкий перевод, чем в RBMT, но непредсказуемый результат
ОБУЧЕНИЕ ЧЕРЕЗ ПАРАЛЛЕЛЬНЫЕ ДАННЫЕ
c 2000 гг.
Neural MT
Абсолютно гладкий текст, без машинного акцента
ОБУЧЕНИЕ ЧЕРЕЗ ПАРАЛЛЕЛЬНЫЕ ДАННЫЕ
c 2015 гг.
Драйверы перевода на основе нейронных сетей
Драйверы перевода на основе нейронных сетей
Рост
вычислительных
мощностей
Развитие
нейросетевых
технологий
ИИ в бизнесе: разрушая барьеры языковых границ
ИИ в бизнесе: разрушая барьеры языковых границ
ЛОКАЛИЗАЦИЯ
описания продуктов, товаров в интернет-магазинах, пользовательская документация, форумы, сайты
МЕЖДУНАРОДНОЕ СОТРУДНИЧЕСТВО
конфиденциальный перевод внутренней и внешней документации в режиме реального времени
ИНТЕГРАЦИЯ
машинный перевод в корпоративных порталах, системах электронного документооборота, системах BI, мобильных девайсах
Почему машинная обработка естественного языка сложная задача
Почему машинная обработка естественного языка сложная задача
МНОГООБРАЗИЕ КОНТЕНТА
Заголовки и большие тексты, распознанная устная речь, терминология из разных отраслей науки и бизнеса, деловой, научный стиль и сленг представляют собой «мини-языки» внутри большого языка
АСИММЕТРИЯ ЯЗЫКОВ
Разные языки по-разному описывают мир и используют разные подходы в морфологии, грамматике, синтаксисе, семантике.
СРЕДНЯЯ ДЛИНА СЛОВ В РАЗНЫХ
ЯЗЫКАХ
Увеличение или уменьшение количества символов в тексте перевода по сравнению с оригиналом влияет на сохранение форматирования документа при переводе.
ДАННЫЕ ДЛЯ ОБУЧЕНИЯ
Сложности в поиске и подборе данных для обучения и настройки систем на перевод под конкретные бизнес-задачи
PROMT Neural - новое слово в ИИ
PROMT Neural – это новая гибридная технология, которая объединяет нейросетевой подход и «перевод на основе правил» (RBMT). Алгоритмы PROMT Neural предварительно анализируют текст и решают, какая технология лучше подходит для перевода того или иного фрагмента текста.
ТРАНСФОРМЕР,
MARIAN NMT
АЛГОРИТМЫ
ГЛУБОКОГО СЕМАНТИКО-
СИНТАКСИЧЕСКОГО
АНАЛИЗА
PROMT Neural - новое слово в ИИ
PROMT Neural – это новая гибридная технология, которая объединяет нейросетевой подход и «перевод на основе правил» (RBMT). Алгоритмы PROMT Neural предварительно анализируют текст и решают, какая технология лучше подходит для перевода того или иного фрагмента текста.
АЛГОРИТМЫ
ГЛУБОКОГО СЕМАНТИКО-
СИНТАКСИЧЕСКОГО
АНАЛИЗА
Как работает PROMT Neural?