Top.Mail.Ru
Незаметная и незаменимая технология или Кому нужен машинный перевод в XXI веке

Незаметная и незаменимая технология

22.04.2019
22.04.2019

Давайте представим, что делал в середине XX века обыкновенный житель Лондона, не знающий французского языка, но которому нужно было срочно ознакомиться со статьей в Le Figaro. Или житель Москвы со скромным опытом изучения иностранных языков в средней школе, получивший доступ к научной литературе на английском языке. Как правило, люди искали того, кто знает иностранный язык. Это могли быть профессиональные переводчики на службе у москвича или личные знакомые британца, но в любом случае получение перевода – а значит и доступа к интересующей информации – представлял собой долгий путь, связанный как минимум с ожиданием, финансовыми затратами или некоторыми обязательствами по возмещению оказанной любезности.

Человечество мечтало о появлении волшебного устройства, которое сможет перевести текст с любого языка на любой, но только в XX веке появились все условия для быстрого развития и проникновения лингвистических технологий в нашу жизнь.

1950-60 годы: машинный перевод специального назначения

Первые практические шаги в машинном переводе связаны с периодом холодной войны. В эту эпоху машинный перевод был нужен, прежде всего, спецслужбам для разведывательной деятельности. Именно у них – доступ к конфиденциальной информации на разных языках, передовая для того времени техника и высокая потребность в переводе с помощью компьютера.

Вопрос перевода текста компьютером был важной задачей для разведки и обеспечения еще и потому, что эта технология помогла бы сохранить конфиденциальность переводимых данных, исключив участие третьих лиц, переводчиков, из работы с секретной информацией. Поэтому в 1950-60-е годы США, Япония, Канада, Германия, Франция и Советский Союз активно финансировали развитие технологий МП. По некоторым данным, только в США в исследования было вложено порядка 20 миллионов долларов, что по тем временам было весьма внушительной суммой.

Пионером машинного перевода выступил личный переводчик генерала Эйзенхауэра, профессор Джорджтаунского университета Леон Достер. В 1950-х годах он создал специальный аппарат, позволяющий переводить русские фразы на английский язык.

Аппарат опирался на шесть базовых правил и мог переводить только те предложения, на которые эти правила распространялись. Фразы на русском языке латиницей забивались в машину на перфокартах – перевод на английский язык можно было получить примерно через 10 минут.

Выглядело это так:

KRAXMAL VIRABATIVAETSYA MYEKHANYCHYESKIM PUTYEM YIZ KARTOFELYA

Starch is produced by mechanical methods from potatoes.

Публично работу машины для перевода продемонстрировали в 1954-м году в Нью-Йорке – в рамках Джорджтаунского эксперимента. Демонстрация возможностей нового аппарата стала настоящей сенсацией и привлекла внимание американских спецслужб. В конечном счете, власти США приняли решение о финансировании проекта.

1960-70 годы: машинный перевод на службе научно-технической революции

Начало 1960-х годов оказалось не самым благополучным периодом в истории машинного перевода. Результаты исследований тех лет не оправдали ожиданий, вызванных головокружительным успехом Джорджтаунского эксперимента, и финансирование проекта временно прекратилось. Первый американский специалист по машинному переводу, философ Иегошуа Бар-Хиллел заявил о бесперспективности МП. В подтверждение своих слов он привел пример. По словам Бар-Хиллела, компьютер не видит различий между фразами The box in the pen (коробка в манеже) и The pen in the box (ручка в коробке), и понять интуитивно, когда pen выступает в значении «манеж», а когда – «ручка» может только человек.

Несмотря на потерю интереса к машинному переводу со стороны американских властей, в 1960-70-е годы появились новые возможности для развития МП – благодаря пику научно-технической революции, начавшейся еще в 1940-50-е годы. В это время стало особенно понятно значение информации в жизни общества, началось широкое распространение автоматизации и компьютеризации, и данные начали переходить в цифровое пространство.

В цифровом формате научные знания стали более доступными для ученых и исследовательских организаций по всему миру – специалисты могли знакомиться с международными архивными данными, результатами исследований и экспериментов с помощью компьютера. Но научные знания были представлены на разных языках, поэтому проблема языкового барьера вновь стала актуальной.

В цифровом формате научные знания стали более доступными для ученых и исследовательских организаций по всему миру – специалисты могли знакомиться с международными архивными данными, информацией из реферативных журналов,  результатами исследований и экспериментов с помощью компьютера. Но научные знания были представлены на разных языках, поэтому проблема языкового барьера вновь стала актуальной.

1970-90 годы: машинный перевод для персональных компьютеров

Первые прототипы современных персональных компьютеров начали появляться еще в 1970-х годах, однако активно ПК распространились в 1980-е годы в западных странах. Теперь  позволить себе вычислительную машину могли не только агенты спецслужб и научные институты, но и рядовые пользователи. 

Этот факт не мог не отразиться на бизнесе – как крупном, так и среднем и малом. С распространением компьютеров и появлением интернета складывались предпосылки для развития машинного перевода, который мог бы не только облегчить компаниям выход на рынки других стран, но и помочь частным пользователям в преодолении языковых барьеров.

В это время  в ряде стран появляются коммерческие компании, разрабатывающие программы для МП для персональных компьютеров: Systran, Personal Translator, Linguatek, PROMT и другие. К концу 1990-х, с  активным распространением интернета, появляются и первые онлайн-сервисы перевода: AltaVista запускает сервис на базе технологий Systran в декабре 1998 г., а компания PROMT в марте 1999 года – первый онлайн-переводчик Рунета Translate.Ru.

XXI век: незаменимая и незаметная технология

По данным отчета Global digital, по состоянию на январь 2018 года, число интернет-пользователей в мире составило 4,021 миллиарда человек при общей численности населения планеты в 7,6 миллиарда. При этом подавляющее большинство веб-сайтов в мире используют английский язык: по данным исследования W3 Techs, проведенного в 2017 году, их доля составила 51,52%. Второе место у русского и немецкого языков (по 5,9%).

Первые социальные сети и мессенджеры, которые сегодня стали неотъемлемой частью нашей жизни, начали появляться в начале 2000-х годов. Сегодня благодаря подобным сервисам можно быстро и легко связаться с человеком из любой страны – достаточно лишь знать иностранный язык.

Увеличились и возможности для предпринимателей. Чтобы расширить географию бизнеса, достаточно открыть интернет-магазин, запустить онлайн-сервис, доступный в любой стране  или наладить работу через местного партнера. Технологии машинного перевода стали ценным инструментом и для предпринимательской деятельности.

На фоне активной дигитализации контента, роста вычислительных мощностей компьютеров, расширения потребностей пользователей можно с уверенностью утверждать, что технологии машинного перевода превратились в незаметный и незаменимый инструмент, применяемый в разных сферах деятельности человека. Если в 1950-е годы компьютер смог перевести лишь 60 предложений с русского на английский, то сегодня МП может переводить документы, сайты, огромные массивы данных (Big Data) и даже речь. 

Возврат к списку