Что такое автоматический синхрон?
Автоматическим синхроном называют синхронный автоматический перевод, который в свою очередь является моментальным машинным переводом речи с одного языка на другой посредством специального технического и программного инструментов.
Естественная речь отличается от печатного или искусственного текста неоднозначностью некоторых ее элементов, а также расчленения ее на части, ведь слова, фразы и фонемы могут не иметь явных физических границ. Слова в речи выделяются лишь в процессе распознавания с помощью подбора самой подходящей последовательности слов, которая лучше всего согласуется с исходным потоком речи по различным критериям – семантическим, акустическим и лингвистическим.
Первая программа для автоматического синхрона появилась в июне 2012 года в Германии. Это устройство переводило речь преподавателей Технологического института в Карлсруэ на английский, а также воспроизводило субтитры. В октябре того же года Microsoft представила автоматический голосовой переводчик с английского на язык путунхуа. Главным его отличием стала способность сохранять модуляции голоса говорящего. В ноябре 2012 открылся сервис японского NTT Docomo, который позволил своим абонентам общаться друг с другом без знания иностранного.
Механизм перевода речи состоит из трех этапов: перевод речи в текст, перевод текста, воспроизведение текста голосом. Самой сложной задачей является уход от дословного перевода и принятие во внимание всего контекста фразы.
Системы синхронного автоматического перевода включают в себя два компонента – автоматическое распознавание речи и машинный перевод. Они отличаются друг от друга принципами организации: часть работает на «клиенте», часть по принципу «клиент-сервер».
Конечной целью подобных автоматизированных переводческих систем является максимальное приближение к живому переводчику, то есть возможность распознавать слитную спонтанную речь. Автоматическое распознавание речи может быть привязано к голосу конкретного человека или не иметь такой привязки.
Самыми серьезными проблемами, которые стоят на пути к решению задачи создания идеального автоматического перевода могут быть как наивность пользователя, так и спонтанная, неграмотная, замусоренная речь, присутствие речевых, акустических искажений и помех, которые произвольно меняются.
Существующие системы автоматического перевода принято делить на несколько категорий:
- Rule-Based Machine Translation (RBMT) — система, основанная на наборе правил, описывающих языковые структуры и их взаимодействие.
- Example-Based MT (EBMT) — система, основанная на примере двух текстов, исходного и переведенного.
- Statistical Machine Translation (SMT) —способ механического перевода, в основе которого лежит сравнение массива языковых пар.
- Hybrid Machine Translation (SMT + RBMT) — гибридная модель машинного перевода, которая признана самой перспективной в настоящее время.