Если раньше искусственный интеллект вытеснял только переводчиков, работающих с текстами, то теперь и синхронистам стоит задуматься о будущем. Google разработал систему синхронного перевода человеческой речи Translatotron с озвучиванием результатов «на лету».
Как работает сервис
Translatotron переводит речь на одном языке в речь на другом. Промежуточное звено в виде текста исключается из цепочки – в нем нет необходимости.
Сервис запустили на базе проекта Duplex. Это расширение для интеллектуального помощника Google, впервые представленное в 2018 году. Duplex может связаться с рестораном, кафе, гостиницей и др, чтобы забронировать столик, номер или определенные услуги. Компьютерный голос воспроизводится реалистично, и собеседники Duplex не сразу понимают, что общаются с роботом.
Технологии Duplex и нейросетевую библиотеку TensorFlow использовали при создании Translatotron. Экспериментальная разработка, в сравнении с традиционными системами перевода, обладает более высокой скоростью работы.
Преимущества
В Translatotron удалось избежать накапливания ошибок между распознаванием и переводом. Специалисты добились лучшей обработки слов, которые не нужно переводить, и реализовали естественное озвучивание речи с сохранением интонации, высоты и тембра голоса. Улучшения качества устного перевода удалось добиться за счет реализации принципа «последовательность-в-последовательность». Человеческий мозг использует тот же принцип, переводя речь на лету.
Старые системы должны сначала распознать достаточно большой фрагмент речи, перевести его и озвучить, так что о синхронности приходилось забыть. «Последовательность-в-последовательность» работает эффективнее, чем традиционный подход из трех стадий.
Ждем в Google Translate
Google Translate постоянно совершенствуется. Он доступный, бесплатный, предлагается в различных форматах – от веб-интерфейса до мобильного приложения или расширения в браузере. Вполне возможно, что функциональность Translatotron хотя бы частично интегрируют в него. Это поможет понимать иностранцев на слух, если вы не разбираетесь в нюансах написания слов на иностранном языке.
В Google признали, что пока Translatotron работает хуже, чем Google Translate. Но препятствий для создания технологии перевода устной речи на уровне профессиональных синхронистов нет. Translatotron – скорее отправная точка, чем финальный результат работы.
Примеры перевода доступны на GitHub. Результаты работы Translatotron получили высокие баллы в системе оценки качества устного перевода алгоритмом BLEU.