Корпорация Microsoft разработала переводчик с инновационной технологией распознавания голоса. Как сообщает Technology Review, программа может синтезировать речь и произносить ее голосом пользователя на другом языке.
Глава проекта Фрэнк Сунн рассказал, что переводчик сначала преобразует речь в текст, переводит его, а затем озвучивает, имитируя голос человека. "Чтобы научить пользователя говорить на другом языке, программе требуется около часа на получение образцов голоса", - отметил он.
На данный момент "умный" переводчик владеет 26 языками, в том числе испанским, итальянским, английским и мандаринским диалектом китайского языка. Эксперты отмечают, что новая технология Microsoft будет полезна путешественникам и людям, изучающим иностранный язык - она подскажет, как правильно следует произносить новые слова.
Оригинальная запись голоса руководителя отдела исследований Microsoft Рика Рашида
Сегодня на рынке уже присутствует несколько систем распознавания голоса, получивших весьма широкое распространение. В частности, технологии распознавания голоса Google применяются для осуществления голосового поиска и управления мобильной операционной системой Android. Эта система способна обучаться особенностям голоса пользователя, но ее основной минус заключается в том, что для работы она требует постоянного соединения с интернетом.
Системы распознавания голоса также используются в автомобильной промышленности: голосовое управление функциями автомобильных аудио- и навигационных систем реализовано в некоторых моделях BMW, Mercedes-Benz, Ford, Toyota и других.
По данным аналитической компании Global Industry Analysts, мировой объем рынка технологий распознавания голосовых команд к 2015 году составит 20 миллиардов долларов.