Microsoft разработала новую технологию распознавания голоса

Владимир Биль

Корпорация Microsoft разработала переводчик с инновационной технологией распознавания голоса. Как сообщает Technology Review, программа может синтезировать речь и произносить ее голосом пользователя на другом языке.

Глава проекта Фрэнк Сунн рассказал, что переводчик сначала преобразует речь в текст, переводит его, а затем озвучивает, имитируя голос человека. "Чтобы научить пользователя говорить на другом языке, программе требуется около часа на получение образцов голоса", - отметил он.

На данный момент "умный" переводчик владеет 26 языками, в том числе испанским, итальянским, английским и мандаринским диалектом китайского языка. Эксперты отмечают, что новая технология Microsoft будет полезна путешественникам и людям, изучающим иностранный язык - она подскажет, как правильно следует произносить новые слова.

Оригинальная запись голоса руководителя отдела исследований Microsoft Рика Рашида

Сегодня на рынке уже присутствует несколько систем распознавания голоса, получивших весьма широкое распространение. В частности, технологии распознавания голоса Google применяются для осуществления голосового поиска и управления мобильной операционной системой Android. Эта система способна обучаться особенностям голоса пользователя, но ее основной минус заключается в том, что для работы она требует постоянного соединения с интернетом.

Системы распознавания голоса также используются в автомобильной промышленности: голосовое управление функциями автомобильных аудио- и навигационных систем реализовано в некоторых моделях BMW, Mercedes-Benz, Ford, Toyota и других.

По данным аналитической компании Global Industry Analysts, мировой объем рынка технологий распознавания голосовых команд к 2015 году составит 20 миллиардов долларов.

Технологии Microsoft