Как оплатить? → Статьи и обзоры → Изучайте компьютер!

"Яндекс" презентовал сервис для перевода устной речи в текст

http://i.rbc.ru/

31.10.2014

Компания «Яндекс» на технологической конференции Yet Another Conference презентовала новое мобильное приложение «Яндекс.Диктовка». Новый сервис позволяет распознавать и синтезировать речь.

Для активации приложения нужно воспользоваться специальной голосовой командой «Яндекс, записывай», после чего пользователь сможет продиктовать устройству текст. Кроме того, приложение поддерживает функции отправки СМС-сообщений и писем, а также дает возможность размещать комментарии в социальных сетях. Программа самостоятельно проверяет пунктуацию и расставляет знаки препинания. Дополнительные голосовые команды позволяют редактировать текст, а в конце сессии можно будет прослушать результат расшифровки речи.

Сейчас приложение «Яндекс.Диктовка» работает только на платформе Android и доступно для скачивания в Yandex.Store. В ближайшее время планируется адаптировать программу для остальных мобильных операционных систем. Некоторое время приложение будет функционировать в демонстрационном режиме.

В основе «Яндекс.Диктовки» лежит технология SpeechKit, представленная компанией в 2013 г. Она позволяет использовать речевые технологии в приложениях для iOS, Android и Windows Phone. Система SpeechKit нашла применение приблизительно в 500 приложениях для смартфонов и планшетов, куда входят как приложения Яндекса (Навигатор, Браузер, Город, Карты и Поиск), так и программы сторонних разработчиков.

В августе 2014 г. компания «Яндекс» объявила о запуске SpeechKit Cloud — облачного сервиса распознавания речи. Благодаря SpeechKit Cloud можно добавить функцию распознавания речи в различные программы и устройства. Программа значительно упрощает работу в колл-центрах, позволяя пропустить этап прослушивания инструкций, а также полезна в интернет-магазинах, где с ее помощью можно автоматизировать процесс подтверждения заказов.

Отметим, что подобные технологии разрабатывали и другие компании, в частности Nuance Communications, специализирующаяся на распознавании речи. Программы Nuance применяются в автоматизированных колл-центрах и виртуальных онлайн-ассистентах авиалиний и банков.

Технология распознавания речи имеет большие перспективы развития. Большую долю на этом стремительно растущем рынке займут игроки, которые смогут решить две основные задачи: качественно расшифровывать речь и переводить ее в текст, а также успешно идентифицировать голос пользователя.

← назад

оглавление

Оставить комментарий

Ваш комментарий будет опубликован после модерации.

Пишите нам:

Звоните нам по тел. +7 (495) 995-82-95. Мы работаем круглосуточно. Прямо сейчас на все Ваши вопросы готова ответить наша служба поддержки:
Круглосуточная трансляция из офиса «ЭргоСОЛО»

Поможем бросить курить

Все права на материалы, находящиеся на сайте ergosolo.ru, охраняются в соответствии с законодательством РФ, в том числе, об авторском праве и смежных правах.
Использование материалов сайта без разрешения ООО "ЭргоСоло" ЗАПРЕЩЕНО!