"Яндекс" презентовал сервис для перевода устной речи в текст
Компания «Яндекс» на технологической конференции Yet Another Conference презентовала новое мобильное приложение «Яндекс.Диктовка». Новый сервис позволяет распознавать и синтезировать речь.
Для активации приложения нужно воспользоваться специальной голосовой командой «Яндекс, записывай», после чего пользователь сможет продиктовать устройству текст. Кроме того, приложение поддерживает функции отправки СМС-сообщений и писем, а также дает возможность размещать комментарии в социальных сетях. Программа самостоятельно проверяет пунктуацию и расставляет знаки препинания. Дополнительные голосовые команды позволяют редактировать текст, а в конце сессии можно будет прослушать результат расшифровки речи.
Сейчас приложение «Яндекс.Диктовка» работает только на платформе Android и доступно для скачивания в Yandex.Store. В ближайшее время планируется адаптировать программу для остальных мобильных операционных систем. Некоторое время приложение будет функционировать в демонстрационном режиме.
В основе «Яндекс.Диктовки» лежит технология SpeechKit, представленная компанией в 2013 г. Она позволяет использовать речевые технологии в приложениях для iOS, Android и Windows Phone. Система SpeechKit нашла применение приблизительно в 500 приложениях для смартфонов и планшетов, куда входят как приложения Яндекса (Навигатор, Браузер, Город, Карты и Поиск), так и программы сторонних разработчиков.
В августе 2014 г. компания «Яндекс» объявила о запуске SpeechKit Cloud — облачного сервиса распознавания речи. Благодаря SpeechKit Cloud можно добавить функцию распознавания речи в различные программы и устройства. Программа значительно упрощает работу в колл-центрах, позволяя пропустить этап прослушивания инструкций, а также полезна в интернет-магазинах, где с ее помощью можно автоматизировать процесс подтверждения заказов.
Отметим, что подобные технологии разрабатывали и другие компании, в частности Nuance Communications, специализирующаяся на распознавании речи. Программы Nuance применяются в автоматизированных колл-центрах и виртуальных онлайн-ассистентах авиалиний и банков.
Технология распознавания речи имеет большие перспективы развития. Большую долю на этом стремительно растущем рынке займут игроки, которые смогут решить две основные задачи: качественно расшифровывать речь и переводить ее в текст, а также успешно идентифицировать голос пользователя.
Оставить комментарий
Ваш комментарий будет опубликован после модерации.