Онлайн превод голоса

Распознавание речи, одна из самых старых задач, над которой бьются разработчики всего мира уже не первый год. Если с распознаванием текста, дела обстоят еще более- менее, то с распознаванием голоса человека все не так уж радужно. С переводчиками тестов и голоса, ситуация аналогичная, не смотря на усилия многих игроков рынка, так что появление на свет новейшей технологии должно изменить эту ситуацию, а в скором времени и мир.

Интернет вещей

Это то, что очень ждали разработчики. Появление на рынке качественного инструмента для распознавания речи выводит на новый уровень развитие интернета вещей, долой кнопки и пульты, тачскрины и джойстики! Даешь голосовое управление!

CLOUD SPEECH API

И так, что мы имеем? CLOUD SPEECH API, поддерживает распознавание 80-ти языков, технология позволяет распознавать не только аудиофайлы, но и голос в режиме онлайн с поддержкой нескольких форматов.

На выходе мы получаем текст, который потом можно спокойно конвертировать в команды для исполнительных механизмов умного дома либо другой автоматизации, ну и конечно можно использовать для общения добавив перевод тестов. Когда вы говорите с японцем или испанцем, на экране его смартфона будет выдаваться текст перевода. Представьте себе мнногонациональные конференции, семинары или вэбинары с использованием такого голосового переводчика в онлайн режиме!

Технологически, CLOUD SPEECH API выглядит как облачная нейронная сеть, которая будет постоянно обучаться и улучшать качество выдаваемых текстов, фильтрация шума и помех уже заложена в технологию, для использования достаточно простого микрофона или гарнитуры, специального оборудования не потребуется.

Мировые игроки рынка распознавания речи напряглись, сторонние разработчики потирают руки, IoT становится ближе с каждым днем, спасибо Google!

Создано:

Автор