Разработки в области голосового ввода текстов и распознавания голосов в текст из аудио и видео конечно-же ведутся, и нужно сказать, что ведутся достаточно успешно.
К примеру - этот ответ полностью надиктован с помощью расширения к браузеру Google Chrome - Голосовой ввод текста - Speechpad.ru, с небольшой последующей "коррекцией".
Взять к примеру ту-же корпорацию Microsoft. В оболочке OS Windows, начиная по моему с версии Windows XP Pro, имеется модуль для голосового ввода текста. Довольно качественное приложение, но к огромному сожалению пока доступно только для английской, французской, испанской, немецкой, японской, китайской локализации. В системе, в которой основным языком "по умолчанию" выставлен русский - это приложение запускаться не будет.
Немного лучше обстоят дела у владельцев мобильных устройств от компании Apple. Специальные приложения для распознавания речи, на базе "голосового движка" Siri, довольно качественно переведут произносимые слова в текстовой файл на более чем 30 языках, в том числе и на русском.
"Голосовые" приложения распознавания речи от корпорации Microsoft и компании Apple работают исключительно через встроенный или внешний микрофон. Качество распознавания голоса в текст напрямую зависит от качества произношения, от правильной дикции, от темпа произношения и от других подобных "человеческих" факторов, а также от наличия и количества посторонних шумов, музыкального, или шумового фона.
В интернете можно "забить" в поисковик фразу - "распознавание речи", и ПС выдадут ссылки на несколько программ, которые "претендуют" на роли лидеров в этой области.
"Знаменитую" программу российских разработчиков "Горыныч", наверное даже и упоминать не стоит. Её разработки "успешно" заброшены и новых версий этой программы не выпускается, а существующие не удовлетворяют даже самых непредвязятых пользователей.
Программы RealSpeaker PRO и Speechka, как и несколько других им подобных, также как и онлайн-сервисы, типа Speechpad.ru, работают в принципе неплохо, но на поверку оказывается, что все эти программы и онлайн-сервисы используют один и тот-же пакет ПО (Google Chrome установленный браузером по умолчанию), и базы данных разработки компании Google - Google Web Speech API. Так что получается, что дальше всех в области создания онлайн-сервиса и программ для распознавания речи продвинулась именно корпорация Google.
Программы - RealSpeaker PRO и Speechka - в принципе неплохо помогают в голосовом управлении компьютером и голосовом вводе текстов. Но "распознавание" голоса в текст осуществляется именно через сервера Google Web Speech.
Для работы этих программ и конечно-же подобных онлайн-сервисов, непременным условием является подключенный высокоскоростной интернет, так-как "распознавание речи" происходит методом быстрой отправки аудио на сервер Google Web Speech, на котором это аудио "распознаётся" (или не распознаётся) в текст, и только после этого отображается в поле текстового ввода.
Именно поэтому "распознавание" и ввод текстов происходят с заметной задержкой. Интернет-подключение должно быть очень стабильным и достаточно скоростным, иначе ничего хорошего вам не "распознают" и не напечатают. При голосовом вводе текстов через эти программы и онлайн-сервисы нужно произносить все слова размеренно, с хорошей дикцией, тщательно проговаривая каждую букву, не делать больших пауз между словами, и так далее, обязательно нужно немного потренироваться и всё станет понятно.
Сервис голосового ввода Google Web Speech пока работает в "бета" версии, то-есть практически в тестовом режиме, и по функционалу очень ограничен. Но на его базе уже работают, как говорилось выше, некоторые программы и онлайн-сервисы, которые вполне уже можно использовать для более-менее комфортной работы.
Программа RealSpeaker PRO не бесплатная, и я не стал скачивать и опробовать её 3-х дневную триал-версию.
Я попробовал поработать в программе Speechka и вполне остался удовлетворён результатами её работы. Голосовое управление компьютером работает очень хорошо. Можно голосовыми командами запускать выбранные программы, открывать сайты и так далее.
Ввод текста также работает вполне корректно. Только нужно все слова произносить не очень быстро но очень тщательно. Эту программу могу порекомендовать к использованию. Потренируетесь немного и всё получится. Для работы необходимо установить браузером по умолчанию - Google Chrome. С настройками микрофона также придётся "поколдовать".
Онлайн-сервис - Блокнот для речевого ввода Speechpad.ru - также рекомендую. На странице сайта есть и видео-пособия о работе этого сервиса. В принципе всё просто. Этот сервис работает только в браузере Google Chrome.