Преобразование речи в текст в Linux



Я планирую запустить приложение, которое преобразует речь в текст в Linux.
Существуют ли какие-либо существующие интерфейсы, чтобы я мог их расширить?
или есть ли такое приложение в Linux?
Любой входы на этом?



EDIT: приложение, которое я планирую написать, должно быть способно конвертировать каждое слово, которое мы говорим, в текст, а не только Да/нет.

634   4  

4 ответов:

Ну, это довольно сложная задача, и, не говоря о том, какую технологию вы хотите использовать, вот некоторые ссылки:

Удачи. С более подробной информацией мы сможем дать лучшие ответы. Например, есть большая разница между "да/нет" -распознавание стиля колл-центра против даже частичного понимания естественного языка.

Предложения Дэйва-отличное начало. Сфинкс очень ловок.

Я просто хочу добавить, что вы должны быть максимально вероятностными. Как бывший лингвист и даже более ранний любитель фонологии, я могу с уверенностью сказать, что не увлекаюсь лингвистическими моделями. Давайте не будем забывать часто неправильно приписываемое "каждый раз, когда я увольняю лингвиста, моя точность растет". На самом деле речь идет о модели и ее возможностях для учета шума и вариаций, а не о чем-то крупном в области гуманитарных наук из Массачусетского технологического института должен сказать. Хорошей книгой, которую можно было бы взять в руки, была бы книга Юрафски и Мартина "речь и обработка языка". Он имеет некоторые очень полезные приложения вычислительных моделей для этой задачи. Работа Харви Сассмана над линейными коррелятами в наклонах F2 для различных гласных (начиная с сипух и продвигаясь к людям) кажется, что это было бы неплохо реализовать в модели на днях.

Julius также является хорошим вариантом для Linux

Sphinx-это ваша лучшая ставка на linux. Я попробовал Sphinx II и Sphinx III. есть несколько доступных языков с открытым исходным кодом и акустических моделей, которые могут быть использованы с каждым из них. Не производительность производственного уровня вообще,но достаточно хороша для прототипирования или демонстрации. Для производства вам нужно будет разработать свой собственный язык и акустические модели.

Comments

    Ничего не найдено.