API преобразования текста в речь (генерация голоса) и речи в текст (распознавание голоса)?

существует ли полный список известных API для настольных или браузерных сред?

3 ответов


я перефразирую и обновлю ответ от распознавание речи на C или Java или PHP?. Это ни в коем случае не всеобъемлющий, но это может быть началом для вас


из просмотра этих вопросов в течение нескольких месяцев я видел, как большинство вариантов разработчика ломаются следующим образом:

Windows folks-используйте систему.Речевые функции .Net или Microsoft.Речь и установить бесплатные распознаватели Microsoft предоставляет. Windows 7 включает в себя полный речи. Другие скачать бесплатно. Существует API C++ для тех же движков, известных как SAPI. См. at http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. или http://msdn.microsoft.com/en-us/library/ms723627 (v=против 85).aspx. Дополнительные сведения о Microsoft Engine для Windows в чем разница между системой.Речь.Признание и Microsoft.Речь.Узнавание?

Linux folks-Sphinx, похоже, имеет хорошее следование. Видеть http://cmusphinx.sourceforge.net/ и http://cmusphinx.sourceforge.net/wiki/

коммерческих товаров - нюансы, Loquendo, AT & T, IBM другие. Каждый из них предоставляет свои собственные SDK и библиотеки для различных языков.

онлайн-сервис - нюансы, Yapme, ispeech.org, содержаться материалы другие. Нюанс улучшил их разработчик программы и теперь даст вам бесплатный доступ к их услугам для развития. Yap (я считаю) был недавно приобретено Amazon, Так что мы можем увидеть некоторые изменения.

конечно, это также может быть полезно -http://en.wikipedia.org/wiki/List_of_speech_recognition_software

существует API речи Java. См.javax.речь.распознавание в API речи Java http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html - ... Я считаю, что вам все еще нужно найти речевой движок, который поддерживает этот API. Я не думаю, что Сфинкс полностью поддерживает его - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

есть много других так quesitons: нужен текст в речь и инструменты распознавания речи для Linux и pyspeech (python) - транскрибировать mp3 файлы? который говорит о http://code.google.com/p/pyspeech/. Вы также можете посмотреть наhttp://code.google.com/p/dragonfly/


ведущими поставщиками API text to speech (генерация голоса) являются YAKiToMe! и iSpeech. Якитомэ! это тот, который я использую, потому что мне нравится их качество голоса лучше всего, и они наименее дорогие (в основном бесплатные). Они поддерживают мужчин и женщин, говорящих на нескольких языках. Некоторые из продавцов голоса, такие как Acapella, Nuance, Loquendo и iVona, имеют приличные голоса, но, как правило, дорого использовать.


вот как вы можете сделать это: Примечание: это api от google, поэтому он работает только в браузере chrome.

(посмотреть демо и скачать полный код здесь http://purpledesign.in/blog/?p=33)

определение кнопки

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />

и определите, что вы хотите сделать в функции в вашем файле javascript

Такой

   function processspeech()
   {
     var speechtext=$("#speech").val();
     var elem = document.getElementById("test");
     elem.value = speechtext;
     var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+  speechtext + "</span>\" <br />*Is this what you said???";
    notify(notification);
}

здесь

<textarea> id="test"></textarea>

речь написана в текстовом поле