API преобразования текста в речь (генерация голоса) и речи в текст (распознавание голоса)?
существует ли полный список известных API для настольных или браузерных сред?
3 ответов
я перефразирую и обновлю ответ от распознавание речи на C или Java или PHP?. Это ни в коем случае не всеобъемлющий, но это может быть началом для вас
из просмотра этих вопросов в течение нескольких месяцев я видел, как большинство вариантов разработчика ломаются следующим образом:
Windows folks-используйте систему.Речевые функции .Net или Microsoft.Речь и установить бесплатные распознаватели Microsoft предоставляет. Windows 7 включает в себя полный речи. Другие скачать бесплатно. Существует API C++ для тех же движков, известных как SAPI. См. at http://msdn.microsoft.com/en-us/magazine/cc163663.aspx. или http://msdn.microsoft.com/en-us/library/ms723627 (v=против 85).aspx. Дополнительные сведения о Microsoft Engine для Windows в чем разница между системой.Речь.Признание и Microsoft.Речь.Узнавание?
Linux folks-Sphinx, похоже, имеет хорошее следование. Видеть http://cmusphinx.sourceforge.net/ и http://cmusphinx.sourceforge.net/wiki/
коммерческих товаров - нюансы, Loquendo, AT & T, IBM другие. Каждый из них предоставляет свои собственные SDK и библиотеки для различных языков.
онлайн-сервис - нюансы, Yapme, ispeech.org, содержаться материалы другие. Нюанс улучшил их разработчик программы и теперь даст вам бесплатный доступ к их услугам для развития. Yap (я считаю) был недавно приобретено Amazon, Так что мы можем увидеть некоторые изменения.
конечно, это также может быть полезно -http://en.wikipedia.org/wiki/List_of_speech_recognition_software
существует API речи Java. См.javax.речь.распознавание в API речи Java http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html - ... Я считаю, что вам все еще нужно найти речевой движок, который поддерживает этот API. Я не думаю, что Сфинкс полностью поддерживает его - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi
есть много других так quesitons: нужен текст в речь и инструменты распознавания речи для Linux и pyspeech (python) - транскрибировать mp3 файлы? который говорит о http://code.google.com/p/pyspeech/. Вы также можете посмотреть наhttp://code.google.com/p/dragonfly/
ведущими поставщиками API text to speech (генерация голоса) являются YAKiToMe! и iSpeech. Якитомэ! это тот, который я использую, потому что мне нравится их качество голоса лучше всего, и они наименее дорогие (в основном бесплатные). Они поддерживают мужчин и женщин, говорящих на нескольких языках. Некоторые из продавцов голоса, такие как Acapella, Nuance, Loquendo и iVona, имеют приличные голоса, но, как правило, дорого использовать.
вот как вы можете сделать это: Примечание: это api от google, поэтому он работает только в браузере chrome.
(посмотреть демо и скачать полный код здесь http://purpledesign.in/blog/?p=33)
определение кнопки
<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />
и определите, что вы хотите сделать в функции в вашем файле javascript
Такой
function processspeech()
{
var speechtext=$("#speech").val();
var elem = document.getElementById("test");
elem.value = speechtext;
var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+ speechtext + "</span>\" <br />*Is this what you said???";
notify(notification);
}
здесь
<textarea> id="test"></textarea>
речь написана в текстовом поле