Каковы языковые коды в реализации Chrome API распознавания речи HTML5?
Chrome реализовал API распознавания речи HTML5. Поддерживаются многие языки. Я хочу знать, какие языки поддерживаются и соответствующий код каждого языка, который используется в HTML-элемент .
например:
- польский (pl-PL)
- турецкий (tr-TR)
спасибо!
4 ответов
хорошо, если он не опубликован, мы можем попытаться, по крайней мере, выяснить это. Позвольте мне поставить эту таблицу для начала, и мы уточним ее, если у кого-то есть больше информации.
я предполагаю, что поддерживаемые языки должны быть похожи на те, которые поддерживаются голосовым поиском, и что google использует стандартные языковые коды и делает это последовательно через свои службы.
я искал языки, поддерживаемые голосовым поиском на Википедия
я нашел коды языков здесь, on страница настроек языка google и здесь
EDIT: Я экспериментировал с системой распознавания голоса. Я провел серию тестов, где я передал тот же образец английской речи API, но каждый раз указывал другой диалект. Это выглядит так:
- если язык не поддерживается, признание возвращается к en-US (похоже, он распознает, что образец на английском языке)
- если диалект не поддерживается (или не существует), распознавание возвращается к основному диалекту или en-US в некоторых случаях
- основной диалект может быть указан как первая часть идентификатора. Таким образом, "en-US" и " en " дают одинаковые результаты.
- распознавание некоторых языков, таких как китайский и японский, дает результаты на английском языке, отличающиеся от en-US, что странно. Наверное образец сильно отличается от китайского, и служба умна, чтобы понять это.
я рассматриваю диалект как поддерживаемый, если распознавание дает другой результат от en-US и от основного диалекта для языка. Тем не менее, чтобы проверить это на 100%, нам нужно запустить образцы для каждого языка.
легенда
-
+
больше всего поддерживается, потому что тест дает результат, отличный от en-US и main диалект. -
.+
отсутствует в Википедии, но больше всего поддерживается, потому что тест дает результат, отличный от en-US и основного диалекта. -
+?
больше всего поддерживается, потому что он указан в Википедии. Но тест на моем образце дает результат, идентичный основному диалекту. Так что либо это coinsidense, либо код языка неверен. -
.+?
не указан в Википедии, но выглядит как поддерживается, потому что тест дает результат, отличный от en-US и main диалект.
языки
-
+
африкаанс af -
+
баскский ЕС -
+
болгарка bg -
+
каталанский ca -
+
Арабский (Египет) АР-ЭГ -
+?
Арабский (Иордания) АР-Жо -
+
Арабский (Кувейт) ar-KW -
+?
Арабский (Ливан) ar-LB -
+
Арабский (Катар) ar-QA -
+
арабский (ОАЭ) ar-AE -
.+
Арабский (Марокко) АР-Ма -
.+
Арабский (Ирак) АР-ай-кью -
.+
арабский (Алжир) ar-DZ -
.+
Арабский (Бахрейн) ar-BH -
.+
Арабский (Ливия) ar-LY -
.+
Арабский (Оман) АР-ом -
.+
Арабский (Саудовская Аравия) ar-SA -
.+
Арабская (Тунис) ar-TN -
.+
Арабский (Йемен) АР-Йе -
+
Чехии cs -
+
голландский nl-NL -
+
Английский (Австралия) en-AU -
+?
Английский (Канада) en-CA -
+
Английский (Индия) en-IN -
+
Английский (Новая Зеландия) en-NZ -
+
Английский (ЮАР) en-ZA -
+
английский (UK) en-GB -
+
английский(США) en-US -
+
Финляндии fi -
+
французский fr-FR -
+
Галицкой gl -
+
немецкий де-де -
+
иврит он -
+
венгерский hu -
+
исландская is -
+
итальянский это -
+
индонезийский id -
+
японский ja -
+
корейский ko -
+
лат Ла -
+
Китайский zh-CN -
+
Традиционный Тайвань ж-TW -
+?
Упрощенный Китая zh-CN ? -
+
Упрощенный Гонконг Ж.-ХК -
+
Юэ Китайский (Традиционный, Гонконг) Ж.-Юэ -
+
Малайзии ms-MY -
+
Норвегии нет-нет -
+
польский pl -
+?
Свинья xx-пиглатин -
+
португальский pt-PT -
.+
португальский (Бразилия) pt-BR -
+
Румынии ро-ро -
+
русский ru -
+
сербский sr-SP -
+
Словакии sk -
+
Испанский (Аргентина) es-AR -
+
Испанский(Боливия) Эс-БО -
+?
Испанский( Чили) es-CL -
+?
Испанский (Колумбия) es-CO -
+?
Испанский(Коста-Рика) es-CR -
+
Испанский(Доминиканская Республика) es-DO -
+
Испанский(Эквадор) es-EC -
+
Испанский(Сальвадор) es-SV -
+
Испанский(Гватемала) es-GT -
+
Испанский(Гондурас) es-HN -
+
Испанский(Мексика) es-MX -
+
Испанский(Никарагуа) es-NI -
+
Испанский(Панама) Эс-ПА -
+
Испанский(Парагвай) es-PY -
+
Испанский(Перу) es-PE -
+
Испанский(Пуэрто-Рико) es-PR -
+
Испанский(Испания) es-ES -
+
испанский(США) es-US -
+
Испанский(Уругвай) es-UY -
+
Испанский(Венесуэла) es-VE -
+
шведская sv-SE -
+
турецкий tr -
+
Зулу ЗУ
Я знаю, что это старый пост, но поскольку эту информацию раздражающе трудно найти, я подумал, что опубликую список для всех, кто может искать. Пожалуйста, оставьте записку, Если вы обнаружите какие-либо ошибки или упущения.
{
"Afrikaans": [
["South Africa", "af-ZA"]
],
"Arabic" : [
["Algeria","ar-DZ"],
["Bahrain","ar-BH"],
["Egypt","ar-EG"],
["Israel","ar-IL"],
["Iraq","ar-IQ"],
["Jordan","ar-JO"],
["Kuwait","ar-KW"],
["Lebanon","ar-LB"],
["Morocco","ar-MA"],
["Oman","ar-OM"],
["Palestinian Territory","ar-PS"],
["Qatar","ar-QA"],
["Saudi Arabia","ar-SA"],
["Tunisia","ar-TN"],
["UAE","ar-AE"]
],
"Basque": [
["Spain", "eu-ES"]
],
"Bulgarian": [
["Bulgaria", "bg-BG"]
],
"Catalan": [
["Spain", "ca-ES"]
],
"Chinese Mandarin": [
["China (Simp.)", "cmn-Hans-CN"],
["Hong Kong SAR (Trad.)", "cmn-Hans-HK"],
["Taiwan (Trad.)", "cmn-Hant-TW"]
],
"Chinese Cantonese": [
["Hong Kong", "yue-Hant-HK"]
],
"Croatian": [
["Croatia", "hr_HR"]
],
"Czech": [
["Czech Republic", "cs-CZ"]
],
"Danish": [
["Denmark", "da-DK"]
],
"English": [
["Australia", "en-AU"],
["Canada", "en-CA"],
["India", "en-IN"],
["Ireland", "en-IE"],
["New Zealand", "en-NZ"],
["Philippines", "en-PH"],
["South Africa", "en-ZA"],
["United Kingdom", "en-GB"],
["United States", "en-US"]
],
"Farsi": [
["Iran", "fa-IR"]
],
"French": [
["France", "fr-FR"]
],
"Filipino": [
["Philippines", "fil-PH"]
],
"Galician": [
["Spain", "gl-ES"]
],
"German": [
["Germany", "de-DE"]
],
"Greek": [
["Greece", "el-GR"]
],
"Finnish": [
["Finland", "fi-FI"]
],
"Hebrew" :[
["Israel", "he-IL"]
],
"Hindi": [
["India", "hi-IN"]
],
"Hungarian": [
["Hungary", "hu-HU"]
],
"Indonesian": [
["Indonesia", "id-ID"]
],
"Icelandic": [
["Iceland", "is-IS"]
],
"Italian": [
["Italy", "it-IT"],
["Switzerland", "it-CH"]
],
"Japanese": [
["Japan", "ja-JP"]
],
"Korean": [
["Korea", "ko-KR"]
],
"Lithuanian": [
["Lithuania", "lt-LT"]
],
"Malaysian": [
["Malaysia", "ms-MY"]
],
"Dutch": [
["Netherlands", "nl-NL"]
],
"Norwegian": [
["Norway", "nb-NO"]
],
"Polish": [
["Poland", "pl-PL"]
],
"Portuguese": [
["Brazil", "pt-BR"],
["Portugal", "pt-PT"]
],
"Romanian": [
["Romania", "ro-RO"]
],
"Russian": [
["Russia", "ru-RU"]
],
"Serbian": [
["Serbia", "sr-RS"]
],
"Slovak": [
["Slovakia", "sk-SK"]
],
"Slovenian": [
["Slovenia", "sl-SI"]
],
"Spanish": [
["Argentina", "es-AR"],
["Bolivia", "es-BO"],
["Chile", "es-CL"],
["Colombia", "es-CO"],
["Costa Rica", "es-CR"],
["Dominican Republic", "es-DO"],
["Ecuador", "es-EC"],
["El Salvador", "es-SV"],
["Guatemala", "es-GT"],
["Honduras", "es-HN"],
["México", "es-MX"],
["Nicaragua", "es-NI"],
["Panamá", "es-PA"],
["Paraguay", "es-PY"],
["Perú", "es-PE"],
["Puerto Rico", "es-PR"],
["Spain", "es-ES"],
["Uruguay", "es-UY"],
["United States", "es-US"],
["Venezuela", "es-VE"]
],
"Swedish": [
["Sweden", "sv-SE"]
],
"Thai": [
["Thailand", "th-TH"]
],
"Turkish": [
["Turkey", "tr-TR"]
],
"Ukrainian": [
["Ukraine", "uk-UA"]
],
"Vietnamese": [
["Viet Nam", "vi-VN"]
],
"Zulu": [
["South Africa", "zu-ZA"]
]
}
Edit: я также нашел этот список, который, вероятно, более актуальный: https://cloud.google.com/speech-to-text/docs/languages
используйте следующий код, чтобы получить все доступные голоса для API речи в вашем браузере:
var voices = speechSynthesis.getVoices();
for(var i = 0; i < voices.length; i++ ) {
console.log("Voice " + i.toString() + ' ' + voices[i].name + ' ' + voices[i].uri);
}
в настоящее время только Chrome и Safari поддерживают API веб-речи (хотя Safari поддерживает только функции преобразования текста в речь). Любопытно, что Firefox OS поддерживает TTS, но версия браузера этого не делает.
список языков зависит от того, в каком браузере вы находитесь в соответствии с документацией и моими тестами (зависит от агента пользователя).
В Safari вы также получаете много доступных языков (я считаю, что более 40). В Chrome в это время вы получаете следующий список:
Голос 0 Google США английский неопределенный
Голос 1 Google UK английский мужской неопределенный
Голос 2 Google UK английский женский неопределенный
Голос 3 Google Español неопределенный
Голос 4 Google Français неопределенный
Голос 5 Google Italiano неопределенный
Голос 6 Google Deutsch неопределено
Голос 7 Google 日本人 неопределенный
Голос 8 Google und неопределенный
Голос 9 Google 中国的 неопределенный
Голос 10 родной неопределенный
здесь у вас есть @TimHayes в LinkedHashMap, где вы можете получить значения. Я использую LinkedHashMap, чтобы я мог получить положение карты.
LinkedHashMap<String,String> country = new LinkedHashMap<String,String>();
country.put("South Africa", "af-ZA");
country.put("Algeria", "ar-DZ");
country.put("Bahrain", "ar-BH");
country.put("Egypt", "ar-EG");
country.put("Israel", "ar-IL");
country.put("Iraq", "ar-IQ");
country.put("Jordan", "ar-JO");
country.put("Kuwait", "ar-KW");
country.put("Lebanon", "ar-LB");
country.put("Morocco", "ar-MA");
country.put("Oman", "ar-OM");
country.put("Palestinian Territory", "ar-PS");
country.put("Qatar", "ar-QA");
country.put("Saudi Arabia", "ar-SA");
country.put("Tunisia", "ar-TN");
country.put("UAE", "ar-AE");
country.put("Spain", "eu-ES");
country.put("Bulgaria", "bg-BG");
country.put("Spain", "ca-ES");
country.put("China (Simp.)", "cmn-Hans-CN");
country.put("Hong Kong SAR (Trad.)", "cmn-Hans-HK");
country.put("Taiwan (Trad.)", "cmn-Hant-TW");
country.put("Hong Kong", "yue-Hant-HK");
country.put("Croatia", "hr_HR");
country.put("Czech Republic", "cs-CZ");
country.put("Denmark", "da-DK");
country.put("Australia", "en-AU");
country.put("Canada", "en-CA");
country.put("India", "en-IN");
country.put("Ireland", "en-IE");
country.put("New Zealand", "en-NZ");
country.put("Philippines", "en-PH");
country.put("South Africa", "en-ZA");
country.put("United Kingdom", "en-GB");
country.put("United States", "en-US");
country.put("Iran", "fa-IR");
country.put("France", "fr-FR");
country.put("Philippines", "fil-PH");
country.put("Spain", "gl-ES");
country.put("Germany", "de-DE");
country.put("Greece", "el-GR");
country.put("Finland", "fi-FI");
country.put("Israel", "he-IL");
country.put("India", "hi-IN");
country.put("Hungary", "hu-HU");
country.put("Indonesia", "id-ID");
country.put("Iceland", "is-IS");
country.put("Italy", "it-IT");
country.put("Switzerland", "it-CH");
country.put("Japan", "ja-JP");
country.put("Korea", "ko-KR");
country.put("Lithuania", "lt-LT");
country.put("Malaysia", "ms-MY");
country.put("Netherlands", "nl-NL");
country.put("Norway", "nb-NO");
country.put("Poland", "pl-PL");
country.put("Brazil", "pt-BR");
country.put("Portugal", "pt-PT");
country.put("Romania", "ro-RO");
country.put("Russia", "ru-RU");
country.put("Serbia", "sr-RS");
country.put("Slovakia", "sk-SK");
country.put("Slovenia", "sl-SI");
country.put("Argentina", "es-AR");
country.put("Bolivia", "es-BO");
country.put("Chile", "es-CL");
country.put("Colombia", "es-CO");
country.put("Costa Rica", "es-CR");
country.put("Dominican Republic", "es-DO");
country.put("Ecuador", "es-EC");
country.put("El Salvador", "es-SV");
country.put("Guatemala", "es-GT");
country.put("Honduras", "es-HN");
country.put("México", "es-MX");
country.put("Nicaragua", "es-NI");
country.put("Panamá", "es-PA");
country.put("Paraguay", "es-PY");
country.put("Perú", "es-PE");
country.put("Puerto Rico", "es-PR");
country.put("Spain", "es-ES");
country.put("Uruguay", "es-UY");
country.put("United States", "es-US");
country.put("Venezuela", "es-VE");
country.put("Sweden", "sv-SE");
country.put("Thailand", "th-TH");
country.put("Turkey", "tr-TR");
country.put("Ukraine", "uk-UA");
country.put("Viet Nam", "vi-VN");
country.put("South Africa", "zu-ZA");