Каковы языковые коды в реализации Chrome API распознавания речи HTML5?

Chrome реализовал API распознавания речи HTML5. Поддерживаются многие языки. Я хочу знать, какие языки поддерживаются и соответствующий код каждого языка, который используется в HTML-элемент .

например:

  • польский (pl-PL)
  • турецкий (tr-TR)

спасибо!

4 ответов


хорошо, если он не опубликован, мы можем попытаться, по крайней мере, выяснить это. Позвольте мне поставить эту таблицу для начала, и мы уточним ее, если у кого-то есть больше информации.

я предполагаю, что поддерживаемые языки должны быть похожи на те, которые поддерживаются голосовым поиском, и что google использует стандартные языковые коды и делает это последовательно через свои службы.

я искал языки, поддерживаемые голосовым поиском на Википедия

я нашел коды языков здесь, on страница настроек языка google и здесь

EDIT: Я экспериментировал с системой распознавания голоса. Я провел серию тестов, где я передал тот же образец английской речи API, но каждый раз указывал другой диалект. Это выглядит так:

  • если язык не поддерживается, признание возвращается к en-US (похоже, он распознает, что образец на английском языке)
  • если диалект не поддерживается (или не существует), распознавание возвращается к основному диалекту или en-US в некоторых случаях
  • основной диалект может быть указан как первая часть идентификатора. Таким образом, "en-US" и " en " дают одинаковые результаты.
  • распознавание некоторых языков, таких как китайский и японский, дает результаты на английском языке, отличающиеся от en-US, что странно. Наверное образец сильно отличается от китайского, и служба умна, чтобы понять это.

я рассматриваю диалект как поддерживаемый, если распознавание дает другой результат от en-US и от основного диалекта для языка. Тем не менее, чтобы проверить это на 100%, нам нужно запустить образцы для каждого языка.

легенда

  • + больше всего поддерживается, потому что тест дает результат, отличный от en-US и main диалект.
  • .+ отсутствует в Википедии, но больше всего поддерживается, потому что тест дает результат, отличный от en-US и основного диалекта.
  • +? больше всего поддерживается, потому что он указан в Википедии. Но тест на моем образце дает результат, идентичный основному диалекту. Так что либо это coinsidense, либо код языка неверен.
  • .+? не указан в Википедии, но выглядит как поддерживается, потому что тест дает результат, отличный от en-US и main диалект.

языки

  • + африкаанс af
  • + баскский ЕС
  • + болгарка bg
  • + каталанский ca
  • + Арабский (Египет) АР-ЭГ
  • +? Арабский (Иордания) АР-Жо
  • + Арабский (Кувейт) ar-KW
  • +? Арабский (Ливан) ar-LB
  • + Арабский (Катар) ar-QA
  • + арабский (ОАЭ) ar-AE
  • .+ Арабский (Марокко) АР-Ма
  • .+ Арабский (Ирак) АР-ай-кью
  • .+ арабский (Алжир) ar-DZ
  • .+ Арабский (Бахрейн) ar-BH
  • .+ Арабский (Ливия) ar-LY
  • .+ Арабский (Оман) АР-ом
  • .+ Арабский (Саудовская Аравия) ar-SA
  • .+ Арабская (Тунис) ar-TN
  • .+ Арабский (Йемен) АР-Йе
  • + Чехии cs
  • + голландский nl-NL
  • + Английский (Австралия) en-AU
  • +? Английский (Канада) en-CA
  • + Английский (Индия) en-IN
  • + Английский (Новая Зеландия) en-NZ
  • + Английский (ЮАР) en-ZA
  • + английский (UK) en-GB
  • + английский(США) en-US
  • + Финляндии fi
  • + французский fr-FR
  • + Галицкой gl
  • + немецкий де-де
  • + иврит он
  • + венгерский hu
  • + исландская is
  • + итальянский это
  • + индонезийский id
  • + японский ja
  • + корейский ko
  • + лат Ла
  • + Китайский zh-CN
  • + Традиционный Тайвань ж-TW
  • +? Упрощенный Китая zh-CN ?
  • + Упрощенный Гонконг Ж.-ХК
  • + Юэ Китайский (Традиционный, Гонконг) Ж.-Юэ
  • + Малайзии ms-MY
  • + Норвегии нет-нет
  • + польский pl
  • +? Свинья xx-пиглатин
  • + португальский pt-PT
  • .+ португальский (Бразилия) pt-BR
  • + Румынии ро-ро
  • + русский ru
  • + сербский sr-SP
  • + Словакии sk
  • + Испанский (Аргентина) es-AR
  • + Испанский(Боливия) Эс-БО
  • +? Испанский( Чили) es-CL
  • +? Испанский (Колумбия) es-CO
  • +? Испанский(Коста-Рика) es-CR
  • + Испанский(Доминиканская Республика) es-DO
  • + Испанский(Эквадор) es-EC
  • + Испанский(Сальвадор) es-SV
  • + Испанский(Гватемала) es-GT
  • + Испанский(Гондурас) es-HN
  • + Испанский(Мексика) es-MX
  • + Испанский(Никарагуа) es-NI
  • + Испанский(Панама) Эс-ПА
  • + Испанский(Парагвай) es-PY
  • + Испанский(Перу) es-PE
  • + Испанский(Пуэрто-Рико) es-PR
  • + Испанский(Испания) es-ES
  • + испанский(США) es-US
  • + Испанский(Уругвай) es-UY
  • + Испанский(Венесуэла) es-VE
  • + шведская sv-SE
  • + турецкий tr
  • + Зулу ЗУ

Я знаю, что это старый пост, но поскольку эту информацию раздражающе трудно найти, я подумал, что опубликую список для всех, кто может искать. Пожалуйста, оставьте записку, Если вы обнаружите какие-либо ошибки или упущения.

{
  "Afrikaans": [
    ["South Africa", "af-ZA"]
  ],
  "Arabic" : [
    ["Algeria","ar-DZ"],
    ["Bahrain","ar-BH"],
    ["Egypt","ar-EG"],
    ["Israel","ar-IL"],
    ["Iraq","ar-IQ"],
    ["Jordan","ar-JO"],
    ["Kuwait","ar-KW"],
    ["Lebanon","ar-LB"],
    ["Morocco","ar-MA"],
    ["Oman","ar-OM"],
    ["Palestinian Territory","ar-PS"],
    ["Qatar","ar-QA"],
    ["Saudi Arabia","ar-SA"],
    ["Tunisia","ar-TN"],
    ["UAE","ar-AE"]
  ],
  "Basque": [
    ["Spain", "eu-ES"]
  ],
  "Bulgarian": [
    ["Bulgaria", "bg-BG"]
  ],
  "Catalan": [
    ["Spain", "ca-ES"]
  ],
  "Chinese Mandarin": [
    ["China (Simp.)", "cmn-Hans-CN"],
    ["Hong Kong SAR (Trad.)", "cmn-Hans-HK"],
    ["Taiwan (Trad.)", "cmn-Hant-TW"]
  ],
  "Chinese Cantonese": [
    ["Hong Kong", "yue-Hant-HK"]
  ],
  "Croatian": [
    ["Croatia", "hr_HR"]
  ],
  "Czech": [
    ["Czech Republic", "cs-CZ"]
  ],
  "Danish": [
    ["Denmark", "da-DK"]
  ],
  "English": [
    ["Australia", "en-AU"],
    ["Canada", "en-CA"],
    ["India", "en-IN"],
    ["Ireland", "en-IE"],
    ["New Zealand", "en-NZ"],
    ["Philippines", "en-PH"],
    ["South Africa", "en-ZA"],
    ["United Kingdom", "en-GB"],
    ["United States", "en-US"]
  ],
  "Farsi": [
    ["Iran", "fa-IR"]
  ],
  "French": [
    ["France", "fr-FR"]
  ],
  "Filipino": [
    ["Philippines", "fil-PH"]
  ],
  "Galician": [
    ["Spain", "gl-ES"]
  ],
  "German": [
    ["Germany", "de-DE"]
  ],
  "Greek": [
    ["Greece", "el-GR"]
  ],
  "Finnish": [
    ["Finland", "fi-FI"]
  ],
  "Hebrew" :[
    ["Israel", "he-IL"]
  ],
  "Hindi": [
    ["India", "hi-IN"]
  ],
  "Hungarian": [
    ["Hungary", "hu-HU"]
  ],
  "Indonesian": [
    ["Indonesia", "id-ID"]
  ],
  "Icelandic": [
    ["Iceland", "is-IS"]
  ],
  "Italian": [
    ["Italy", "it-IT"],
    ["Switzerland", "it-CH"]
  ],
  "Japanese": [
    ["Japan", "ja-JP"]
  ],
  "Korean": [
    ["Korea", "ko-KR"]
  ],
  "Lithuanian": [
    ["Lithuania", "lt-LT"]
  ],
  "Malaysian": [
    ["Malaysia", "ms-MY"]
  ],
  "Dutch": [
    ["Netherlands", "nl-NL"]
  ],
  "Norwegian": [
    ["Norway", "nb-NO"]
  ],
  "Polish": [
    ["Poland", "pl-PL"]
  ],
  "Portuguese": [
    ["Brazil", "pt-BR"],
    ["Portugal", "pt-PT"]
  ],
  "Romanian": [
    ["Romania", "ro-RO"]
  ],
  "Russian": [
    ["Russia", "ru-RU"]
  ],
  "Serbian": [
    ["Serbia", "sr-RS"]
  ],
  "Slovak": [
    ["Slovakia", "sk-SK"]
  ],
  "Slovenian": [
    ["Slovenia", "sl-SI"]
  ],
  "Spanish": [
    ["Argentina", "es-AR"],
    ["Bolivia", "es-BO"],
    ["Chile", "es-CL"],
    ["Colombia", "es-CO"],
    ["Costa Rica", "es-CR"],
    ["Dominican Republic", "es-DO"],
    ["Ecuador", "es-EC"],
    ["El Salvador", "es-SV"],
    ["Guatemala", "es-GT"],
    ["Honduras", "es-HN"],
    ["México", "es-MX"],
    ["Nicaragua", "es-NI"],
    ["Panamá", "es-PA"],
    ["Paraguay", "es-PY"],
    ["Perú", "es-PE"],
    ["Puerto Rico", "es-PR"],
    ["Spain", "es-ES"],
    ["Uruguay", "es-UY"],
    ["United States", "es-US"],
    ["Venezuela", "es-VE"]
  ],
  "Swedish": [
    ["Sweden", "sv-SE"]
  ],
  "Thai": [
    ["Thailand", "th-TH"]
  ],
  "Turkish": [
    ["Turkey", "tr-TR"]
  ],
  "Ukrainian": [
    ["Ukraine", "uk-UA"]
  ],
  "Vietnamese": [
    ["Viet Nam", "vi-VN"]
  ],
  "Zulu": [
    ["South Africa", "zu-ZA"]
  ]
}

Edit: я также нашел этот список, который, вероятно, более актуальный: https://cloud.google.com/speech-to-text/docs/languages


используйте следующий код, чтобы получить все доступные голоса для API речи в вашем браузере:

var voices = speechSynthesis.getVoices();
      for(var i = 0; i < voices.length; i++ ) {
        console.log("Voice " + i.toString() + ' ' + voices[i].name + ' ' + voices[i].uri);
      }

в настоящее время только Chrome и Safari поддерживают API веб-речи (хотя Safari поддерживает только функции преобразования текста в речь). Любопытно, что Firefox OS поддерживает TTS, но версия браузера этого не делает.

список языков зависит от того, в каком браузере вы находитесь в соответствии с документацией и моими тестами (зависит от агента пользователя).

В Safari вы также получаете много доступных языков (я считаю, что более 40). В Chrome в это время вы получаете следующий список:

Голос 0 Google США английский неопределенный

Голос 1 Google UK английский мужской неопределенный

Голос 2 Google UK английский женский неопределенный

Голос 3 Google Español неопределенный

Голос 4 Google Français неопределенный

Голос 5 Google Italiano неопределенный

Голос 6 Google Deutsch неопределено

Голос 7 Google 日本人 неопределенный

Голос 8 Google und неопределенный

Голос 9 Google 中国的 неопределенный

Голос 10 родной неопределенный


здесь у вас есть @TimHayes в LinkedHashMap, где вы можете получить значения. Я использую LinkedHashMap, чтобы я мог получить положение карты.

    LinkedHashMap<String,String> country = new LinkedHashMap<String,String>();


    country.put("South Africa", "af-ZA");
    country.put("Algeria", "ar-DZ");
    country.put("Bahrain", "ar-BH");
    country.put("Egypt", "ar-EG");
    country.put("Israel", "ar-IL");
    country.put("Iraq", "ar-IQ");
    country.put("Jordan", "ar-JO");
    country.put("Kuwait", "ar-KW");
    country.put("Lebanon", "ar-LB");
    country.put("Morocco", "ar-MA");
    country.put("Oman", "ar-OM");
    country.put("Palestinian Territory", "ar-PS");
    country.put("Qatar", "ar-QA");
    country.put("Saudi Arabia", "ar-SA");
    country.put("Tunisia", "ar-TN");
    country.put("UAE", "ar-AE");
    country.put("Spain", "eu-ES");
    country.put("Bulgaria", "bg-BG");
    country.put("Spain", "ca-ES");
    country.put("China (Simp.)", "cmn-Hans-CN");
    country.put("Hong Kong SAR (Trad.)", "cmn-Hans-HK");
    country.put("Taiwan (Trad.)", "cmn-Hant-TW");
    country.put("Hong Kong", "yue-Hant-HK");
    country.put("Croatia", "hr_HR");
    country.put("Czech Republic", "cs-CZ");
    country.put("Denmark", "da-DK");
    country.put("Australia", "en-AU");
    country.put("Canada", "en-CA");
    country.put("India", "en-IN");
    country.put("Ireland", "en-IE");
    country.put("New Zealand", "en-NZ");
    country.put("Philippines", "en-PH");
    country.put("South Africa", "en-ZA");
    country.put("United Kingdom", "en-GB");
    country.put("United States", "en-US");
    country.put("Iran", "fa-IR");
    country.put("France", "fr-FR");
    country.put("Philippines", "fil-PH");
    country.put("Spain", "gl-ES");
    country.put("Germany", "de-DE");
    country.put("Greece", "el-GR");
    country.put("Finland", "fi-FI");
    country.put("Israel", "he-IL");
    country.put("India", "hi-IN");
    country.put("Hungary", "hu-HU");
    country.put("Indonesia", "id-ID");
    country.put("Iceland", "is-IS");
    country.put("Italy", "it-IT");
    country.put("Switzerland", "it-CH");
    country.put("Japan", "ja-JP");
    country.put("Korea", "ko-KR");
    country.put("Lithuania", "lt-LT");
    country.put("Malaysia", "ms-MY");
    country.put("Netherlands", "nl-NL");
    country.put("Norway", "nb-NO");
    country.put("Poland", "pl-PL");
    country.put("Brazil", "pt-BR");
    country.put("Portugal", "pt-PT");
    country.put("Romania", "ro-RO");
    country.put("Russia", "ru-RU");
    country.put("Serbia", "sr-RS");
    country.put("Slovakia", "sk-SK");
    country.put("Slovenia", "sl-SI");
    country.put("Argentina", "es-AR");
    country.put("Bolivia", "es-BO");
    country.put("Chile", "es-CL");
    country.put("Colombia", "es-CO");
    country.put("Costa Rica", "es-CR");
    country.put("Dominican Republic", "es-DO");
    country.put("Ecuador", "es-EC");
    country.put("El Salvador", "es-SV");
    country.put("Guatemala", "es-GT");
    country.put("Honduras", "es-HN");
    country.put("México", "es-MX");
    country.put("Nicaragua", "es-NI");
    country.put("Panamá", "es-PA");
    country.put("Paraguay", "es-PY");
    country.put("Perú", "es-PE");
    country.put("Puerto Rico", "es-PR");
    country.put("Spain", "es-ES");
    country.put("Uruguay", "es-UY");
    country.put("United States", "es-US");
    country.put("Venezuela", "es-VE");
    country.put("Sweden", "sv-SE");
    country.put("Thailand", "th-TH");
    country.put("Turkey", "tr-TR");
    country.put("Ukraine", "uk-UA");
    country.put("Viet Nam", "vi-VN");
    country.put("South Africa", "zu-ZA");