文字识别 v2:支持的语言

机器学习套件文本识别 API 能够识别各种脚本和语言中的文本。语言支持分为三个级别:

  1. 受支持语言,我们会优先考虑这些语言,并定期进行性能评估。
  2. 实验性语言,这些语言正处于开发阶段,但不会定期评估。
  3. 映射的语言是指可将其映射到其他语言代码或常规字符识别程序而得到的语言。例如,系统支持“en-GB”,但出于识别文本的目的,系统不会将其与“en”区分对待。

支持的语言

以下语言会得到优先考虑并会定期进行评估。

要按语言过滤,请在下面的搜索框中输入所需的语言:

语言 语言(中文名称) BCP-47 语言代码 脚本/备注
南非荷兰语 南非荷兰语 af Latn
shqip 阿尔巴尼亚语 sq Latn
加泰罗尼亚语 加泰罗尼亚语 ca Latn
中文 中文 zh Hans/Hant;在 v2 中受支持
Hrvatski 克罗地亚语 小时 Latn
Čeština 捷克语 cs Latn
Dansk 丹麦语 da Latn
Nederlands 荷兰语 nl Latn
英语 英语 en Latn; 美国
Eesti keel 爱沙尼亚语 et Latn
菲律宾语 菲律宾语 fil(或 tl) Latn
Suomi 芬兰语 fi Latn
Français 法语 fr Latn; 欧洲
Deutsch 德语 de Latn
हिन्दी 印地语 hi Deva;在 v2 中受支持
Magyar 匈牙利语 hu Latn
Íslenska 冰岛语 Latn
Bahasa Indonesia 印度尼西亚语 id Latn
Italiano 意大利语 it Latn
日本語 日语 ja Jpan;在 v2 中受支持
한국어 韩语 ko Kore;在 v2 中受支持
Latviešu 拉脱维亚语 lv Latn
Lietuvių 立陶宛语 lt Latn
Bahasa Melayu 马来语 毫秒 Latn
मराठी 马拉地语 mr Deva;在 v2 中受支持
नेपाली 尼泊尔语 ne Deva;在 v2 中受支持
Norsk 挪威语 Latn; Bokmål
Polski 波兰语 pl Latn
Português 葡萄牙语 pt Latn; 巴西
Română 罗马尼亚语 ro Latn
Српски (латиница) 塞尔维亚语 sr-Latn Latn
Slovenčina 斯洛伐克语 sk Latn
Slovenščina 斯洛文尼亚语 sl Latn
Español 西班牙语 es Latn; 欧洲
Svenska 瑞典语 sv Latn
Türkçe 土耳其语 tr Latn
Tiếng Việt 越南语 vi Latn

实验性语言

以下语言正处于开发阶段,但不会定期评估。

语言 语言(中文名称) BCP-47 语言代码 脚本/备注
Azərbaycan 阿塞拜疆语 az Latn
Euskara 巴斯克语 eu Latn
Bosanski 波斯尼亚语 bs Latn
宿务语 宿务语 ceb Latn
世界语 世界语 eo Latn
Galego 加利西亚语 gl Latn
Kreyòl Ayisyen 海地克里奥尔语 ht Latn
Gaeilge 爱尔兰语 ga Latn
Jawa 爪哇语 jv Latn
Latine 拉丁语 la Latn
Malti 马耳他语 mt Latn
संस्कृतम् 梵语 sa Deva;在 v2 中受支持
斯瓦希里语 斯瓦希里语 sw Latn
oʻzbekcha 乌兹别克语 uz Latn
Cymraeg 威尔士语 cy Latn
IsiZulu 祖鲁语 zu Latn

映射语言

以下语言会映射到其他语言代码或映射到常规字符识别器。

语言 语言(中文名称) BCP-47 语言代码 脚本/备注 映射到
بهسا اچيه 亚齐语 ace Latn 拉丁字母文字模式
Lwo 阿乔利语 ach Latn 拉丁字母文字模式
当梅语 Adangme ada Latn 拉丁字母文字模式
阿坎语 阿坎语 ak Latn 拉丁字母文字模式
Anicinâbemowin 阿尔贡金语 alg Latn 拉丁字母文字模式
Mapudungu 阿洛柯语/马普切语 arn Latn 拉丁字母文字模式
Asturianu 阿斯图里亚斯语 ast Latn 拉丁字母文字模式
Dene 阿萨巴斯卡语 ath Latn 拉丁字母文字模式
Aymar aru 艾马拉语 ay Latn 拉丁字母文字模式
Bhāṣa Bali 巴厘文 ban Latn 拉丁字母文字模式
Bamanankan 班巴拉语 bm Latn 拉丁字母文字模式
Narrow Bantu 班图语 bnt Latn 拉丁字母文字模式
Toba–Batak 巴塔克文 btk Latn 拉丁字母文字模式
Chibemba 奔巴语 bem Latn 拉丁字母文字模式
Bikol Naga 比考尔语 bik Latn 拉丁字母文字模式
Bichelamar 比斯拉马语 bi Latn 拉丁字母文字模式
Brezhoneg 布列塔尼语 br Latn 拉丁字母文字模式
汉语 中文 zh-Hans Hans;简体;普通话;;在 v2 中受支持 zh
漢語 中文 zh-Hant Hant;繁体;普通话;v2 中支持 zh
普通話 中文 zh-Hant-HK Hant;普通话;香港;在 v2 中受支持 zh
Chahta' 乔克托语 cho Latn 拉丁字母文字模式
Cree–Montagnais–Naskapi 克里语 cr Latn 拉丁字母文字模式
Mvskoke Creek mus Latn 拉丁字母文字模式
Dakhótiyapi, Dakȟótiyapi 达科他语 dak Latn 拉丁字母文字模式
杜阿拉 Duala dua Latn 拉丁字母文字模式
Ikɔ Efik 埃菲克语 efi Latn 拉丁字母文字模式
英语(英国) 英语 en-GB Latn; 英国 en
Èʋegbe 埃维语 ee Latn 拉丁字母文字模式
føroyskt mál 法罗语 fo Latn 拉丁字母文字模式
Na Vosa Vakaviti 斐济语 fj Latn 拉丁字母文字模式
fɔ̀ngbè 丰族语 fon Latn 拉丁字母文字模式
Français canadien 法语 fr-CA Latn; 加拿大 fr
Fulani, Fulah, Peul Fulah ff Latn 拉丁字母文字模式
加 (Ga) 语 gaa Latn 拉丁字母文字模式
卢干达语 干达语 lg Latn 拉丁字母文字模式
Basa Gayo 卡约语 快乐的/同性恋者 Latn 拉丁字母文字模式
基里巴斯 吉尔伯特语 gil Latn 拉丁字母文字模式
哥特文 哥特文 got Latn 拉丁字母文字模式
Guaraní 瓜拉尼语 gn Latn 拉丁字母文字模式
Harshen/Halshen Hausa هَرْشَن هَوْسَ 豪萨语 ha Latn 拉丁字母文字模式
ʻŌlelo Hawaiʻi 夏威夷语 haw Latn 拉丁字母文字模式
Otjiherero 赫雷罗语 hz Latn 拉丁字母文字模式
Ilonggo 希利盖农语 hil Latn 拉丁字母文字模式
Jaku Iban 伊班语 iba Latn 拉丁字母文字模式
Asụsụ Igbo 伊博语 ig Latn 拉丁字母文字模式
Ilokano Iloko ilo Latn 拉丁字母文字模式
Taqbaylit 卡拜尔语 kab Latn 拉丁字母文字模式
景颇语 克钦语 kac Latn 拉丁字母文字模式
格陵兰语 格陵兰语 kl Latn 拉丁字母文字模式
Kikamba 卡姆巴语 kam Latn 拉丁字母文字模式
卡努里语 卡努里语 kr Latn 拉丁字母文字模式
Ka Ktien Khasi 卡西语 kha Latn 拉丁字母文字模式
Gĩkũyũ 吉库尤语 ki Latn 拉丁字母文字模式
卢旺达语 卢旺达语 rw Latn 拉丁字母文字模式
Kikongo 刚果语 kg Latn 拉丁字母文字模式
科斯拉伊语 科斯拉伊语 kos Latn 拉丁字母文字模式
Oshikwanyama 宽尼亚玛语 kj Latn 拉丁字母文字模式
Ngala 林格拉语 ln Latn 拉丁字母文字模式
Plattdütsch, Plattdeutsch, Nedersaksisch 低地德语 nds Latn 拉丁字母文字模式
siLozi 罗兹 (Lozi) 语 loz Latn 拉丁字母文字模式
Kiluba 卢巴加丹加语 lu Latn 拉丁字母文字模式
Dholuo 卢奥语 luo Latn 拉丁字母文字模式
Madhura, Basa Mathura, بَهاسَ مَدورا 马都拉语 mad Latn 拉丁字母文字模式
马尔加什语 马尔加什语 mg Latn 拉丁字母文字模式
Mandinka, لغة مندنكا 曼丁果语 man Latn 拉丁字母文字模式
Gaelg, Gailck 马恩岛语 gv Latn 拉丁字母文字模式
Te reo Māori 毛利语 mi Latn 拉丁字母文字模式
埃崩 马绍尔语 mh Latn 拉丁字母文字模式
Mɛnde yia 门德语 men Latn 拉丁字母文字模式
中古英语 中古英语 enm Latn 拉丁字母文字模式
Mittelhochdeutsch 中古高地德语 gmh Latn 拉丁字母文字模式
Baso Minangkabau, باسو مينڠكاباو 米南佳保语 min Latn 拉丁字母文字模式
Kanienʼkéha 莫霍克语 moh Latn 拉丁字母文字模式
Nkundu 蒙戈语 lol Latn 拉丁字母文字模式
Nāhuatl 纳瓦特尔语 nah Latn 拉丁字母文字模式
Diné bizaad Navajo nv Latn 拉丁字母文字模式
恩东加语 恩东加语 ng Latn 拉丁字母文字模式
ko e vagahau Niuē 纽埃语 niu Latn 拉丁字母文字模式
津巴布韦恩德贝莱 北恩德贝勒语 nd Latn 拉丁字母文字模式
塞索托萨莱博亚 北索托语 nso Latn 拉丁字母文字模式
奇切瓦,钦亚尼亚 尼扬贾语 ny Latn 拉丁字母文字模式
鲁扬科雷 尼扬科莱语 nyn Latn 拉丁字母文字模式
Chitonga 汤加语(尼亚萨地区) tog Latn 拉丁字母文字模式
Appolo 恩济马语 nzi Latn 拉丁字母文字模式
Occitan, lenga d'òc, provençal 奥克语 oc Latn 拉丁字母文字模式
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ 奥杰布瓦语 oj Latn 拉丁字母文字模式
Ænglisc, Englisc, Anglisc 古英语 ang Latn 拉丁字母文字模式
Franceis, François, Romanz 古法语 fro Latn 拉丁字母文字模式
Diutisk, Althochdeutsch 古高地德语 goh Latn 拉丁字母文字模式
Dǫnsk tunga 古诺斯语 non Latn 拉丁字母文字模式
奥克斯坦语 古普罗文斯语 pro Latn 拉丁字母文字模式
ирон ӕвзаг 奥塞特语 os Cyrl 西里尔字母文字模式
邦板牙语 邦板牙语 pam Latn 拉丁字母文字模式
Salitan Pangasinan 邦阿西楠语 pag Latn 拉丁字母文字模式
Papiamentu 帕皮亚内托语 pap Latn 拉丁字母文字模式
Português (Portugal) 葡萄牙语 pt-PT Latn; 欧洲 pt
Kechua / Runa Simi 克丘亚语 qu Latn 拉丁字母文字模式
Rumantsch 罗曼什语 rm Latn 拉丁字母文字模式
Romani čhib 吉普赛语 rom Latn 拉丁字母文字模式
Ikirundi 隆迪语 rn Latn 拉丁字母文字模式
Gagana faʻa Sāmoa 萨摩亚语 sm Latn 拉丁字母文字模式
yângâ tî sängö 桑戈语 sg Latn 拉丁字母文字模式
(Braid) Scots, Lallans, Doric 苏格兰语 sco Latn 拉丁字母文字模式
Gàidhlig 苏格兰盖尔语 gd Latn 拉丁字母文字模式
chiShona 修纳语 sn Latn 拉丁字母文字模式
Songhay Songhai son Latn 拉丁字母文字模式
塞索托语 南索托文 st Latn 拉丁字母文字模式
Español (Latinoamérica) 西班牙语 es-419 Latn; 拉丁美洲 es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda 苏丹语 su Latn 拉丁字母文字模式
siSwati 斯瓦特语 ss Latn 拉丁字母文字模式
Reo Tahiti 塔希提语 ty Latn 拉丁字母文字模式
KʌThemnɛ 提姆语 tem Latn 拉丁字母文字模式
lea faka-Tonga 汤加语 to Latn 拉丁字母文字模式
Xitsonga 宗加语 ts Latn 拉丁字母文字模式
Setswana 茨瓦纳语 tn Latn 拉丁字母文字模式
Türkmençe 土库曼语 tk Latn 西里尔字母文字模式
Tshivenḓa 文达语 ve Latn 拉丁字母文字模式
Frysk 西弗里西亚语 fy Latn 拉丁字母文字模式
沃洛夫语 沃洛夫语 wo Latn 拉丁字母文字模式
isiXhosa 班图语 xh Latn 拉丁字母文字模式
Èdè Yorùbá 约鲁巴语 yo Latn 拉丁字母文字模式
Diidxazá 萨波特克语 zap Latn 拉丁字母文字模式