机器学习套件文本识别 API 能够识别各种脚本和语言中的文本。语言支持分为三个级别:
- 受支持语言,我们会优先考虑这些语言,并定期进行性能评估。
- 实验性语言,这些语言正处于开发阶段,但不会定期评估。
- 映射的语言是指可将其映射到其他语言代码或常规字符识别程序而得到的语言。例如,系统支持“
en-GB
”,但出于识别文本的目的,系统不会将其与“en
”区分对待。
支持的语言
以下语言会得到优先考虑并会定期进行评估。
要按语言过滤,请在下面的搜索框中输入所需的语言:
语言 | 语言(中文名称) | BCP-47 语言代码 | 脚本/备注 |
---|---|---|---|
南非荷兰语 | 南非荷兰语 | af | Latn |
shqip | 阿尔巴尼亚语 | sq | Latn |
加泰罗尼亚语 | 加泰罗尼亚语 | ca | Latn |
中文 | 中文 | zh | Hans/Hant;在 v2 中受支持 |
Hrvatski | 克罗地亚语 | 小时 | Latn |
Čeština | 捷克语 | cs | Latn |
Dansk | 丹麦语 | da | Latn |
Nederlands | 荷兰语 | nl | Latn |
英语 | 英语 | en | Latn; 美国 |
Eesti keel | 爱沙尼亚语 | et | Latn |
菲律宾语 | 菲律宾语 | fil(或 tl) | Latn |
Suomi | 芬兰语 | fi | Latn |
Français | 法语 | fr | Latn; 欧洲 |
Deutsch | 德语 | de | Latn |
हिन्दी | 印地语 | hi | Deva;在 v2 中受支持 |
Magyar | 匈牙利语 | hu | Latn |
Íslenska | 冰岛语 | 是 | Latn |
Bahasa Indonesia | 印度尼西亚语 | id | Latn |
Italiano | 意大利语 | it | Latn |
日本語 | 日语 | ja | Jpan;在 v2 中受支持 |
한국어 | 韩语 | ko | Kore;在 v2 中受支持 |
Latviešu | 拉脱维亚语 | lv | Latn |
Lietuvių | 立陶宛语 | lt | Latn |
Bahasa Melayu | 马来语 | 毫秒 | Latn |
मराठी | 马拉地语 | mr | Deva;在 v2 中受支持 |
नेपाली | 尼泊尔语 | ne | Deva;在 v2 中受支持 |
Norsk | 挪威语 | 否 | Latn; Bokmål |
Polski | 波兰语 | pl | Latn |
Português | 葡萄牙语 | pt | Latn; 巴西 |
Română | 罗马尼亚语 | ro | Latn |
Српски (латиница) | 塞尔维亚语 | sr-Latn | Latn |
Slovenčina | 斯洛伐克语 | sk | Latn |
Slovenščina | 斯洛文尼亚语 | sl | Latn |
Español | 西班牙语 | es | Latn; 欧洲 |
Svenska | 瑞典语 | sv | Latn |
Türkçe | 土耳其语 | tr | Latn |
Tiếng Việt | 越南语 | vi | Latn |
实验性语言
以下语言正处于开发阶段,但不会定期评估。
语言 | 语言(中文名称) | BCP-47 语言代码 | 脚本/备注 |
---|---|---|---|
Azərbaycan | 阿塞拜疆语 | az | Latn |
Euskara | 巴斯克语 | eu | Latn |
Bosanski | 波斯尼亚语 | bs | Latn |
宿务语 | 宿务语 | ceb | Latn |
世界语 | 世界语 | eo | Latn |
Galego | 加利西亚语 | gl | Latn |
Kreyòl Ayisyen | 海地克里奥尔语 | ht | Latn |
Gaeilge | 爱尔兰语 | ga | Latn |
Jawa | 爪哇语 | jv | Latn |
Latine | 拉丁语 | la | Latn |
Malti | 马耳他语 | mt | Latn |
संस्कृतम् | 梵语 | sa | Deva;在 v2 中受支持 |
斯瓦希里语 | 斯瓦希里语 | sw | Latn |
oʻzbekcha | 乌兹别克语 | uz | Latn |
Cymraeg | 威尔士语 | cy | Latn |
IsiZulu | 祖鲁语 | zu | Latn |
映射语言
以下语言会映射到其他语言代码或映射到常规字符识别器。
语言 | 语言(中文名称) | BCP-47 语言代码 | 脚本/备注 | 映射到 |
---|---|---|---|---|
بهسا اچيه | 亚齐语 | ace | Latn | 拉丁字母文字模式 |
Lwo | 阿乔利语 | ach | Latn | 拉丁字母文字模式 |
当梅语 | Adangme | ada | Latn | 拉丁字母文字模式 |
阿坎语 | 阿坎语 | ak | Latn | 拉丁字母文字模式 |
Anicinâbemowin | 阿尔贡金语 | alg | Latn | 拉丁字母文字模式 |
Mapudungu | 阿洛柯语/马普切语 | arn | Latn | 拉丁字母文字模式 |
Asturianu | 阿斯图里亚斯语 | ast | Latn | 拉丁字母文字模式 |
Dene | 阿萨巴斯卡语 | ath | Latn | 拉丁字母文字模式 |
Aymar aru | 艾马拉语 | ay | Latn | 拉丁字母文字模式 |
Bhāṣa Bali | 巴厘文 | ban | Latn | 拉丁字母文字模式 |
Bamanankan | 班巴拉语 | bm | Latn | 拉丁字母文字模式 |
Narrow Bantu | 班图语 | bnt | Latn | 拉丁字母文字模式 |
Toba–Batak | 巴塔克文 | btk | Latn | 拉丁字母文字模式 |
Chibemba | 奔巴语 | bem | Latn | 拉丁字母文字模式 |
Bikol Naga | 比考尔语 | bik | Latn | 拉丁字母文字模式 |
Bichelamar | 比斯拉马语 | bi | Latn | 拉丁字母文字模式 |
Brezhoneg | 布列塔尼语 | br | Latn | 拉丁字母文字模式 |
汉语 | 中文 | zh-Hans | Hans;简体;普通话;;在 v2 中受支持 | zh |
漢語 | 中文 | zh-Hant | Hant;繁体;普通话;v2 中支持 | zh |
普通話 | 中文 | zh-Hant-HK | Hant;普通话;香港;在 v2 中受支持 | zh |
Chahta' | 乔克托语 | cho | Latn | 拉丁字母文字模式 |
Cree–Montagnais–Naskapi | 克里语 | cr | Latn | 拉丁字母文字模式 |
Mvskoke | Creek | mus | Latn | 拉丁字母文字模式 |
Dakhótiyapi, Dakȟótiyapi | 达科他语 | dak | Latn | 拉丁字母文字模式 |
杜阿拉 | Duala | dua | Latn | 拉丁字母文字模式 |
Ikɔ Efik | 埃菲克语 | efi | Latn | 拉丁字母文字模式 |
英语(英国) | 英语 | en-GB | Latn; 英国 | en |
Èʋegbe | 埃维语 | ee | Latn | 拉丁字母文字模式 |
føroyskt mál | 法罗语 | fo | Latn | 拉丁字母文字模式 |
Na Vosa Vakaviti | 斐济语 | fj | Latn | 拉丁字母文字模式 |
fɔ̀ngbè | 丰族语 | fon | Latn | 拉丁字母文字模式 |
Français canadien | 法语 | fr-CA | Latn; 加拿大 | fr |
Fulani, Fulah, Peul | Fulah | ff | Latn | 拉丁字母文字模式 |
Gã | 加 (Ga) 语 | gaa | Latn | 拉丁字母文字模式 |
卢干达语 | 干达语 | lg | Latn | 拉丁字母文字模式 |
Basa Gayo | 卡约语 | 快乐的/同性恋者 | Latn | 拉丁字母文字模式 |
基里巴斯 | 吉尔伯特语 | gil | Latn | 拉丁字母文字模式 |
哥特文 | 哥特文 | got | Latn | 拉丁字母文字模式 |
Guaraní | 瓜拉尼语 | gn | Latn | 拉丁字母文字模式 |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | 豪萨语 | ha | Latn | 拉丁字母文字模式 |
ʻŌlelo Hawaiʻi | 夏威夷语 | haw | Latn | 拉丁字母文字模式 |
Otjiherero | 赫雷罗语 | hz | Latn | 拉丁字母文字模式 |
Ilonggo | 希利盖农语 | hil | Latn | 拉丁字母文字模式 |
Jaku Iban | 伊班语 | iba | Latn | 拉丁字母文字模式 |
Asụsụ Igbo | 伊博语 | ig | Latn | 拉丁字母文字模式 |
Ilokano | Iloko | ilo | Latn | 拉丁字母文字模式 |
Taqbaylit | 卡拜尔语 | kab | Latn | 拉丁字母文字模式 |
景颇语 | 克钦语 | kac | Latn | 拉丁字母文字模式 |
格陵兰语 | 格陵兰语 | kl | Latn | 拉丁字母文字模式 |
Kikamba | 卡姆巴语 | kam | Latn | 拉丁字母文字模式 |
卡努里语 | 卡努里语 | kr | Latn | 拉丁字母文字模式 |
Ka Ktien Khasi | 卡西语 | kha | Latn | 拉丁字母文字模式 |
Gĩkũyũ | 吉库尤语 | ki | Latn | 拉丁字母文字模式 |
卢旺达语 | 卢旺达语 | rw | Latn | 拉丁字母文字模式 |
Kikongo | 刚果语 | kg | Latn | 拉丁字母文字模式 |
科斯拉伊语 | 科斯拉伊语 | kos | Latn | 拉丁字母文字模式 |
Oshikwanyama | 宽尼亚玛语 | kj | Latn | 拉丁字母文字模式 |
Ngala | 林格拉语 | ln | Latn | 拉丁字母文字模式 |
Plattdütsch, Plattdeutsch, Nedersaksisch | 低地德语 | nds | Latn | 拉丁字母文字模式 |
siLozi | 罗兹 (Lozi) 语 | loz | Latn | 拉丁字母文字模式 |
Kiluba | 卢巴加丹加语 | lu | Latn | 拉丁字母文字模式 |
Dholuo | 卢奥语 | luo | Latn | 拉丁字母文字模式 |
Madhura, Basa Mathura, بَهاسَ مَدورا | 马都拉语 | mad | Latn | 拉丁字母文字模式 |
马尔加什语 | 马尔加什语 | mg | Latn | 拉丁字母文字模式 |
Mandinka, لغة مندنكا | 曼丁果语 | man | Latn | 拉丁字母文字模式 |
Gaelg, Gailck | 马恩岛语 | gv | Latn | 拉丁字母文字模式 |
Te reo Māori | 毛利语 | mi | Latn | 拉丁字母文字模式 |
埃崩 | 马绍尔语 | mh | Latn | 拉丁字母文字模式 |
Mɛnde yia | 门德语 | men | Latn | 拉丁字母文字模式 |
中古英语 | 中古英语 | enm | Latn | 拉丁字母文字模式 |
Mittelhochdeutsch | 中古高地德语 | gmh | Latn | 拉丁字母文字模式 |
Baso Minangkabau, باسو مينڠكاباو | 米南佳保语 | min | Latn | 拉丁字母文字模式 |
Kanienʼkéha | 莫霍克语 | moh | Latn | 拉丁字母文字模式 |
Nkundu | 蒙戈语 | lol | Latn | 拉丁字母文字模式 |
Nāhuatl | 纳瓦特尔语 | nah | Latn | 拉丁字母文字模式 |
Diné bizaad | Navajo | nv | Latn | 拉丁字母文字模式 |
恩东加语 | 恩东加语 | ng | Latn | 拉丁字母文字模式 |
ko e vagahau Niuē | 纽埃语 | niu | Latn | 拉丁字母文字模式 |
津巴布韦恩德贝莱 | 北恩德贝勒语 | nd | Latn | 拉丁字母文字模式 |
塞索托萨莱博亚 | 北索托语 | nso | Latn | 拉丁字母文字模式 |
奇切瓦,钦亚尼亚 | 尼扬贾语 | ny | Latn | 拉丁字母文字模式 |
鲁扬科雷 | 尼扬科莱语 | nyn | Latn | 拉丁字母文字模式 |
Chitonga | 汤加语(尼亚萨地区) | tog | Latn | 拉丁字母文字模式 |
Appolo | 恩济马语 | nzi | Latn | 拉丁字母文字模式 |
Occitan, lenga d'òc, provençal | 奥克语 | oc | Latn | 拉丁字母文字模式 |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | 奥杰布瓦语 | oj | Latn | 拉丁字母文字模式 |
Ænglisc, Englisc, Anglisc | 古英语 | ang | Latn | 拉丁字母文字模式 |
Franceis, François, Romanz | 古法语 | fro | Latn | 拉丁字母文字模式 |
Diutisk, Althochdeutsch | 古高地德语 | goh | Latn | 拉丁字母文字模式 |
Dǫnsk tunga | 古诺斯语 | non | Latn | 拉丁字母文字模式 |
奥克斯坦语 | 古普罗文斯语 | pro | Latn | 拉丁字母文字模式 |
ирон ӕвзаг | 奥塞特语 | os | Cyrl | 西里尔字母文字模式 |
邦板牙语 | 邦板牙语 | pam | Latn | 拉丁字母文字模式 |
Salitan Pangasinan | 邦阿西楠语 | pag | Latn | 拉丁字母文字模式 |
Papiamentu | 帕皮亚内托语 | pap | Latn | 拉丁字母文字模式 |
Português (Portugal) | 葡萄牙语 | pt-PT | Latn; 欧洲 | pt |
Kechua / Runa Simi | 克丘亚语 | qu | Latn | 拉丁字母文字模式 |
Rumantsch | 罗曼什语 | rm | Latn | 拉丁字母文字模式 |
Romani čhib | 吉普赛语 | rom | Latn | 拉丁字母文字模式 |
Ikirundi | 隆迪语 | rn | Latn | 拉丁字母文字模式 |
Gagana faʻa Sāmoa | 萨摩亚语 | sm | Latn | 拉丁字母文字模式 |
yângâ tî sängö | 桑戈语 | sg | Latn | 拉丁字母文字模式 |
(Braid) Scots, Lallans, Doric | 苏格兰语 | sco | Latn | 拉丁字母文字模式 |
Gàidhlig | 苏格兰盖尔语 | gd | Latn | 拉丁字母文字模式 |
chiShona | 修纳语 | sn | Latn | 拉丁字母文字模式 |
Songhay | Songhai | son | Latn | 拉丁字母文字模式 |
塞索托语 | 南索托文 | st | Latn | 拉丁字母文字模式 |
Español (Latinoamérica) | 西班牙语 | es-419 | Latn; 拉丁美洲 | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | 苏丹语 | su | Latn | 拉丁字母文字模式 |
siSwati | 斯瓦特语 | ss | Latn | 拉丁字母文字模式 |
Reo Tahiti | 塔希提语 | ty | Latn | 拉丁字母文字模式 |
KʌThemnɛ | 提姆语 | tem | Latn | 拉丁字母文字模式 |
lea faka-Tonga | 汤加语 | to | Latn | 拉丁字母文字模式 |
Xitsonga | 宗加语 | ts | Latn | 拉丁字母文字模式 |
Setswana | 茨瓦纳语 | tn | Latn | 拉丁字母文字模式 |
Türkmençe | 土库曼语 | tk | Latn | 西里尔字母文字模式 |
Tshivenḓa | 文达语 | ve | Latn | 拉丁字母文字模式 |
Frysk | 西弗里西亚语 | fy | Latn | 拉丁字母文字模式 |
沃洛夫语 | 沃洛夫语 | wo | Latn | 拉丁字母文字模式 |
isiXhosa | 班图语 | xh | Latn | 拉丁字母文字模式 |
Èdè Yorùbá | 约鲁巴语 | yo | Latn | 拉丁字母文字模式 |
Diidxazá | 萨波特克语 | zap | Latn | 拉丁字母文字模式 |