ML Kit のオンデバイス言語識別 API を使用すると、テキストの文字列の言語を判別できます。
言語識別は、ユーザー指定のテキストを処理する際に便利です。多くの場合、ユーザー指定のテキストには言語情報が含まれていないからです。
主な機能
幅広い言語のサポート。100 を超える言語を識別します。全リストをご覧ください。
ローマ字テキストをサポート。アラビア語、ブルガリア語、ギリシャ語、ヒンディー語、日本語、ロシア語、中国語のテキストを、ネイティブの文字とローマ字の両方で識別します。
検索結果の例
シンプルな言語識別 | |
---|---|
「私のホバークラフトはうなぎだ。」 | en (英語) |
「Dao shan xue hai」 | zh-Latn (ラテン化中国語) |
「ph'nglui mglw'nafh wgah'nagl fhtagn」 | und (不確定) |
信頼度分布 | |
---|---|
「an amicable coup d'etat」 |
en (0.52)fr (0.44)ca (0.03) |