在 Android 上使用 ML Kit 辨識文字語言

您可以使用 ML Kit 識別字串的語言。您可以取得字串最有可能的語言，以及字串所有可能語言的信賴分數。

ML Kit 可辨識超過 100 種語言的文字，並以原生文字顯示。此外，阿拉伯文、保加利亞文、中文、希臘文、北印度文、日文和俄文的羅馬拼音文字也能辨識。如需完整的支援語言和文字清單，請參閱這篇文章。

	組合	未綁定
程式庫名稱	`com.google.mlkit:language-id`	`com.google.android.gms:play-services-mlkit-language-id`
導入	模型會在建構階段靜態連結至應用程式。	模型會透過 Google Play 服務動態下載。
應用程式大小影響	大小增加約 900 KB。	大小增加約 200 KB。
初始化時間	模型會立即提供。	首次使用前可能需要等待模型下載完成。

立即試用

請試用範例應用程式，瞭解這個 API 的使用範例。

事前準備

這項 API 需要 Android API 級別 23 以上。請確認應用程式的建構檔案使用 23 以上的 minSdkVersion 值。

在專案層級的 build.gradle 檔案中，請務必在 buildscript 和 allprojects 區段中加入 Google 的 Maven 存放區。

將 ML Kit Android 程式庫的依附元件新增至模組的應用程式層級 Gradle 檔案，通常為 app/build.gradle。請依據需求選擇下列其中一個依附元件：

如要將模型與應用程式組合：

dependencies {
  // ...
  // Use this dependency to bundle the model with your app
  implementation 'com.google.mlkit:language-id:17.0.6'
}

在 Google Play 服務中使用模型：

dependencies {
  // ...
  // Use this dependency to use the dynamically downloaded model in Google Play Services
  implementation 'com.google.android.gms:play-services-mlkit-language-id:17.0.0'
}

如果選擇在 Google Play 服務中使用模型，您可以設定應用程式，在從 Play 商店安裝後自動將模型下載至裝置。如要這麼做，請在應用程式的 AndroidManifest.xml 檔案中加入以下宣告：
```
<application ...>
      ...
      <meta-data
          android:name="com.google.mlkit.vision.DEPENDENCIES"
          android:value="langid" >
      
</application>
```
您也可以透過 Google Play 服務 ModuleInstallClient API，明確檢查模型是否可用，並要求下載。

如果您未啟用安裝時模型下載或要求明確下載，模型會在您首次執行 ID 時下載。在下載完成前提出的要求不會產生任何結果。

辨識字串的語言

如要識別字串的語言，請呼叫 LanguageIdentification.getClient() 取得 LanguageIdentifier 的例項，然後將字串傳遞至 LanguageIdentifier 的 identifyLanguage() 方法。

例如：

Kotlin

val languageIdentifier = LanguageIdentification.getClient()
languageIdentifier.identifyLanguage(text)
        .addOnSuccessListener { languageCode ->
            if (languageCode == "und") {
                Log.i(TAG, "Can't identify language.")
            } else {
                Log.i(TAG, "Language: $languageCode")
            }
        }
        .addOnFailureListener {
            // Model couldn’t be loaded or other internal error.
            // ...
        }LanguageIdentificationActivity.kt

Java

LanguageIdentifier languageIdentifier =
        LanguageIdentification.getClient();
languageIdentifier.identifyLanguage(text)
        .addOnSuccessListener(
                new OnSuccessListener<String>() {
                    @Override
                    public void onSuccess(@Nullable String languageCode) {
                        if (languageCode.equals("und")) {
                            Log.i(TAG, "Can't identify language.");
                        } else {
                            Log.i(TAG, "Language: " + languageCode);
                        }
                    }
                })
        .addOnFailureListener(
                new OnFailureListener() {
                    @Override
                    public void onFailure(@NonNull Exception e) {
                        // Model couldn’t be loaded or other internal error.
                        // ...
                    }
                });LanguageIdentificationActivity.java

如果呼叫成功，系統會將 BCP-47 語言代碼傳遞至成功事件監聽器，指出文字的語言。如果系統無法準確偵測語言，則會傳遞 und (未確定) 程式碼。

根據預設，只有在語言的信心值至少為 0.5 時，ML Kit 才會傳回 und 以外的值。如要變更這個門檻，請將 LanguageIdentificationOptions 物件傳遞至 getClient()：

Kotlin

val languageIdentifier = LanguageIdentification
        .getClient(LanguageIdentificationOptions.Builder()
                .setConfidenceThreshold(0.34f)
                .build())LanguageIdentificationActivity.kt

Java

LanguageIdentifier languageIdentifier = LanguageIdentification.getClient(
        new LanguageIdentificationOptions.Builder()
                .setConfidenceThreshold(0.34f)
                .build());LanguageIdentificationActivity.java

取得字串的可能語言

如要取得字串最有可能語言的信賴度值，請取得 LanguageIdentifier 的例項，然後將字串傳遞至 identifyPossibleLanguages() 方法。

例如：

Kotlin

val languageIdentifier = LanguageIdentification.getClient()
languageIdentifier.identifyPossibleLanguages(text)
        .addOnSuccessListener { identifiedLanguages ->
            for (identifiedLanguage in identifiedLanguages) {
                val language = identifiedLanguage.languageTag
                val confidence = identifiedLanguage.confidence
                Log.i(TAG, "$language $confidence")
            }
        }
        .addOnFailureListener {
            // Model couldn’t be loaded or other internal error.
            // ...
        }LanguageIdentificationActivity.kt

Java

LanguageIdentifier languageIdentifier =
        LanguageIdentification.getClient();
languageIdentifier.identifyPossibleLanguages(text)
        .addOnSuccessListener(new OnSuccessListener<List<IdentifiedLanguage>>() {
            @Override
            public void onSuccess(List<IdentifiedLanguage> identifiedLanguages) {
                for (IdentifiedLanguage identifiedLanguage : identifiedLanguages) {
                    String language = identifiedLanguage.getLanguageTag();
                    float confidence = identifiedLanguage.getConfidence();
                    Log.i(TAG, language + " (" + confidence + ")");
                }
            }
        })
        .addOnFailureListener(
                new OnFailureListener() {
                    @Override
                    public void onFailure(@NonNull Exception e) {
                        // Model couldn’t be loaded or other internal error.
                        // ...
                    }
                });LanguageIdentificationActivity.java

如果呼叫成功，系統會將 IdentifiedLanguage 物件清單傳遞至成功監聽器。您可以從每個物件取得語言的 BCP-47 代碼，以及字串屬於該語言的信賴度。請注意，這些值表示整個字串屬於指定語言的信心程度，ML Kit 不會在單一字串中識別多種語言。

根據預設，ML Kit 只會傳回信心值至少為 0.01 的語言。如要變更這個門檻，請將 LanguageIdentificationOptions 物件傳遞至 getClient()：

Kotlin

val languageIdentifier = LanguageIdentification
      .getClient(LanguageIdentificationOptions.Builder()
              .setConfidenceThreshold(0.5f)
              .build())

Java

LanguageIdentifier languageIdentifier = LanguageIdentification.getClient(
      new LanguageIdentificationOptions.Builder()
              .setConfidenceThreshold(0.5f)
              .build());

如果沒有任何語言達到這個門檻，清單會包含一個項目，值為 und。

在 Android 上使用 ML Kit 辨識文字語言 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

立即試用

事前準備

辨識字串的語言

Kotlin

Java

Kotlin

Java

取得字串的可能語言

Kotlin

Java

Kotlin

Java

在 Android 上使用 ML Kit 辨識文字語言