חילוץ ישויות באמצעות ערכת ML ב-Android

כדי לנתח קטע טקסט ולחלץ את הישויות שבו, מפעילים את השיטה annotate() ומעבירים לה את מחרוזת הטקסט או מופע של EntityExtractionParams, שבו אפשר לציין אפשרויות נוספות כמו שעון פנייה, אזור זמן או מסנן כדי להגביל את החיפוש לקבוצת משנה של סוגי ישויות. ה-API מחזיר רשימה של אובייקטים מסוג EntityAnnotation שמכילים מידע על כל ישות.

שם ה-SDKentity-extraction
הטמעההנכסים של הגלאי הבסיסי מקושרים באופן סטטי לאפליקציה שלכם בזמן ה-build.
ההשפעה של גודל הנכסחילוץ ישויות משפיע על גודל האפליקציה בכ-5.6MB.

רוצה לנסות?

לפני שמתחילים

  1. בקובץ build.gradle ברמת הפרויקט, חשוב לוודא שמאגר Maven של Google נכלל גם בקטע buildscript וגם בקטע allprojects.
  2. מוסיפים את התלות בספריית החילוץ של ישויות ב-ML Kit לקובץ ה-Gradle ברמת האפליקציה של המודול, שבדרך כלל נקרא app/build.gradle:

    dependencies {
    // …
    implementation 'com.google.mlkit:entity-extraction:16.0.0-beta5'

חילוץ ישויות

יצירת אובייקט EntityExtractor והגדרה שלו באמצעות EntityExtractorOptions


val entityExtractor =


EntityExtractor entityExtractor =
            new EntityExtractorOptions.Builder(EntityExtractorOptions.ENGLISH)

אפשר גם להגדיר Executor בהתאמה אישית ב-EntityExtractorOptions, אם צריך. אחרת, המערכת תשתמש ב-Executor שמוגדר כברירת מחדל ב-ML Kit.

מוודאים שהמודל הנדרש הועלה למכשיר.


  .addOnSuccessListener { _ ->
    /* Model downloading succeeded, you can call extraction API here. */
  .addOnFailureListener { _ -> /* Model downloading failed. */ }


        aVoid -> {
          // Model downloading succeeded, you can call the extraction API here. 
        exception -> {
          // Model downloading failed.

אחרי שמוודאים שהמודל הוריד, מעבירים מחרוזת או את הערך EntityExtractionParams אל annotate(). אל תתקשרו למספר annotate() עד שתדעו שהדגם זמין.


val params =
      EntityExtractionParams.Builder("My flight is LX373, please pick me up at 8am tomorrow.")
        .setEntityTypesFilter((/* optional entity type filter */)
        .setPreferredLocale(/* optional preferred locale */)
        .setReferenceTime(/* optional reference date-time */)
        .setReferenceTimeZone(/* optional reference timezone */)
      .addOnSuccessListener {
        // Annotation process was successful, you can parse the EntityAnnotations list here.
      .addOnFailureListener {
        // Check failure message here.


EntityExtractionParams params = new EntityExtractionParams
        .Builder("My flight is LX373, please pick me up at 8am tomorrow.")
        .setEntityTypesFilter(/* optional entity type filter */)
        .setPreferredLocale(/* optional preferred locale */)
        .setReferenceTime(/* optional reference date-time */)
        .setReferenceTimeZone(/* optional reference timezone */)
        .addOnSuccessListener(new OnSuccessListener<List<EntityAnnotation>>() {
          public void onSuccess(List<EntityAnnotation> entityAnnotations) {
            // Annotation process was successful, you can parse the EntityAnnotations list here.
        .addOnFailureListener(new OnFailureListener() {
          public void onFailure(@NonNull Exception e) {
            // Check failure message here.

השדות PreferredLocale, ‏ ReferenceTime ו-ReferenceTimeZone ישפיעו רק על ישויות DateTime. אם לא מגדירים אותם במפורש, הם מוגדרים כברירת מחדל לפי הערכים במכשיר של המשתמש.

מפעילים לולאה על תוצאות ההערות כדי לאחזר מידע על הישויות שזוהו.


for (entityAnnotation in entityAnnotations) {
  val entities: List<Entity> = entityAnnotation.entities

  Log.d(TAG, "Range: ${entityAnnotation.start} - ${entityAnnotation.end}")
  for (entity in entities) {
    when (entity) {
      is DateTimeEntity -> {
        Log.d(TAG, "Granularity: ${entity.dateTimeGranularity}")
        Log.d(TAG, "TimeStamp: ${entity.timestampMillis}")
      is FlightNumberEntity -> {
        Log.d(TAG, "Airline Code: ${entity.airlineCode}")
        Log.d(TAG, "Flight number: ${entity.flightNumber}")
      is MoneyEntity -> {
        Log.d(TAG, "Currency: ${entity.unnormalizedCurrency}")
        Log.d(TAG, "Integer part: ${entity.integerPart}")
        Log.d(TAG, "Fractional Part: ${entity.fractionalPart}")
      else -> {
        Log.d(TAG, "  $entity")


List<EntityAnnotation> entityAnnotations = /* Get from EntityExtractor */;
for (EntityAnnotation entityAnnotation : entityAnnotations) {
  List<Entity> entities = entityAnnotation.getEntities();

  Log.d(TAG, String.format("Range: [%d, %d)", entityAnnotation.getStart(), entityAnnotation.getEnd()));
  for (Entity entity : entities) {
    switch (entity.getType()) {
      case Entity.TYPE_DATE_TIME:
        DateTimeEntity dateTimeEntity = entity.asDateTimeEntity();
        Log.d(TAG, "Granularity: " + dateTimeEntity.getDateTimeGranularity());
        Log.d(TAG, "Timestamp: " + dateTimeEntity.getTimestampMillis());
      case Entity.TYPE_FLIGHT_NUMBER:
        FlightNumberEntity flightNumberEntity = entity.asFlightNumberEntity();
        Log.d(TAG, "Airline Code: " + flightNumberEntity.getAirlineCode());
        Log.d(TAG, "Flight number: " + flightNumberEntity.getFlightNumber());
      case Entity.TYPE_MONEY:
        MoneyEntity moneyEntity = entity.asMoneyEntity();
        Log.d(TAG, "Currency: " + moneyEntity.getUnnormalizedCurrency());
        Log.d(TAG, "Integer Part: " + moneyEntity.getIntegerPart());
        Log.d(TAG, "Fractional Part: " + moneyEntity.getFractionalPart());
      case Entity.TYPE_UNKNOWN:
        Log.d(TAG, "Entity: " + entity);

צריך לקרוא לשיטה close() כשאין יותר צורך באובייקט EntityExtractor. אם אתם משתמשים ב-EntityExtractor ב-Fragment או ב-AppCompatActivity, אתם יכולים להפעיל את LifecycleOwner.getLifecycle() ב-Fragment או ב-AppCompatActivity ואז את Lifecycle.addObserver. לדוגמה:


val options = 
val extractor = EntityExtraction.getClient(options);


EntityExtractorOptions options = 
EntityExtractor extractor = EntityExtraction.getClient(options);

ניהול מפורש של מודלים לחילוץ ישויות

כשמשתמשים ב-API לחילוץ ישויות כפי שמתואר למעלה, ML Kit מוריד באופן אוטומטי מודלים ספציפיים לשפה למכשיר לפי הצורך (כשקוראים ל-downloadModelIfNeeded()). אפשר גם לנהל באופן מפורש את המודלים שרוצים שיהיו זמינים במכשיר באמצעות ממשק ה-API לניהול מודלים של ML Kit. האפשרות הזו שימושית אם רוצים להוריד מודלים מראש. ממשק ה-API מאפשר גם למחוק מודלים שכבר לא נדרשים.


val modelManager = RemoteModelManager.getInstance()

// Get entity extraction models stored on the device.
  .addOnSuccessListener {
    // ...
    // Error.
// Delete the German model if it's on the device.
val germanModel =
    // Model deleted.
    // Error.
// Download the French model.
val frenchModel =
val conditions =
modelManager.download(frenchModel, conditions)
    // Model downloaded.
    // Error.


// Get entity extraction models stored on the device.
    .addOnSuccessListener(new OnSuccessListener<Set<EntityExtractionRemoteModel>>() {
      public void onSuccess(Set<EntityExtractionRemoteModel> models) {
        // ...
    .addOnFailureListener(new OnFailureListener() {
      public void onFailure(@NonNull Exception e) {
        // Error.

// Delete the German model if it's on the device.
EntityExtractionRemoteModel germanModel = new EntityExtractionRemoteModel.Builder(EntityExtractorOptions.GERMAN).build();
        .addOnSuccessListener(new OnSuccessListener<Void>() {
          public void onSuccess(Void v) {
            // Model deleted.
        .addOnFailureListener(new OnFailureListener() {
          public void onFailure(@NonNull Exception e) {
            // Error.

// Download the French model.
EntityExtractionRemoteModel frenchModel = new EntityExtractionRemoteModel.Builder(EntityExtractorOptions.FRENCH).build();
    DownloadConditions conditions = new DownloadConditions.Builder()
    modelManager.download(frenchModel, conditions)
        .addOnSuccessListener(new OnSuccessListener<Void>() {
          public void onSuccess(Void v) {
            // Model downloaded.
        .addOnFailureListener(new OnFailureListener() {
          public void onFailure(@NonNull Exception e) {
            // Error.