Обзор API-интерфейсов GenAI для ML Kit

API GenAI от ML Kit используют возможности Gemini Nano , чтобы помочь вашим приложениям выполнять задачи. Эти API обеспечивают высокое качество работы для популярных сценариев использования благодаря высокоуровневому интерфейсу. API GenAI от ML Kit построены на основе AICore , системной службы Android, которая позволяет запускать базовые модели GenAI на устройстве для реализации таких функций, как расширенная функциональность приложений и повышение конфиденциальности пользователей за счет локальной обработки данных.

К использованию API GenAI применяются Дополнительные условия обслуживания ML Kit . Разработчики несут полную ответственность за безопасность своего API-клиента и удобство использования своего приложения.

Основные характеристики

API-интерфейсы ML Kit GenAI поддерживают следующие функции:

  • Подведение итогов : Представьте краткое содержание статей или переписок в чате в виде маркированного списка.
  • Корректура : улучшена качество коротких текстов путем корректировки грамматики и исправления орфографических ошибок.
  • Переписывание : Переписывание коротких сообщений в другом тоне или стиле.
  • Описание изображения : Сгенерировать краткое описание заданного изображения.
  • Распознавание речи : преобразование аудиоконтента в текст.
  • Подсказка : Сгенерировать текстовое содержимое на основе пользовательской текстовой или мультимодальной подсказки.

Преимущества API GenAI

Подобно другим существующим функциям ML Kit, API GenAI работают полностью на устройстве и, следовательно, предоставляют следующие преимущества:

  • Входные, логические и выходные данные обрабатываются локально.
  • Функциональность остаётся неизменной и без надёжного интернет-соединения.
  • За каждый вызов API не взимается дополнительная плата за сервер.

Кроме того, поскольку API GenAI построены на основе AICore и работают на базе Gemini Nano, каждое приложение может использовать общую модель Gemini Nano, установленную на устройстве. Это позволяет избежать необходимости ждать загрузки модели, если она уже существует на устройстве, и, в свою очередь, экономит место на диске. Узнайте больше о том, как AICore изолирует запросы для защиты конфиденциальности .

Стриминг против нестриминга

API ML Kit GenAI предлагают как потоковый, так и непрерывный способы получения результатов. Потоковый API доставляет ответы постепенно по мере их генерации, обеспечивая непрерывный поток данных. В отличие от него, непрерывный API ожидает завершения всего ответа, прежде чем вернуть его в виде единого блока.

Для длинных ответов выбирайте потоковый API, поскольку он обеспечивает более быструю первоначальную обратную связь. Непотоковый API больше подходит для коротких ответов или при пакетной обработке результатов.

Поддержка устройств

Специализированные API GenAI (суммирование, проверка орфографии, переписывание текста и описание изображений) поддерживают другие устройства, чем API Prompt, как описано в следующих разделах.

Поддержка устройств с API, специфичным для каждой функции.

API для суммирования , проверки орфографии , переписывания текста и описания изображений доступны на следующих устройствах, и планируется расширение поддержки на другие устройства:

  • Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Honor 400 Pro, Magic 6 Pro, Magic 6 RSR, Magic 7, Magic 7 Pro, Magic V3, Magic V5
  • iQOO: iQOO 13
  • Motorola: Razr 60 Ultra
  • OnePlus: OnePlus 13, OnePlus 13s, OnePlus Pad 3
  • OPPO: Find N5, Find X8, Find X8 Pro, Reno 14 Pro
  • POCO: POCO F7 Ultra, POCO X7 Pro
  • realme: realme GT 7 Pro, realme GT 7T
  • Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy Z Fold7
  • vivo: vivo X200, vivo X200 Pro, vivo X Fold3 Pro, vivo X Fold5
  • Xiaomi: Xiaomi 15 Ultra, Xiaomi 15, Xiaomi 15T Pro, Xiaomi 15T, Xiaomi Pad Mini

Доступность поддержки конкретных языков может варьироваться в зависимости от конфигурации устройства и моделей, загруженных на него.

Поддержка устройств с оперативным API

API Prompt поддерживается на следующих устройствах:

нано-v2

  • Google: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Magic V5, Magic 7, Magic 7 Pro
  • iQOO: iQOO 13
  • Motorola: Razr 60 Ultra
  • OnePlus: OnePlus 13, OnePlus 13s, OnePlus Pad 3
  • OPPO: Find N5, Find X8, Find X8 Pro, Reno 14 Pro
  • POCO: POCO F7 Ultra, POCO X7 Pro
  • realme: realme GT 7 Pro, realme GT 7T
  • Samsung: Galaxy Z Fold7
  • vivo: vivo X200, vivo X200 Pro
  • Xiaomi: Xiaomi 15 Ultra, Xiaomi 15, Xiaomi 15T Pro, Xiaomi 15T, Xiaomi Pad Mini

нано-v3

  • Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold

Поддержка устройств API распознавания речи

API распознавания речи поддерживается на следующих устройствах:

Базовый режим Использует традиционную модель распознавания речи, встроенную в устройство, доступную на большинстве устройств Android с API уровня 31 и выше.
Расширенный режим Использует модель GenAI для повышения качества и расширения языкового охвата. Поддерживается устройствами Pixel 10, разработка ведется для других устройств.

Получить версию Gemini Nano

Разные версии Gemini Nano работают на разных устройствах. Чтобы узнать версию Gemini Nano на устройстве, используйте getBaseModelName() .

Квота на одно заявление

AICore устанавливает квоту на выполнение запросов для каждого приложения. Слишком большое количество запросов к API GenAI за короткий период времени приведет к ошибке ErrorCode.BUSY . При получении такой ошибки рекомендуется использовать экспоненциальную задержку для повторной попытки запроса. Кроме того, если приложение превышает квоту на длительный период (например, суточную квоту), может быть возвращено значение ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED .

Фоновое использование

Вывод данных через API GenAI разрешен только тогда, когда приложение находится на переднем плане. Использование API, когда приложение не находится на переднем плане, включая использование службы переднего плана, приведет к ошибке ErrorCode.BACKGROUND_USE_BLOCKED .

Пример кода

Чтобы получить этот код, ознакомьтесь со следующими примерами: