Segmentación de temas

La API de segmentación de temas del Kit de AA permite a los desarrolladores separar fácilmente varios sujetos del fondo de una foto, lo que habilita casos de uso como la creación de calcomanías, el intercambio de fondos o la adición de efectos geniales a los sujetos.

Los sujetos se definen como las personas, los objetos o las mascotas más destacados en el primer plano de la imagen. Si 2 personas están muy cerca o se tocan entre sí, se consideran como un solo sujeto.

La API de segmentación de temas toma una imagen de entrada y genera una máscara de salida o un mapa de bits para el primer plano. También proporciona una máscara y un mapa de bits para cada uno de los sujetos detectados (el primer plano es igual a todos los sujetos combinados).

De forma predeterminada, la máscara en primer plano y el mapa de bits en primer plano tienen el mismo tamaño que la imagen de entrada (es probable que el tamaño de la máscara y el mapa de bits de cada sujeto individual difiera del tamaño de la imagen de entrada). A cada píxel de la máscara se le asigna un número de punto flotante que tiene un rango entre 0.0 y 1.0. Cuanto más cercano sea el número a 1.0, mayor será la confianza de que el píxel represente un sujeto y viceversa.

En promedio, la latencia medida en el Pixel 7 Pro es de alrededor de 200 ms. Actualmente, esta API solo admite imágenes estáticas.

Android

Funciones clave

  • Segmentación de varios temas: Proporciona máscaras y mapas de bits para cada objeto individual, en lugar de una sola máscara y un mapa de bits para todos los sujetos combinados.
  • Reconocimiento de sujetos: Los sujetos reconocidos son objetos, mascotas y humanos.
  • Procesamiento en el dispositivo: Todo el procesamiento se realiza en el dispositivo, lo que preserva la privacidad del usuario y no requiere conectividad de red.

Resultados de ejemplo

Imagen de entrada Imagen de salida + máscara