La API de segmentación de temas del Kit de AA permite a los desarrolladores separar fácilmente varios sujetos del fondo de una foto, lo que habilita casos de uso como la creación de calcomanías, el intercambio de fondos o la adición de efectos geniales a los sujetos.
Los sujetos se definen como las personas, los objetos o las mascotas más destacados en el primer plano de la imagen. Si 2 personas están muy cerca o se tocan entre sí, se consideran como un solo sujeto.
La API de segmentación de temas toma una imagen de entrada y genera una máscara de salida o un mapa de bits para el primer plano. También proporciona una máscara y un mapa de bits para cada uno de los sujetos detectados (el primer plano es igual a todos los sujetos combinados).
De forma predeterminada, la máscara en primer plano y el mapa de bits en primer plano tienen el mismo tamaño que la imagen de entrada (es probable que el tamaño de la máscara y el mapa de bits de cada sujeto individual difiera del tamaño de la imagen de entrada). A cada píxel de la máscara se le asigna un número de punto flotante que tiene un rango entre 0.0
y 1.0
. Cuanto más cercano sea el número a 1.0
, mayor será la confianza de que el píxel represente un sujeto y viceversa.
En promedio, la latencia medida en el Pixel 7 Pro es de alrededor de 200 ms. Actualmente, esta API solo admite imágenes estáticas.
Funciones clave
- Segmentación de varios temas: Proporciona máscaras y mapas de bits para cada objeto individual, en lugar de una sola máscara y un mapa de bits para todos los sujetos combinados.
- Reconocimiento de sujetos: Los sujetos reconocidos son objetos, mascotas y humanos.
- Procesamiento en el dispositivo: Todo el procesamiento se realiza en el dispositivo, lo que preserva la privacidad del usuario y no requiere conectividad de red.
Resultados de ejemplo
Imagen de entrada | Imagen de salida + máscara |
---|---|