借助机器学习套件的主题分割 API,开发者可以轻松地区分图片中的多个对象与背景,从而实现贴纸创建、背景交换或为对象添加炫酷效果等使用场景。
正文是指图片前景中最突出的人物、宠物或物体。如果 2 个对象离得非常近或相距很近,则它们会被视为一个对象。
主题分割 API 接受输入图片,并为前景生成输出蒙版或位图。它还为检测到的每个对象提供蒙版和位图(前景等于所有对象合并在一起)。
默认情况下,前景蒙版和前景位图与输入图片的大小相同(各个正文的蒙版和位图的大小可能不同于输入图片的大小)。遮罩的每个像素都分配有一个浮点数,范围介于 0.0
和 1.0
之间。数字越接近 1.0
,像素代表对象的置信度就越高,反之亦然。
在 Pixel 7 Pro 上测得的平均延迟时间约为 200 毫秒。此 API 目前仅支持静态图片。
主要功能
- 多主题分割:为每个不同的对象提供蒙版和位图,而不是为所有对象组合提供单一的蒙版和位图。
- 正文识别:识别出的拍摄对象为物体、宠物和人类。
- 设备端处理:所有处理均在设备上执行,保护用户隐私,无需网络连接。
示例结果
输入图片 | 输出图像 + 蒙版 |
---|---|