ML Kit'in konu segmentasyonu API'si, geliştiricilerin bir resimdeki birden fazla özneyi arka plandan kolayca ayırmasına olanak tanıyarak çıkartma oluşturma, arka plan değiştirme veya öznelere havalı efektler ekleme gibi kullanım alanlarını mümkün kılar.
Özneler, görselin ön planındaki en belirgin kişiler, evcil hayvanlar veya nesneler olarak tanımlanır. 2 özne birbirine çok yakınsa veya birbirine dokunuyorsa tek bir özne olarak kabul edilir.
Konu segmentasyonu API'si, giriş görüntüsü alır ve ön plan için çıkış maskesi veya bit eşlem oluşturur. Ayrıca, algılanan öznelerin her biri için maske ve bit eşlem sağlar (ön plan, tüm öznelere eşittir).
Varsayılan olarak ön plan maskesi ve ön plan bit eşlemi, giriş resmiyle aynı boyuttadır (her bir öznenin maskesi ve bit eşleminin boyutu muhtemelen giriş resmi boyutundan farklı olacaktır). Maskenin her bir pikseline 0.0
ile 1.0
arasında aralığa sahip bir kayan sayı atanır. Sayı 1.0
'e ne kadar yakın olursa pikselin bir konuyu temsil etmeyle ilgili güven o kadar yüksek olur.
Pixel 7 Pro'da ölçülen gecikme ortalama olarak 200 ms'dir. Bu API şu anda yalnızca statik resimleri desteklemektedir.
Temel özellikler
- Çok konu segmentasyonu: Tüm konular için birlikte tek bir maske ve bit eşlem yerine her bir konu için maskeler ve bit eşlemler sağlar.
- Özne tanıma: Tanınan özneler; nesneler, evcil hayvanlar ve insanlardır.
- Cihaz üzerinde işleme: Tüm işlemler, kullanıcı gizliliği korunarak ve ağ bağlantısı gerekmeden cihazda gerçekleştirilir.
Örnek sonuçlar
Resim Girin | Çıkış Resmi + Maske |
---|---|