Resim etiketleme

ML Kit'in resim etiketleme API'leri sayesinde, çok sayıda kategori içinde bir resimdeki varlıklarla ilgili bilgileri algılayıp ayıklayabilirsiniz. Varsayılan resim etiketleme modeli genel nesneleri, yerleri, etkinlikleri, hayvan türlerini, ürünleri ve daha fazlasını tanımlayabilir.

Algılamayı belirli bir kullanım alanına uyarlamak için özel bir resim sınıflandırma modeli de kullanabilirsiniz. Daha fazla bilgi için Özel TensorFlow Lite modeli kullanma bölümüne bakın.

Temel özellikler

  • Güçlü, genel amaçlı temel sınıflandırıcı Fotoğraflarda en sık bulunan nesneleri açıklayan 400'den fazla kategoriyi tanır.
  • Özel modeller ile kullanım alanınıza uygun TensorFlow Hub'dan önceden eğitilmiş diğer modelleri veya TensorFlow, AutoML Vision Edge ya da TensorFlow Lite Model maker ile eğitilen özel modelinizi kullanın.
  • Kullanımı kolay üst düzey API'ler Düşük düzeyli model girişi/çıkışı, görüntü öncesi ve sonrası işleme veya işleme ardışık düzeni oluşturma gerekmez. ML Kit, etiketleri TensorFlow Lite modelinden çıkarır ve metin açıklaması olarak sağlar.

Bu API'nin, tam görüntüyü açıklayan resim sınıflandırma modelleri için tasarlandığını unutmayın. Nesne Algılama ve İzleme API'si, bir resimdeki bir veya daha fazla nesneyi (ayakkabılar veya mobilya parçaları gibi) sınıflandırmak için daha uygun olabilir.

Desteklenen resim sınıflandırma modelleri

Image Labeling API'leri farklı resim sınıflandırma modellerini destekler:

Desteklenen resim sınıflandırma modelleri
Temel model Varsayılan olarak API, fotoğraflarda en sık bulunan kavramları kapsayan 400'den fazla varlığı tanıyan güçlü, genel amaçlı bir görüntü etiketleme modeli kullanır.
Özel TensorFlow Lite modelleri Uygulamaya özel kavramları hedeflemek için API çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini kabul eder. Bunlar, TensorFlow Hub'dan indirilen önceden eğitilmiş modeller veya AutoML Vision Edge, TensorFlow Lite Model Maker ya da TensorFlow'un kendisi tarafından eğitilen kendi modelleriniz olabilir. Modeller uygulamanızla birlikte paket haline getirilebilir veya Firebase Makine Öğrenimi ile barındırılabilir ve çalışma sırasında indirilebilir.

Temel modeli kullanma

ML Kit'in temel modeli; kişileri, nesneleri, yerleri, etkinlikleri ve benzer öğeleri tanımlayan varlıkların listesini döndürür. Her varlık, makine öğrenimi modelinin alaka düzeyine ne kadar güvendiğini belirten bir puana sahiptir. Bu bilgiler sayesinde otomatik meta veri oluşturma ve içerik denetimi gibi görevleri gerçekleştirebilirsiniz. ML Kit ile sağlanan varsayılan model 400'den fazla farklı varlığı tanır.

iOS Android

Örnek etiketler

Image labeling API'deki temel model 400+ etiketleri destekler, örneğin:

KategoriÖrnek etiketler
Kişiler Crowd
Selfie
Smile
Etkinlikler Dancing
Eating
Surfing
Nesneler Car
Piano
Receipt
Hayvanlar Bird
Cat
Dog
Bitkiler Flower
Fruit
Vegetable
Yerler Beach
Lake
Mountain

Örnek sonuçlar

Fotoğrafta tanınan varlıkların bir örneğini burada bulabilirsiniz.

Fotoğraf: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Etiket 0
Text Stadyum
Güven 0,9205354
1. etiket
Text Spor
Güven 0,7531109
Etiket 2
Text Etkinlik
Güven 0,66905296
Etiket 3
Text Boş zaman
Güven 0,59904146
Etiket 4
Text Futbol
Güven 0,56384534
Etiket 5
Text Net
Güven 0,54679185
Etiket 6
Text Bitki
Güven 0,524364

Özel TensorFlow Lite modeli kullanma

ML Kit'in temel görüntü etiketleme modeli genel kullanım için tasarlanmıştır. Fotoğraflarda en sık bulunan nesneleri açıklayan 400 kategoriyi tanımak için eğitildi. Uygulamanızın çiçek türlerini veya yiyecek türlerini birbirinden ayıran bir model gibi, daha dar bir kategori sayısını daha ayrıntılı biçimde tanımlayan özel bir görüntü sınıflandırma modeline ihtiyacı olabilir.

Bu API, çok çeşitli kaynaklardan özel resim sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre uyarlama yapmanıza olanak tanır. Daha fazla bilgi için lütfen ML Kit ile özel modeller sayfasına göz atın. Özel modeller uygulamanızla birlikte paket haline getirilebilir veya Firebase Machine Learning'in Model dağıtım hizmeti aracılığıyla buluttan dinamik olarak indirilebilir.

iOS Android

Giriş resmini önceden işleme

Resim etiketleme, giriş resmi boyutunu ve en boy oranını temel modelin gereksinimlerine uyacak şekilde ayarlamak için gerekirse çift yönlü resim ölçeklendirme ve genişletme kullanır.