Resim etiketleme

ML Kit'in görüntü etiketleme API'leri sayesinde çok çeşitli kategorilerde bulunan bir görüntüdeki varlıklarla ilgili bilgileri algılayıp ayıklayabilirsiniz. Varsayılan resim etiketleme modeli; genel nesneleri, yerleri, etkinlikleri, hayvan türlerini, ürünleri ve daha fazlasını tanımlayabilir.

Algılamayı belirli bir kullanım alanına uyarlamak için özel bir görüntü sınıflandırma modeli de kullanabilirsiniz. Daha fazla bilgi için Özel bir TensorFlow Lite modeli kullanma bölümüne bakın.

Temel özellikler

  • Genel amaçlı, güçlü bir temel sınıflandırıcı Fotoğraflarda en yaygın olarak bulunan nesneleri tanımlayan 400'den fazla kategoriyi tanır.
  • Özel modellerle kullanım alanınıza göre uyarlayın TensorFlow Hub'daki önceden eğitilmiş diğer modelleri veya TensorFlow, AutoML Vision Edge ya da TensorFlow Lite Model oluşturucusu ile eğitilmiş kendi özel modelinizi kullanın.
  • Kullanımı kolay üst düzey API'ler Düşük düzeyli model giriş/çıkışı, görüntü öncesi ve sonrası işleme veya işleme ardışık düzeni oluşturma işlemleriyle uğraşmaya gerek yoktur. ML Kit, etiketleri TensorFlow Lite modelinden alıp metin açıklaması olarak sunar.

Bu API'nin, tam görüntüyü açıklayan görüntü sınıflandırma modelleri için tasarlandığını unutmayın. Bir resimdeki ayakkabı veya mobilya gibi bir veya daha fazla nesneyi sınıflandırmak için Nesne Algılama ve İzleme API'si daha uygun olabilir.

Desteklenen görüntü sınıflandırma modelleri

Görüntü Etiketleme API'leri farklı görüntü sınıflandırma modellerini destekler:

Desteklenen görüntü sınıflandırma modelleri
Temel model API, varsayılan olarak fotoğraflarda en sık karşılaşılan kavramları kapsayan 400'den fazla varlığı tanıyan güçlü bir genel amaçlı resim etiketleme modeli kullanır.
Özel TensorFlow Lite modelleri API, uygulamaya özel kavramları hedeflemek için çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini kabul eder. Bunlar, TensorFlow Hub'dan indirilen önceden eğitilmiş modeller veya AutoML Vision Edge, TensorFlow Lite Model Maker ya da TensorFlow'un kendisi ile eğitilmiş kendi modelleriniz olabilir. Modeller, uygulamanızla birlikte paket haline getirilebilir veya Firebase Makine Öğrenimi ile barındırılabilir ve çalışma zamanında indirilebilir.

Temel modeli kullanma

ML Kiti'nin temel modeli; kişileri, nesneleri, yerleri, etkinlikleri ve benzerlerini tanımlayan bir varlık listesi sunar. Her varlık, ML modelinin alaka düzeyine ne kadar güvendiğini gösteren bir puana sahiptir. Bu bilgiler sayesinde otomatik meta veri oluşturma ve içerik moderasyonu gibi görevleri gerçekleştirebilirsiniz. ML Kiti ile sağlanan varsayılan model 400'den fazla farklı varlığı tanır.

iOS Android

Örnek etiketler

Görüntü etiketleme API'sindeki temel model, aşağıdaki örnekler gibi 400'den fazla etiketi destekler:

KategoriÖrnek etiketler
Kişiler Crowd
Selfie
Smile
Etkinlikler Dancing
Eating
Surfing
Nesneler Car
Piano
Receipt
Hayvanlar Bird
Cat
Dog
Bitkiler Flower
Fruit
Vegetable
Yerler Beach
Lake
Mountain

Örnek sonuçlar

Fotoğrafta tanınan varlıkların bir örneğini burada görebilirsiniz.

Fotoğraf: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Etiket 0
Metin Stadyum
Güven 0,9205354
1. etiket
Metin Spor
Güven 0,7531109
Etiket 2
Metin Etkinlik
Güven 0,66905296
Etiket 3
Metin Boş zaman
Güven 0,59904146
Etiket 4
Metin Futbol
Güven 0,56384534
Etiket 5
Metin Net
Güven 0,54679185
Etiket 6
Metin Bitki
Güven 0,524364

Özel bir TensorFlow Lite modeli kullanma

ML Kit'in temel görüntü etiketleme modeli, genel amaçlı kullanım için tasarlanmıştır. Fotoğraflarda en sık bulunan nesneleri tanımlayan 400 kategoriyi tanıyacak şekilde eğitilmiştir. Uygulamanız, daha dar sayıda kategoriyi daha ayrıntılı olarak tanıyan özel bir resim sınıflandırma modeline (ör. çiçek türlerini veya yiyecek türlerini ayıran bir model) ihtiyaç duyabilir.

Bu API, çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre özelleştirme yapmanıza olanak tanır. Daha fazla bilgi edinmek için lütfen Makine Öğrenimi Kiti ile özel modeller bölümüne bakın. Özel modeller, uygulamanızla birlikte paket haline getirilebilir veya Firebase Makine Öğrenimi'nin Model dağıtım hizmeti kullanılarak buluttan dinamik olarak indirilebilir.

iOS Android

Giriş resmi ön işlemesi

Gerekirse Görüntü Etiketleme, giriş resim boyutunu ve en boy oranını temel modelin gereksinimlerini karşılayacak şekilde ayarlamak için iki doğrusal görüntü ölçeklendirme ve genişletme kullanır.