ML Kit'in görüntü etiketleme API'leri sayesinde çok çeşitli kategorilerde bulunan bir görüntüdeki varlıklarla ilgili bilgileri algılayıp ayıklayabilirsiniz. Varsayılan resim etiketleme modeli; genel nesneleri, yerleri, etkinlikleri, hayvan türlerini, ürünleri ve daha fazlasını tanımlayabilir.
Algılamayı belirli bir kullanım alanına uyarlamak için özel bir görüntü sınıflandırma modeli de kullanabilirsiniz. Daha fazla bilgi için Özel bir TensorFlow Lite modeli kullanma bölümüne bakın.
Temel özellikler
- Genel amaçlı, güçlü bir temel sınıflandırıcı Fotoğraflarda en yaygın olarak bulunan nesneleri tanımlayan 400'den fazla kategoriyi tanır.
- Özel modellerle kullanım alanınıza göre uyarlayın TensorFlow Hub'daki önceden eğitilmiş diğer modelleri veya TensorFlow, AutoML Vision Edge ya da TensorFlow Lite Model oluşturucusu ile eğitilmiş kendi özel modelinizi kullanın.
- Kullanımı kolay üst düzey API'ler Düşük düzeyli model giriş/çıkışı, görüntü öncesi ve sonrası işleme veya işleme ardışık düzeni oluşturma işlemleriyle uğraşmaya gerek yoktur. ML Kit, etiketleri TensorFlow Lite modelinden alıp metin açıklaması olarak sunar.
Bu API'nin, tam görüntüyü açıklayan görüntü sınıflandırma modelleri için tasarlandığını unutmayın. Bir resimdeki ayakkabı veya mobilya gibi bir veya daha fazla nesneyi sınıflandırmak için Nesne Algılama ve İzleme API'si daha uygun olabilir.
Desteklenen görüntü sınıflandırma modelleri
Görüntü Etiketleme API'leri farklı görüntü sınıflandırma modellerini destekler:
Desteklenen görüntü sınıflandırma modelleri | |
---|---|
Temel model | API, varsayılan olarak fotoğraflarda en sık karşılaşılan kavramları kapsayan 400'den fazla varlığı tanıyan güçlü bir genel amaçlı resim etiketleme modeli kullanır. |
Özel TensorFlow Lite modelleri | API, uygulamaya özel kavramları hedeflemek için çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini kabul eder. Bunlar, TensorFlow Hub'dan indirilen önceden eğitilmiş modeller veya AutoML Vision Edge, TensorFlow Lite Model Maker ya da TensorFlow'un kendisi ile eğitilmiş kendi modelleriniz olabilir. Modeller, uygulamanızla birlikte paket haline getirilebilir veya Firebase Makine Öğrenimi ile barındırılabilir ve çalışma zamanında indirilebilir. |
Temel modeli kullanma
ML Kiti'nin temel modeli; kişileri, nesneleri, yerleri, etkinlikleri ve benzerlerini tanımlayan bir varlık listesi sunar. Her varlık, ML modelinin alaka düzeyine ne kadar güvendiğini gösteren bir puana sahiptir. Bu bilgiler sayesinde otomatik meta veri oluşturma ve içerik moderasyonu gibi görevleri gerçekleştirebilirsiniz. ML Kiti ile sağlanan varsayılan model 400'den fazla farklı varlığı tanır.
Örnek etiketler
Görüntü etiketleme API'sindeki temel model, aşağıdaki örnekler gibi 400'den fazla etiketi destekler:
Kategori | Örnek etiketler |
---|---|
Kişiler | Crowd Selfie Smile |
Etkinlikler | Dancing Eating Surfing |
Nesneler | Car Piano Receipt |
Hayvanlar | Bird Cat Dog |
Bitkiler | Flower Fruit Vegetable |
Yerler | Beach Lake Mountain |
Örnek sonuçlar
Fotoğrafta tanınan varlıkların bir örneğini burada görebilirsiniz.
Etiket 0 | |
---|---|
Metin | Stadyum |
Güven | 0,9205354 |
1. etiket | |
Metin | Spor |
Güven | 0,7531109 |
Etiket 2 | |
Metin | Etkinlik |
Güven | 0,66905296 |
Etiket 3 | |
Metin | Boş zaman |
Güven | 0,59904146 |
Etiket 4 | |
Metin | Futbol |
Güven | 0,56384534 |
Etiket 5 | |
Metin | Net |
Güven | 0,54679185 |
Etiket 6 | |
Metin | Bitki |
Güven | 0,524364 |
Özel bir TensorFlow Lite modeli kullanma
ML Kit'in temel görüntü etiketleme modeli, genel amaçlı kullanım için tasarlanmıştır. Fotoğraflarda en sık bulunan nesneleri tanımlayan 400 kategoriyi tanıyacak şekilde eğitilmiştir. Uygulamanız, daha dar sayıda kategoriyi daha ayrıntılı olarak tanıyan özel bir resim sınıflandırma modeline (ör. çiçek türlerini veya yiyecek türlerini ayıran bir model) ihtiyaç duyabilir.
Bu API, çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre özelleştirme yapmanıza olanak tanır. Daha fazla bilgi edinmek için lütfen Makine Öğrenimi Kiti ile özel modeller bölümüne bakın. Özel modeller, uygulamanızla birlikte paket haline getirilebilir veya Firebase Makine Öğrenimi'nin Model dağıtım hizmeti kullanılarak buluttan dinamik olarak indirilebilir.
Giriş resmi ön işlemesi
Gerekirse Görüntü Etiketleme, giriş resim boyutunu ve en boy oranını temel modelin gereksinimlerini karşılayacak şekilde ayarlamak için iki doğrusal görüntü ölçeklendirme ve genişletme kullanır.