एमएल किट में मौजूद इमेज को लेबल करने वाले एपीआई की मदद से, इमेज की इकाइयों के बारे में जानकारी पाई जा सकती है और उनसे जुड़ी जानकारी निकाली जा सकती है. इस सुविधा का इस्तेमाल, कई कैटगरी के ग्रुप में किया जा सकता है. इमेज लेबल करने का डिफ़ॉल्ट मॉडल, सामान्य चीज़ों, जगहों, गतिविधियों, जानवरों की जातियों, प्रॉडक्ट वगैरह की पहचान करता है.
आप उपयोग के किसी खास उदाहरण के हिसाब से पहचानने के लिए कस्टम इमेज क्लासिफ़िकेशन मॉडल का भी इस्तेमाल कर सकते हैं. ज़्यादा जानकारी के लिए, कस्टम TensorFlow लाइट मॉडल का इस्तेमाल करना देखें.
मुख्य सुविधाएं
- खास मकसद के लिए इस्तेमाल की जाने वाली बुनियादी कैटगरी तय करने वाली सुविधा 400 से ज़्यादा कैटगरी की पहचान करती है. ये कैटगरी, फ़ोटो में सबसे ज़्यादा मिलने वाले ऑब्जेक्ट की जानकारी देती हैं.
- कस्टम मॉडल के साथ, इस्तेमाल के उदाहरण के हिसाब से बदलाव करें TenorFlow Hub या TensorFlow, AutoML Vision Edge या TensorFlow Lite मॉडल बनाने वाली कंपनी की मदद से बनाए गए कस्टम मॉडल का इस्तेमाल करके, अपनी पसंद के मुताबिक मॉडल का इस्तेमाल करें.
- इस्तेमाल करने में आसान हाई-लेवल एपीआई कम लेवल वाले मॉडल इनपुट/आउटपुट, इमेज प्री- और पोस्ट-प्रोसेसिंग या प्रोसेसिंग पाइपलाइन बनाने से जुड़ी कोई ज़रूरत नहीं है. ML किट, TensorFlow लाइट मॉडल से लेबल निकालता है और उन्हें टेक्स्ट के तौर पर दिखाता है.
ध्यान दें कि यह एपीआई, इमेज की कैटगरी तय करने वाले उन मॉडल के लिए है जिनमें पूरी इमेज होती है. किसी इमेज में जूते या फ़र्नीचर के हिस्से जैसे एक से ज़्यादा ऑब्जेक्ट को कैटगरी में बांटने के लिए, ऑब्जेक्ट का पता लगाना और ट्रैकिंग एपीआई बेहतर विकल्प हो सकता है.
Google Images के साथ काम करने वाले मॉडल
इमेज लेबलिंग एपीआई, इमेज की कैटगरी तय करने वाले अलग-अलग मॉडल के साथ काम करते हैं:
Google Images के साथ काम करने वाले मॉडल | |
---|---|
बेस मॉडल | एपीआई डिफ़ॉल्ट रूप से, एक बेहतर मकसद वाले इमेज लेबलिंग मॉडल का इस्तेमाल करता है. यह मॉडल, 400 से ज़्यादा इकाइयों की पहचान करता है, जो फ़ोटो में सबसे ज़्यादा मिलने वाली सिद्धांतों को शामिल करती हैं. |
कस्टम TensorFlow लाइट मॉडल | ऐप्लिकेशन के हिसाब से बने कॉन्सेप्ट को टारगेट करने के लिए, एपीआई कई तरह के सोर्स से, इमेज की कैटगरी तय करने वाले कस्टम मॉडल स्वीकार करता है. ये TensorFlow हब से डाउनलोड किए गए मॉडल हो सकते हैं. इसके अलावा, आपके पास अपने मॉडल को AutoML Vision Edge, TensorFlow Lite Model Maker या TensorFlow से ट्रेनिंग लेने का विकल्प भी होता है. मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Firebase मशीन लर्निंग के साथ होस्ट किया जा सकता है और रन-टाइम पर डाउनलोड किया जा सकता है. |
मूल मॉडल का इस्तेमाल करना
मशीन लर्निंग (एमएल) का बुनियादी मॉडल लोगों, चीज़ों, जगहों, गतिविधियों वगैरह की पहचान करने वाली इकाइयों की सूची दिखाता है. हर इकाई के पास एक स्कोर होता है, जो यह बताता है कि मशीन लर्निंग के मॉडल की प्रासंगिकता कितनी है. इस जानकारी की मदद से, अपने-आप मेटाडेटा जनरेट होने और कॉन्टेंट मॉडरेट करने जैसे काम किए जा सकते हैं. एमएल किट का डिफ़ॉल्ट मॉडल 400 से ज़्यादा इकाइयों की पहचान करता है.
लेबल के उदाहरण
इमेज लेबलिंग एपीआई में मौजूद बेस मॉडल में 400 से ज़्यादा लेबल काम करते हैं, जैसे कि ये उदाहरण:
कैटगरी | लेबल के उदाहरण |
---|---|
लोग | Crowd Selfie Smile |
गतिविधियां | Dancing Eating Surfing |
चीज़ें | Car Piano Receipt |
जानवर | Bird Cat Dog |
पौधे | Flower Fruit Vegetable |
जगहें | Beach Lake Mountain |
परिणामों के उदाहरण
यहां दी गई फ़ोटो में मौजूद इकाइयों की जानकारी दी गई है.

लेबल 0 | |
---|---|
टेक्स्ट | स्टेडियम |
आत्मविश्वास | 0.9205354 से शुरू |
लेबल 1 | |
टेक्स्ट | खेल |
आत्मविश्वास | 0.7531109 |
लेबल 2 | |
टेक्स्ट | इवेंट |
आत्मविश्वास | 0.66905296 |
लेबल 3 | |
टेक्स्ट | फ़ुर्सत के पल |
आत्मविश्वास | 0.59904146 |
लेबल 4 | |
टेक्स्ट | सॉकर |
आत्मविश्वास | 0.56384534 से मेल खाता है |
लेबल 5 | |
टेक्स्ट | कुल |
आत्मविश्वास | 0.54679185 |
लेबल 6 | |
टेक्स्ट | पौधा |
आत्मविश्वास | 0.524364 |
कस्टम TensorFlow लाइट मॉडल का इस्तेमाल करना
मशीन लर्निंग किट के बेस इमेज लेबलिंग मॉडल को सामान्य कामों के लिए बनाया गया है. फ़ोटो की 400 अलग-अलग कैटगरी को पहचानना आसान होता है. आपके ऐप्लिकेशन को इमेज की कैटगरी तय करने के लिए, किसी खास मॉडल की ज़रूरत पड़ सकती है. इससे, कैटगरी की कम संख्या के बारे में ज़्यादा जानकारी मिलती है. जैसे, ऐसा मॉडल जो फूलों की प्रजातियों या खाने के टाइप के बीच अंतर करता है.
यह एपीआई, आपको कई तरह के स्रोतों से कस्टम इमेज की कैटगरी तय करने वाले मॉडल के हिसाब से, इस्तेमाल के किसी खास उदाहरण में बदलाव करने की सुविधा देता है. ज़्यादा जानने के लिए, कृपया ML किट वाले कस्टम मॉडल देखें. कस्टम मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Firebase मशीन लर्निंग की मॉडल डिप्लॉयमेंट सेवा का इस्तेमाल करके क्लाउड से डाइनैमिक रूप से डाउनलोड किया जा सकता है.
इनपुट चित्र प्री-प्रोसेसिंग
ज़रूरत पड़ने पर, इमेज को लेबल करने के लिए, बायलाइनर इमेज स्केलिंग और स्ट्रेचिंग का इस्तेमाल किया जाता है. इसकी मदद से, इनपुट इमेज के साइज़ और आसपेक्ट रेशियो को अडजस्ट किया जाता है, ताकि वे मूल मॉडल की ज़रूरी शर्तों के मुताबिक हों.