मशीन लर्निंग क्या है?

अनुवाद करने वाले ऐप्लिकेशन से लेकर स्वायत्त गाड़ियों तक, मशीन लर्निंग (एमएल) की मदद से हमारे इस्तेमाल की जाने वाली कुछ सबसे अहम टेक्नोलॉजी को बेहतर बनाया जाता है. इस कोर्स में, मशीन लर्निंग के मुख्य सिद्धांतों के बारे में बताया गया है.

ML, समस्याओं को हल करने, मुश्किल सवालों के जवाब देने, और नया कॉन्टेंट बनाने का एक नया तरीका है. एमएल मौसम का अनुमान लगा सकता है, यात्रा में लगने वाले समय का अनुमान लगा सकता है, गानों के सुझाव दे सकता है, वाक्य अपने-आप पूरा कर सकता है, लेखों की खास जानकारी दे सकता है, और ऐसी इमेज जनरेट कर सकता है जो कभी न देखी गई हो.

बुनियादी शब्दों में, एमएल किसी सॉफ़्टवेयर के एक हिस्से को ट्रेन करने की प्रक्रिया है जिसे model कहा जाता है. इससे काम के अनुमान लगाने या डेटा से कॉन्टेंट बनाने में मदद मिलती है.

उदाहरण के लिए, मान लें कि हमें बारिश का अनुमान लगाने वाला ऐप्लिकेशन बनाना है. इसके लिए, हम परंपरागत तरीके या मशीन लर्निंग (एमएल) वाले तरीके का इस्तेमाल कर सकते हैं. पारंपरिक नज़रिए का इस्तेमाल करते हुए, हम पृथ्वी के वायुमंडल और सतह का भौतिक विज्ञान के आधार पर निरूपण करेंगे. साथ ही, बड़ी मात्रा में द्रव गतिशीलता वाले समीकरणों की गणना करेंगे. यह बहुत ही मुश्किल है.

मशीन लर्निंग (एमएल) के तरीके का इस्तेमाल करके, हम मशीन लर्निंग मॉडल को मौसम का बड़ा डेटा तब तक देते हैं, जब तक कि मशीन लर्निंग मॉडल अलग-अलग मात्रा में बारिश पैदा करने वाले मौसम के पैटर्न के बीच गणित के सवाल को समझ नहीं लेता. इसके बाद, हम मॉडल को मौजूदा मौसम का डेटा देंगे और यह बारिश की मात्रा का अनुमान लगाएगा.

अपनी समझ को परखें

मशीन लर्निंग में "मॉडल" क्या होता है?
मॉडल, गणित के विषय पर आधारित एक संबंध है. इसे मशीन लर्निंग सिस्टम (एमएल सिस्टम) सिस्टम, अनुमान लगाने के लिए इस्तेमाल करता है
मॉडल, कंप्यूटर हार्डवेयर का एक हिस्सा होता है
मॉडल उस चीज़ का छोटा रूप होता है जिसके बारे में पढ़ा जा रहा है.

एमएल सिस्टम के टाइप

एमएल सिस्टम इनमें से एक या एक से ज़्यादा कैटगरी में आते हैं. ये कैटगरी इस आधार पर तय होती हैं कि वे अनुमान लगाने या कॉन्टेंट जनरेट करने का तरीका कैसे सीखते हैं:

  • सुपरवाइज़्ड लर्निंग
  • अनसुपरवाइज़्ड लर्निंग
  • रीइन्फ़ोर्समेंट लर्निंग
  • जनरेटिव एआई

सुपरवाइज़्ड लर्निंग

सुपरवाइज़्ड लर्निंग मॉडल, सही जवाबों के साथ बहुत सारा डेटा देखने और फिर सही जवाब देने वाले डेटा में एलिमेंट के बीच कनेक्शन का पता लगाने के बाद अनुमान लगा सकता है. यह छात्र-छात्राओं की पुरानी परीक्षाओं को पढ़कर नई सामग्री सीखने जैसा है. इनमें सवाल और जवाब दोनों शामिल होते हैं. जब वह काफ़ी पुरानी परीक्षा में ट्रेनिंग ले लेता है, तो वह नई परीक्षा देने के लिए पूरी तरह तैयार हो जाता है. इन एमएल सिस्टम को "निगरानी" में रखा जाता है. इसकी वजह यह है कि कोई व्यक्ति मशीन लर्निंग सिस्टम का डेटा पहले से सही नतीजे के साथ देता है.

सुपरवाइज़्ड लर्निंग के लिए आम तौर पर, रिग्रेशन और कैटगरी तय करने जैसे दो इस्तेमाल होते हैं.

रिग्रेशन

रिग्रेशन मॉडल, किसी न्यूमेरिक वैल्यू का अनुमान लगाता है. उदाहरण के लिए, इंच या मिलीमीटर में बारिश की मात्रा का अनुमान लगाने वाला मौसम मॉडल, रिग्रेशन मॉडल है.

रिग्रेशन मॉडल के ज़्यादा उदाहरण देखने के लिए, यहां दी गई टेबल देखें:

स्थिति इनपुट का संभावित डेटा संख्यात्मक अनुमान
आने वाले समय में घर का किराया स्क्वेयर फ़ुटेज, पिन कोड, बेडरूम और बाथरूम की संख्या, लॉट साइज़, गिरवी रखने की ब्याज दर, प्रॉपर्टी पर लगने वाले टैक्स की दर, कंस्ट्रक्शन का खर्च, और इलाके में बेचे जाने वाले घरों की संख्या. घर की कीमत.
अगली राइड का समय ट्रैफ़िक की पिछली स्थिति (जैसे कि स्मार्टफ़ोन, ट्रैफ़िक सेंसर, राइड के नेविगेशन, और नेविगेशन के अन्य ऐप्लिकेशन), मंज़िल से दूरी, और मौसम की जानकारी. किसी मंज़िल पर पहुंचने का समय मिनट और सेकंड में.

कैटगरी

क्लासिफ़िकेशन मॉडल इस बात की संभावना का अनुमान लगाते हैं कि कोई चीज़ किसी कैटगरी से जुड़ी है. रिग्रेशन मॉडल के उलट, जिसका आउटपुट नंबर होता है, क्लासिफ़िकेशन मॉडल एक वैल्यू दिखाते हैं. इससे पता चलता है कि कोई चीज़ किसी कैटगरी से जुड़ी है या नहीं. उदाहरण के लिए, क्लासिफ़िकेशन मॉडल का इस्तेमाल यह अनुमान लगाने के लिए किया जाता है कि कोई ईमेल स्पैम है या फ़ोटो में एक बिल्ली है.

क्लासिफ़िकेशन मॉडल को दो ग्रुप में बांटा जाता है: बाइनरी क्लासिफ़िकेशन और मल्टीक्लास क्लासिफ़िकेशन. बाइनरी क्लासिफ़िकेशन मॉडल, एक ऐसी क्लास से वैल्यू देते हैं जिसमें सिर्फ़ दो वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो या तो rain या no rain देता है. मल्टी-क्लास क्लासिफ़िकेशन मॉडल, किसी ऐसी क्लास से कोई वैल्यू देते हैं जिसमें दो से ज़्यादा वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain, hail, snow या sleet आउटपुट दे सकता है.

अपनी समझ को परखें

अगर आपको व्यावसायिक इमारतों में ऊर्जा के इस्तेमाल का अनुमान लगाने के लिए, एमएल मॉडल का इस्तेमाल करना है, तो आपको किस तरह का मॉडल इस्तेमाल करना चाहिए?
रिग्रेशन
ऊर्जा का इस्तेमाल, किलोवाट घंटे (kWh) में मापा जाता है. यह एक संख्या है. इसलिए, आपकी ज़रूरत के मुताबिक, रिग्रेशन मॉडल का इस्तेमाल करना चाहिए.
कैटगरी
क्लासिफ़िकेशन मॉडल यह अनुमान लगाते हैं कि कोई चीज़ किसी कैटगरी में है या नहीं. वहीं, रिग्रेशन मॉडल किसी संख्या का अनुमान लगाते हैं. ऊर्जा का इस्तेमाल, किलोवाट-घंटे (kWh) में मापा जाता है. यह एक संख्या है. इसलिए, शायद आप रिग्रेशन मॉडल का इस्तेमाल करना चाहें.

अनसुपरवाइज़्ड लर्निंग

अनसुपरवाइज़्ड लर्निंग मॉडल, ऐसे डेटा के आधार पर अनुमान लगाता है जिसमें सही जवाब मौजूद नहीं होते. बिना निगरानी वाले लर्निंग मॉडल का मकसद, डेटा में मौजूद काम के पैटर्न की पहचान करना होता है. दूसरे शब्दों में, मॉडल को डेटा के हर हिस्से को कैटगरी में बांटने के बारे में कोई संकेत नहीं मिलता, बल्कि उसे अपने नियमों का अनुमान लगाना चाहिए.

आम तौर पर, बिना निगरानी वाले लर्निंग मॉडल में क्लस्टरिंग नाम की तकनीक का इस्तेमाल किया जाता है. मॉडल, नैचुरल ग्रुपिंग को तय करने वाले डेटा पॉइंट ढूंढता है.

इमेज में, क्लस्टर में रंगीन बिंदु दिखाए गए हैं.

पहला डायग्राम. एक एमएल मॉडल, जिसमें मिलते-जुलते डेटा पॉइंट को क्लस्टर किया गया है.

इमेज में ऐसे क्लस्टर में रंगीन बिंदु दिखाए गए हैं जो आकार में बंद हैं और एक-दूसरे के बॉर्डर में हैं.

दूसरा डायग्राम. ऐसे क्लस्टर के ग्रुप जो सामान्य तौर पर अलग-अलग हैं.

क्लस्टरिंग, वर्गीकरण से अलग होती है, क्योंकि कैटगरी आपके हिसाब से नहीं होती हैं. उदाहरण के लिए, निगरानी में नहीं रखा गया कोई मॉडल, तापमान के आधार पर मौसम के डेटासेट को इकट्ठा कर सकता है. इससे, मौसम के बारे में बताने वाले सेगमेंट का पता चलता है. इसके बाद, डेटासेट की समझ के हिसाब से उन क्लस्टर को नाम देने की कोशिश की जा सकती है.

समूहों में रंगीन बिंदुओं को दिखाने वाली एक इमेज जिन्हें बर्फ़, बारिश, ओले और बारिश नहीं के तौर पर लेबल किया गया है.

तीसरी इमेज. एक एमएल मॉडल, जिसमें मौसम के एक जैसे पैटर्न को दिखाया गया है.

एक इमेज, जिसमें अलग-अलग तरह के रंगों वाले बिंदु हैं. इन बिंदुओं पर बर्फ़, बारिश, ओले, और बारिश न होने का लेबल लगा है. ये बिंदु एक-दूसरे के आकार और बॉर्डर में हैं.

चौथी इमेज. मौसम के अलग-अलग पैटर्न के ऐसे क्लस्टर जिन्हें बर्फ़, बारिश, बारिश और कोई बारिश नहीं के तौर पर लेबल किया गया है.

अपनी समझ को परखें

निगरानी में रखे गए तरीके और बिना निगरानी वाले तरीके में क्या अंतर है?
माता-पिता की निगरानी वाले मोड में ऐसा डेटा दिया जाता है जिसमें सही जवाब मौजूद होता है.
माता-पिता की निगरानी वाले मोड में ऐसा डेटा दिया जाता है जिसमें सही जवाब मौजूद होता है. इस मॉडल का काम, डेटा में ऐसे कनेक्शन ढूंढना है जो सही जवाब देते हों. बिना निगरानी वाले तरीके को सही जवाब के बिना ही डेटा दिया जाता है. इसका काम डेटा में ग्रुप खोजना है.
आम तौर पर, माता-पिता की निगरानी वाले मोड में क्लस्टरिंग का इस्तेमाल किया जाता है.
बिना निगरानी वाला तरीका, क्लस्टरिंग का इस्तेमाल किया जाता है.
बिना निगरानी वाले तरीके में, डेटा के क्लस्टर को लेबल करने का तरीका पता चलता है.
बिना निगरानी के काम करने के तरीके में, डेटा के क्लस्टर का मतलब नहीं पता होता. डेटा के बारे में आपकी समझ के आधार पर, यह तय करना आपकी ज़िम्मेदारी है कि डेटा का इस्तेमाल किस तरह करना चाहिए.

रीइन्फ़ोर्समेंट लर्निंग

रीइन्फ़ोर्समेंट लर्निंग मॉडल, किसी एनवायरमेंट में की गई कार्रवाइयों के आधार पर इनाम या पेनल्टी हासिल करके अनुमान लगाता है. रीइन्फ़ोर्समेंट लर्निंग सिस्टम ऐसी नीति जनरेट करता है जो ज़्यादा से ज़्यादा इनाम पाने की सबसे अच्छी रणनीति के बारे में बताती है.

रीइन्फ़ोर्समेंट लर्निंग का इस्तेमाल, रोबोट को कुछ काम करने के लिए किया जाता है. जैसे, कमरे के आस-पास टहलना और AlphaGo जैसे सॉफ़्टवेयर प्रोग्राम से Go गेम खेलना.

जनरेटिव एआई

जनरेटिव एआई, मॉडल की एक क्लास है, जो उपयोगकर्ता के इनपुट से कॉन्टेंट बनाती है. उदाहरण के लिए, जनरेटिव एआई यूनीक इमेज, संगीत कंपोज़िशन, और चुटकुले बना सकता है. साथ ही, यह लेखों की ख़ास जानकारी दे सकता है, किसी टास्क को करने का तरीक़ा बता सकता है या फ़ोटो में बदलाव कर सकता है.

जनरेटिव एआई कई तरह के इनपुट ले सकता है और कई तरह के आउटपुट बना सकता है. जैसे, टेक्स्ट, इमेज, ऑडियो, और वीडियो. यह इनका संयोजन भी ले सकती है और बना सकती है. उदाहरण के लिए, कोई मॉडल इनपुट के तौर पर किसी इमेज को लेकर, आउटपुट के तौर पर इमेज और टेक्स्ट बना सकता है या इनपुट के तौर पर कोई इमेज और टेक्स्ट लेकर, आउटपुट के तौर पर वीडियो बना सकता है.

हम जनरेटिव मॉडल के बारे में उनके इनपुट और आउटपुट के आधार पर चर्चा कर सकते हैं. आम तौर पर, इसे "इनपुट का टाइप" से "आउटपुट का टाइप" के तौर पर लिखा जाता है. उदाहरण के लिए, यहां जनरेटिव मॉडल के कुछ इनपुट और आउटपुट की सूची दी गई है:

  • टेक्स्ट को टेक्स्ट में बदलना
  • टेक्स्ट-टू-इमेज
  • टेक्स्ट-टू-वीडियो
  • टेक्स्ट-टू-कोड
  • लिखाई को बोली में बदलें
  • इमेज और टेक्स्ट-टू-इमेज

इस टेबल में, जनरेटिव मॉडल, उनके इनपुट, और उनके संभावित आउटपुट के उदाहरण दिए गए हैं:

मॉडल इनपुट आउटपुट का उदाहरण
टेक्स्ट को टेक्स्ट में बदलना ले मैंस नस्ल का आविष्कार किसने किया? 24 Hours of Le Mans की स्थापना Automobile Club de l'Ouest (ACO) ने की थी. यह मोटरिंग संगठन, 1906 में बना था. पहली रेस 26 और 27 मई, 1923 को 13.426-किलोमीटर (8.345 मील) लंबे रोड सर्किट पर आयोजित की गई थी. यह सर्किट, फ़्रांस के ले मैंस शहर के पास है. मूल रूप से इस रेस की शुरुआत, ACO और सारथे इलाके का प्रचार करने के लिए की गई थी.
सोर्स: Bard
टेक्स्ट-टू-इमेज पोर्टल में तैरता हुआ एक एलियन ऑक्टोपस, अखबार पढ़ रहा है. कार्टून वाले ऑक्टोपस की इमेज.
सोर्स: Imagen
टेक्स्ट-टू-वीडियो सैन फ़्रांसिस्को में एक फ़ोटोरियलिस्टिक टेडी बीयर समुद्र में तैर रहा है. एक टेडी बीयर, पानी के अंदर जाता है. टेडी बीयर, पानी के अंदर रंग-बिरंगी मछलियों के साथ तैरता रहता है. एक पांडा भालू पानी के नीचे तैर रहा है. पानी में तैरते हुए टेडी बीयर का वीडियो.
सोर्स: फ़ेनाकी
टेक्स्ट-टू-कोड ऐसा Python लूप लिखें जो संख्याओं की सूची के ऊपर लूप करता है और अभाज्य संख्याओं को प्रिंट करता है.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

सोर्स: Bard
इमेज-टू-टेक्स्ट राजहंस की इमेज. राजहंस की आवाज़ ऐसी है. ये कैरेबियन में पाए जाते हैं.
सोर्स: Google DeepMind

जनरेटिव एआई कैसे काम करता है? हाई लेवल पर, जनरेटिव मॉडल, डेटा में मौजूद पैटर्न के बारे में सीखते हैं. इन मॉडल का मकसद, नया लेकिन मिलता-जुलता डेटा तैयार करना होता है. जनरेटिव मॉडल ऐसे होते हैं:

  • कॉमेडियन, जो लोगों के बर्ताव और बोलने के तरीके को देखकर दूसरों की नकल करना सीखते हैं
  • ऐसे कलाकार जो किसी खास स्टाइल में पेंटिंग बनाना सीखकर, उस स्टाइल की पेंटिंग बनाना सीखते हैं
  • ऐसे बैंड को कवर करें जो उस ग्रुप के बहुत सारे संगीत को सुनकर एक खास तरह के म्यूज़िक ग्रुप की तरह बोलना सीखते हैं

यूनीक और क्रिएटिव आउटपुट बनाने के लिए, जनरेटिव मॉडल को शुरुआत में बिना निगरानी वाले तरीके का इस्तेमाल करके ट्रेनिंग दी जाती है. इसमें मॉडल, उस डेटा की नकल करना सीखता है जिस पर ट्रेनिंग दी गई है. कभी-कभी मॉडल को निगरानी में रखे गए या रीइन्फ़ोर्समेंट लर्निंग का इस्तेमाल करके, ऐसे टास्क से जुड़े डेटा के आधार पर आगे की ट्रेनिंग दी जाती है जिन्हें पूरा करने के लिए मॉडल को कहा जा सकता है. जैसे, किसी लेख की ख़ास जानकारी देना या फ़ोटो में बदलाव करना.

जनरेटिव एआई एक तेज़ी से बढ़ रही टेक्नोलॉजी है. इसे इस्तेमाल करने के नए उदाहरण लगातार खोजे जा रहे हैं. उदाहरण के लिए, जनरेटिव मॉडल, कारोबारों को ई-कॉमर्स प्रॉडक्ट की इमेज को बेहतर बनाने में मदद कर रहे हैं. इसके लिए, ध्यान भटकाने वाले बैकग्राउंड अपने-आप हट जाते हैं या लो-रिज़ॉल्यूशन वाली इमेज की क्वालिटी अपने-आप हट जाती है.