मशीन लर्निंग क्या है?

मशीन लर्निंग (एमएल) की मदद से, अनुवाद ऐप्लिकेशन से लेकर ऑटोमेटेड वाहनों तक, कई अहम टेक्नोलॉजी काम करती हैं. इस कोर्स में, एमएल के बुनियादी कॉन्सेप्ट के बारे में बताया गया है.

एमएल की मदद से, समस्याओं को हल करने, मुश्किल सवालों के जवाब पाने, और नया कॉन्टेंट बनाने का नया तरीका मिलता है. मशीन लर्निंग की मदद से, मौसम का अनुमान लगाया जा सकता है, यात्रा के समय का अनुमान लगाया जा सकता है, गाने के सुझाव दिए जा सकते हैं, वाक्यों को अपने-आप पूरा किया जा सकता है, लेखों की खास जानकारी दी जा सकती है, और ऐसी इमेज जनरेट की जा सकती हैं जो पहले कभी नहीं देखी गई हैं.

बुनियादी तौर पर, एमएल किसी सॉफ़्टवेयर को मॉडल के तौर पर ट्रेन करने की प्रोसेस है. इससे, काम के अनुमान लगाए जा सकते हैं या डेटा से कॉन्टेंट जनरेट किया जा सकता है.

उदाहरण के लिए, मान लें कि हमें बारिश का अनुमान लगाने वाला ऐप्लिकेशन बनाना है. हम इसके लिए, किसी पारंपरिक तरीके या एमएल के तरीके का इस्तेमाल कर सकते हैं. पारंपरिक तरीके का इस्तेमाल करके, हम पृथ्वी के वायुमंडल और सतह को दिखाने के लिए, फ़्लuid dynamics के बहुत सारे समीकरणों का हिसाब लगाते. यह काफ़ी मुश्किल है.

एमएल के तरीके का इस्तेमाल करके, हम एमएल मॉडल को मौसम का ज़्यादा से ज़्यादा डेटा देंगे. ऐसा तब तक करेंगे, जब तक कि एमएल मॉडल अलग-अलग मात्रा में बारिश करने वाले मौसम के पैटर्न के बीच के गणितीय संबंध को नहीं सीख लेता. इसके बाद, हम मॉडल को मौसम का मौजूदा डेटा देंगे. इससे, मॉडल बारिश की मात्रा का अनुमान लगाएगा.

देखें कि आपको विषय की कितनी समझ है

मशीन लर्निंग में "मॉडल" क्या होता है?
मॉडल, डेटा से मिला गणितीय संबंध होता है. एमएल सिस्टम, अनुमान लगाने के लिए इसका इस्तेमाल करता है
मॉडल, कंप्यूटर हार्डवेयर का एक हिस्सा होता है
मॉडल, उस चीज़ का छोटा वर्शन होता है जिसे आपने स्टडी किया है.

अलग-अलग तरह के एमएल सिस्टम

एमएल सिस्टम, इनमें से एक या एक से ज़्यादा कैटगरी में आते हैं. यह इस बात पर निर्भर करता है कि वे अनुमान लगाने या कॉन्टेंट जनरेट करने का तरीका कैसे सीखते हैं:

  • सुपरवाइज़्ड लर्निंग
  • अनसुपरवाइज़्ड लर्निंग
  • रीइनफ़ोर्समेंट लर्निंग
  • जनरेटिव एआई

सुपरवाइज़्ड लर्निंग

सुपरवाइज़्ड लर्निंग मॉडल, सही जवाबों वाले बहुत सारे डेटा को देखने के बाद अनुमान लगा सकते हैं. इसके बाद, वे डेटा के उन एलिमेंट के बीच के कनेक्शन का पता लगाते हैं जिनसे सही जवाब मिलते हैं. यह ऐसा है जैसे कोई छात्र, पुराने परीक्षा पेपर की मदद से नया कॉन्टेंट सीख रहा हो. इन पेपर में सवाल और जवाब, दोनों होते हैं. जब छात्र/छात्रा, पुरानी परीक्षाओं के लिए ज़रूरत के मुताबिक ट्रेनिंग ले लेता है, तो वह नई परीक्षा देने के लिए पूरी तरह तैयार हो जाता है. इन एमएल सिस्टम को "सुपरवाइज़ किया जाता है", इस मायने में कि कोई व्यक्ति एमएल सिस्टम को, पहले से सही नतीजों के साथ डेटा देता है.

सुपरवाइज़्ड लर्निंग के सबसे सामान्य इस्तेमाल के दो उदाहरण हैं, रिग्रेशन और कैटगरी तय करना.

रिग्रेशन

रिग्रेशन मॉडल, संख्या वाली वैल्यू का अनुमान लगाता है. उदाहरण के लिए, बारिश की मात्रा का अनुमान इंच या मिलीमीटर में लगाने वाला मौसम मॉडल, एक रिग्रेशन मॉडल है.

रेग्रेसन मॉडल के ज़्यादा उदाहरणों के लिए, नीचे दी गई टेबल देखें:

स्थिति इनपुट डेटा के लिए संभावित वैल्यू संख्या के हिसाब से अनुमान
आने वाले समय में घर की कीमत स्क्वेयर फ़ुट, पिन कोड, बेडरूम और बाथरूम की संख्या, ज़मीन का साइज़, मॉर्गेज की ब्याज दर, प्रॉपर्टी टैक्स की दर, निर्माण की लागत, और इलाके में बिक्री के लिए उपलब्ध घरों की संख्या. घर की कीमत.
आने वाले समय में यात्रा का समय ट्रैफ़िक की पुरानी स्थिति (स्मार्टफ़ोन, ट्रैफ़िक सेंसर, राइड-हेलिंग, और नेविगेशन के अन्य ऐप्लिकेशन से इकट्ठा की गई), डेस्टिनेशन से दूरी, और मौसम की स्थिति. किसी जगह पर पहुंचने में लगने वाला समय, मिनट और सेकंड में.

कैटगरी

क्लासिफ़िकेशन मॉडल, किसी चीज़ के किसी कैटगरी से जुड़े होने की संभावना का अनुमान लगाते हैं. रेग्रेसन मॉडल के आउटपुट के तौर पर संख्या मिलती है, जबकि क्लासिफ़िकेशन मॉडल से ऐसी वैल्यू मिलती है जिससे पता चलता है कि कोई आइटम किसी खास कैटगरी से जुड़ा है या नहीं. उदाहरण के लिए, कैटगरी तय करने वाले मॉडल का इस्तेमाल यह अनुमान लगाने के लिए किया जाता है कि कोई ईमेल स्पैम है या नहीं या किसी फ़ोटो में बिल्ली है या नहीं.

क्लासिफ़िकेशन मॉडल को दो ग्रुप में बांटा गया है: बाइनरी क्लासिफ़िकेशन और मल्टीक्लास क्लासिफ़िकेशन. बाइनरी क्लासिफ़िकेशन मॉडल, किसी ऐसी क्लास से वैल्यू दिखाते हैं जिसमें सिर्फ़ दो वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain या no rain में से कोई एक वैल्यू दिखाता है. मल्टीक्लास क्लासिफ़िकेशन मॉडल, ऐसी क्लास से वैल्यू दिखाते हैं जिसमें दो से ज़्यादा वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain, hail, snow या sleet में से कोई वैल्यू दिखा सकता है.

देखें कि आपको विषय की कितनी समझ है

अगर आपको कमर्शियल इमारतों के लिए ऊर्जा के इस्तेमाल का अनुमान लगाने के लिए, एमएल मॉडल का इस्तेमाल करना है, तो किस तरह के मॉडल का इस्तेमाल किया जाएगा?
रिग्रेशन
ऊर्जा के इस्तेमाल को किलोवॉट-घंटे (kWh) में मेज़र किया जाता है, जो एक संख्या है. इसलिए, आपको रेग्रेसन मॉडल का इस्तेमाल करना होगा.
कैटगरी
क्लासिफ़िकेशन मॉडल यह अनुमान लगाते हैं कि कोई चीज़ किसी कैटगरी से जुड़ी है या नहीं, जबकि रिग्रेशन मॉडल किसी संख्या का अनुमान लगाते हैं. ऊर्जा के इस्तेमाल को, बिजली की खपत के हिसाब से मापा जाता है. बिजली की खपत को किलोवाट-घंटे (kWh) में मेज़र किया जाता है. इसलिए, आपको रेग्रेसन मॉडल का इस्तेमाल करना होगा.

अनसुपरवाइज़्ड लर्निंग

निगरानी में नहीं रखी गई लर्निंग के मॉडल, ऐसे डेटा का इस्तेमाल करके अनुमान लगाते हैं जिसमें कोई सही जवाब नहीं होता. बिना निगरानी वाले लर्निंग मॉडल का मकसद, डेटा में काम के पैटर्न की पहचान करना है. दूसरे शब्दों में, मॉडल को हर डेटा को अलग-अलग कैटगरी में बांटने का कोई सुझाव नहीं दिया जाता. इसके बजाय, उसे अपने नियमों का पता लगाना होता है.

आम तौर पर इस्तेमाल किया जाने वाला, बिना निगरानी वाला लर्निंग मॉडल, क्लस्टरिंग नाम की तकनीक का इस्तेमाल करता है. मॉडल, ऐसे डेटा पॉइंट ढूंढता है जो नैचुरल ग्रुपिंग को अलग करते हैं.

क्लस्टर में रंगीन बिंदु दिखाने वाली इमेज.

पहली इमेज. मिलते-जुलते डेटा पॉइंट को क्लस्टर करने वाला एमएल मॉडल.

रंगीन बिंदुओं के क्लस्टर दिखाने वाली इमेज, जो किसी आकार में बंद हैं और एक-दूसरे से जुड़े हैं.

दूसरी इमेज. क्लस्टर के ऐसे ग्रुप जिनके बीच में कोई सीमा नहीं होती.

क्लस्टर करने की सुविधा, कैटगरी तय करने की सुविधा से अलग है. इसकी वजह यह है कि कैटगरी तय करने की सुविधा का इस्तेमाल करके, आपके पास कैटगरी तय करने का विकल्प होता है. उदाहरण के लिए, बिना निगरानी वाले मॉडल से, तापमान के आधार पर मौसम के डेटासेट को क्लस्टर किया जा सकता है. इससे, सीज़न के हिसाब से सेगमेंटेशन का पता चलता है. इसके बाद, डेटासेट के बारे में अपनी समझ के आधार पर, उन क्लस्टर को नाम दिया जा सकता है.

क्लस्टर में रंगीन बिंदु दिखाने वाली इमेज, जिन्हें बर्फ़, बारिश, ओले, और बारिश नहीं के तौर पर लेबल किया गया है.

तीसरी इमेज. मौसम के मिलते-जुलते पैटर्न को क्लस्टर करने वाला मशीन लर्निंग मॉडल.

एक इमेज, जिसमें क्लस्टर में रंगीन बिंदु दिख रहे हैं. इन्हें बर्फ़, बारिश, ओले, और बारिश नहीं के तौर पर लेबल किया गया है. ये बिंदु एक आकार में मौजूद हैं और एक-दूसरे से जुड़े हुए हैं.

चौथी इमेज. मौसम के पैटर्न के क्लस्टर, जिन्हें बर्फ़बारी, स्लीट, बारिश, और बारिश नहीं के तौर पर लेबल किया गया है.

देखें कि आपको विषय की कितनी समझ है

निगरानी में रखे गए मॉडल और बिना निगरानी वाले मॉडल में क्या अंतर है?
सुपरवाइज़्ड लर्निंग में, सही जवाब वाला डेटा दिया जाता है.
सुपरवाइज़्ड लर्निंग में, सही जवाब वाला डेटा दिया जाता है. मॉडल का काम, डेटा में ऐसे कनेक्शन ढूंढना है जिनसे सही जवाब मिल सके. बिना निगरानी वाले तरीके में, सही जवाब के बिना डेटा दिया जाता है. इसका काम, डेटा में ग्रुपिंग ढूंढना है.
निगरानी में रखे गए मशीन लर्निंग मॉडल में आम तौर पर क्लस्टरिंग का इस्तेमाल किया जाता है.
बिना निगरानी वाले तरीके में क्लस्टरिंग का इस्तेमाल किया जाता है.
बिना निगरानी वाले तरीके से, डेटा के क्लस्टर को लेबल करने का तरीका पता होता है.
बिना निगरानी वाले तरीके से यह पता नहीं चलता कि डेटा के क्लस्टर का क्या मतलब है. डेटा के बारे में अपनी समझ के आधार पर, यह तय करना आपके ऊपर है.

रीइनफ़ोर्समेंट लर्निंग

रीइंफ़ोर्समेंट लर्निंग मॉडल, किसी परिवेश में की गई कार्रवाइयों के आधार पर इनाम या दंड पाकर, अनुमान लगाते हैं. रिनफ़ोर्समेंट लर्निंग सिस्टम, एक नीति जनरेट करता है. इससे, ज़्यादा से ज़्यादा इनाम पाने के लिए सबसे अच्छी रणनीति तय की जाती है.

किसी कमरे में घूमने जैसे टास्क को पूरा करने के लिए, रोबोट को ट्रेनिंग देने के लिए रिनफ़ोर्समेंट लर्निंग का इस्तेमाल किया जाता है. साथ ही, AlphaGo जैसे सॉफ़्टवेयर प्रोग्राम को गो गेम खेलने के लिए भी इसका इस्तेमाल किया जाता है.

जनरेटिव एआई

जनरेटिव एआई, मॉडल का एक क्लास है. यह उपयोगकर्ता के इनपुट से कॉन्टेंट बनाता है. उदाहरण के लिए, जनरेटिव एआई की मदद से यूनीक इमेज, संगीत कम्पोज़िशन, और चुटकुले बनाए जा सकते हैं. साथ ही, यह लेखों की खास जानकारी दे सकता है, किसी टास्क को पूरा करने का तरीका बता सकता है या किसी फ़ोटो में बदलाव कर सकता है.

जनरेटिव एआई, कई तरह के इनपुट ले सकता है और कई तरह के आउटपुट दे सकता है. जैसे, टेक्स्ट, इमेज, ऑडियो, और वीडियो. यह इनके कॉम्बिनेशन भी बना सकता है और इनका इस्तेमाल भी कर सकता है. उदाहरण के लिए, कोई मॉडल इनपुट के तौर पर इमेज ले सकता है और आउटपुट के तौर पर इमेज और टेक्स्ट बना सकता है. इसके अलावा, वह इनपुट के तौर पर इमेज और टेक्स्ट ले सकता है और आउटपुट के तौर पर वीडियो बना सकता है.

जनरेटिव मॉडल के इनपुट और आउटपुट के आधार पर, इनकी चर्चा की जा सकती है. आम तौर पर, इन मॉडल को "इनपुट टाइप" से "आउटपुट टाइप" के तौर पर लिखा जाता है. उदाहरण के लिए, जनरेटिव मॉडल के कुछ इनपुट और आउटपुट की सूची यहां दी गई है:

  • टेक्स्ट से टेक्स्ट में अनुवाद
  • टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करने की प्रोसेस
  • टेक्स्ट से वीडियो बनाना
  • टेक्स्ट को कोड में बदलना
  • पाठ से वाक्
  • इमेज और टेक्स्ट-टू-इमेज

इस टेबल में जनरेटिव मॉडल, उनके इनपुट, और उनके संभावित आउटपुट के उदाहरण दिए गए हैं:

मॉडल इनपुट आउटपुट का उदाहरण
टेक्स्ट से टेक्स्ट में अनुवाद ले मैन्स रेस का आविष्कार किसने किया था? 24 आवर्स ऑफ़ ल मॉन की स्थापना, ऑटोमोबाइल क्लब डी ल ऑस्ट (ACO) ने की थी. यह एक मोटरिंग संगठन है, जिसकी स्थापना 1906 में हुई थी. पहली रेस 26 और 27 मई, 1923 को फ़्रांस के ल मॉन शहर के पास, 13.426 किलोमीटर (8.345 मील) के सार्थ सर्किट पर हुई थी. इस रेस को मूल रूप से ACO और Sarthe इलाके का प्रमोशन करने के लिए शुरू किया गया था.
सोर्स: Bard
टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करने की प्रोसेस एक एलियन ऑक्टोपस, अखबार पढ़ते हुए पोर्टल से तैरता हुआ दिख रहा है. कार्टून ऑक्टोपस की इमेज.
सोर्स: Imagen
टेक्स्ट से वीडियो बनाना सैन फ़्रांसिस्को के समुद्र में तैरती हुई टेडी बियर की असली जैसी दिखने वाली इमेज. टेडी बियर पानी में चला जाता है. टेडी बियर, रंग-बिरंगी मछलियों के साथ पानी के नीचे तैर रहा है. पानी में तैरता हुआ पांडा. पानी के अंदर तैरती हुई टेडी बियर का वीडियो.
सोर्स: Phenaki
टेक्स्ट को कोड में बदलना Python लूप लिखें, जो संख्याओं की सूची पर लूप करता है और प्राइम नंबर प्रिंट करता है.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

सोर्स: Bard
इमेज को टेक्स्ट में बदलना फ़्लेमिंगो की इमेज. यह फ़्लेमिंगो है. ये कैरिबियन में पाए जाते हैं.
सोर्स: Google DeepMind

जनरेटिव एआई कैसे काम करता है? जनरेटिव मॉडल, डेटा में मौजूद पैटर्न को हाई-लेवल पर समझते हैं. ऐसा इसलिए किया जाता है, ताकि मिलते-जुलते नए डेटा को जनरेट किया जा सके. जनरेटिव मॉडल इस तरह के होते हैं:

  • ऐसे कॉमेडियन जो लोगों के व्यवहार और बोलने के तरीके को देखकर, दूसरों की नकल करना सीखते हैं
  • ऐसे कलाकार जो किसी खास स्टाइल में पेंटिंग करने के लिए, उस स्टाइल में बनी कई पेंटिंग का अध्ययन करते हैं
  • कवर बैंड, जो किसी खास म्यूज़िक ग्रुप के कई गाने सुनकर, उसी ग्रुप की तरह गाना सीखते हैं

यूनीक और क्रिएटिव आउटपुट बनाने के लिए, जनरेटिव मॉडल को शुरुआत में बिना निगरानी वाले तरीके का इस्तेमाल करके ट्रेन किया जाता है. इस तरीके से, मॉडल उस डेटा की नकल करना सीखता है जिस पर उसे ट्रेन किया गया है. मॉडल को कभी-कभी, सुपरवाइज़्ड या रिइंफ़ॉर्समेंट लर्निंग का इस्तेमाल करके और ट्रेन किया जाता है. ऐसा, उन टास्क से जुड़े खास डेटा पर किया जाता है जिन्हें मॉडल से करने के लिए कहा जा सकता है. उदाहरण के लिए, किसी लेख की खास जानकारी देना या किसी फ़ोटो में बदलाव करना.

जनरेटिव एआई की टेक्नोलॉजी तेज़ी से बेहतर हो रही है. इसका इस्तेमाल करने के नए उदाहरण लगातार खोजे जा रहे हैं. उदाहरण के लिए, जनरेटिव मॉडल, कारोबारों को ई-कॉमर्स प्रॉडक्ट की इमेज को बेहतर बनाने में मदद कर रहे हैं. ये मॉडल, ध्यान भटकाने वाले बैकग्राउंड को अपने-आप हटा देते हैं या लो रिज़ॉल्यूशन वाली इमेज की क्वालिटी को बेहतर बना देते हैं.