एलएलएम: फ़ाइन ट्यूनिंग, डिस्टिलेशन, और प्रॉम्प्ट इंजीनियरिंग

पिछली यूनिट में अलग-अलग तरह के एलएलएम के बारे में बताया गया है इस नाम से जाना जाता है:

  • फ़ाउंडेशन एलएलएम
  • बेस एलएलएम
  • पहले से ट्रेन किए गए एलएलएम

एक फ़ाउंडेशन एलएलएम को, "जानने" के लिए काफ़ी आसान भाषा में ट्रेनिंग दी गई है एक शानदार व्याकरण, शब्दों, और मुहावरों की कुल संख्या. बुनियादी लैंग्वेज मॉडल से ये काम किए जा सकते हैं उन विषयों के बारे में काम के वाक्य जनरेट करो जिनके बारे में इसे ट्रेनिंग दी गई है. इसके अलावा, एलएलएम टेक्नोलॉजी से जुड़े कुछ ऐसे काम भी किए जा सकते हैं जिन्हें आम तौर पर कहा जाता है "क्रिएटिव", जैसे कि कविता लिखना. हालांकि, फ़ाउंडेशन के एलएलएम का जनरेटिव टेक्स्ट आउटपुट, मशीन लर्निंग की अन्य आम समस्याओं का हल नहीं है. जैसे, रिग्रेशन या क्लासिफ़िकेशन. इस्तेमाल के इन उदाहरणों में, एक फ़ाउंडेशन एलएलएम, की सुविधा देने के बजाय प्लैटफ़ॉर्म के तौर पर पेश करना चाहिए.

फ़ाउंडेशन के एलएलएम को ऐसे सलूशन में बदलना जो किसी ऐप्लिकेशन की फ़ाइन-ट्यूनिंग नाम की प्रोसेस की ज़रूरत होती है. दूसरी प्रोसेस को डिस्टिलेशन, फ़ाइन-ट्यून किया गया छोटा (कम पैरामीटर) वर्शन जनरेट करता है मॉडल.

फ़ाइन-ट्यूनिंग

रिसर्च से पता चलता है कि फ़ाउंडेशन की पैटर्न को पहचानने की क्षमताएं भाषा मॉडल इतने प्रभावशाली होते हैं कि उन्हें कभी-कभी कुछ और ट्रेनिंग की ज़रूरत होती है. उस अतिरिक्त ट्रेनिंग से, मॉडल बेहतर अनुमान लगा पाता है खास टास्क पर ही लागू होता है. इस अतिरिक्त ट्रेनिंग को, फ़ाइन-ट्यूनिंग, एलएलएम के व्यावहारिक पक्ष के बारे में बताता है.

आपके ऐप्लिकेशन के टास्क के लिए खास उदाहरणों के आधार पर ट्रेनों को बेहतर बनाना काम करेगा. इंजीनियर, कभी-कभी कुछ ही सिस्टम की मदद से, बुनियादी एलएलएम को बेहतर बना सकते हैं ट्रेनिंग के एक लाख या कुछ हज़ार उदाहरण.

ट्रेनिंग के उदाहरणों की संख्या कम होने के बावजूद, स्टैंडर्ड फ़ाइन-ट्यूनिंग अक्सर कंप्यूटेशनल रूप से महंगा होता है. ऐसा इसलिए है, क्योंकि स्टैंडर्ड फ़ाइन ट्यूनिंग में हर पैरामीटर के वेट और बायस को अपडेट करना backProagation को बार-बार इस्तेमाल करना. अच्छी बात यह है कि पैरामीटर-कुशल" नाम की एक ज़्यादा स्मार्ट प्रोसेस ट्यूनिंग हर पैरामीटर के सिर्फ़ एक सबसेट में बदलाव करके, एलएलएम को बेहतर बना सकता है बैकप्रोपगेशन इटरेशन.

किसी मॉडल के अनुमान, आम तौर पर फ़ाउंडेशन एलएलएम से बेहतर अनुमान लगाते हैं सुझाव. हालांकि, बेहतर बनाए गए मॉडल में पैरामीटर दिए गए हैं. इसलिए, अगर किसी फ़ाउंडेशन एलएलएम में दस अरब है, तो फ़ाइन-ट्यून वर्शन में भी दस अरब पैरामीटर का इस्तेमाल करें.

डिस्टिलेशन

बेहतर बनाए गए ज़्यादातर एलएलएम में बहुत ज़्यादा पैरामीटर होते हैं. इस वजह से, फ़ाउंडेशन के एलएलएम के लिए, बड़े कंप्यूटेशनल और पर्यावरणीय संसाधनों की ज़रूरत होती है का इस्तेमाल करें. ध्यान दें कि इन पैरामीटर की बड़ी संख्या जो आम तौर पर किसी खास ऐप्लिकेशन के लिए काम के नहीं होते हैं.

डिस्टिलेशन एलएलएम का छोटा वर्शन बनाता है. डिस्टिल्ड एलएलएम, अनुमान जनरेट करता है तेज़ी से काम करता है. साथ ही, कम्प्यूटेशनल और पर्यावरणीय संसाधनों की ज़रूरत होती है पूरा एलएलएम दिखा सकते हैं. हालांकि, डिस्टिल्ड मॉडल के अनुमान आम तौर पर उतना ही अच्छा है जितना मूल एलएलएम के अनुमानों जितना ही अच्छा है. याद रखें कि एलएलएम, पैरामीटर हमेशा कम संख्या वाले एलएलएम के मुकाबले बेहतर अनुमान जनरेट करते हैं पैरामीटर का इस्तेमाल करें.

प्रॉम्प्ट इंजीनियरिंग

प्रॉम्प्ट इंजीनियरिंग एलएलएम के असली उपयोगकर्ताओं को मॉडल के आउटपुट को पसंद के मुताबिक बनाने की सुविधा देता है. इसका मतलब है कि असली उपयोगकर्ता यह साफ़ तौर पर बताते हैं कि एलएलएम को उनके सवाल का जवाब कैसे देना चाहिए.

उदाहरण से इंसान अच्छी तरह सीखते हैं. एलएलएम भी करते हैं. एलएलएम का एक उदाहरण दिखाया जा रहा है कॉल किया जाता है एक बार में प्रॉम्प्ट दिखाने की सुविधा. उदाहरण के लिए, मान लीजिए कि आपको एक मॉडल से आउटपुट फल का परिवार:

उपयोगकर्ता किसी फल का नाम डालता है: एलएलएम से, फल की क्लास का पता चलता है.

वन-शॉट प्रॉम्प्ट, एलएलएम को पिछले फ़ॉर्मैट का एक उदाहरण दिखाता है इसके बाद, एलएलएम से उस उदाहरण के आधार पर किसी क्वेरी को पूरा करने के लिए कहा जाता है. उदाहरण के लिए:

peach: drupe
apple: ______

कभी-कभी सिर्फ़ एक उदाहरण काफ़ी होता है. अगर ऐसा है, तो एलएलएम से लोगों को सुझाव. उदाहरण के लिए:

apple: pome

अन्य स्थितियों में, सिर्फ़ एक उदाहरण काफ़ी नहीं होता. इसका मतलब है कि उपयोगकर्ता को ज़रूरी शर्तें पूरी करनी होंगी एलएलएम के कई उदाहरण दिखाएं. उदाहरण के लिए, नीचे दिए गए प्रॉम्प्ट में यह शामिल है दो उदाहरण:

plum: drupe
pear: pome
lemon: ____

एक से ज़्यादा उदाहरण देना कुछ शॉट प्रॉम्प्ट. पिछले प्रॉम्प्ट की पहली दो लाइनों को ट्रेनिंग के तौर पर समझा जा सकता है उदाहरण.

क्या एलएलएम, बिना किसी उदाहरण के काम के सुझाव दे सकता है (ज़ीरो-शॉट सूचना दे रहा है)? कभी-कभी, लेकिन कॉन्टेक्स्ट के हिसाब से एलएलएम. कॉन्टेक्स्ट के बिना, ज़ीरो-शॉट का यह प्रॉम्प्ट फल के बजाय टेक्नोलॉजी कंपनी के बारे में जानकारी देना:

apple: _______

ऑफ़लाइन अनुमान

एलएलएम में कभी-कभी पैरामीटर की संख्या ऑनलाइन अनुमान असल दुनिया के कामों में बहुत धीमा है, जैसे कि रिग्रेशन या वर्गीकरण. इस वजह से, कई इंजीनियरिंग टीमें ऑफ़लाइन अनुमान (भी जिसे बल्क अनुमान या स्टैटिक अनुमान कहा जाता है). दूसरे शब्दों में, क्वेरी का जवाब देने के बजाय, मॉडल पहले से अनुमान लगा लेता है और फिर उन अनुमानों को कैश मेमोरी में सेव कर लेता है.

इससे कोई फ़र्क़ नहीं पड़ता कि एलएलएम को टास्क पूरा करने में ज़्यादा समय लगता है या नहीं, एलएलएम को हफ़्ते में सिर्फ़ एक बार या महीने में एक बार टास्क पूरा करना होता है.

उदाहरण के लिए, Google Search एलएलएम का इस्तेमाल किया 800 से ज़्यादा समानार्थी शब्दों की सूची को कैश मेमोरी में सेव करने के लिए, ऑफ़लाइन अनुमान लागू किया जाता है और 50 से ज़्यादा भाषाओं में COVID-19 के टीकों के बारे में बताया है. इसके बाद, Google Search ने कैश मेमोरी में सेव की गई सूची की मदद से लाइव ट्रैफ़िक में टीकों से जुड़ी क्वेरी की पहचान की जा सकती है.

एलएलएम का ज़िम्मेदारी से इस्तेमाल करना

मशीन लर्निंग के किसी भी अन्य मॉडल की तरह, एलएलएम भी इन मापदंडों के लिए काम करते हैं:

  • वह डेटा जिसके आधार पर उन्हें ट्रेनिंग दी गई थी.
  • वह डेटा जिसकी मदद से उन्हें डिसकनेक्ट किया गया.

दिए गए लेसन के मुताबिक, एलएलएम का सही और ज़िम्मेदारी से इस्तेमाल करें इस कोर्स में पहले ही शामिल किया जा चुका है.

व्यायाम: अपनी समझ की जांच करें

एलएलएम के बारे में, इनमें से कौनसी बात सही है?
डिस्टिल्ड एलएलएम में, फ़ाउंडेशन के पैरामीटर से कम पैरामीटर होते हैं से जुड़ी है.
हां, डिस्टिलेशन पैरामीटर की संख्या कम कर देता है.
बेहतर बनाए गए एलएलएम में, फ़ाउंडेशन के पैरामीटर से कम पैरामीटर होते हैं जिस भाषा में इसे ट्रेनिंग दी गई थी.
बेहतर बनाए गए मॉडल में समान संख्या पैरामीटर होते हैं किया गया है.
जैसे-जैसे उपयोगकर्ता तेज़ी से इंजीनियरिंग करते हैं, वैसे-वैसे पैरामीटर की संख्या सफलता हासिल कर रहा है.
प्रॉम्प्ट इंजीनियरिंग की सुविधा, एलएलएम को न तो जोड़ती है, न ही हटाती है, और न ही उसमें बदलाव करती है पैरामीटर का इस्तेमाल करें.