Bu sayfada, üretken yapay zeka ile ilgili terimler yer almaktadır. Tüm terimler için burayı tıklayın.
A
otomatik değerlendirme
Bir modelin çıktısının kalitesini değerlendirmek için yazılım kullanma
Model çıkışı nispeten basit olduğunda bir komut dosyası veya program, modelin çıkışını ideal yanıt ile karşılaştırabilir. Bu tür otomatik değerlendirmelere bazen programlı değerlendirme denir. ROUGE veya BLEU gibi metrikler genellikle programatik değerlendirme için yararlıdır.
Model çıktısı karmaşıksa veya tek bir doğru yanıt yoksa otomatik değerlendirmeyi bazen otomatik değerlendirici adlı ayrı bir yapay zeka programı gerçekleştirir.
Gerçek kişi tarafından yapılan değerlendirme ile karşılaştırın.
otomatik yorum değerlendirmesi
Üretken yapay zeka modelinin çıktısının kalitesini değerlendirmek için insan değerlendirmesini otomatik değerlendirmeyle birleştiren karma bir mekanizma. Otomatik metin yazarı, gerçek kişiler tarafından yapılan değerlendirme ile oluşturulan verilerle eğitilmiş bir makine öğrenimi modelidir. İdeal olarak, otomatik derecelendirme sistemi gerçek bir değerlendiriciyi taklit etmeyi öğrenir.Hazır otomatik yazıcılar mevcuttur ancak en iyi otomatik yazıcılar, özellikle değerlendirdiğiniz göreve göre hassas ayarlanır.
otoregresif model
Kendi önceki tahminlerine dayanarak tahminde bulunan bir model. Örneğin, otomatik geriye dönük dil modelleri, daha önce tahmin edilen jetonlara göre bir sonraki jetonu tahmin eder. Transformer tabanlı tüm büyük dil modelleri otomatik geriye dönüktür.
Buna karşılık, GAN tabanlı görüntü modelleri, bir görüntüyü adım adım iteratif olarak değil, tek bir ileri geçişte oluşturdukları için genellikle otoregresif değildir. Ancak belirli resim oluşturma modelleri, resimleri adım adım oluşturdukları için otoregresif olurlar.
C
düşünce zinciri istemi
Büyük dil modelini (LLM) mantığını adım adım açıklamaya teşvik eden bir istem mühendisliği tekniği. Örneğin, ikinci cümleye özellikle dikkat ederek aşağıdaki istemi inceleyin:
7 saniyede 0'dan 100 kilometre hıza çıkan bir araçta sürücü kaç g kuvveti yaşar? Yanıtta, ilgili tüm hesaplamaları gösterin.
LLM'nin yanıtı büyük olasılıkla:
- Uygun yerlere 0, 60 ve 7 değerlerini ekleyerek bir dizi fizik formülü gösterin.
- Bu formülleri neden seçtiğini ve çeşitli değişkenlerin ne anlama geldiğini açıklayın.
Düşünce zinciri istemi, LLM'yi tüm hesaplamaları yapmaya zorlar. Bu da daha doğru bir yanıta yol açabilir. Ayrıca düşünce zinciri istemi, kullanıcının cevabın mantıklı olup olmadığını belirlemek için LLM'nin adımlarını incelemesini sağlar.
sohbet
Genellikle büyük dil modeli olan bir yapay zeka sistemiyle yapılan karşılıklı konuşmanın içeriği. Sohbetteki önceki etkileşim (ne yazdığınız ve büyük dil modelinin nasıl yanıt verdiği), sohbetin sonraki bölümlerinin bağlamı olur.
Chat bot, büyük dil modelinin bir uygulamasıdır.
bağlama dayalı dil yerleştirme
Kelimeleri ve ifadeleri ana dili konuşan insanların anlayabileceği şekilde "anlamaya" yakın bir yerleşim. Bağlamsallaştırılmış dil embeddings'leri karmaşık söz dizimi, anlambilim ve bağlamı anlayabilir.
Örneğin, İngilizce cow kelimesinin yerleştirilmelerini ele alalım. word2vec gibi eski yerleştirmeler, İngilizce kelimeleri yerleşim alanında inek ile boğa arasındaki mesafenin koyun (dişi koyun) ile koç (erkek koyun) arasındaki mesafeye veya dişi ile erkek arasındaki mesafeye benzer olacak şekilde temsil edebilir. Bağlamsallaştırılmış dil embeddings'leri, İngilizce konuşan kişilerin bazen inek veya boğa anlamına gelen cow kelimesini gelişigüzel kullandığını fark ederek bir adım daha ileri gidebilir.
bağlam penceresi
Bir modelin belirli bir istemde işleyebileceği jeton sayısı. Bağlam penceresi ne kadar büyük olursa model, istem için tutarlı ve tutarlı yanıtlar sağlamak üzere o kadar fazla bilgi kullanabilir.
D
doğrudan istem
Sıfır görevli istem ile eş anlamlıdır.
damıtma
Bir modelin (öğretmen olarak bilinir) boyutunu, orijinal modelin tahminlerini olabildiğince doğru bir şekilde taklit eden daha küçük bir modele (öğrenci olarak bilinir) indirgeme işlemi. Küçük modelin büyük modele (öğretmen) kıyasla iki önemli avantajı olduğundan damıtma faydalıdır:
- Daha hızlı çıkarım süresi
- Azaltılmış bellek ve enerji kullanımı
Ancak öğrencinin tahminleri genellikle öğretmenin tahminleri kadar iyi değildir.
Damıtma, öğrenci modelini öğrenci ve öğretmen modellerinin tahminlerinin çıkışları arasındaki fark temel alınarak bir kayıp fonksiyonunu en aza indirecek şekilde eğitir.
Damıtma işlemini aşağıdaki terimlerle karşılaştırın ve ayırt edin:
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki LLM'ler: İnce ayar, damıtma ve istem mühendisliği bölümüne bakın.
E
evals
Öncelikle LLM değerlendirmeleri için kısaltma olarak kullanılır. Daha geniş bir açıdan bakıldığında evals, değerlendirme biçimlerinin kısaltmasıdır.
değerlendirme
Bir modelin kalitesini ölçme veya farklı modelleri birbiriyle karşılaştırma işlemi.
Bir gözetimli makine öğrenimi modelini değerlendirmek için genellikle doğrulama kümesi ve test kümesi ile karşılaştırırsınız. LLM'yi değerlendirme genellikle daha kapsamlı kalite ve güvenlik değerlendirmelerini içerir.
C
doğruluk
Makine öğrenimi dünyasında, çıkışı gerçeğe dayalı bir modeli tanımlayan özellik. Gerçeklik, bir metrik değil bir kavramdır. Örneğin, bir büyük dil modeline aşağıdaki isteği gönderdiğinizi varsayalım:
Sofra tuzunun kimyasal formülü nedir?
Gerçekliği optimize eden bir model şu şekilde yanıt verir:
NaCl
Tüm modellerin gerçeklere dayalı olması gerektiğini varsaymak caziptir. Ancak aşağıdaki gibi bazı istemler, üretken yapay zeka modelinin gerçeklik yerine yaratıcılığı optimize etmesine neden olur.
Bana bir astronot ve tırtıl hakkında limerick söyle.
Sonuç olarak ortaya çıkan limerick'in gerçeklere dayalı olması pek olası değildir.
Gerçekçilik ile kontrast oluşturur.
çok görevli istem
Büyük dil modelinin nasıl yanıt vermesi gerektiğini gösteren birden fazla ("birkaç") örnek içeren bir istem. Örneğin, aşağıdaki uzun istemde büyük bir dil modelinin bir sorguyu nasıl yanıtlayacağını gösteren iki örnek yer almaktadır.
Bir istemin bölümleri | Notlar |
---|---|
Belirtilen ülkenin resmi para birimi nedir? | LLM'nin yanıtlamasını istediğiniz soru. |
Fransa: avro | Bir örnek vereyim. |
Birleşik Krallık: GBP | Başka bir örnek. |
Hindistan: | Gerçek sorgu. |
Çok görevli istem, genellikle sıfır görevli istem ve tek görevli istem'den daha iyi sonuçlar verir. Ancak çok görevli istem, daha uzun bir istem gerektirir.
Çok görevli istem, isteme dayalı öğrenmeye uygulanan bir az sayıda örnekle öğrenme biçimidir.
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki İstem mühendisliği bölümüne bakın.
ince ayar
Önceden eğitilmiş bir modelde, belirli bir kullanım alanı için parametrelerini hassaslaştırmak amacıyla göreve özel ikinci bir eğitim geçişi. Örneğin, bazı büyük dil modelleri için tam eğitim sırası aşağıdaki gibidir:
- Ön eğitim: Büyük bir dil modelini, tüm İngilizce Wikipedia sayfaları gibi geniş bir genel veri kümesiyle eğitin.
- İnce ayarlama: Önceden eğitilmiş modeli, tıbbi sorgulara yanıt vermek gibi belirli bir görevi gerçekleştirecek şekilde eğitin. İnce ayar genellikle belirli göreve odaklanan yüzlerce veya binlerce örnek içerir.
Başka bir örnek olarak, büyük bir resim modelinin tam eğitim sırası aşağıda verilmiştir:
- Ön eğitim: Wikimedia Commons'taki tüm resimler gibi geniş bir genel resim veri kümesinde büyük bir resim modeli eğitin.
- İnce ayarlama: Önceden eğitilmiş modeli, orka resimleri oluşturma gibi belirli bir görevi gerçekleştirecek şekilde eğitin.
İnce ayar, aşağıdaki stratejilerin herhangi bir kombinasyonunu içerebilir:
- Önceden eğitilmiş modelin mevcut parametrelerinin tümünü değiştirme Buna bazen tam hassas ayar da denir.
- Önceden eğitilmiş modelin mevcut parametrelerinin yalnızca bir kısmını (genellikle çıktı katmanına en yakın katmanlar) değiştirirken diğer mevcut parametreleri (genellikle giriş katmanına en yakın katmanlar) değiştirmeden bırakma Parametreleri verimli şekilde kullanma başlıklı makaleyi inceleyin.
- Genellikle çıkış katmanına en yakın mevcut katmanların üzerine daha fazla katman ekleme.
İnce ayar, transfer öğrenimi biçimlerinden biridir. Bu nedenle, hassas ayarlama işleminde, önceden eğitilmiş modeli eğitmek için kullanılanlardan farklı bir kayıp işlevi veya farklı bir model türü kullanılabilir. Örneğin, önceden eğitilmiş büyük bir resim modelinde ince ayar yaparak giriş resmindeki kuş sayısını döndüren bir regresyon modeli oluşturabilirsiniz.
İnce ayarlama ile aşağıdaki terimleri karşılaştırın:
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki İnce ayarlama bölümüne bakın.
başarı oranı
Bir yapay zeka modelinin oluşturulan metnini değerlendirmek için kullanılan metrik. Başarı oranı, oluşturulan "başarılı" metin çıktılarının toplam oluşturulan metin çıktısı sayısına bölünmesiyle elde edilir. Örneğin, bir büyük dil modeli 10 kod bloğu oluşturduysa ve bunların beşi başarılı olduysa başarı oranı %50 olur.
Başarı oranı, istatistikler genelinde geniş bir şekilde faydalı olsa da makine öğrenimi kapsamında bu metrik, öncelikle kod oluşturma veya matematik problemleri gibi doğrulanabilir görevleri ölçmek için faydalıdır.
G
Gemini
Google'ın en gelişmiş yapay zekasını içeren ekosistem. Bu ekosistemin öğeleri şunlardır:
- Çeşitli Gemini modelleri.
- Gemini modelinin etkileşimli sohbet arayüzü. Kullanıcılar istemler yazar ve Gemini bu istemlere yanıt verir.
- Çeşitli Gemini API'leri.
- Gemini modellerine dayalı çeşitli işletme ürünleri (ör. Google Cloud için Gemini).
Gemini modelleri
Google'ın son teknoloji Transformer tabanlı çoklu modal modelleri. Gemini modelleri, özellikle müşteri temsilcileriyle entegre edilmek üzere tasarlanmıştır.
Kullanıcılar, etkileşimli bir iletişim arayüzü ve SDK'lar dahil olmak üzere çeşitli yollarla Gemini modelleriyle etkileşim kurabilir.
oluşturulan metin
Genel olarak, bir makine öğrenimi modelinin oluşturduğu metindir. Büyük dil modelleri değerlendirilirken bazı metrikler, oluşturulan metni referans metinle karşılaştırır. Örneğin, bir ML modelinin Fransızcadan Hollandacaya ne kadar etkili bir şekilde çeviri yaptığını belirlemeye çalıştığınızı varsayalım. Bu durumda:
- Oluşturulan metin, makine öğrenimi modelinin oluşturduğu Hollandaca çeviridir.
- Referans metin, gerçek bir çevirmen (veya yazılım) tarafından oluşturulan Hollandaca çeviridir.
Bazı değerlendirme stratejilerinin referans metni içermediğini unutmayın.
üretken yapay zeka
Resmi bir tanımı olmayan, yeni ve dönüştürücü bir alan. Bununla birlikte, çoğu uzman üretken yapay zeka modellerinin aşağıdakilerin tümünü içeren içerikler oluşturabileceği ("üretebildiği") konusunda hemfikirdir:
- karmaşık
- tutarlı
- orijinal
Örneğin, üretken yapay zeka modelleri karmaşık makaleler veya resimler oluşturabilir.
LSTM'ler ve RNN'ler de dahil olmak üzere bazı eski teknolojiler özgün ve tutarlı içerikler oluşturabilir. Bazı uzmanlar bu eski teknolojileri üretken yapay zeka olarak görürken diğerleri, gerçek üretken yapay zekanın bu eski teknolojilerin üretebileceğinden daha karmaşık bir çıktı gerektirdiğini düşünüyor.
Tahmine dayalı makine öğrenimi ile karşılaştırın.
altın yanıt
İyi olduğu bilinen bir yanıt. Örneğin, aşağıdaki istem için:
2 + 2
En iyi yanıt şudur:
4
H
gerçek kişi tarafından yapılan değerlendirme
Kullanıcıların bir makine öğrenimi modelinin çıktısının kalitesini değerlendirdiği bir süreçtir. Örneğin, iki dili bilen kullanıcıların bir makine öğrenimi çeviri modelinin kalitesini değerlendirmesi. Gerçek kişiler tarafından yapılan değerlendirmeler, özellikle tek bir doğru yanıtı olmayan modelleri değerlendirmek için kullanışlıdır.
Otomatik değerlendirme ve otomatik değerlendirme ile karşılaştırın.
Sürecin parçası olan insan (HITL)
Aşağıdakilerden birini ifade edebilecek, gevşek bir şekilde tanımlanmış bir deyim:
- Üretken yapay zeka çıktılarını eleştirel veya şüpheci bir şekilde görüntüleme politikası. Örneğin, bu yapay zeka terimleri sözlüğünü yazan kişiler büyük dil modellerinin neler yapabileceğine hayran olsa da bu modellerin yaptığı hatalara dikkat eder.
- Kullanıcıların bir modelin davranışını şekillendirmesine, değerlendirmesine ve hassaslaştırmasına yardımcı olan bir strateji veya sistem. İnsanları sürece dahil etmek, yapay zekanın hem makine zekasından hem de insan zekasından yararlanmasını sağlar. Örneğin, bir yapay zekanın kod oluşturduğu ve yazılım mühendislerinin bu kodu incelediği bir sistem, döngüye insan dahil edilmiş bir sistemdir.
I
bağlam içinde öğrenme
Çok görevli istem ile eş anlamlıdır.
talimat ince ayarı
Üretken yapay zeka modelinin talimatları takip etme özelliğini iyileştiren bir ince ayar biçimidir. Talimat ince ayarı, bir modeli genellikle çok çeşitli görevleri kapsayan bir dizi talimat istemiyle eğitmeyi içerir. Bunun sonucunda, talimatlara göre ayarlanmış model, çeşitli görevlerde sıfır atışlı istemlere yararlı yanıtlar üretme eğilimindedir.
Aşağıdakilerle karşılaştırma ve ayırt etme:
L
LLM
Büyük dil modeli kısaltması.
LLM değerlendirmeleri (evals)
Büyük dil modellerinin (LLM'ler) performansını değerlendirmeye yönelik bir dizi metrik ve karşılaştırma. Genel olarak LLM değerlendirmeleri:
- Araştırmacıların, LLM'lerin iyileştirilmesi gereken alanlarını belirlemesine yardımcı olun.
- Farklı LLM'leri karşılaştırmak ve belirli bir görev için en iyi LLM'yi belirlemek için yararlıdır.
- LLM'lerin güvenli ve etik bir şekilde kullanılmasına yardımcı olma
LoRA
Düşük Sıralı Uyumluluk kısaltması.
Düşük Sıralı Uyumluluk (LoRA)
Modelin önceden eğitilmiş ağırlıklarını "dondurup" (artık değiştirilemeyecek şekilde) ve ardından modele küçük bir eğitilebilir ağırlık grubu ekleyen ince ayar için parametre açısından verimli bir teknik. Bu eğitilebilir ağırlıklar grubu ("güncelleme matrisleri" olarak da bilinir), temel modelden önemli ölçüde daha küçüktür ve bu nedenle eğitilmesi çok daha hızlıdır.
LoRA aşağıdaki avantajları sağlar:
- İnce ayarlama işleminin uygulandığı alan için modelin tahminlerinin kalitesini artırır.
- Bir modelin tüm parametrelerinin ince ayarlanmasını gerektiren tekniklere kıyasla daha hızlı ince ayar yapar.
- Aynı temel modeli paylaşan birden fazla özel modelin eşzamanlı olarak sunulmasını sağlayarak tahmin işleminin hesaplama maliyetini azaltır.
M
makine çevirisi
Metni bir insan dilinden başka bir insan diline (ör. İngilizceden Japoncaya) dönüştürmek için yazılım (genellikle makine öğrenimi modeli) kullanma
k değerinde ortalama hassasiyet (mAP@k)
Doğrulama veri kümesinde tüm k için ortalama hassasiyet puanlarının istatistiksel ortalaması. k değerinde ortalama hassasiyetin bir kullanım alanı, öneri sistemi tarafından oluşturulan önerilerin kalitesini değerlendirmektir.
"Ortalama ortalama" ifadesi gereksiz görünse de metriğin adı uygundur. Sonuçta bu metrik, birden fazla k değerinde ortalama kesinlik değerinin ortalamasını bulur.
uzmanların karışımı
Belirli bir giriş jetonunu veya öreğini işlemek için yalnızca parametrelerinin bir alt kümesini (uzman olarak bilinir) kullanarak sinir ağının verimliliğini artırmaya yönelik bir şema. Giriş ağı, her giriş jetonunu veya örneği uygun uzmanlara yönlendirir.
Ayrıntılı bilgi için aşağıdaki makalelerden birini inceleyin:
- Çok Büyük Nöral Ağlar: Seyrek Kapılı Uzman Karışım Katmanı
- Uzman Seçimi Yönlendirmesi ile Uzman Karması
MMIT
Çok modlu talimat ayarlı kısaltması.
model basamaklı
Belirli bir çıkarım sorgusu için ideal modeli seçen bir sistem.
Çok büyükten (çok sayıda parametre) çok daha küçüğe (çok daha az parametre) kadar değişen bir model grubunu düşünün. Çok büyük modeller, tahmin sırasında küçük modellere kıyasla daha fazla bilgi işlem kaynağı tüketir. Ancak çok büyük modeller genellikle daha küçük modellere kıyasla daha karmaşık istekler çıkarabilir. Model basamaklandırması, çıkarım sorgusunun karmaşıklığını belirler ve ardından çıkarım yapmak için uygun modeli seçer. Model basamaklandırmanın temel amacı, genellikle daha küçük modeller seçerek ve yalnızca daha karmaşık sorgular için daha büyük bir model seçerek çıkarım maliyetlerini azaltmaktır.
Küçük bir modelin bir telefonda, bu modelin daha büyük bir sürümünün ise uzak bir sunucuda çalıştığını varsayalım. İyi bir model basamaklandırması, küçük modelin basit istekleri işlemesine olanak tanıyarak ve yalnızca karmaşık istekleri işlemek için uzak modeli çağırarak maliyeti ve gecikmeyi azaltır.
Ayrıca model yönlendirici konusuna bakın.
model yönlendirici
Model basamaklandırmasında tahmin için ideal modeli belirleyen algoritma. Model yönlendirici, genellikle belirli bir giriş için en iyi modeli nasıl seçeceğini kademeli olarak öğrenen bir makine öğrenimi modelidir. Ancak model yönlendirici bazen makine öğrenimi içermeyen daha basit bir algoritma olabilir.
MOE
Uzmanlardan oluşan bir grup kısaltması.
MT
Makine çevirisi kısaltması.
H
Tek doğru yanıt yok (NORA)
Birden fazla uygun yanıtı olan bir istem. Örneğin, aşağıdaki istemde tek bir doğru yanıt yoktur:
Bana fillerle ilgili bir fıkra anlat.
Doğru yanıtı olmayan istemleri değerlendirmek zor olabilir.
NORA
Tek doğru cevap yok ifadesinin kısaltması.
O
tek görevli istem
Büyük dil modelinin nasıl yanıt vermesi gerektiğini gösteren bir örnek içeren istem. Örneğin, aşağıdaki istemde büyük bir dil modelinin bir sorguyu nasıl yanıtlaması gerektiğini gösteren bir örnek yer almaktadır.
Bir istemin bölümleri | Notlar |
---|---|
Belirtilen ülkenin resmi para birimi nedir? | LLM'nin yanıtlamasını istediğiniz soru. |
Fransa: avro | Bir örnek vereyim. |
Hindistan: | Gerçek sorgu. |
Tek seferlik istem ile aşağıdaki terimleri karşılaştırın:
P
parametreleri verimli şekilde kullanma
Büyük bir önceden eğitilmiş dil modelini (PLM) tam ince ayarlama işleminden daha verimli bir şekilde ince ayarlama yapmak için kullanılan bir teknik grubu. Parametre verimliliği odaklı ayarlama, genellikle tam ince ayarlamaya kıyasla çok daha az sayıda parametrede ince ayar yapar ancak genellikle tam ince ayarlamayla oluşturulan büyük bir dil modeliyle aynı performansı (veya neredeyse aynı performansı) gösteren bir büyük dil modeli oluşturur.
Parametre verimliliği ayarlamayı aşağıdakilerle karşılaştırın:
Parametrelerin verimli şekilde kullanıldığı ayarlama, parametreleri verimli şekilde kullanma olarak da bilinir.
PLM
Önceden eğitilmiş dil modeli kısaltması.
eğitilmiş model
Genellikle aşağıdakilerden biri veya daha fazlası gibi bazı son işlemlerden geçmiş önceden eğitilmiş bir modeli ifade eden, gevşek tanımlanmış bir terimdir:
önceden eğitilmiş model
Genellikle, eğitilmiş bir modeldir. Bu terim, daha önce eğitilmiş bir gömülü vektör anlamına da gelebilir.
Önceden eğitilmiş dil modeli terimi genellikle önceden eğitilmiş bir büyük dil modelini ifade eder.
ön eğitim
Bir modelin büyük bir veri kümesinde ilk eğitimi. Bazı önceden eğitilmiş modeller hantal devler gibidir ve genellikle ek eğitimle hassaslaştırılması gerekir. Örneğin, makine öğrenimi uzmanları, Wikipedia'daki tüm İngilizce sayfalar gibi geniş bir metin veri kümesinde büyük dil modelini önceden eğitebilir. Ön eğitimden sonra elde edilen model, aşağıdaki tekniklerden herhangi biri kullanılarak daha da hassaslaştırılabilir:
istem
Modeli belirli bir şekilde davranmaya koşullandırmak için büyük dil modeline giriş olarak girilen tüm metinler. İstemler bir kelime öbeği kadar kısa veya istediğiniz kadar uzun olabilir (örneğin, bir romanın tamamı). İstemler, aşağıdaki tabloda gösterilenler de dahil olmak üzere birden fazla kategoriye ayrılır:
İstem kategorisi | Örnek | Notlar |
---|---|---|
Soru | Güvercin ne kadar hızlı uçabilir? | |
Talimat | Arbitraj hakkında komik bir şiir yazın. | Büyük dil modelinden bir şey yapmasını isteyen istem. |
Örnek | Markdown kodunu HTML'ye çevirin. Örneğin:
Markdown: * liste öğesi HTML: <ul> <li>liste öğesi</li> </ul> |
Bu örnek istemdeki ilk cümle bir talimattır. İstemin geri kalanı örnektir. |
Rol | Fizik alanında doktora yapmak için makine öğrenimi eğitiminde gradyan azalma yönteminin neden kullanıldığını açıklayın. | Cümlenin ilk kısmı bir talimattır; "Fizik alanında doktora" ifadesi ise rol bölümüdür. |
Modelin tamamlaması için kısmi giriş | Birleşik Krallık Başbakanı şu adreste yaşıyor: | Tamamlama girişi istemi, aniden (bu örnekte olduğu gibi) veya alt çizgiyle bitebilir. |
Üretken yapay zeka modelleri, istemlere metin, kod, resim, yerleşim, video gibi neredeyse her şeyle yanıt verebilir.
istem temelli öğrenme
Belirli modellerin, davranışlarını rastgele metin girişlerine (istemler) göre uyarlamalarına olanak tanıyan bir özelliktir. İstem tabanlı öğrenme paradigmasında büyük dil modeli, istemlere metin üreterek yanıt verir. Örneğin, bir kullanıcının aşağıdaki istemi girdiğini varsayalım:
Newton'un üçüncü hareket yasasını özetleyin.
İsteme dayalı öğrenme yapabilen bir model, önceki istemi yanıtlamak için özel olarak eğitilmez. Model, fizik, genel dil kuralları ve genel olarak yararlı yanıtları oluşturan konular hakkında çok fazla bilgi "biliyor". Bu bilgiler, faydalı bir yanıt (umarım) sağlamak için yeterlidir. Ek insan geri bildirimleri ("Bu yanıt çok karmaşıktı." veya "Yanıtın ne olduğunu anlamadım.") bazı istem tabanlı öğrenme sistemlerinin yanıtlarının faydasını kademeli olarak artırmasını sağlar.
istem tasarımı
İstem mühendisliği ile eş anlamlıdır.
istem mühendisliği
Büyük dil modelinden istenen yanıtları alan istemler oluşturma sanatı. İstem mühendisliği, insanlar tarafından gerçekleştirilir. İyi yapılandırılmış istemler yazmak, büyük dil modelinden yararlı yanıtlar almanın önemli bir parçasıdır. İstem mühendisliği aşağıdakiler gibi birçok faktöre bağlıdır:
- Büyük dil modelini ön eğitmek ve muhtemelen ince ayarlamak için kullanılan veri kümesi.
- Modelin yanıt oluşturmak için kullandığı sıcaklık ve diğer kod çözme parametreleri.
Faydalı istemler yazma hakkında daha fazla bilgi için İstem tasarımına giriş başlıklı makaleyi inceleyin.
İstem tasarımı, istem mühendisliğinin eş anlamlısıdır.
istem ayarı
Sistemin gerçek istemin başına eklediği bir "ön ek" öğrenen parametrelerin verimli kullanıldığı ayarlama mekanizması.
İstem ayarının bir varyantı (bazen önek ayarlama olarak adlandırılır) ön eki her katmana eklemektir. Buna karşılık, çoğu istem ayarı yalnızca giriş katmanına bir ön ek ekler.
K
referans metni
Uzmanın bir isteme verdiği yanıt. Örneğin, aşağıdaki istemde:
"Adınız ne?" sorusunu İngilizceden Fransızcaya çevirin.
Bir uzmanın yanıtı şöyle olabilir:
Comment vous appelez-vous?
Çeşitli metrikler (ör. ROUGE), referans metninin bir yapay zeka modelinin oluşturduğu metinle eşleşme derecesini ölçer.
Gerçek Kullanıcı Geri Bildirimlerinden Pekiştirmeli Öğrenme (RLHF)
Modelin yanıtlarının kalitesini iyileştirmek için gerçek kişilerden gelen geri bildirimleri kullanma Örneğin, bir RLHF mekanizması kullanıcılardan bir modelin yanıtının kalitesini 👍 veya 👎 emojisiyle değerlendirmelerini isteyebilir. Sistem daha sonra gelecekteki yanıtlarını bu geri bildirime göre ayarlayabilir.
rol istemi
Üretken yapay zeka modelinin yanıtı için hedef kitleyi tanımlayan istemin isteğe bağlı bir parçasıdır. Büyük dil modelleri, rol istemi olmadan soruları soran kullanıcı için yararlı olabilecek veya olamayacak bir yanıt sağlar. Büyük dil modelleri, rol istemi ile belirli bir hedef kitle için daha uygun ve daha yararlı bir şekilde yanıt verebilir. Örneğin, aşağıdaki istemlerin rol istemi kısmı kalın olarak gösterilir:
- Ekonomi alanında doktora yapanlar için bu makaleyi özetleyin.
- On yaşındaki bir çocuğa gelgitlerin nasıl çalıştığını açıklayın.
- 2008 mali krizini açıklayın. Küçük bir çocukla veya golden retriever ile konuşuyormuş gibi konuşun.
S
yumuşak istem ayarı
Kaynak yoğun ince ayar yapmadan belirli bir görev için büyük dil modelini ayarlama tekniği. Yumuşak istem ayarı, modeldeki tüm ağırlıkları yeniden eğitmek yerine, aynı hedefe ulaşmak için istemi otomatik olarak ayarlar.
Metin istemi verildiğinde yumuşak istem ayarı genellikle isme ek jeton ekleme işlemi yapar ve girişi optimize etmek için geri yayılımı kullanır.
"Sabit" istem, jeton yerleştirmeleri yerine gerçek jetonlar içerir.
T
sıcaklık
Bir modelin çıkışının rastgelelik derecesini kontrol eden hiper parametre. Yüksek sıcaklıklar daha rastgele sonuçlara, düşük sıcaklıklar ise daha az rastgele sonuçlara yol açar.
En iyi sıcaklığı seçmek, belirli uygulamaya ve modelin çıktısının tercih edilen özelliklerine bağlıdır. Örneğin, reklam öğesi çıkışı oluşturan bir uygulama oluştururken sıcaklığı artırmanız gerekir. Buna karşılık, modelin doğruluğunu ve tutarlılığını artırmak için resimleri veya metni sınıflandıran bir model oluştururken sıcaklığı düşürmeniz muhtemeldir.
Sıcaklık genellikle softmax ile birlikte kullanılır.
Z
sıfır görevli istem
Büyük dil modelinin nasıl yanıt vermesini istediğinize dair bir örnek vermeyen istem. Örneğin:
Bir istemin bölümleri | Notlar |
---|---|
Belirtilen ülkenin resmi para birimi nedir? | LLM'nin yanıtlamasını istediğiniz soru. |
Hindistan: | Gerçek sorgu. |
Büyük dil modeli aşağıdakilerden herhangi biriyle yanıt verebilir:
- Rupi
- INR
- ₹
- Hint rupisi
- Rupi
- Hint rupisi
Tüm yanıtlar doğrudur ancak belirli bir biçimi tercih edebilirsiniz.
Sıfır atışlı istem ile aşağıdaki terimleri karşılaştırın: