Bu sayfa, Cloud Translation API ile çevrilmiştir.

Makine Öğrenimi Sözlüğü: Üretken Yapay Zeka

Bu sayfada, üretken yapay zeka ile ilgili terimler yer almaktadır. Tüm terimler için burayı tıklayın.

A

otomatik değerlendirme

#language

#generativeAI

Bir modelin çıktısının kalitesini değerlendirmek için yazılım kullanma

Model çıkışı nispeten basit olduğunda bir komut dosyası veya program, modelin çıkışını ideal yanıt ile karşılaştırabilir. Bu tür otomatik değerlendirmelere bazen programlı değerlendirme denir. ROUGE veya BLEU gibi metrikler genellikle programatik değerlendirme için yararlıdır.

Model çıktısı karmaşıksa veya tek bir doğru yanıt yoksa otomatik değerlendirmeyi bazen otomatik değerlendirici adlı ayrı bir yapay zeka programı gerçekleştirir.

Gerçek kişi tarafından yapılan değerlendirme ile karşılaştırın.

otomatik yorum değerlendirmesi

#language

#generativeAI

Üretken yapay zeka modelinin çıktısının kalitesini değerlendirmek için insan değerlendirmesini otomatik değerlendirmeyle birleştiren karma bir mekanizma. Otomatik metin yazarı, gerçek kişiler tarafından yapılan değerlendirme ile oluşturulan verilerle eğitilmiş bir makine öğrenimi modelidir. İdeal olarak, otomatik derecelendirme sistemi gerçek bir değerlendiriciyi taklit etmeyi öğrenir.

Hazır otomatik yazıcılar mevcuttur ancak en iyi otomatik yazıcılar, özellikle değerlendirdiğiniz göreve göre hassas ayarlanır.

otoregresif model

#language

#image

#generativeAI

Kendi önceki tahminlerine dayanarak tahminde bulunan bir model. Örneğin, otomatik geriye dönük dil modelleri, daha önce tahmin edilen jetonlara göre bir sonraki jetonu tahmin eder. Transformer tabanlı tüm büyük dil modelleri otomatik geriye dönüktür.

Buna karşılık, GAN tabanlı görüntü modelleri, bir görüntüyü adım adım iteratif olarak değil, tek bir ileri geçişte oluşturdukları için genellikle otoregresif değildir. Ancak belirli resim oluşturma modelleri, resimleri adım adım oluşturdukları için otoregresif olurlar.

C

düşünce zinciri istemi

#language

#generativeAI

Büyük dil modelini (LLM) mantığını adım adım açıklamaya teşvik eden bir istem mühendisliği tekniği. Örneğin, ikinci cümleye özellikle dikkat ederek aşağıdaki istemi inceleyin:

7 saniyede 0'dan 100 kilometre hıza çıkan bir araçta sürücü kaç g kuvveti yaşar? Yanıtta, ilgili tüm hesaplamaları gösterin.

LLM'nin yanıtı büyük olasılıkla:

Uygun yerlere 0, 60 ve 7 değerlerini ekleyerek bir dizi fizik formülü gösterin.
Bu formülleri neden seçtiğini ve çeşitli değişkenlerin ne anlama geldiğini açıklayın.

Düşünce zinciri istemi, LLM'yi tüm hesaplamaları yapmaya zorlar. Bu da daha doğru bir yanıta yol açabilir. Ayrıca düşünce zinciri istemi, kullanıcının cevabın mantıklı olup olmadığını belirlemek için LLM'nin adımlarını incelemesini sağlar.

sohbet

#language

#generativeAI

Genellikle büyük dil modeli olan bir yapay zeka sistemiyle yapılan karşılıklı konuşmanın içeriği. Sohbetteki önceki etkileşim (ne yazdığınız ve büyük dil modelinin nasıl yanıt verdiği), sohbetin sonraki bölümlerinin bağlamı olur.

Chat bot, büyük dil modelinin bir uygulamasıdır.

bağlama dayalı dil yerleştirme

#language

#generativeAI

Kelimeleri ve ifadeleri ana dili konuşan insanların anlayabileceği şekilde "anlamaya" yakın bir yerleşim. Bağlamsallaştırılmış dil embeddings'leri karmaşık söz dizimi, anlambilim ve bağlamı anlayabilir.

Örneğin, İngilizce cow kelimesinin yerleştirilmelerini ele alalım. word2vec gibi eski yerleştirmeler, İngilizce kelimeleri yerleşim alanında inek ile boğa arasındaki mesafenin koyun (dişi koyun) ile koç (erkek koyun) arasındaki mesafeye veya dişi ile erkek arasındaki mesafeye benzer olacak şekilde temsil edebilir. Bağlamsallaştırılmış dil embeddings'leri, İngilizce konuşan kişilerin bazen inek veya boğa anlamına gelen cow kelimesini gelişigüzel kullandığını fark ederek bir adım daha ileri gidebilir.

bağlam penceresi

#language

#generativeAI

Bir modelin belirli bir istemde işleyebileceği jeton sayısı. Bağlam penceresi ne kadar büyük olursa model, istem için tutarlı ve tutarlı yanıtlar sağlamak üzere o kadar fazla bilgi kullanabilir.

D

doğrudan istem

#language

#generativeAI

Sıfır görevli istem ile eş anlamlıdır.

damıtma

#generativeAI

Bir modelin (öğretmen olarak bilinir) boyutunu, orijinal modelin tahminlerini olabildiğince doğru bir şekilde taklit eden daha küçük bir modele (öğrenci olarak bilinir) indirgeme işlemi. Küçük modelin büyük modele (öğretmen) kıyasla iki önemli avantajı olduğundan damıtma faydalıdır:

Daha hızlı çıkarım süresi
Azaltılmış bellek ve enerji kullanımı

Ancak öğrencinin tahminleri genellikle öğretmenin tahminleri kadar iyi değildir.

Damıtma, öğrenci modelini öğrenci ve öğretmen modellerinin tahminlerinin çıkışları arasındaki fark temel alınarak bir kayıp fonksiyonunu en aza indirecek şekilde eğitir.

Damıtma işlemini aşağıdaki terimlerle karşılaştırın ve ayırt edin:

ince ayar
İsteme dayalı öğrenme

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki LLM'ler: İnce ayar, damıtma ve istem mühendisliği bölümüne bakın.

E

evals

#language

#generativeAI

Öncelikle LLM değerlendirmeleri için kısaltma olarak kullanılır. Daha geniş bir açıdan bakıldığında evals, değerlendirme biçimlerinin kısaltmasıdır.

değerlendirme

#language

#generativeAI

Bir modelin kalitesini ölçme veya farklı modelleri birbiriyle karşılaştırma işlemi.

Bir gözetimli makine öğrenimi modelini değerlendirmek için genellikle doğrulama kümesi ve test kümesi ile karşılaştırırsınız. LLM'yi değerlendirme genellikle daha kapsamlı kalite ve güvenlik değerlendirmelerini içerir.

C

doğruluk

#generativeAI

Makine öğrenimi dünyasında, çıkışı gerçeğe dayalı bir modeli tanımlayan özellik. Gerçeklik, bir metrik değil bir kavramdır. Örneğin, bir büyük dil modeline aşağıdaki isteği gönderdiğinizi varsayalım:

Sofra tuzunun kimyasal formülü nedir?

Gerçekliği optimize eden bir model şu şekilde yanıt verir:

NaCl

Tüm modellerin gerçeklere dayalı olması gerektiğini varsaymak caziptir. Ancak aşağıdaki gibi bazı istemler, üretken yapay zeka modelinin gerçeklik yerine yaratıcılığı optimize etmesine neden olur.

Bana bir astronot ve tırtıl hakkında limerick söyle.

Sonuç olarak ortaya çıkan limerick'in gerçeklere dayalı olması pek olası değildir.

Gerçekçilik ile kontrast oluşturur.

çok görevli istem

#language

#generativeAI

Büyük dil modelinin nasıl yanıt vermesi gerektiğini gösteren birden fazla ("birkaç") örnek içeren bir istem. Örneğin, aşağıdaki uzun istemde büyük bir dil modelinin bir sorguyu nasıl yanıtlayacağını gösteren iki örnek yer almaktadır.

Bir istemin bölümleri	Notlar
`Belirtilen ülkenin resmi para birimi nedir?`	LLM'nin yanıtlamasını istediğiniz soru.
`Fransa: avro`	Bir örnek vereyim.
`Birleşik Krallık: GBP`	Başka bir örnek.
`Hindistan:`	Gerçek sorgu.

Çok görevli istem, genellikle sıfır görevli istem ve tek görevli istem'den daha iyi sonuçlar verir. Ancak çok görevli istem, daha uzun bir istem gerektirir.

Çok görevli istem, isteme dayalı öğrenmeye uygulanan bir az sayıda örnekle öğrenme biçimidir.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki İstem mühendisliği bölümüne bakın.

ince ayar

#language

#image

#generativeAI

Önceden eğitilmiş bir modelde, belirli bir kullanım alanı için parametrelerini hassaslaştırmak amacıyla göreve özel ikinci bir eğitim geçişi. Örneğin, bazı büyük dil modelleri için tam eğitim sırası aşağıdaki gibidir:

Ön eğitim: Büyük bir dil modelini, tüm İngilizce Wikipedia sayfaları gibi geniş bir genel veri kümesiyle eğitin.
İnce ayarlama: Önceden eğitilmiş modeli, tıbbi sorgulara yanıt vermek gibi belirli bir görevi gerçekleştirecek şekilde eğitin. İnce ayar genellikle belirli göreve odaklanan yüzlerce veya binlerce örnek içerir.

Başka bir örnek olarak, büyük bir resim modelinin tam eğitim sırası aşağıda verilmiştir:

Ön eğitim: Wikimedia Commons'taki tüm resimler gibi geniş bir genel resim veri kümesinde büyük bir resim modeli eğitin.
İnce ayarlama: Önceden eğitilmiş modeli, orka resimleri oluşturma gibi belirli bir görevi gerçekleştirecek şekilde eğitin.

İnce ayar, aşağıdaki stratejilerin herhangi bir kombinasyonunu içerebilir:

Önceden eğitilmiş modelin mevcut parametrelerinin tümünü değiştirme Buna bazen tam hassas ayar da denir.
Önceden eğitilmiş modelin mevcut parametrelerinin yalnızca bir kısmını (genellikle çıktı katmanına en yakın katmanlar) değiştirirken diğer mevcut parametreleri (genellikle giriş katmanına en yakın katmanlar) değiştirmeden bırakma Parametreleri verimli şekilde kullanma başlıklı makaleyi inceleyin.
Genellikle çıkış katmanına en yakın mevcut katmanların üzerine daha fazla katman ekleme.

İnce ayar, transfer öğrenimi biçimlerinden biridir. Bu nedenle, hassas ayarlama işleminde, önceden eğitilmiş modeli eğitmek için kullanılanlardan farklı bir kayıp işlevi veya farklı bir model türü kullanılabilir. Örneğin, önceden eğitilmiş büyük bir resim modelinde ince ayar yaparak giriş resmindeki kuş sayısını döndüren bir regresyon modeli oluşturabilirsiniz.

İnce ayarlama ile aşağıdaki terimleri karşılaştırın:

damıtma
İsteme dayalı öğrenme

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki İnce ayarlama bölümüne bakın.

başarı oranı

#generativeAI

Bir yapay zeka modelinin oluşturulan metnini değerlendirmek için kullanılan metrik. Başarı oranı, oluşturulan "başarılı" metin çıktılarının toplam oluşturulan metin çıktısı sayısına bölünmesiyle elde edilir. Örneğin, bir büyük dil modeli 10 kod bloğu oluşturduysa ve bunların beşi başarılı olduysa başarı oranı %50 olur.

Başarı oranı, istatistikler genelinde geniş bir şekilde faydalı olsa da makine öğrenimi kapsamında bu metrik, öncelikle kod oluşturma veya matematik problemleri gibi doğrulanabilir görevleri ölçmek için faydalıdır.

G

Gemini

#language

#image

#generativeAI

Google'ın en gelişmiş yapay zekasını içeren ekosistem. Bu ekosistemin öğeleri şunlardır:

Çeşitli Gemini modelleri.
Gemini modelinin etkileşimli sohbet arayüzü. Kullanıcılar istemler yazar ve Gemini bu istemlere yanıt verir.
Çeşitli Gemini API'leri.
Gemini modellerine dayalı çeşitli işletme ürünleri (ör. Google Cloud için Gemini).

Gemini modelleri

#language

#image

#generativeAI

Google'ın son teknoloji Transformer tabanlı çoklu modal modelleri. Gemini modelleri, özellikle müşteri temsilcileriyle entegre edilmek üzere tasarlanmıştır.

Kullanıcılar, etkileşimli bir iletişim arayüzü ve SDK'lar dahil olmak üzere çeşitli yollarla Gemini modelleriyle etkileşim kurabilir.

oluşturulan metin

#language

#generativeAI

Genel olarak, bir makine öğrenimi modelinin oluşturduğu metindir. Büyük dil modelleri değerlendirilirken bazı metrikler, oluşturulan metni referans metinle karşılaştırır. Örneğin, bir ML modelinin Fransızcadan Hollandacaya ne kadar etkili bir şekilde çeviri yaptığını belirlemeye çalıştığınızı varsayalım. Bu durumda:

Oluşturulan metin, makine öğrenimi modelinin oluşturduğu Hollandaca çeviridir.
Referans metin, gerçek bir çevirmen (veya yazılım) tarafından oluşturulan Hollandaca çeviridir.

Bazı değerlendirme stratejilerinin referans metni içermediğini unutmayın.

üretken yapay zeka

#language

#image

#generativeAI

Resmi bir tanımı olmayan, yeni ve dönüştürücü bir alan. Bununla birlikte, çoğu uzman üretken yapay zeka modellerinin aşağıdakilerin tümünü içeren içerikler oluşturabileceği ("üretebildiği") konusunda hemfikirdir:

karmaşık
tutarlı
orijinal

Örneğin, üretken yapay zeka modelleri karmaşık makaleler veya resimler oluşturabilir.

LSTM'ler ve RNN'ler de dahil olmak üzere bazı eski teknolojiler özgün ve tutarlı içerikler oluşturabilir. Bazı uzmanlar bu eski teknolojileri üretken yapay zeka olarak görürken diğerleri, gerçek üretken yapay zekanın bu eski teknolojilerin üretebileceğinden daha karmaşık bir çıktı gerektirdiğini düşünüyor.

Tahmine dayalı makine öğrenimi ile karşılaştırın.

altın yanıt

#language

#generativeAI

İyi olduğu bilinen bir yanıt. Örneğin, aşağıdaki istem için:

2 + 2

En iyi yanıt şudur:

4

Altın yanıt ve referans metinle ilgili notlar için burayı tıklayın.

ROUGE gibi bazı değerlendirme metrikleri, referans metni ile modelin oluşturulan metnini karşılaştırır. Bir istem için tek bir doğru yanıt varsa altın yanıt genellikle referans metni olarak kullanılır.

Bazı istemlerin tek bir doğru cevabı yoktur. Örneğin, Bu dokümanı özetleyin istemi muhtemelen birçok doğru yanıta sahiptir. Bir model çok çeşitli olası özetler oluşturabileceğinden, bu tür istemler için referans metin genellikle kullanışlı değildir. Ancak bu durumda mükemmel bir yanıt vermeniz yararlı olabilir. Örneğin, iyi bir doküman özeti içeren mükemmel bir yanıt, otomatik notlandırıcıyı iyi doküman özeti kalıplarını keşfetmesi için eğitmeye yardımcı olabilir.

H

gerçek kişi tarafından yapılan değerlendirme

#language

#generativeAI

Kullanıcıların bir makine öğrenimi modelinin çıktısının kalitesini değerlendirdiği bir süreçtir. Örneğin, iki dili bilen kullanıcıların bir makine öğrenimi çeviri modelinin kalitesini değerlendirmesi. Gerçek kişiler tarafından yapılan değerlendirmeler, özellikle tek bir doğru yanıtı olmayan modelleri değerlendirmek için kullanışlıdır.

Otomatik değerlendirme ve otomatik değerlendirme ile karşılaştırın.

Sürecin parçası olan insan (HITL)

#generativeAI

Aşağıdakilerden birini ifade edebilecek, gevşek bir şekilde tanımlanmış bir deyim:

Üretken yapay zeka çıktılarını eleştirel veya şüpheci bir şekilde görüntüleme politikası. Örneğin, bu yapay zeka terimleri sözlüğünü yazan kişiler büyük dil modellerinin neler yapabileceğine hayran olsa da bu modellerin yaptığı hatalara dikkat eder.
Kullanıcıların bir modelin davranışını şekillendirmesine, değerlendirmesine ve hassaslaştırmasına yardımcı olan bir strateji veya sistem. İnsanları sürece dahil etmek, yapay zekanın hem makine zekasından hem de insan zekasından yararlanmasını sağlar. Örneğin, bir yapay zekanın kod oluşturduğu ve yazılım mühendislerinin bu kodu incelediği bir sistem, döngüye insan dahil edilmiş bir sistemdir.

I

bağlam içinde öğrenme

#language

#generativeAI

Çok görevli istem ile eş anlamlıdır.

talimat ince ayarı

#generativeAI

Üretken yapay zeka modelinin talimatları takip etme özelliğini iyileştiren bir ince ayar biçimidir. Talimat ince ayarı, bir modeli genellikle çok çeşitli görevleri kapsayan bir dizi talimat istemiyle eğitmeyi içerir. Bunun sonucunda, talimatlara göre ayarlanmış model, çeşitli görevlerde sıfır atışlı istemlere yararlı yanıtlar üretme eğilimindedir.

Aşağıdakilerle karşılaştırma ve ayırt etme:

Parametreleri verimli şekilde kullanma
istem ayarı

L

LLM

#language

#generativeAI

Büyük dil modeli kısaltması.

LLM değerlendirmeleri (evals)

#language

#generativeAI

Büyük dil modellerinin (LLM'ler) performansını değerlendirmeye yönelik bir dizi metrik ve karşılaştırma. Genel olarak LLM değerlendirmeleri:

Araştırmacıların, LLM'lerin iyileştirilmesi gereken alanlarını belirlemesine yardımcı olun.
Farklı LLM'leri karşılaştırmak ve belirli bir görev için en iyi LLM'yi belirlemek için yararlıdır.
LLM'lerin güvenli ve etik bir şekilde kullanılmasına yardımcı olma

LoRA

#language

#generativeAI

Düşük Sıralı Uyumluluk kısaltması.

Düşük Sıralı Uyumluluk (LoRA)

#language

#generativeAI

Modelin önceden eğitilmiş ağırlıklarını "dondurup" (artık değiştirilemeyecek şekilde) ve ardından modele küçük bir eğitilebilir ağırlık grubu ekleyen ince ayar için parametre açısından verimli bir teknik. Bu eğitilebilir ağırlıklar grubu ("güncelleme matrisleri" olarak da bilinir), temel modelden önemli ölçüde daha küçüktür ve bu nedenle eğitilmesi çok daha hızlıdır.

LoRA aşağıdaki avantajları sağlar:

İnce ayarlama işleminin uygulandığı alan için modelin tahminlerinin kalitesini artırır.
Bir modelin tüm parametrelerinin ince ayarlanmasını gerektiren tekniklere kıyasla daha hızlı ince ayar yapar.
Aynı temel modeli paylaşan birden fazla özel modelin eşzamanlı olarak sunulmasını sağlayarak tahmin işleminin hesaplama maliyetini azaltır.

LoRA'daki güncelleme matrisleri hakkında daha fazla bilgi edinmek için simgeyi tıklayın.

LoRA'da kullanılan güncelleme matrisleri, gürültüyü filtrelemeye ve eğitimi modelin en önemli özelliklerine odaklamaya yardımcı olmak için temel modelden türetilen sıralama ayrıştırma matrislerinden oluşur.

M

makine çevirisi

#generativeAI

Metni bir insan dilinden başka bir insan diline (ör. İngilizceden Japoncaya) dönüştürmek için yazılım (genellikle makine öğrenimi modeli) kullanma

k değerinde ortalama hassasiyet (mAP@k)

#language

#generativeAI

Doğrulama veri kümesinde tüm k için ortalama hassasiyet puanlarının istatistiksel ortalaması. k değerinde ortalama hassasiyetin bir kullanım alanı, öneri sistemi tarafından oluşturulan önerilerin kalitesini değerlendirmektir.

"Ortalama ortalama" ifadesi gereksiz görünse de metriğin adı uygundur. Sonuçta bu metrik, birden fazla k değerinde ortalama kesinlik değerinin ortalamasını bulur.

Örnek görmek için simgeyi tıklayın.

Her kullanıcı için önerilen romanların kişiselleştirilmiş bir listesini oluşturan bir öneri sistemi oluşturduğunuzu varsayalım. Seçilen kullanıcılardan gelen geri bildirimlere göre, k puanında aşağıdaki beş ortalama hassasiyeti hesaplarsınız (kullanıcı başına bir puan):

0,73
0,77
0,67
0,82
0,76

Bu nedenle, K için ortalama ortalama hassasiyet şu şekildedir:

$$\text{mean } = \frac{\text{0.73 + 0.77 + 0.67 + 0.82 + 0.76}} {\text{5}} = \text{0.75}$$

uzmanların karışımı

#language

#generativeAI

Belirli bir giriş jetonunu veya öreğini işlemek için yalnızca parametrelerinin bir alt kümesini (uzman olarak bilinir) kullanarak sinir ağının verimliliğini artırmaya yönelik bir şema. Giriş ağı, her giriş jetonunu veya örneği uygun uzmanlara yönlendirir.

Ayrıntılı bilgi için aşağıdaki makalelerden birini inceleyin:

MMIT

#language

#image

#generativeAI

Çok modlu talimat ayarlı kısaltması.

model basamaklı

#generativeAI

Belirli bir çıkarım sorgusu için ideal modeli seçen bir sistem.

Çok büyükten (çok sayıda parametre) çok daha küçüğe (çok daha az parametre) kadar değişen bir model grubunu düşünün. Çok büyük modeller, tahmin sırasında küçük modellere kıyasla daha fazla bilgi işlem kaynağı tüketir. Ancak çok büyük modeller genellikle daha küçük modellere kıyasla daha karmaşık istekler çıkarabilir. Model basamaklandırması, çıkarım sorgusunun karmaşıklığını belirler ve ardından çıkarım yapmak için uygun modeli seçer. Model basamaklandırmanın temel amacı, genellikle daha küçük modeller seçerek ve yalnızca daha karmaşık sorgular için daha büyük bir model seçerek çıkarım maliyetlerini azaltmaktır.

Küçük bir modelin bir telefonda, bu modelin daha büyük bir sürümünün ise uzak bir sunucuda çalıştığını varsayalım. İyi bir model basamaklandırması, küçük modelin basit istekleri işlemesine olanak tanıyarak ve yalnızca karmaşık istekleri işlemek için uzak modeli çağırarak maliyeti ve gecikmeyi azaltır.

Ayrıca model yönlendirici konusuna bakın.

model yönlendirici

#generativeAI

Model basamaklandırmasında tahmin için ideal modeli belirleyen algoritma. Model yönlendirici, genellikle belirli bir giriş için en iyi modeli nasıl seçeceğini kademeli olarak öğrenen bir makine öğrenimi modelidir. Ancak model yönlendirici bazen makine öğrenimi içermeyen daha basit bir algoritma olabilir.

MOE

#language

#image

#generativeAI

Uzmanlardan oluşan bir grup kısaltması.

MT

#generativeAI

Makine çevirisi kısaltması.

H

Tek doğru yanıt yok (NORA)

#language

#generativeAI

Birden fazla uygun yanıtı olan bir istem. Örneğin, aşağıdaki istemde tek bir doğru yanıt yoktur:

Bana fillerle ilgili bir fıkra anlat.

Doğru yanıtı olmayan istemleri değerlendirmek zor olabilir.

NORA

#language

#generativeAI

Tek doğru cevap yok ifadesinin kısaltması.

O

tek görevli istem

#language

#generativeAI

Büyük dil modelinin nasıl yanıt vermesi gerektiğini gösteren bir örnek içeren istem. Örneğin, aşağıdaki istemde büyük bir dil modelinin bir sorguyu nasıl yanıtlaması gerektiğini gösteren bir örnek yer almaktadır.

Bir istemin bölümleri	Notlar
`Belirtilen ülkenin resmi para birimi nedir?`	LLM'nin yanıtlamasını istediğiniz soru.
`Fransa: avro`	Bir örnek vereyim.
`Hindistan:`	Gerçek sorgu.

Tek seferlik istem ile aşağıdaki terimleri karşılaştırın:

sıfır görevli istem
çok görevli istem

P

parametreleri verimli şekilde kullanma

#language

#generativeAI

Büyük bir önceden eğitilmiş dil modelini (PLM) tam ince ayarlama işleminden daha verimli bir şekilde ince ayarlama yapmak için kullanılan bir teknik grubu. Parametre verimliliği odaklı ayarlama, genellikle tam ince ayarlamaya kıyasla çok daha az sayıda parametrede ince ayar yapar ancak genellikle tam ince ayarlamayla oluşturulan büyük bir dil modeliyle aynı performansı (veya neredeyse aynı performansı) gösteren bir büyük dil modeli oluşturur.

Parametre verimliliği ayarlamayı aşağıdakilerle karşılaştırın:

instruction tuning
istem ayarı

Parametrelerin verimli şekilde kullanıldığı ayarlama, parametreleri verimli şekilde kullanma olarak da bilinir.

PLM

#language

#generativeAI

Önceden eğitilmiş dil modeli kısaltması.

eğitilmiş model

#language

#image

#generativeAI

Genellikle aşağıdakilerden biri veya daha fazlası gibi bazı son işlemlerden geçmiş önceden eğitilmiş bir modeli ifade eden, gevşek tanımlanmış bir terimdir:

Damıtma
Hassas ayar
Talimatın ince ayarı

önceden eğitilmiş model

#language

#image

#generativeAI

Genellikle, eğitilmiş bir modeldir. Bu terim, daha önce eğitilmiş bir gömülü vektör anlamına da gelebilir.

Önceden eğitilmiş dil modeli terimi genellikle önceden eğitilmiş bir büyük dil modelini ifade eder.

ön eğitim

#language

#image

#generativeAI

Bir modelin büyük bir veri kümesinde ilk eğitimi. Bazı önceden eğitilmiş modeller hantal devler gibidir ve genellikle ek eğitimle hassaslaştırılması gerekir. Örneğin, makine öğrenimi uzmanları, Wikipedia'daki tüm İngilizce sayfalar gibi geniş bir metin veri kümesinde büyük dil modelini önceden eğitebilir. Ön eğitimden sonra elde edilen model, aşağıdaki tekniklerden herhangi biri kullanılarak daha da hassaslaştırılabilir:

damıtma
ince ayar
instruction tuning
Parametreleri verimli şekilde kullanma
prompt-tuning

istem

#language

#generativeAI

Modeli belirli bir şekilde davranmaya koşullandırmak için büyük dil modeline giriş olarak girilen tüm metinler. İstemler bir kelime öbeği kadar kısa veya istediğiniz kadar uzun olabilir (örneğin, bir romanın tamamı). İstemler, aşağıdaki tabloda gösterilenler de dahil olmak üzere birden fazla kategoriye ayrılır:

İstem kategorisi	Örnek	Notlar
Soru	`Güvercin ne kadar hızlı uçabilir?`
Talimat	`Arbitraj hakkında komik bir şiir yazın.`	Büyük dil modelinden bir şey yapmasını isteyen istem.
Örnek	`Markdown kodunu HTML'ye çevirin. Örneğin: Markdown: * liste öğesi HTML: <ul> <li>liste öğesi</li> </ul>`	Bu örnek istemdeki ilk cümle bir talimattır. İstemin geri kalanı örnektir.
Rol	`Fizik alanında doktora yapmak için makine öğrenimi eğitiminde gradyan azalma yönteminin neden kullanıldığını açıklayın.`	Cümlenin ilk kısmı bir talimattır; "Fizik alanında doktora" ifadesi ise rol bölümüdür.
Modelin tamamlaması için kısmi giriş	`Birleşik Krallık Başbakanı şu adreste yaşıyor:`	Tamamlama girişi istemi, aniden (bu örnekte olduğu gibi) veya alt çizgiyle bitebilir.

Üretken yapay zeka modelleri, istemlere metin, kod, resim, yerleşim, video gibi neredeyse her şeyle yanıt verebilir.

istem temelli öğrenme

#language

#generativeAI

Belirli modellerin, davranışlarını rastgele metin girişlerine (istemler) göre uyarlamalarına olanak tanıyan bir özelliktir. İstem tabanlı öğrenme paradigmasında büyük dil modeli, istemlere metin üreterek yanıt verir. Örneğin, bir kullanıcının aşağıdaki istemi girdiğini varsayalım:

Newton'un üçüncü hareket yasasını özetleyin.

İsteme dayalı öğrenme yapabilen bir model, önceki istemi yanıtlamak için özel olarak eğitilmez. Model, fizik, genel dil kuralları ve genel olarak yararlı yanıtları oluşturan konular hakkında çok fazla bilgi "biliyor". Bu bilgiler, faydalı bir yanıt (umarım) sağlamak için yeterlidir. Ek insan geri bildirimleri ("Bu yanıt çok karmaşıktı." veya "Yanıtın ne olduğunu anlamadım.") bazı istem tabanlı öğrenme sistemlerinin yanıtlarının faydasını kademeli olarak artırmasını sağlar.

istem tasarımı

#language

#generativeAI

İstem mühendisliği ile eş anlamlıdır.

istem mühendisliği

#language

#generativeAI

Büyük dil modelinden istenen yanıtları alan istemler oluşturma sanatı. İstem mühendisliği, insanlar tarafından gerçekleştirilir. İyi yapılandırılmış istemler yazmak, büyük dil modelinden yararlı yanıtlar almanın önemli bir parçasıdır. İstem mühendisliği aşağıdakiler gibi birçok faktöre bağlıdır:

Büyük dil modelini ön eğitmek ve muhtemelen ince ayarlamak için kullanılan veri kümesi.
Modelin yanıt oluşturmak için kullandığı sıcaklık ve diğer kod çözme parametreleri.

Faydalı istemler yazma hakkında daha fazla bilgi için İstem tasarımına giriş başlıklı makaleyi inceleyin.

İstem tasarımı, istem mühendisliğinin eş anlamlısıdır.

istem ayarı

#language

#generativeAI

Sistemin gerçek istemin başına eklediği bir "ön ek" öğrenen parametrelerin verimli kullanıldığı ayarlama mekanizması.

İstem ayarının bir varyantı (bazen önek ayarlama olarak adlandırılır) ön eki her katmana eklemektir. Buna karşılık, çoğu istem ayarı yalnızca giriş katmanına bir ön ek ekler.

Ön ekler hakkında daha fazla bilgi edinmek için simgeyi tıklayın.

İstem ayarı için "önek" ("yumuşak istem" olarak da bilinir), gerçek istemdeki metin jetonu yer paylaşımlarına eklenen, öğrenilen ve göreve özel bir avuç vektördür. Sistem, diğer tüm model parametrelerini dondurup belirli bir görevde ince ayar yaparak yumuşak istemi öğrenir.

K

referans metni

#language

#generativeAI

Uzmanın bir isteme verdiği yanıt. Örneğin, aşağıdaki istemde:

"Adınız ne?" sorusunu İngilizceden Fransızcaya çevirin.

Bir uzmanın yanıtı şöyle olabilir:

Comment vous appelez-vous?

Çeşitli metrikler (ör. ROUGE), referans metninin bir yapay zeka modelinin oluşturduğu metinle eşleşme derecesini ölçer.

Gerçek Kullanıcı Geri Bildirimlerinden Pekiştirmeli Öğrenme (RLHF)

#generativeAI

#rl

Modelin yanıtlarının kalitesini iyileştirmek için gerçek kişilerden gelen geri bildirimleri kullanma Örneğin, bir RLHF mekanizması kullanıcılardan bir modelin yanıtının kalitesini 👍 veya 👎 emojisiyle değerlendirmelerini isteyebilir. Sistem daha sonra gelecekteki yanıtlarını bu geri bildirime göre ayarlayabilir.

rol istemi

#language

#generativeAI

Üretken yapay zeka modelinin yanıtı için hedef kitleyi tanımlayan istemin isteğe bağlı bir parçasıdır. Büyük dil modelleri, rol istemi olmadan soruları soran kullanıcı için yararlı olabilecek veya olamayacak bir yanıt sağlar. Büyük dil modelleri, rol istemi ile belirli bir hedef kitle için daha uygun ve daha yararlı bir şekilde yanıt verebilir. Örneğin, aşağıdaki istemlerin rol istemi kısmı kalın olarak gösterilir:

Ekonomi alanında doktora yapanlar için bu makaleyi özetleyin.
On yaşındaki bir çocuğa gelgitlerin nasıl çalıştığını açıklayın.
2008 mali krizini açıklayın. Küçük bir çocukla veya golden retriever ile konuşuyormuş gibi konuşun.

S

yumuşak istem ayarı

#language

#generativeAI

Kaynak yoğun ince ayar yapmadan belirli bir görev için büyük dil modelini ayarlama tekniği. Yumuşak istem ayarı, modeldeki tüm ağırlıkları yeniden eğitmek yerine, aynı hedefe ulaşmak için istemi otomatik olarak ayarlar.

Metin istemi verildiğinde yumuşak istem ayarı genellikle isme ek jeton ekleme işlemi yapar ve girişi optimize etmek için geri yayılımı kullanır.

"Sabit" istem, jeton yerleştirmeleri yerine gerçek jetonlar içerir.

T

sıcaklık

#language

#image

#generativeAI

Bir modelin çıkışının rastgelelik derecesini kontrol eden hiper parametre. Yüksek sıcaklıklar daha rastgele sonuçlara, düşük sıcaklıklar ise daha az rastgele sonuçlara yol açar.

En iyi sıcaklığı seçmek, belirli uygulamaya ve modelin çıktısının tercih edilen özelliklerine bağlıdır. Örneğin, reklam öğesi çıkışı oluşturan bir uygulama oluştururken sıcaklığı artırmanız gerekir. Buna karşılık, modelin doğruluğunu ve tutarlılığını artırmak için resimleri veya metni sınıflandıran bir model oluştururken sıcaklığı düşürmeniz muhtemeldir.

Sıcaklık genellikle softmax ile birlikte kullanılır.

Z

sıfır görevli istem

#language

#generativeAI

Büyük dil modelinin nasıl yanıt vermesini istediğinize dair bir örnek vermeyen istem. Örneğin:

Bir istemin bölümleri	Notlar
`Belirtilen ülkenin resmi para birimi nedir?`	LLM'nin yanıtlamasını istediğiniz soru.
`Hindistan:`	Gerçek sorgu.

Büyük dil modeli aşağıdakilerden herhangi biriyle yanıt verebilir:

Rupi
INR
₹
Hint rupisi
Rupi
Hint rupisi

Tüm yanıtlar doğrudur ancak belirli bir biçimi tercih edebilirsiniz.

Sıfır atışlı istem ile aşağıdaki terimleri karşılaştırın:

Tek görevli istem
çok görevli istem