Makine Öğrenimi Sözlüğü: Üretken Yapay Zeka

Bu sayfada, üretken yapay zeka terimleri sözlüğü yer almaktadır. Tüm sözlük terimleri için burayı tıklayın.

A

uyarlama

#generativeAI

Tuning veya ince ayar ile eş anlamlıdır.

otomatik değerlendirme

#generativeAI

Bir modelin çıktısının kalitesini değerlendirmek için yazılım kullanma

Model çıkışı nispeten basit olduğunda bir komut dosyası veya program, modelin çıkışını altın yanıtla karşılaştırabilir. Bu tür otomatik değerlendirmeye bazen programatik değerlendirme adı verilir. ROUGE veya BLEU gibi metrikler genellikle programatik değerlendirme için yararlıdır.

Model çıktısı karmaşık olduğunda veya tek bir doğru yanıt olmadığında, bazen otomatik değerlendirici adı verilen ayrı bir makine öğrenimi programı otomatik değerlendirme yapar.

İnsan değerlendirmesiyle karşılaştırın.

otomatik derecelendirme değerlendirmesi

#generativeAI
İnsan değerlendirmesi ile otomatik değerlendirmeyi birleştiren, üretken yapay zeka modelinin çıktısının kalitesini değerlendirmek için kullanılan karma mekanizma. Otomatik puanlayıcı, insan değerlendirmesi ile oluşturulan veriler üzerinde eğitilmiş bir makine öğrenimi modelidir. İdeal olarak, otomatik derecelendirici, insan değerlendiricileri taklit etmeyi öğrenir.

Önceden oluşturulmuş otomatik derecelendiriciler mevcuttur ancak en iyi otomatik derecelendiriciler, değerlendirdiğiniz göreve göre özel olarak ayarlanmış olanlardır.

otoregresif model

#generativeAI

Önceki tahminlerine dayanarak tahmin çıkaran bir model. Örneğin, kendi kendine regresif dil modelleri, daha önce tahmin edilen jetonlara göre bir sonraki jetonu tahmin eder. Transformer tabanlı tüm büyük dil modelleri, otomatik regresiftir.

Buna karşılık, GAN tabanlı görüntü modelleri, görüntüyü tek bir ileri geçişte oluşturdukları ve adım adım yinelemeli olarak oluşturmadıkları için genellikle otoregresif değildir. Ancak belirli görüntü oluşturma modelleri, görüntüyü adım adım oluşturdukları için otoregresiftir.

B

base model

#generativeAI

Belirli görevleri veya uygulamaları ele almak için ince ayar yapmaya başlamak üzere kullanılabilecek bir önceden eğitilmiş model.

Ayrıca önceden eğitilmiş model ve temel model konularına da bakın.

C

düşünce zinciri istemi

#generativeAI

Büyük dil modelini (LLM) adım adım muhakemesini açıklamaya teşvik eden bir istem mühendisliği tekniği. Örneğin, ikinci cümleye özellikle dikkat ederek aşağıdaki istemi inceleyin:

0'dan 96,5 km/sa hıza 7 saniyede ulaşan bir arabadaki sürücü kaç G kuvveti yaşar? Yanıtınızda ilgili tüm hesaplamaları gösterin.

LLM'nin yanıtı muhtemelen:

  • 0, 60 ve 7 değerlerini uygun yerlere yerleştirerek bir dizi fizik formülü göster.
  • Bu formülleri neden seçtiğini ve çeşitli değişkenlerin ne anlama geldiğini açıklayın.

Düşünce zinciri istemi, LLM'yi tüm hesaplamaları yapmaya zorlar. Bu da daha doğru bir yanıta yol açabilir. Ayrıca, düşünce zinciri istemi, kullanıcının yanıtın mantıklı olup olmadığını belirlemek için LLM'nin adımlarını incelemesine olanak tanır.

sohbet

#generativeAI

Genellikle bir büyük dil modeli olan bir makine öğrenimi sistemiyle yapılan karşılıklı diyalogların içeriği. Sohbetteki önceki etkileşim (yazdıklarınız ve büyük dil modelinin nasıl yanıt verdiği), sohbetin sonraki bölümleri için bağlam haline gelir.

Chatbot, büyük bir dil modelinin uygulamasıdır.

bağlamsallaştırılmış dil yerleştirme

#generativeAI

Kelimeleri ve ifadeleri, akıcı konuşan insanların anlayabileceği şekilde "anlamaya" yakın bir yerleştirme. Bağlamsallaştırılmış dil yerleştirmeleri, karmaşık söz dizimini, semantiği ve bağlamı anlayabilir.

Örneğin, cow (inek) İngilizce kelimesinin yerleştirmelerini ele alalım. word2vec gibi eski yerleştirmeler, İngilizce kelimeleri yerleştirme alanındaki uzaklık inek ile boğa arasındaki uzaklığın koyun (dişi koyun) ile koç (erkek koyun) veya kadın ile erkek arasındaki uzaklığa benzer şekilde temsil edebilir. Bağlamsallaştırılmış dil yerleştirmeleri, İngilizce konuşanların bazen cow kelimesini inek veya boğa anlamında kullandığını fark ederek bir adım daha ileri gidebilir.

bağlam penceresi

#generativeAI

Bir modelin belirli bir istemde işleyebileceği parça sayısı. Bağlam penceresi ne kadar büyük olursa model, isteme tutarlı ve tutarlı yanıtlar sağlamak için o kadar fazla bilgi kullanabilir.

D

doğrudan istem

#generativeAI

Sıfır görevli istem ile eş anlamlıdır.

damıtma

#generativeAI

Bir modelin (öğretmen olarak bilinir) boyutunu, orijinal modelin tahminlerini olabildiğince aslına uygun şekilde taklit eden daha küçük bir modele (öğrenci olarak bilinir) düşürme süreci. Küçük modelin büyük modele (öğretmen) kıyasla iki temel avantajı olduğundan Distilasyon faydalıdır:

  • Daha hızlı çıkarım süresi
  • Daha az bellek ve enerji kullanımı

Ancak öğrencinin tahminleri genellikle öğretmenin tahminleri kadar iyi değildir.

Distilasyon, öğrenci ve öğretmen modellerinin tahminlerinin çıkışları arasındaki farka dayalı olarak bir kayıp fonksiyonunu en aza indirecek şekilde öğrenci modelini eğitir.

Damıtma işlemini aşağıdaki terimlerle karşılaştırın ve aralarındaki farkları belirtin:

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki LLM'ler: İnce ayar, damıtma ve istem mühendisliği başlıklı makaleyi inceleyin.

E

evals

#generativeAI
#Metric

Öncelikli olarak LLM değerlendirmeleri için kısaltma olarak kullanılır. Daha geniş bir ifadeyle evals, herhangi bir değerlendirme biçiminin kısaltmasıdır.

değerlendirme

#generativeAI
#Metric

Bir modelin kalitesini ölçme veya farklı modelleri birbiriyle karşılaştırma süreci.

Gözetimli makine öğrenimi modelini değerlendirmek için genellikle doğrulama kümesi ve test kümesi ile karşılaştırırsınız. LLM'leri değerlendirme genellikle daha kapsamlı kalite ve güvenlik değerlendirmelerini içerir.

C

doğruluk

#generativeAI

Makine öğrenimi dünyasında, çıkışı gerçekliğe dayalı bir modeli tanımlayan özellik. Doğruluk, metrikten ziyade bir kavramdır. Örneğin, bir büyük dil modeline aşağıdaki istemi gönderdiğinizi varsayalım:

Sofra tuzunun kimyasal formülü nedir?

Doğruluğu optimize eden bir model şu yanıtı verir:

NaCl

Tüm modellerin doğruluğa dayanması gerektiği düşüncesi cazip gelebilir. Ancak aşağıdaki gibi bazı istemler, üretken yapay zeka modelinin doğruluğu yerine yaratıcılığı optimize etmesine neden olmalıdır.

Bir astronot ve tırtıl hakkında 5 dizelik komik bir şiir yaz.

Ortaya çıkan beşliklerin gerçeklere dayanması pek olası değildir.

Temellendirme ile karşılaştırma

hızlı azalma

#generativeAI

LLM'lerin performansını artırmaya yönelik bir eğitim tekniği. Hızlı azalma, eğitim sırasında öğrenme hızının hızlı bir şekilde düşürülmesini ifade eder. Bu strateji, modelin eğitim verilerine aşırı uyum sağlamasını önlemeye yardımcı olur ve genelleştirmeyi iyileştirir.

az örnekli istem

#generativeAI

Büyük dil modelinin nasıl yanıt vermesi gerektiğini gösteren birden fazla ("birkaç") örnek içeren bir istem. Örneğin, aşağıdaki uzun istemde, büyük bir dil modeline bir sorguyu nasıl yanıtlayacağını gösteren iki örnek yer alıyor.

Bir istemin bölümleri Notlar
Belirtilen ülkenin resmi para birimi nedir? LLM'nin yanıtlamasını istediğiniz soru.
Fransa: EUR Bir örnek verelim.
Birleşik Krallık: GBP Başka bir örnek.
Hindistan: Gerçek sorgu.

Çok görevli istem genellikle sıfır görevli istem ve tek görevli istem yöntemlerine kıyasla daha iyi sonuçlar verir. Ancak çok görevli istem için daha uzun bir istem gerekir.

Çok görevli istem, çok görevli öğrenmenin bir biçimidir ve isteme dayalı öğrenmeye uygulanır.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki İstem mühendisliği bölümüne bakın.

ince ayar

#generativeAI

Parametrelerini belirli bir kullanım alanı için hassaslaştırmak amacıyla önceden eğitilmiş bir modelde gerçekleştirilen ikinci bir göreve özgü eğitim geçişi. Örneğin, bazı büyük dil modelleri için tam eğitim sırası şu şekildedir:

  1. Ön eğitim: Büyük bir dil modelini, tüm İngilizce Wikipedia sayfaları gibi kapsamlı bir genel veri kümesi üzerinde eğitme.
  2. İnce ayar: Önceden eğitilmiş modeli, tıbbi sorgulara yanıt verme gibi belirli bir görevi yerine getirecek şekilde eğitme. İnce ayar genellikle belirli bir göreve odaklanan yüzlerce veya binlerce örnek içerir.

Başka bir örnek olarak, büyük bir görüntü modelinin tam eğitim sırası şu şekildedir:

  1. Ön eğitim: Wikimedia Commons'taki tüm resimler gibi geniş bir genel resim veri kümesi üzerinde büyük bir resim modelini eğitme.
  2. İnce ayar: Önceden eğitilmiş modeli, belirli bir görevi (ör. orka görüntüleri oluşturma) yerine getirecek şekilde eğitin.

İnce ayar, aşağıdaki stratejilerin herhangi bir kombinasyonunu içerebilir:

  • Önceden eğitilmiş modelin mevcut tüm parametrelerini değiştirme. Bu işleme bazen tam ince ayar da denir.
  • Önceden eğitilmiş modelin mevcut parametrelerinin yalnızca bazılarını değiştirme (genellikle çıkış katmanına en yakın katmanlar) ve diğer mevcut parametreleri değiştirmeden bırakma (genellikle giriş katmanına en yakın katmanlar). Parametrelerin verimli kullanıldığı ayarlama başlıklı makaleyi inceleyin.
  • Genellikle çıkış katmanına en yakın olan mevcut katmanların üzerine daha fazla katman ekleme.

İnce ayar, bir transfer öğrenimi biçimidir. Bu nedenle, ince ayar işleminde önceden eğitilmiş modeli eğitmek için kullanılanlardan farklı bir kayıp işlevi veya farklı bir model türü kullanılabilir. Örneğin, önceden eğitilmiş büyük bir görüntü modelini, giriş görüntüsündeki kuş sayısını döndüren bir regresyon modeli oluşturacak şekilde ince ayarlayabilirsiniz.

Aşağıdaki terimlerle karşılaştırarak ince ayar yapmanın benzerliklerini ve farklılıklarını açıklayın:

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki İnce ayar bölümüne bakın.

Flaş modeli

#generativeAI

Hız ve düşük gecikme için optimize edilmiş, nispeten küçük bir Gemini model ailesi. Flash modelleri, hızlı yanıtların ve yüksek işleme hızının önemli olduğu çok çeşitli uygulamalar için tasarlanmıştır.

temel model

#generativeAI
#Metric

Çok büyük ve çeşitli bir eğitim kümesi üzerinde eğitilmiş çok büyük bir önceden eğitilmiş model. Temel model, aşağıdakilerin ikisini de yapabilir:

  • Çok çeşitli isteklere iyi yanıt verme
  • Ek ince ayar veya diğer özelleştirmeler için temel model olarak kullanılabilir.

Başka bir deyişle, temel model genel anlamda zaten çok yeteneklidir ancak belirli bir görev için daha da faydalı olacak şekilde özelleştirilebilir.

başarı oranı

#generativeAI
#Metric

Bir makine öğrenimi modelinin oluşturduğu metni değerlendirmek için kullanılan bir metrik. Başarı oranı, oluşturulan "başarılı" metin çıkışlarının sayısının, oluşturulan toplam metin çıkışı sayısına bölünmesiyle elde edilir. Örneğin, bir büyük dil modeli 10 kod bloğu oluşturduysa ve bunların beşi başarılı olduysa başarı oranı %50 olur.

Başarı oranı, istatistiklerde genel olarak faydalı olsa da makine öğreniminde bu metrik, öncelikli olarak kod oluşturma veya matematik problemleri gibi doğrulanabilir görevleri ölçmek için kullanılır.

G

Gemini

#generativeAI

Google'ın en gelişmiş yapay zekasını içeren ekosistem. Bu ekosistemin öğeleri şunlardır:

  • Çeşitli Gemini modelleri.
  • Gemini modeliyle etkileşimli sohbet arayüzü. Kullanıcılar istem girer ve Gemini bu istemlere yanıt verir.
  • Çeşitli Gemini API'leri.
  • Gemini modellerine dayalı çeşitli işletme ürünleri (ör. Google Cloud için Gemini).

Gemini modelleri

#generativeAI

Google'ın son teknoloji Transformer tabanlı çok formatlı modelleri. Gemini modelleri, aracılarla entegre olacak şekilde özel olarak tasarlanmıştır.

Kullanıcılar, etkileşimli bir diyalog arayüzü ve SDK'lar aracılığıyla Gemini modelleriyle çeşitli şekillerde etkileşimde bulunabilir.

Gemma

#generativeAI

Gemini modellerini oluşturmak için kullanılan araştırma ve teknolojinin aynısıyla geliştirilmiş, hafif açık modeller ailesidir. Birkaç farklı Gemma modeli mevcuttur. Her biri; görme, kod ve talimatları takip etme gibi farklı özellikler sunar. Ayrıntılar için Gemma konusuna bakın.

Üretken yapay zeka

#generativeAI

Üretken yapay zeka kısaltması.

oluşturulan metin

#generativeAI

Genel olarak, bir makine öğrenimi modelinin çıkardığı metin. Büyük dil modellerini değerlendirirken bazı metrikler, oluşturulan metni referans metinle karşılaştırır. Örneğin, bir makine öğrenimi modelinin Fransızcadan Hollandacaya ne kadar etkili bir şekilde çeviri yaptığını belirlemeye çalıştığınızı varsayalım. Bu durumda:

  • Üretilen metin, makine öğrenimi modelinin çıkardığı Hollandaca çeviridir.
  • Referans metin, bir çevirmen (veya yazılım) tarafından oluşturulan Hollandaca çeviridir.

Bazı değerlendirme stratejilerinde referans metin kullanılmadığını unutmayın.

üretken yapay zeka

#generativeAI

Resmi bir tanımı olmayan, dönüşüm yaratan yeni bir alan. Bununla birlikte, çoğu uzman üretken yapay zeka modellerinin aşağıdaki özelliklere sahip içerikler oluşturabileceği ("üretebileceği") konusunda hemfikirdir:

  • karmaşık
  • tutarlı
  • orijinal

Üretken yapay zekaya örnek olarak aşağıdakiler verilebilir:

  • Büyük dil modelleri: Orijinal metinler oluşturabilir ve soruları yanıtlayabilir.
  • Benzersiz görüntüler üretebilen görüntü oluşturma modeli
  • Orijinal müzik besteleyebilen veya gerçekçi konuşma üretebilen ses ve müzik üretimi modelleri.
  • Orijinal videolar oluşturabilen video üretim modelleri

LSTM'ler ve RNN'ler gibi bazı eski teknolojiler de özgün ve tutarlı içerikler oluşturabilir. Bazı uzmanlar bu eski teknolojileri üretken yapay zeka olarak değerlendirirken bazıları ise gerçek üretken yapay zekanın, bu eski teknolojilerin üretebileceğinden daha karmaşık bir çıktı gerektirdiğini düşünüyor.

Tahmine dayalı makine öğrenimi ile karşılaştırın.

altın yanıt

#generativeAI

İyi olduğu bilinen bir yanıt. Örneğin, aşağıdaki istem verildiğinde:

2 + 2

İdeal yanıt:

4

H

insan değerlendirmesi

#generativeAI

Kullanıcıların bir makine öğrenimi modelinin çıktısının kalitesini değerlendirdiği süreç. Örneğin, iki dil bilen kişilerin bir makine öğrenimi çeviri modelinin kalitesini değerlendirmesi. İnsan değerlendirmesi, tek bir doğru yanıtı olmayan modelleri değerlendirmek için özellikle yararlıdır.

Otomatik değerlendirme ve değerlendirici değerlendirmesi ile karşılaştırın.

insan etkileşimli yöntem (HITL)

#generativeAI

Aşağıdakilerden birini ifade edebilen, net bir tanımı olmayan deyim:

  • Üretken yapay zeka çıkışlarını eleştirel veya şüpheci bir şekilde görüntüleme politikası.
  • Kullanıcıların bir modelin davranışını şekillendirmesine, değerlendirmesine ve iyileştirmesine yardımcı olmasını sağlayan bir strateji veya sistem. İnsan etkileşimini sürdürmek, yapay zekanın hem makine zekasından hem de insan zekasından yararlanmasını sağlar. Örneğin, yapay zekanın kod oluşturduğu ve yazılım mühendislerinin bu kodu incelediği bir sistem, insan etkileşimli bir sistemdir.

I

bağlam içinde öğrenme

#generativeAI

Çok görevli istem ile eş anlamlıdır.

çıkarım

#fundamentals
#generativeAI

Geleneksel makine öğreniminde, eğitilmiş bir modelin etiketlenmemiş örneklere uygulanarak tahminlerde bulunma süreci. Daha fazla bilgi edinmek için Makine Öğrenimine Giriş kursundaki Denetimli Öğrenme bölümüne bakın.

Büyük dil modellerinde çıkarım, eğitilmiş bir modeli kullanarak bir giriş istemine yanıt oluşturma sürecidir.

İstatistiklerde çıkarım biraz farklı bir anlama sahiptir. Ayrıntılar için istatistiksel çıkarım hakkındaki Wikipedia makalesine bakın.

talimat ince ayarı

#generativeAI

İnce ayar biçimidir. Üretken yapay zeka modelinin talimatlara uyma becerisini geliştirir. Talimat ince ayarı, genellikle çok çeşitli görevleri kapsayan bir dizi talimat istemi üzerinde model eğitme işlemidir. Bunun sonucunda talimatlara göre ayarlanmış model, çeşitli görevlerde sıfır görevli istemlere yararlı yanıtlar üretme eğiliminde olur.

Şununla karşılaştırın:

L

gecikme

#generativeAI

Bir modelin girişi işlemesi ve yanıt oluşturması için gereken süre. Yüksek gecikme süresine sahip bir yanıtın oluşturulması, düşük gecikme süresine sahip bir yanıttan daha uzun sürer.

Büyük dil modellerinin gecikmesini etkileyen faktörler şunlardır:

  • Giriş ve çıkış [jeton] uzunlukları
  • Model karmaşıklığı
  • Modelin üzerinde çalıştığı altyapı

Gecikmeye göre optimizasyon, duyarlı ve kullanıcı dostu uygulamalar oluşturmak için çok önemlidir.

LLM

#generativeAI

Büyük dil modeli kısaltması.

LLM değerlendirmeleri (evals)

#generativeAI
#Metric

Büyük dil modellerinin (LLM'ler) performansını değerlendirmeye yönelik bir dizi metrik ve karşılaştırma. Özetle, LLM değerlendirmeleri:

  • Araştırmacıların, LLM'lerin iyileştirilmesi gereken alanları belirlemesine yardımcı olun.
  • Farklı büyük dil modellerini karşılaştırmak ve belirli bir görev için en iyi büyük dil modelini belirlemek amacıyla kullanılır.
  • Büyük dil modellerinin güvenli ve etik bir şekilde kullanılmasını sağlamaya yardımcı olur.

Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Büyük dil modelleri (LLM'ler) bölümüne bakın.

LoRA

#generativeAI

Düşük Sıralı Uyarlanabilirlik'in kısaltmasıdır.

Düşük Dereceli Uyarlanabilirlik (LoRA)

#generativeAI

Modelin önceden eğitilmiş ağırlıklarını "dondurarak" (artık değiştirilemezler) ve ardından modele küçük bir eğitilebilir ağırlık grubu ekleyerek ince ayar yapmaya yönelik parametre açısından verimli bir teknik. Bu eğitilebilir ağırlıklar kümesi ("güncelleme matrisleri" olarak da bilinir) temel modelden önemli ölçüde küçüktür ve bu nedenle eğitimi çok daha hızlıdır.

LoRA aşağıdaki avantajları sağlar:

  • İnce ayarın uygulandığı alan için modelin tahminlerinin kalitesini artırır.
  • Bir modelin tüm parametrelerinin ince ayarını gerektiren tekniklerden daha hızlı ince ayar yapar.
  • Aynı temel modeli paylaşan birden fazla uzmanlaşmış modelin eşzamanlı olarak sunulmasını sağlayarak çıkarım hesaplama maliyetini düşürür.

A

makine çevirisi

#generativeAI

Metni bir insan dilinden başka bir insan diline (ör. İngilizceden Japoncaya) dönüştürmek için yazılım (genellikle makine öğrenimi modeli) kullanma.

k'da ortalama hassasiyet (mAP@k)

#generativeAI
#Metric

Bir doğrulama veri kümesindeki tüm k değerinde ortalama hassasiyet puanlarının istatistiksel ortalaması. k'da ortalama hassasiyetin bir kullanım alanı, öneri sistemi tarafından oluşturulan önerilerin kalitesini değerlendirmektir.

"Ortalama" ifadesi gereksiz gibi görünse de metriğin adı uygundur. Bu metrik, birden fazla k değerinde ortalama kesinlik değerinin ortalamasını bulur.

uzman karışımı

#generativeAI

Belirli bir giriş jetonunu veya örneğini işlemek için parametrelerinin yalnızca bir alt kümesini (uzman olarak bilinir) kullanarak sinir ağı verimliliğini artırma planı. Bir giriş kontrolü ağı, her giriş jetonunu veya örneğini uygun uzmanlara yönlendirir.

Ayrıntılar için aşağıdaki makalelerden birine bakın:

MMIT

#generativeAI

Çok formatlı talimatlara göre ayarlanmış ifadesinin kısaltmasıdır.

model basamaklandırma

#generativeAI

Belirli bir çıkarım sorgusu için ideal modeli seçen bir sistem.

Çok büyük (çok sayıda parametre) ile çok daha küçük (çok daha az parametre) arasında değişen bir grup model olduğunu düşünün. Çok büyük modeller, çıkarım sırasında daha küçük modellere kıyasla daha fazla bilişim kaynağı tüketir. Ancak çok büyük modeller genellikle daha küçük modellere kıyasla daha karmaşık istekleri tahmin edebilir. Model basamaklandırma, çıkarım sorgusunun karmaşıklığını belirler ve ardından çıkarımı gerçekleştirmek için uygun modeli seçer. Model basamaklandırmanın temel amacı, genellikle daha küçük modelleri seçerek ve yalnızca daha karmaşık sorgular için daha büyük bir model seçerek çıkarım maliyetlerini düşürmektir.

Küçük bir modelin telefonda, bu modelin daha büyük bir sürümünün ise uzak bir sunucuda çalıştığını düşünün. İyi bir model basamaklandırması, küçük modelin basit istekleri işlemesini ve yalnızca karmaşık istekleri işlemek için uzak modeli çağırmasını sağlayarak maliyeti ve gecikmeyi azaltır.

Ayrıca model yönlendirici konusuna da bakın.

model router

#generativeAI

Model sıralamada çıkarım için ideal modeli belirleyen algoritma. Model yönlendirici, genellikle belirli bir giriş için en iyi modeli nasıl seçeceğini kademeli olarak öğrenen bir makine öğrenimi modelidir. Ancak model yönlendirici bazen daha basit bir makine öğrenimi dışı algoritma olabilir.

MOE

#generativeAI

Uzman karışımı ifadesinin kısaltması.

MT

#generativeAI

Makine çevirisi kısaltması.

H

Nano

#generativeAI

Cihaz üzerinde kullanım için tasarlanmış, nispeten küçük bir Gemini modeli. Ayrıntılı bilgi için Gemini Nano başlıklı makaleyi inceleyin.

Ayrıca Pro ve Ultra'yı da inceleyin.

tek doğru yanıt yok (NORA)

#generativeAI

Birden fazla doğru yanıt içeren bir istem. Örneğin, aşağıdaki istemin tek bir doğru yanıtı yoktur:

Fillere dair komik bir fıkra anlat.

Doğru cevabı olmayan istemlere verilen yanıtları tek bir doğru cevabı olan istemleri değerlendirmekten çok daha özneldir. Örneğin, bir fil şakasını değerlendirmek için şakanın ne kadar komik olduğunu belirlemeye yönelik sistematik bir yöntem gerekir.

NORA

#generativeAI

Doğru cevap yok ifadesinin kısaltması.

Notebook LM

#generativeAI

Kullanıcıların doküman yüklemesine ve ardından bu dokümanlarla ilgili soru sormak, özetlemek veya dokümanları düzenlemek için istemler kullanmasına olanak tanıyan Gemini tabanlı bir araç. Örneğin, bir yazar birkaç kısa öykü yükleyip NotebookLM'den ortak temalarını bulmasını veya hangisinin en iyi film olacağını belirlemesini isteyebilir.

O

Tek doğru cevap (ORA)

#generativeAI

Tek bir doğru yanıt içeren bir istem. Örneğin, aşağıdaki istemi ele alalım:

Doğru mu yanlış mı: Satürn, Mars'tan daha büyüktür.

Tek doğru yanıt true'dur.

Tek bir doğru yanıtın olmaması ile karşılaştırın.

tek görevli istem

#generativeAI

Büyük dil modelinin nasıl yanıt vermesi gerektiğini gösteren bir örnek içeren istem. Örneğin, aşağıdaki istemde büyük bir dil modeline bir sorguya nasıl yanıt vermesi gerektiğini gösteren bir örnek yer alıyor.

Bir istemin bölümleri Notlar
Belirtilen ülkenin resmi para birimi nedir? LLM'nin yanıtlamasını istediğiniz soru.
Fransa: EUR Bir örnek verelim.
Hindistan: Gerçek sorgu.

Tek görev istemi ile aşağıdaki terimleri karşılaştırın:

ORA

#generativeAI

Tek doğru cevap kısaltması.

P

parametrelerin verimli kullanıldığı ayarlama

#generativeAI

Tam ince ayardan daha verimli bir şekilde büyük bir önceden eğitilmiş dil modeline (PLM) ince ayar yapmaya yönelik bir dizi teknik. Parametre açısından verimli ayarlama, genellikle tam ayarlamaya kıyasla çok daha az parametreye ince ayar yapar ancak genellikle tam ayarlamadan oluşturulan büyük dil modeli kadar iyi (veya neredeyse o kadar iyi) performans gösteren bir büyük dil modeli üretir.

Parametrelerin verimli kullanıldığı ayarlamayı aşağıdakilerle karşılaştırın:

Parametrelerin verimli kullanıldığı ayarlama, parametrelerin verimli kullanıldığı ince ayar olarak da bilinir.

Pax

#generativeAI

Birden fazla TPU hızlandırıcı çip dilimini veya kapsülünü kapsayacak kadar büyük ölçekli nöral ağ modellerini eğitmek için tasarlanmış bir programlama çerçevesi.

Pax, JAX üzerine kurulu olan Flax üzerine kurulmuştur.

Pax'in yazılım yığınındaki konumunu gösteren şema.
          Pax, JAX'in üzerine inşa edilmiştir. Pax'ın kendisi üç katmandan oluşur. En alttaki katmanda TensorStore ve Flax bulunur.
          Orta katmanda Optax ve Flaxformer bulunur. En üst katmanda Praxis Modelleme Kitaplığı bulunur. Fiddle, Pax'in üzerine inşa edilmiştir.

PLM

#generativeAI

Önceden eğitilmiş dil modeli kısaltması.

sonradan eğitilmiş model

#generativeAI

Genellikle aşağıdaki gibi bir veya daha fazla işlem sonrası uygulanan önceden eğitilmiş bir modeli ifade eden, net olarak tanımlanmamış bir terimdir:

önceden eğitilmiş model

#generativeAI

Bu terim, eğitilmiş herhangi bir modeli veya eğitilmiş yerleştirme vektörünü ifade edebilse de önceden eğitilmiş model artık genellikle eğitilmiş bir büyük dil modelini veya eğitilmiş başka bir üretken yapay zeka modelini ifade eder.

Ayrıca temel model ve temel model başlıklı makalelere de göz atın.

ön eğitim

#generativeAI

Bir modelin büyük bir veri kümesi üzerinde ilk eğitimi. Bazı önceden eğitilmiş modeller beceriksiz devlerdir ve genellikle ek eğitimlerle iyileştirilmesi gerekir. Örneğin, makine öğrenimi uzmanları büyük bir dil modelini devasa bir metin veri kümesi (ör. Wikipedia'daki tüm İngilizce sayfalar) üzerinde önceden eğitebilir. Ön eğitimden sonra, elde edilen model aşağıdaki tekniklerden herhangi biri kullanılarak daha da iyileştirilebilir:

Pro

#generativeAI

Ultra'dan daha az, Nano'dan daha fazla parametreye sahip bir Gemini modeli. Ayrıntılar için Gemini Pro başlıklı makaleyi inceleyin.

prompt

#generativeAI

Modelin belirli bir şekilde davranmasını sağlamak için büyük dil modeline giriş olarak girilen tüm metinler. İstemler bir ifade kadar kısa veya rastgele uzun olabilir (ör. bir romanın tamamı). İstemler, aşağıdaki tabloda gösterilenler de dahil olmak üzere birden fazla kategoriye ayrılır:

İstem kategorisi Örnek Notlar
Soru Bir güvercin ne kadar hızlı uçabilir?
Talimat Arbitraj hakkında komik bir şiir yaz. Büyük dil modelinden bir şey yapmasını isteyen istem.
Örnek Markdown kodunu HTML'ye çevirin. Örneğin:
Markdown: * list item
HTML: <ul> <li>list item</li> </ul>
Bu örnek istemdeki ilk cümle bir talimattır. İstemin geri kalanı örnektir.
Rol Fizik alanında doktora yapmış birine, makine öğrenimi eğitiminde neden gradyan inişinin kullanıldığını açıkla. Cümlenin ilk kısmı talimat, "to a PhD in Physics" (Fizik alanında doktora) ifadesi ise rol kısmıdır.
Modelin tamamlayacağı kısmi giriş Birleşik Krallık Başbakanı'nın ikamet ettiği yer Kısmi giriş istemi, bu örnekte olduğu gibi aniden veya alt çizgiyle sona erebilir.

Üretken yapay zeka modeli, bir isteme metin, kod, resim, gömme ve video gibi neredeyse her şeyle yanıt verebilir.

istem tabanlı öğrenme

#generativeAI

Belirli modellerin, rastgele metin girişine (istemler) yanıt olarak davranışlarını uyarlamalarını sağlayan bir özellik. İsteme dayalı öğrenme paradigmasında, büyük dil modeli metin oluşturarak bir isteme yanıt verir. Örneğin, bir kullanıcının aşağıdaki istemi girdiğini varsayalım:

Newton'un üçüncü hareket yasasını özetle.

İstem tabanlı öğrenme özelliğine sahip bir model, önceki isteme yanıt vermek için özel olarak eğitilmez. Bunun yerine, model fizik hakkında birçok bilgiye, genel dil kuralları hakkında birçok bilgiye ve genel olarak faydalı yanıtların ne olduğu hakkında birçok bilgiye "sahiptir". Bu bilgi, (umarım) faydalı bir yanıt vermek için yeterlidir. Ek insan geri bildirimi ("Bu yanıt çok karmaşıktı." veya "Tepki nedir?"), istem tabanlı bazı öğrenme sistemlerinin yanıtlarının faydasını kademeli olarak artırmasını sağlar.

istem tasarımı

#generativeAI

İstem mühendisliği ile eş anlamlıdır.

istem mühendisliği

#generativeAI

Büyük dil modelinden istenen yanıtları almayı sağlayan istemler oluşturma sanatı. İstem mühendisliğini insanlar yapar. İyi yapılandırılmış istemler yazmak, büyük bir dil modelinden faydalı yanıtlar almanın önemli bir parçasıdır. İstem mühendisliği, aşağıdakiler de dahil olmak üzere birçok faktöre bağlıdır:

İstem tasarımı, istem mühendisliğinin eş anlamlısıdır.

Faydalı istemler yazma hakkında daha fazla bilgi için İstem tasarımına giriş başlıklı makaleyi inceleyin.

istem grubu

#generativeAI

Büyük dil modelini değerlendirmek için bir grup istem. Örneğin, aşağıdaki resimde üç istemden oluşan bir istem grubu gösterilmektedir:

Bir LLM&#39;ye gönderilen üç istem üç yanıt üretir. Üç istem, istem kümesini oluşturur. Üç yanıt, yanıt kümesini oluşturur.

İyi istem kümeleri, büyük dil modelinin güvenliğini ve faydasını kapsamlı bir şekilde değerlendirmek için yeterince "geniş" bir istem koleksiyonundan oluşur.

Ayrıca yanıt kümesi başlıklı makaleyi de inceleyin.

istem ayarlama

#generativeAI

Sistemin gerçek istemin önüne eklediği bir "önek" öğrenen parametrelerin verimli kullanıldığı ayarlama mekanizması.

Bazen prefix tuning olarak da adlandırılan istem ayarlama varyasyonlarından biri, her katmana önek eklemektir. Buna karşılık, çoğu istem ayarlama işlemi yalnızca giriş katmanına bir önek ekler.

R

referans metin

#generativeAI

Bir uzmanın istem yanıtı. Örneğin, şu istemi girdiğinizde:

"What is your name?" (Adın ne?) sorusunu İngilizce'den Fransızca'ya çevir.

Uzman yanıtı şöyle olabilir:

Comment vous appelez-vous?

Çeşitli metrikler (ör. ROUGE), referans metnin bir makine öğrenimi modelinin oluşturulan metniyle eşleşme derecesini ölçer.

Pekiştirmeli İnsan Geri Bildiriminden Öğrenme (RLHF)

#generativeAI

Modelin yanıtlarının kalitesini artırmak için uzman değerlendiricilerden alınan geri bildirimleri kullanma. Örneğin, bir RLHF mekanizması, kullanıcılardan modelin yanıtının kalitesini 👍 veya 👎 emojisiyle derecelendirmesini isteyebilir. Sistem, gelecekteki yanıtlarını bu geri bildirime göre ayarlayabilir.

gönderin

#generativeAI

Üretken yapay zeka modelinin çıkarım yaptığı metin, resim, ses veya video. Diğer bir deyişle, istem, üretken yapay zeka modeline verilen giriş, yanıt ise çıkıştır.

yanıt kümesi

#generativeAI

Büyük dil modelinin bir giriş istem grubuna verdiği yanıtlar koleksiyonu.

role prompting

#generativeAI

İstem, genellikle sen zamiriyle başlar ve üretken yapay zeka modeline yanıt oluştururken belirli bir kişi veya rol gibi davranmasını söyler. Rol istemi, üretken yapay zeka modelinin daha faydalı bir yanıt oluşturması için doğru "zihniyete" girmesine yardımcı olabilir. Örneğin, istediğiniz yanıtın türüne bağlı olarak aşağıdaki rol istemlerinden herhangi biri uygun olabilir:

Bilgisayar bilimleri alanında doktora dereceniz var.

Yeni programlama öğrencilerine Python hakkında sabırlı açıklamalar yapmaktan hoşlanan bir yazılım mühendisisiniz.

Çok özel bir programlama becerileri kümesine sahip bir aksiyon kahramanısınız. Python listesinde belirli bir öğeyi bulacağımı garanti et.

G

yumuşak istem ayarlama

#generativeAI

Kaynak yoğun ince ayar yapmadan, belirli bir görev için büyük bir dil modelini ayarlama tekniği. Yumuşak istem ayarlama, modeldeki tüm ağırlıkları yeniden eğitmek yerine aynı hedefe ulaşmak için istemleri otomatik olarak ayarlar.

Metin istemi verildiğinde, yumuşak istem ayarlama genellikle isteme ek jeton yerleştirmeleri ekler ve girişi optimize etmek için geri yayılımı kullanır.

"Sert" istemler, jeton yerleştirmeleri yerine gerçek jetonlar içerir.

T

sıcaklık

#generativeAI

Model çıkışının rastgelelik derecesini kontrol eden bir hiperparametredir. Sıcaklık yükseldikçe daha rastgele çıkışlar, düştükçe ise daha az rastgele çıkışlar elde edilir.

En iyi sıcaklığı seçmek, belirli uygulamaya ve/veya dize değerlerine bağlıdır.

U

Ultra

#generativeAI

En fazla parametreye sahip Gemini modeli. Ayrıntılı bilgi için Gemini Ultra başlıklı makaleyi inceleyin.

Ayrıca Pro ve Nano'yu da inceleyin.

V

Vertex

#GoogleCloud
#generativeAI
Google Cloud'un yapay zeka ve makine öğrenimi platformu. Vertex, Gemini modellerine erişim de dahil olmak üzere yapay zeka uygulamaları oluşturma, dağıtma ve yönetme için araçlar ve altyapı sağlar.

Z

sıfır görevli istem

#generativeAI

Büyük dil modelinin nasıl yanıt vermesini istediğinize dair örnek vermeyen bir istem. Örneğin:

Bir istemin bölümleri Notlar
Belirtilen ülkenin resmi para birimi nedir? LLM'nin yanıtlamasını istediğiniz soru.
Hindistan: Gerçek sorgu.

Büyük dil modeli aşağıdaki yanıtları verebilir:

  • Rupi
  • INR
  • Hint rupisi
  • Rupi
  • Hindistan rupisi

Belirli bir biçimi tercih edebilirsiniz ancak tüm yanıtlar doğrudur.

Sıfır görevli istem ile aşağıdaki terimleri karşılaştırın: