ML sorununu çerçeveleme

Sorununuzun en iyi çözümün bir tahmine dayalı araç İster makine öğrenimi ister üretken yapay zeka yaklaşımı olarak kullanıyorsanız, sorununuzu makine öğrenimi terimleriyle ortaya koymaya hazırsınız. Aşağıdaki görevleri tamamlayarak bir problemi makine öğrenimi terimlerinde şekillendirirsiniz:

  • İdeal sonucu ve modelin hedefini tanımlayın.
  • Modelin çıkışını belirleyin.
  • Başarı metriklerini tanımlayın.

İdeal sonucu ve modelin hedefini tanımlayın

Makine öğrenimi modelinden bağımsız olarak ideal sonuç nedir? Başka bir deyişle, veya özelliğinizin tam olarak gerçekleştirmesini istediğiniz görev nedir? Bu aynı Hedefi belirtin bölümünde önceden tanımladığınız ifadeden bölümüne bakın.

Ne elde etmeniz gerektiğini açıkça tanımlayarak modelin hedefi ile ideal sonuç arasında bağ kurun. istediğiniz performansı gösterir. Aşağıdaki tabloda ideal sonuçlar ve uygulamalarla ilgili hedefimizdir:

Uygulama İdeal sonuç Modelin hedefi
Hava Durumu uygulaması Bir coğrafi bölgedeki yağış miktarını altı saatlik artışlarla hesaplama. Belirli coğrafi bölgeler için altı saatlik yağış miktarlarını tahmin etme.
Moda uygulaması Çeşitli gömlek tasarımları üretmek. Metin ve resimden üç farklı gömlek tasarımı üretmek Burada metnin stil ve renk, resmin ise gömlek (tişört, düğmeli, polo).
Video uygulaması Yararlı videolar önerme. Kullanıcının bir videoyu tıklayıp tıklamayacağını tahmin edin.
Posta uygulaması Spam'i tespit edin. Bir e-postanın spam olup olmadığını tahmin etme.
Finans uygulaması Birden fazla haber kaynağındaki finansal bilgileri özetleyebilirsiniz. 50 kelimelik özetler oluşturarak finansal trendlerin son yedi gün.
Harita uygulaması Seyahat süresini hesaplamak. İki nokta arasında seyahat etmenin ne kadar süreceğini tahmin etme.
Bankacılık uygulaması Sahte işlemleri tespit edin. Bir işlemin kart sahibi tarafından yapılıp yapılmadığını tahmin edin.
Yemek uygulaması Mutfağını restoranın menüsüne göre tanımlayın. Restoran türünü tahmin etme.
E-ticaret uygulaması Şirketin ürünleri hakkında müşteri desteği yanıtları oluşturmak. Yaklaşım analizini ve kuruluşun oluşturmaktır.

İhtiyacınız olan çıktıyı belirleyin

Model türü seçiminiz, projenizin belirli bağlamına ve kısıtlamalarına bir cümle ekleyebilirsiniz. Modelin çıkışı, düşünme egzersizlerini teşvik edersiniz. Bu yüzden yanıtlamamız gereken ilk soru "Sorunumu çözmek için ne tür bir çıkışa ihtiyacım var?"

Bir şeyi sınıflandırmanız veya sayısal bir tahminde bulunmanız gerekirse, büyük olasılıkla tahmine dayalı makine öğrenimi kullanır. Yeni içerik veya çıktı üretmeniz gerekiyorsa ilgili bir konu varsa muhtemelen üretken yapay zekayı kullanacaksınız.

Aşağıdaki tablolarda tahmine dayalı makine öğrenimi ve üretken yapay zeka çıkışları listelenmiştir:

Tablo 1. Tahmine dayalı makine öğrenimi
ML sistemi Örnek çıkış
Sınıflandırma İkili Bir e-postayı spam veya spam değil olarak sınıflandırın.
Çok sınıflı tek etiketli Bir resimdeki hayvanı sınıflandırma.
Çok sınıflı çok etiketli Bir resimdeki tüm hayvanları sınıflandırın.
Sayısal Tek boyutlu regresyon Bir videonun kaç kez görüntüleneceğini tahmin edin.
Çok boyutlu regresyon Hastalık için tansiyon, nabız ve kolesterol seviyelerini tahmin edin kişidir.
Tablo 2. Üretken yapay zeka
Model türü Örnek çıkış
Metin
Makaleyi özetleyin.

Müşteri yorumlarını yanıtlayın.

Dokümanları İngilizceden Mandarin Çincesine çevirin.

Ürün açıklamaları yazın.

Yasal belgeleri analiz edin.
Resim
Pazarlama resimleri oluşturun.

Fotoğraflara görsel efekt uygulayın.

Ürün tasarım varyasyonları oluşturun.
Ses
Belirli bir aksana sahip diyaloglar oluşturun.

Belirli bir türde kısa bir müzik bestesi oluşturun. Örneğin: caz.
Video
Gerçekçi görünen videolar oluşturun.

Video kayıtlarını analiz etme ve görsel efektler uygulama.
Çok formatlı Metin altyazılı bir video gibi birden çok türde çıktı üretin.

Sınıflandırma

Sınıflandırma modeli giriş verilerinin hangi kategoriye ait olduğunu (örneğin, bir girişin A, B veya C olarak sınıflandırılmalıdır.

Bir sınıflandırma modeli tahminde bulunuyor.

Şekil 1. Tahminde bulunan bir sınıflandırma modeli.

Modelin tahminine bağlı olarak uygulamanız bir karar verebilir. Örneğin, A kategorisi, ardından X yapın. tahmin B kategorisiyse CANNOT TRANSLATE tahmin C kategorisiyse Z yapın. Bazı durumlarda, uygulamanın çıkışıdır.

Ürün kodu, karar vermek için modelin çıkışını kullanır.

Şekil 2. Bir sınıflandırma modelinin çıkışının ürün kodunda şu işlemler için kullanılır: karar vermenize yardımcı olacaktır.

Regresyon

regresyon modeli sayısal bir değerdir.

Regresyon modeli tahminde bulunuyor.

Şekil 3. Sayısal tahminde bulunan bir regresyon modeli.

Modelin tahminine bağlı olarak uygulamanız bir karar verebilir. Örneğin, tahmin A aralığına düştüğünde, X; tahmin aralık dahilindeyse B, Y yapın; tahmin C aralığına düşüyorsa Z yapın. Bazı durumlarda, tahmin, uygulamanın çıkışı olur.

Ürün kodu, karar vermek için modelin çıkışını kullanır.

4.Şekil Bir regresyon modelinin çıkışının ürün kodunda şu işlemler için kullanılır: bir karardır.

Aşağıdaki senaryoyu değerlendirin:

Önbelleğe almak istiyorsanız . Başka bir deyişle, modeliniz bir videonun popüler olacağını tahmin ediyor ve kullanıcılara hızlı bir şekilde sunmak istiyorsunuz. Alıcı: daha etkili ve pahalı önbelleği kullanırsınız. Diğer videolarda farklı bir önbellek kullanırsınız. Önbelleğe alma ölçütleriniz şunlardır:

  • Bir videonun 50 veya daha fazla görüntüleme alacağı tahmin ediliyorsa pahalı olan önbellek.
  • Bir videonun 30 ile 50 arasında izlenme elde edeceği öngörülürse uygun fiyatlı önbellek.
  • Videonun 30'dan az görüntüleme alacağı tahmin ediliyorsa videosunu izleyin.

Regresyon modelinin doğru yaklaşım olduğunu düşünüyorsunuz çünkü regresyon sayısal bir değer (görüntüleme sayısı). Ancak regresyonu eğitirken ürettiğinizin aynı sonucu verdiğini 28 ve 32 tahmini için kayıp 30 defa izlenen videolar için de geçerli. Diğer bir deyişle uygulamanız, 28'e karşı 32 ise model her ikisini de dikkate alarak eşit derecede iyi olduğunu unutmayın.

Eğitilen ve kaybı değerlendirilen bir model.

5. Şekil. Regresyon modelini eğitme

Regresyon modelleri ürün tanımlı eşiklerin farkında değildir. Dolayısıyla, uygulamanın davranışı, çalışma biçimindeki küçük farklılıklar nedeniyle regresyon modelinin tahminlerine ilişkin tahminlerinde değişiklik yapmayın, bir sınıflandırma modelini kullanır.

Bu senaryoda, sınıflandırma modeli doğru davranışı ve çünkü sınıflandırma modeli tahmininde daha yüksek kayıp 32'den 28. Bir anlamda, sınıflandırma modelleri varsayılan olarak eşikler üretir.

Bu senaryoda iki önemli nokta vurgulanmaktadır:

  • Kararı tahmin edin. Mümkün olduğunda, uygulamanızın azımsayabilirsiniz. Video örneğinde bir sınıflandırma modeli, videoları sınıflandırdığı kategorilerin "önbelleksiz" olup olmadığına, "ucuz önbellek," "pahalı önbellek" gibi. Uygulamanızın davranışını modelden gizlemek, uygulamanızın yanlış davranış sergilemesine neden olur.

  • Sorunun kısıtlamalarını anlayın. Uygulamanız farklı temel işlemleri belirlemek, bu eşiklerin gerçekleşip gerçekleşmediğinin sabit ya da dinamik olabilir.

    • Dinamik eşikler: Eşikler dinamikse regresyon modeli kullanın ve uygulamanızın kodunda eşik sınırlarını belirleyin. Bu sayede modelin makul düzeyde kalmasını sağlarken eşiklerin güncellenmesi tahminler.
    • Sabit eşikler: Eşikler sabitse sınıflandırma modeli kullanın eşik sınırlarına göre veri kümelerinizi etiketleyin.

    Genel olarak, çoğu önbellek temel hazırlığı dinamiktir ve eşikler değişir. oluşacaktır. Dolayısıyla, bu özel olarak önbelleğe alma sorunu olduğundan, regresyon modeli en iyi seçenektir. Ancak birçok sorun için Eşikler sabitleneceği için en iyi çözüm sınıflandırma modelidir.

Şimdi başka bir örneğe bakalım. Hava durumu uygulaması oluşturuyorsanız kullanıcılara önümüzdeki altı saat içinde ne kadar yağmur yağacağını söylemektir. precipitation_amount. etiketini tahmin eden bir regresyon modeli kullanabilirsiniz

İdeal sonuç İdeal etiket
Kullanıcılara bölgelerinde ne kadar yağmur yağacağını söyleyin konuşmaya devam edebilir. precipitation_amount

Hava durumu uygulaması örneğinde etiket doğrudan ideal sonucu ele alır. Ancak bazı durumlarda, müşteri hizmetleri arasındaki etiketinden bahsedeceğiz. Örneğin video uygulamasında ideal sonuç yararlı videolar önermeyi de unutmayın. Ancak veri kümesinde useful_to_user..

İdeal sonuç İdeal etiket
Faydalı videolar önerin. ?

Bu nedenle, bir proxy etiketi bulmanız gerekir.

Proxy etiketleri

Proxy etiketleri, veri kümesinde bulunmayan etiketlerdir. Şu durumlarda proxy etiketleri gereklidir: istediğiniz verileri doğrudan ölçmenizi sağlar. Video uygulamasında, Kullanıcının videoyu faydalı bulup bulmayacağını ölçmenizi sağlar. Hem veri kümesinde useful özelliği vardı ve kullanıcılar buldukları tüm videoları işaretledi yararlı olabilir ancak veri kümesi işe yaramadığı için, gibi araçlar yer alır.

Yararlılık için proxy etiketi, kullanıcının içeriği paylaşıp paylaşmayacağı veya seçeceğiz.

İdeal sonuç Proxy etiketi
Faydalı videolar önerin. shared OR liked

Proxy etiketleri kullanırken dikkatli olun, çünkü bunlar istediğiniz şeyi doğrudan ölçmez. ortaya çıkarmanıza yardımcı olabilir. Örneğin aşağıdaki tabloda potansiyel riskleri Faydalı videolar öner için proxy etiketleri:

Proxy etiketi Sorun
Kullanıcının "beğen"i tıklayıp tıklamayacağını tahmin et düğmesini tıklayın. Çoğu kullanıcı "beğen"i hiç tıklamaz.
Bir videonun popüler olup olmayacağını tahmin etme. Kişiselleştirilmedi. Bazı kullanıcılar popüler videoları beğenmeyebilir.
Kullanıcının videoyu paylaşıp paylaşmayacağını tahmin edin. Bazı kullanıcılar video paylaşmaz. Bazen insanlar videoları paylaştığı için sevmezler.
Kullanıcının oynat seçeneğini tıklayıp tıklamayacağını tahmin edin. Tıklama tuzağı sayısını en üst düzeye çıkarır.
Videoyu ne kadar süre izlediklerini tahmin etme. Uzun videoları, kısa videolara göre farklı noktalarda öne çıkarır.
Kullanıcının videoyu kaç kez yeniden izleyeceğini tahmin etme. "Yeniden izlenebilir"i tercih eder veya tekrar izlenemeyen video türleriyle ilgili videolar oluşturabilirsiniz.

Hiçbir proxy etiketi ideal sonucunuzun mükemmel bir yerine geçemez. Tümü potansiyel sorunları vardır. Kategori açısından en az soruna sahip olanı seçin bir şablon görevi görür.

Öğrendiklerinizi kontrol edin

Bir şirket, sağlık ve denge uygulamasında makine öğreniminden faydalanmak istiyor. insanlar daha iyi hisseder. Sence her şeyi tek bir yerden yapmak için, nasıl emin olabilir?
Evet, şirketin proxy etiketlerini bulması gerekir. Benzer kategoriler mutluluk ve sağlık doğrudan ölçülemez. Bunun yerine (ör. harcanan saat sayısı gibi) başka bir özellikle ilgili veya hobilerle ya da arkadaşlarla harcanan süreyi ifade eder.
Hayır, şirketin proxy etiketleri kullanması gerekmez. Mutluluk ve sağlıklı yaşam doğrudan ölçülebilir.

Oluşturma

Çoğu durumda, kendi üretken modelinizi eğitmeyeceksiniz. büyük miktarda eğitim verisi ve bilgi işlem kaynağı gerektirir. Bunun yerine üretken yapay zeka modelini özelleştirebilirsiniz. Üretken model oluşturmak için istediğiniz çıkışı üretiyorsanız aşağıdakilerden en az birini kullanmanız gerekebilir: teknikler:

  • Ayıklama. Bir büyük bir modelin daha küçük sürümlerini çıkarırsanız sentetik etiketli bir veri kümesi daha büyük modellerden yararlanabilirsiniz. Üretici modelleri genellikle çok büyüktür ve önemli kaynakları (örneğin, ve elektrik). Damıtma, daha küçük ve daha az kaynak yoğunluğuna olanak tanır. büyük modelin performansını tahmin etmeye çalışın.

  • İnce ayar veya parametre açısından verimli ayarlama. Bir modelin belirli bir görevdeki performansını iyileştirmek için, modeli, oluşturduğunuz çıkış türünün örneklerini içeren bir veri kümesi üzerinde eğitmek ne kadar önemli olduğunu göstereceğim.

  • İstem mühendisliği. Alıcı: modelin belirli bir görevi yerine getirmesini çıktıyı belirli bir formatta ürettikten sonra, modele istediğiniz görevi bunu yapabilir veya çıktının nasıl biçimlendirilmesini istediğinizi belirtebilirsiniz. Başka bir deyişle, istem, görevin nasıl gerçekleştirileceğine dair doğal dil talimatları içerebilir veya açıklayıcı örnekler içerir.

    Örneğin, makalelerin kısa özetlerini istiyorsanız, takip etmek için:

    Produce 100-word summaries for each article.
    

    Modelin belirli bir okuma seviyesi için metin oluşturmasını istiyorsanız şunları girebilirsiniz:

    All the output should be at a reading level for a 12-year-old.
    

    Modelin çıktısını belirli bir biçimde sunmasını isterseniz çıktının nasıl biçimlendirilmesi gerektiğini açıklayın. Örneğin, " ya da belirli bir görevi tamamlamak için örnekler vererek takip edebilirsiniz. Örneğin, aşağıdakileri girebilirsiniz:

    Translate words from English to Spanish.
    
    English: Car
    Spanish: Auto
    
    English: Airplane
    Spanish: Avión
    
    English: Home
    Spanish:______
    

Damıtma ve ince ayar yapma, modelin parametrelerini kullanın. İstem mühendisliği modelin parametrelerini güncellemez. Bunun yerine, istem mühendisliği model, istem bağlamından istenen çıktıyı nasıl üreteceğini öğrenir.

Bazı durumlarda, test etmek için test veri kümesini üretken modelin çıktısını bilinen değerlerle karşılaştırarak kontrol etme (ör. özetleri gerçek insanlar tarafından oluşturulan özetlere benzer veya iyi olduğunu anlayabilirsiniz.

Üretken yapay zeka, tahmine dayalı bir makine öğrenimi uygulamak için de kullanılabilir. gibi çözümleri ifade eder. Örneğin, doğal dil konusunda derin bilgiye sahip oldukları için büyük dil modelleri (LLM) çoğu zaman metin sınıflandırma görevlerini tahmine dayalı makine öğreniminden daha iyi gerçekleştirebilir. eğitilmiş olması gerekir.

Başarı metriklerini tanımlama

Makine öğreniminin uygulanıp uygulanmayacağını belirlemek için kullanacağınız metrikleri tanımlayın başarılı olduğundan emin olun. Başarı metrikleri, etkileşim veya ilgi alanı gibi sizin için neyin önemli olduğunu kullanıcıların bulacakları videoları izlemek gibi uygun işlemleri yapmalarına yardımcı olmak faydalı olur. Başarı metrikleri, modelin değerlendirme metriklerinden farklıdır. Örneğin, doğruluk hassasiyet, geri çağırma veya AUC.

Örneğin, hava durumu uygulamasının başarı ve başarısızlık metrikleri şu şekilde tanımlanabilir: şu:

Başarılı Kullanıcılar "Yağmur yağacak mı?" yüzde 50 daha sık kullandıklarını daha iyi anlamışsınızdır.
Hata Kullanıcılar "Yağmur yağacak mı?" çok daha sık kullanmamak kontrol edin.

Video uygulaması metrikleri aşağıdaki şekilde tanımlanabilir:

Başarılı Kullanıcılar sitede ortalama yüzde 20 daha fazla zaman geçiriyor.
Hata Kullanıcılar sitede geçmişe kıyasla ortalama olarak daha fazla zaman geçirmiyor.

İddialı başarı metrikleri tanımlamanızı öneririz. Büyük hırslar boşluklara neden olabilir arasındaki farkları konuşacağız. Örneğin, kullanıcılar ortalama olarak Sitede geçirilen sürenin yüzde 10 fazla olması başarı ya da başarısızlık anlamına gelmez. Önemli olan tanımlanmamış boşluklar değildir.

Önemli olan, modelinizin yaklaşma kapasitesidir. başarının tanımıdır. Örneğin, modelin kendinize şu soruyu sorun: Modelin iyileştirilmesi, performansınızı daha yakın olduğunu biliyor muydunuz? Örneğin, bir modelin ölçmenizi sağlayacak olan ve sizi başarı kriterlerinize yaklaştırmayan mükemmel bir model olsa bile, hedeflediğiniz başarı kriterlerini tanımlanmıştır. Öte yandan, bir modelin değerlendirme metrikleri kötü olabilir ama bu durumda başarı kriterlerinize daha da yaklaşırsınız. Bu da modeli iyileştirmenin sizi başarıya bir adım daha yaklaştırır.

Aşağıda, modelin değerli olup olmadığına karar verirken dikkate alınacak boyutlar verilmiştir iyileşiyor:

  • Yeterince iyi değil ama devam et. Model, ancak zamanla önemli ölçüde geliştirilebilir.

  • Yeterince iyi, devam et. Model bir üretimde kullanılabilir yer alır ve daha da iyileştirilebilir.

  • Yeterince iyi, ancak daha iyisi yapılamaz. Model bir üretimde ancak mümkün olduğunca iyi olacaktır.

  • Yeterince iyi değil ve asla olmayacak. Model, ve yeterince eğitim almamış olabilirsiniz, muhtemelen bunu başarmaya çalışmayacaktır.

Modeli iyileştirmeye karar verirken kaynaklardaki artışın, bütçedeki artışın veya gibi maliyetlerin neden olduğu tahmini geliştirme maliyetini bahsedeceğim.

Başarı ve başarısızlık metriklerini tanımladıktan sonra, performansın ne sıklıkla bunları ölçeceksiniz. Örneğin, başarı metriklerinizi, başarı metriklerinizi, gün, altı hafta veya altı ay sonra erişebiliyor.

Hata metriklerini analiz ederken sistemin neden başarısız olduğunu belirlemeye çalışın. Örneğin, Örneğin model, kullanıcıların hangi videoları tıklayacağını tahmin ediyor olabilir ancak kullanıcı etkileşimine neden olan tıklama tuzağı başlıkları önermeye yardımcı olur. Hava durumu uygulaması örneğinde, model, hava durumu tahmininde çok büyük bir coğrafi bölgede yağmur yağacağını lütfen unutmayın.

Öğrendiklerinizi kontrol edin

Bir moda firması daha fazla kıyafet satmak istiyor. Birisi makine öğreniminin firmanın hangi giysileri üretmesi gerektiğini belirlemek önemlidir. Böylece her şeyi moda olan kıyafetlerin hangileri olduğunu belirlemek için bir model eğitmek. Şu tarihten sonra: ve bu modeli kendi kataloğuna uygulayarak giyeceğim için çok heyecanlıyım.

Problemlerini makine öğrenimi açısından nasıl ele almaları gerekir?

İdeal sonuç: Üretilecek ürünleri belirleyin.

Modelin hedefi: Hangi giysilerin giyside olduğunu tahmin edin moda oluyor.

Model çıkışı: İkili program sınıflandırması, in_fashion, not_in_fashion

Başarı metrikleri: Giysilerin en az yüzde yetmişini satın yapar.

İdeal sonuç: Ne kadar kumaş ve malzeme sipariş edileceğini belirleyin.

Modelin hedefi: Her bir parçanın ne kadarının üretileceğini tahmin edin.

Model çıkışı: İkili program sınıflandırması, make, do_not_make

Başarı metrikleri: Giysilerin en az yüzde yetmişini satın yapar.

İdeal sonuç, müşteriye ne kadar kumaş ve malzemelerin sipariş. Bir ürünün üretilip üretilmemesi gerektiğini belirlemektir. Dolayısıyla, modelin hedefi yanlış hedefe yönelik olabilir.
.