Sorunu anlama

Sorunu anlamak için aşağıdaki görevleri gerçekleştirin:

  • Geliştirdiğiniz veya yeniden düzenlediğiniz ürünün hedefini belirtin.
  • Hedefin en iyi şekilde çözülüp çözülmediğini tahmine dayalı makine öğrenimi, üretken yapay zeka veya makine öğrenimi dışında bir çözüm.
  • yaklaşımını benimsemiştim.

Hedefi belirtin

Hedefinizi makine öğrenimiyle ilgili olmayan terimlerle söyleyerek başlayın. Hedef, bir proje başlatma belgesinin “Neyi başarmaya çalışıyorum?”

Aşağıdaki tabloda varsayıma dayalı uygulamalar için hedefler açıkça belirtilmiştir:

Uygulama Hedef
Hava durumu uygulaması Bir coğrafi bölge için altı saatlik artışlarla yağış miktarını hesaplama
Moda uygulaması Çeşitli gömlek tasarımları oluşturun.
Video uygulaması Faydalı videolar önerin.
Posta uygulaması Spam'i tespit edin.
Finans uygulaması Birden fazla haber kaynağından alınan finansal bilgileri özetleme
Harita uygulaması Seyahat süresini hesaplamak.
Bankacılık uygulaması Sahte işlemleri tespit edin.
Yemek uygulaması Mutfağını restoranın menüsüne göre tanımlayın.
E-ticaret uygulaması Yorumları faydalı yanıtlarla yanıtlayın.

Makine Öğrenimi için net bir kullanım alanı

Bazıları ML'yi tüm sorunlara uygulanabilecek evrensel bir araç olarak görür. Gerçekte, yapay zeka yalnızca belirli sorunlara uygun özel bir araçtır. Makine Öğrenimi içermeyen daha basit bir çözümün işe yarayacağı durumlarda karmaşık bir Makine Öğrenimi çözümü uygulamak istemiyorsunuz.

ML sistemleri iki geniş kategoriye ayrılabilir: tahmini ML ve üretken yapay zeka. Aşağıdaki tabloda bu özelliklerin ayırt edici özellikleri listelenmiştir:

Giriş Çıkış Eğitim tekniği
Tahmine dayalı makine öğrenimi Metin
Resim
Ses
Video
Sayısal
Bir tahminde bulunur (ör. müşterinin spam ya da spam değil olarak işaretledi, yarının yağış akışını tahmin etme hisse senedinin fiyatını tahmin etmektir. Çıkış, genellikle gerçeklere karşı doğrulanabilir. Gözetimli bir modeli eğitmek için genellikle çok fazla veri kullanır. gözetimsiz veya pekiştirmeli öğrenme modelini karar vermeniz gerekir.
Generative AI Metin
Resim
Ses
Video
Sayısal
Kullanıcının amacına göre çıkış oluşturur (ör. bir makaleyi özetleme, ses klibi veya kısa video oluşturma). Genellikle büyük bir dil modelini eğitmek veya eksik verileri doldurmak için çok sayıda etiketlenmemiş veri kullanır. Model daha sonra, boş görevler olarak çerçevelenebilir veya bazı görevler için etiketli verilerle eğiterek en iyi uygulamaları görelim.

Doğru yaklaşımın makine öğrenimi olduğunu doğrulamak için öncelikle mevcut makine öğrenimi içermeyen çözümünüzün optimize edildiğinden emin olun. ML dışı bir çözüm uygulamanız yoksa problemi manuel olarak çözmek için buluşsal olarak tanımlar.

ML olmayan çözüm, ML'nin sorununuz için iyi bir kullanım alanı olup olmadığını belirlemek üzere kullanacağınız karşılaştırma ölçütüdür. ML dışı bir yaklaşımı ML'ye kıyasla karşılaştırırken aşağıdaki soruları göz önünde bulundurun:

  • Kalite. Sizce bir makine öğrenimi çözümü ne kadar iyi olabilir? Şu durumda: ML çözümünün küçük bir iyileştirme olabileceğini en iyi seçenek budur.

  • Maliyet ve bakım. Makine öğrenimi çözümü hem ne kadar önemli? Bazı durumlarda, bir tedarikçinin satın alma kaynakları ve makine öğrenimini uygulayacak şekilde zaman ayırmalıdır. Aşağıdakileri göz önünde bulundurun sorular:

    • Makine öğrenimi çözümü maliyetteki artışı gerekçelendirebilir mi? Bu özelliğin büyük sistemlerdeki iyileştirmelerin maliyeti, bakımına ihtiyaç vardır.
    • Çözüm ne kadar bakım gerektirir? Çoğu durumda, yapay zeka uygulamalarının özel uzun süreli bakıma ihtiyacı vardır.
    • Ürününüz, ML uzmanlığı olan kişileri eğitme veya işe alma konusunda destek sağlayacak kaynaklara sahip mi?

Öğrendiklerinizi test etme

Proje başlatmadan önce makine öğrenimi harici bir çözümün veya buluşsal yöntemin bir makine öğrenimi çözümü mü var?
ML dışı çözümler, makine öğrenimi çözümlerinin karşılaştırmasını ölçmek için kullanılan karşılaştırma ölçütüdür.
ML dışı çözümler, bir makine öğrenimi çözümünün maliyetini belirlemenize yardımcı olur.

Tahmine dayalı makine öğrenimi ve veriler

Veriler, tahmine dayalı makine öğreniminin itici gücüdür. İyi tahminler yapmak için tahmin gücü olan özellikleri içeren verilere ihtiyacınız vardır. Verileriniz aşağıdaki özelliklere sahip olmalıdır:

  • Bol. Veri kümenizde ne kadar alakalı ve yararlı örnek olursa modeliniz o kadar iyi olur.

  • Tutarlı ve güvenilir. Düzenli ve güvenilir bir şekilde toplanan veriler daha iyi bir model oluşturur. Örneğin, makine öğrenimine dayalı bir hava durumu modeli, aynı güvenilir cihazlardan yıllar boyunca toplanan verilerden yararlanır.

  • Güvenilir. Verilerinizin nereden geleceğini anlayın. Veriler gösterilecek mi? ürününüze ait günlükler gibi güvendiğiniz güvenilir kaynaklardan mı yoksa daha fazla bilgi sahibi olmadığınız kaynaklardan (ör. başka bir kullanıcının çıktısı) makine öğrenimi sistemi nedir?

  • Kullanılabilir. Tahmin zamanında tüm girişlerin mevcut olduğundan emin olun. doğru biçimdedir. Belirli özellik değerlerini bu özellikleri veri kümelerinizden çıkarın.

  • Doğru. Büyük veri kümelerinde bazı etiketlerin hatalı değerlere sahip olması kaçınılmazdır ancak etiketlerin küçük bir yüzdesinden fazlası hatalıysa model kötü tahminler yapar.

  • Temsilci. Veri kümeleri, gerçek dünyayı mümkün olduğunca temsil etmelidir. Başka bir deyişle, veri kümelerindeki veriler, gerçek dünyadaki olayları, kullanıcı davranışlarını ve/veya gerçek dünyayı için de geçerlidir. Doğru temsil etmeyen veri kümeleriyle eğitim, düşük performansa neden olabilir modelden gerçek dünyada tahminler yapması istendiğinde.

İhtiyacınız olan verileri gerekli biçimde alamazsanız, modeliniz kötü tahminlere neden olabilir.

Tahmine dayalı güç

Bir modelin iyi tahminlerde bulunabilmesi için veri kümenizdeki özelliklerin tahmin gücü. Bir özelliğin etiketle ne kadar yüksek korelasyona sahip olduğu, özelliğin tahmin edilme olasılığını artırır.

Bazı özellikler, diğerlerine kıyasla daha fazla tahmin gücüne sahiptir. Örneğin, bir hava durumu veri kümesinde cloud_coverage, temperature ve dew_point gibi özellikler, yağmur için moon_phase veya day_of_week'ten daha iyi tahminler sunar. Video uygulaması örneğinde, video_description, length ve views gibi özelliklerin kullanıcının izlemek isteyeceği videoları iyi tahmin edebileceğini varsayabilirsiniz.

Bir özelliğin tahmin gücünün, bağlam veya alan değiştiği için değişebileceğini unutmayın. Örneğin, video uygulamasında upload_date gibi bir özellik, genel olarak etiketle zayıf bir ilişkiye sahip olabilir. Ancak oyun videolarının alt alanında upload_date, etiketle güçlü bir korelasyona sahip olabilir.

Hangi özelliklerin tahmin gücüne sahip olduğunu belirlemek zaman alabilir. bahsedeceğim. Bir modeli eğitirken özelliği kaldırıp ekleyerek özelliğin tahmin gücünü manuel olarak keşfedebilirsiniz. Bir özelliğin tahmin gücünü bulma işlemini otomatikleştirebilirsiniz. Bunun için Pearson korelasyon, düzenlenmiş karşılıklı bilgi (AMI) ve Shapley değeri gibi algoritmaları kullanabilirsiniz. Bu algoritmalar, bir özelliğin tahmin gücünü analiz etmek için sayısal bir değerlendirme sağlar.

Öğrendiklerinizi test etme

Veri kümelerinizi analiz ederken dikkate almanız gereken üç temel özellik
Gerçek dünyayı temsil eder.
Doğru değerler içeriyor.
Özellikler, etiket için tahmin gücüne sahiptir.
Yerel bir makineye yüklenebilecek kadar küçük olmalıdır.
Tahmin edilemeyen çeşitli kaynaklardan toplanır.

Veri kümelerinizi analiz etme ve hazırlama hakkında daha fazla yardım için Makine Öğrenimi İçin Veri Hazırlama ve Özellik Mühendisliği.

Tahminler ve işlemler

Bir öngörüyü bir şeye dönüştüremezseniz, bir şeyi öngörmenin hiçbir değeri yoktur yardımcı olan bir eylemdir. Yani ürününüz, modelin çıkışına göre işlem yapmalıdır.

Örneğin, kullanıcının bir videoyu faydalı bulup bulmayacağını tahmin eden bir model yararlı videolar öneren bir uygulamaya yerleştirilmelidir. Yağmur yağacağını tahmin eden bir model, hava durumu uygulamasına beslenmelidir.

Öğrendiklerinizi test etme

Aşağıdaki senaryoya göre makine öğrenimi kullanmanın en iyi seçenek olup olmadığını belirleyin nasıl yaklaştığını göreceğiz.

Büyük bir kurumda mühendislik ekibi, gelen aramaları gösterir.

Hedef: Mevcut arama hacmi göz önüne alındığında arayanlara bekleme süresini bildirmek.

Şu anda uygulanan bir çözümleri yok ancak beklemedeki mevcut müşteri sayısını telefonları yanıtlayan çalışan sayısına bölmeyi ve ardından 10 dakikayla çarpmayı heuristik bir yaklaşım olarak düşünüyorlar. Ancak bazı müşterilerin sorunlarının iki dakikada çözüldüğünü, bazılarının ise 45 dakika veya daha uzun sürebileceğini bilirler.

Buluşsal yöntemleri muhtemelen bu kullanıcılara yeterince kesin bir sayı vermeyecektir. Onlar aşağıdaki sütunları içeren bir veri kümesi oluşturabilir: number_of_callcenter_phones, user_issue, time_to_resolve, call_time, time_on_hold.

Makine öğrenimini kullanın. Mühendislik ekibinin net bir hedefi vardır. Diğer bulgusal yaklaşımın kullanım alanı için yeterince iyi olmayacaktır. Veri kümesinde time_on_hold etiketi için tahmini özellikler olduğu anlaşılıyor.
Makine öğrenimi kullanmayın. Açıkça tanımlanmış bir hedefleri olsalar da önce makine öğrenimi harici bir çözümü uygulamalı ve optimize etmelidir. Ayrıca, veri kümesinde tahmin gücüne sahip yeterli özellik yok.
.