Bu belge, derin öğrenme modellerini daha etkili bir şekilde eğitmenize yardımcı olur. Bu dokümanda hiperparametre ayarı vurgulanmakta olsa da, derin öğrenme eğitiminin eğitim ardışık düzeni uygulaması ve optimizasyonu gibi diğer yönlerine de değinilmektedir.
Bu dokümanda, makine öğrenimi görevinizin gözetimli öğrenme problemi veya benzer bir sorun (ör. kendi kendine gözetimli öğrenim) olduğu varsayılır. Dolayısıyla bu dokümandaki bazı öneriler, diğer makine öğrenimi problemleri türleri için de geçerli olabilir.
Hedef kitle
Bu dokümanı, en azından temel düzeyde makine öğrenimi ve derin öğrenme bilgisine sahip mühendisler ve araştırmacılara yönelik olarak hazırladık. Bu konuda bilginiz yoksa Makine Öğrenimi Crash Course'a katılmayı düşünebilirsiniz.
Bu dokümanı neden yazdık?
Şu anda derin nöral ağların pratikte iyi çalışmasını sağlamak için şaşırtıcı miktarda çaba ve tahmin yürütülmektedir. Daha da kötüsü, kullanıcıların derin öğrenmeyle iyi sonuçlar elde etmek için kullandığı asıl tarifler nadiren belgeleniyor. Makaleler, daha net bir hikaye sunmak için nihai sonuçlara yol açan süreci gözler önüne seriyor. Ticari sorunlar üzerinde çalışan makine öğrenimi mühendislerinin bir adım geri çekerek süreçlerini genelleştirmesi için çok az zamanı oluyor. Yazarlar faydalı çalışmalar sunmak için gerekli çalışma tecrübesine sahip olsalar bile, pratik referansları gözden kaçırırlar ve temel ilkelere öncelik verirler.
Bu dokümanı oluşturmaya hazırlanırken, derin öğrenimle nasıl iyi sonuçlar elde edebileceğinizi açıklayan kapsamlı bir deneme bulamadık. Bunun yerine blog yayınlarında ve sosyal medyada öneriler, araştırma makalelerinin eklerinden hileli bir şekilde faydalanan hileler, belirli bir proje ya da ardışık düzen hakkında zaman zaman yapılan başarılı örnekler ve birçok karışıklığa rastladık. Derin öğrenme uzmanlarının elde ettiği sonuçlar ile yüzeysel olarak benzer yöntemler kullanan daha az beceri sahibi uzmanların elde ettiği sonuçlar arasında büyük bir fark vardır. Ancak uzmanlar yaptıkları işlerden bazılarının haklı gerekçeler olmayabileceğini kolayca kabul ediyor. Derin öğrenme olgunlaştıkça ve dünya genelinde daha büyük bir etkiye sahip olduğundan topluluk, yararlı sonuçlar içeren daha fazla kaynağa ve iyi sonuçlar almak için çok önemli olan tüm pratik bilgilere ihtiyaç duyuyor.
2006'dan bu yana yıllardır derin öğrenme konusunda çalışan beş araştırmacı ve mühendisten oluşan bir ekibiz. Konuşma tanımadan astronomiye kadar her şeyde derin öğrenme uyguladık. Nöral ağların eğitilmesi, yeni makine öğrenimi mühendislerinin öğretilmesi ve meslektaşlarımızın derin öğrenme pratiği konusunda edindiği deneyimden yola çıkarak bu dokümandan yararlandık.
Derin öğrenmenin, az sayıda akademik laboratuvar tarafından uygulanan bir makine öğrenimi yaklaşımından, milyarlarca insanın kullandığı ürünlere güç veren bir teknolojiye dönüştüğünü görmek bizi memnun etti. Bununla birlikte, derin öğrenme henüz mühendislik alanında henüz çok başlangıç aşamasındadır ve bu dokümanın, diğer kullanıcıları alanın deneysel protokollerini sistematikleştirmeye yardımcı olmaya teşvik edeceğini umuyoruz.
Bu doküman, derin öğrenmeye kendi yaklaşımımızı netleştirmeye çalıştığımız için ortaya çıktı. Dolayısıyla, fiili olarak herhangi bir gerçeği değil, yazma anında düşüncelerimizi temsil eder. Hiperparametre ayarıyla ilgili karşılaştığımız güçlükler bizi rehberimizin özel bir odak noktası haline getirdi. Bununla birlikte, çalışmalarımızda karşılaştığımız (veya yanlış gittiğimiz) diğer önemli konuları da ele alıyoruz. Bu çalışma, inançlarımız değiştikçe gelişen ve gelişen yaşayan bir doküman olmayı amaçlamaktadır. Örneğin, en son sonuçlara ve devam eden araştırmalara dayalı olduğu için, hata ayıklama ve eğitim hatalarını azaltmaya yönelik materyaller iki yıl önce yazmamız mümkün olmazdı.
Önerdiğimiz bazı tavsiyeler, yeni sonuçlara ve iyileştirilmiş iş akışlarına uygun olarak güncellenmelidir. İdeal derin öğrenme formülünü bilmiyoruz ama topluluk yazmaya ve farklı prosedürler üzerinde tartışmaya başlayana kadar bulabilmemiz mümkün değil. Bu doğrultuda, tavsiyemizle ilgili sorun yaşayan okuyucuları, ikna edici kanıtlarla birlikte alternatif öneriler üretmeye teşvik ederiz. Böylece başucu kitabını güncelleyebiliriz. Farklı öneriler sunabilecek alternatif kılavuzlar ve başucu kitapları görmekten de mutluluk duyarız. Böylece topluluk olarak en iyi uygulamalara yönelik çalışmalar yapabiliriz.
Robot emojisi hakkında
Robot 🤖 emojisi, daha fazla araştırma yapmak istediğimiz alanları gösterir. Ancak bu başucu kitabını yazmaya çalıştıktan sonra, derin öğrenme uzmanının iş akışında kaç tane ilginç ve ihmal edilmiş araştırma sorusunun bulunabildiği tam olarak anlaşılmıştır.