AutoML'yi kullanmayı düşünüyorsanız nasıl çalıştığı ve başlamak için hangi adımları uygulamanız gerektiği hakkında sorularınız olabilir. Bu bölümde, yaygın AutoML kalıpları daha ayrıntılı bir şekilde ele alınmakta, AutoML'in işleyiş şekli incelenmekte ve projeniz için AutoML'i kullanmaya başlamadan önce uygulamanız gerekebilecek adımlar incelenmektedir.
AutoML araçları
AutoML araçları iki ana kategoriye ayrılır:
- Kod yazma gerektirmeyen araçlar genellikle, kod yazmadan verileriniz için en iyi modeli bulmak üzere kullanıcı arayüzü üzerinden denemeleri yapılandırmanıza ve çalıştırmanıza olanak tanıyan web uygulamaları şeklindedir.
- API ve CLI araçları gelişmiş otomasyon özellikleri sunar ancak daha fazla (bazen önemli ölçüde daha fazla) programlama ve makine öğrenimi uzmanlığı gerektirir.
Kodlama gerektiren AutoML araçları, kod yazma gerektirmeyen araçlardan daha güçlü ve daha esnek olabilir ancak kullanımı daha zor olabilir. Bu modülde, model geliştirme için kodsuz seçeneklere odaklanılır ancak özelleştirilmiş otomasyona ihtiyacınız varsa API ve CLI seçeneklerinin yardımcı olabileceğini unutmayın.
AutoML iş akışı
Tipik bir makine öğrenimi iş akışını inceleyip AutoML'i kullandığınızda neler olduğunu görelim. İş akışında yer alan üst düzey adımlar, özel eğitim için kullandıklarınızla aynıdır. Aradaki temel fark, AutoML'in bazı görevleri sizin için halletmesidir.
Problem tanımı
Herhangi bir makine öğrenimi iş akışının ilk adımı sorununuzu tanımlamaktır. AutoML'i kullanırken seçtiğiniz aracın, ML projenizin hedeflerini desteklediğinden emin olun. Çoğu AutoML aracı, çeşitli gözetimli makine öğrenimi algoritmalarını ve giriş veri türlerini destekler.
Sorun çerçeveleme hakkında daha fazla bilgi için Machine Learning Problem Framing'e Giriş modülüne göz atın.
Veri toplama
AutoML aracıyla çalışmaya başlamadan önce verilerinizi tek bir veri kaynağında toplamalısınız. Aracınızın aşağıdakileri desteklediğinden emin olmak için ürün dokümanlarını kontrol edin: veri kaynağınız, veri kümenizdeki veri türleri, veri kümenizin boyutu.
Veri hazırlama
Veri hazırlama, AutoML araçlarının size yardımcı olabileceği bir alandır ancak hiçbir araç her şeyi otomatik olarak yapamaz. Bu nedenle, verilerinizi araca aktarmadan önce biraz çalışma yapmanız gerekir. AutoML için veri hazırlama işlemi, bir modeli manuel olarak eğitmek için yapmanız gerekenlere benzer. Verilerinizi eğitime hazırlama hakkında daha fazla bilgi edinmek istiyorsanız Veri Hazırlama bölümüne göz atın.
Verilerinizi hazırlama hakkında daha fazla bilgi edinmek için sayısal verilerle çalışma ve kategorik verilerle çalışma modüllerine bakın.
AutoML eğitimi için verilerinizi içe aktarmadan önce aşağıdaki adımları tamamlamanız gerekir:
Verilerinizi etiketleme
Veri kümenizdeki her örnek için bir etiket gerekir.
Verileri temizleme ve biçimlendirme
Gerçek dünyadaki veriler genellikle dağınıktır. Bu nedenle, verileri kullanmadan önce temizlemeniz gerekir. AutoML kullanırken bile belirli veri kümeniz ve sorununuz için en iyi işlemleri belirlemeniz gerekir. En iyi sonuçları elde etmek için biraz keşif yapmanız ve muhtemelen birden fazla AutoML çalıştırmanız gerekebilir.
Özellik dönüşümleri gerçekleştirme
Bazı AutoML araçları, belirli özellik dönüşümlerini sizin için yapar. Ancak kullandığınız araç, ihtiyacınız olan özellik dönüşümünü desteklemiyorsa veya iyi desteklemiyorsa dönüşümleri önceden yapmanız gerekebilir.
Model geliştirme (kodsuz AutoML ile)
AutoML, eğitim sırasında sizin için gerekenleri yapar. Ancak eğitime başlamadan önce denemenizi yapılandırmanız gerekir. AutoML eğitim çalıştırması oluşturmak için genellikle aşağıdaki üst düzey adımları belirtmeniz gerekir:
Verilerinizi içe aktarma
Verilerinizi içe aktarmak için veri kaynağınızı belirtin. AutoML aracı, içe aktarma işlemi sırasında her veri değerine bir anlamsal veri türü atar.
Verilerinizi analiz edin
AutoML ürünleri genellikle eğitimden önce ve sonra veri kümenizi analiz etmek için araçlar sağlar. En iyi uygulama olarak, AutoML çalıştırması başlatmadan önce verilerinizi anlamak ve doğrulamak için bu analiz araçlarını kullanabilirsiniz.
Verilerinizi hassaslaştırma
AutoML araçları genellikle içe aktarma işleminden sonra ve eğitimden önce verilerinizi hassaslaştırmanıza yardımcı olacak mekanizmalar sağlar. Verilerinizi hassaslaştırmak için tamamlayabileceğiniz bazı görevler:
Anlamsal Kontrol: AutoML araçları, içe aktarma sırasında her bir özellik için doğru anlamsal türü belirlemeye çalışır ancak bu tahminler yalnızca tahmindir. Tüm özelliklere atanan türleri kontrol etmeniz ve yanlış atanmış olanları değiştirmeniz gerekir.
Örneğin, posta kodları veritabanınızdaki bir sütunda sayı olarak depolanmış olabilir. Çoğu AutoML sistemi, verileri kesintisiz sayısal veri olarak algılar. Bu, posta kodu için yanlış olur ve kullanıcı muhtemelen bu özellik sütunu için semantik türü sürekli yerine kategorik olarak değiştirmek ister.
Dönüşümler: Bazı araçlar, kullanıcıların hassaslaştırma süreci kapsamında veri dönüşümlerini özelleştirmesine olanak tanır. Bazen, bir veri kümesinde, AutoML araçlarının yardım almadan belirlemesi zor olacak şekilde dönüştürülmesi veya birleştirilmesi gereken tahmini özelliklere sahip olduğunda bu işlem gerekli olur.
Örneğin, bir evin satış fiyatını tahmin etmek için kullandığınız bir konut veri kümesini düşünün.
description
adlı bir mülk girişinin açıklamasını temsil eden bir özellik olduğunu ve bu verileridescription_length
adlı yeni bir özellik oluşturmak için kullanmak istediğinizi varsayalım. Bazı AutoML sistemleri, özel dönüşümleri kullanmanın yollarını sunar. Bu örnekte, aşağıdaki gibi yeni bir açıklama uzunluğu özelliği oluşturmak için birLENGTH
işlevi olabilir:LENGTH(description)
.
AutoML çalıştırma parametrelerini yapılandırma
Eğitim denemenizi çalıştırmadan önceki son adım, araca modelinizi nasıl eğitmesini istediğinizi bildirmek için birkaç yapılandırma ayarı seçmektir. Her AutoML aracının kendine özgü bir yapılandırma seçenekleri grubu olsa da tamamlamanız gerekebilecek önemli yapılandırma görevlerinden birkaçını aşağıda bulabilirsiniz:
- Çözmeyi planladığınız makine öğrenimi sorunu türünü seçin. Örneğin, bir sınıflandırma veya regresyon sorununu mu çözüyorsunuz?
- Veri kümenizdeki etiket sütununu seçin.
- Modeli eğitmek için kullanılacak özellik grubunu seçin.
- AutoML'in model aramasında dikkate alacağı makine öğrenimi algoritmalarını seçin.
- AutoML'in en iyi modeli seçmek için kullandığı değerlendirme metriğini seçin.
AutoML denemenizi yapılandırdıktan sonra eğitim çalıştırmasını başlatmaya hazırsınız demektir. Eğitimin tamamlanması biraz zaman alabilir (yaklaşık birkaç saat).
Modeli değerlendir
Eğitimden sonra, AutoML ürününüzün size yardımcı olmak için sunduğu araçları kullanarak sonuçları inceleyebilirsiniz:
- Özellik önemi metriklerini inceleyerek özelliklerinizi değerlendirin.
- Modelinizi oluşturmak için kullanılan mimariyi ve hiperparametreleri inceleyerek modelinizi anlayın.
- Çıkış modeli için eğitim sırasında toplanan grafikler ve metriklerle üst düzey model performansını değerlendirin.
Üretim
Bu modülün kapsamı dışında olsa da bazı AutoML sistemleri, modelinizi test etmenize ve dağıtmanıza yardımcı olabilir.
Modeli yeniden eğitme
Modeli yeni verilerle yeniden eğitmeniz gerekebilir. Bu durum, AutoML eğitim çalışmanızı değerlendirdikten veya modeliniz bir süre üretimde çalıştıktan sonra ortaya çıkabilir. Her iki durumda da AutoML sistemleri yeniden eğitim konusunda da yardımcı olabilir. AutoML çalıştırması sonrasında verilerinize tekrar göz atıp geliştirilmiş bir veri kümesiyle yeniden eğitme işlemi gerçekleştirmek yaygın bir durumdur.
Sırada ne var?
Bu modülü tamamladığınız için tebrikler.
Kendi hızınıza ve ilgi alanlarınıza göre çeşitli MLCC modüllerini keşfetmenizi öneririz. Önerilen sırayı uygulamak istiyorsanız sıradaki modüle geçmenizi öneririz: Makine Öğrenimi Adilliği.