AutoML kullanmayı düşünüyorsanız ve başlamak için atmanız gereken adımları açıklayacağım. Bu bölümde daha ayrıntılı bilgi verilmektedir , AutoML'in işleyiş şeklini keşfeder ve hangi adımların projeniz için AutoML'i kullanmaya başlamadan önce bazı işlemler yapmanız gerekebilir.
AutoML araçları
AutoML araçları iki ana kategoriye ayrılır:
- Kodlama gerektirmeyen araçlar genellikle web uygulamaları biçiminde olur kullanıcı arayüzü üzerinden denemeler yapılandırmanıza ve çalıştırmanıza olanak tanıyan Böylece hiçbir kod yazmadan verileriniz için en iyi modeli oluşturabilirsiniz.
- API ve CLI araçları, gelişmiş otomasyon özellikleri sağlar ancak daha fazlasını gerektirir (bazen çok daha fazla) programlama ve makine öğrenimi uzmanlığı.
Kodlama gerektiren AutoML araçları, ancak bunların kullanımı daha zor olabilir. Bu modülde seçenekleri vardır ancak API ve CLI'ın manuel olarak Özelleştirilmiş otomasyona ihtiyacınız varsa şu seçenekleri kullanabilirsiniz:
AutoML iş akışı
Tipik bir makine öğrenimi iş akışını gözden geçirelim ve AutoML. İş akışındaki üst düzey adımlar, iş akışı için kullandığınız adımlarla aynıdır. özel eğitim Aradaki temel fark, AutoML'in bazı görevleri sizin yerinize yerine getirmesidir.
Sorunun tanımı
Herhangi bir makine öğrenimi iş akışının ilk adımı, sorununuzu tanımlamaktır. Bunu kullandığınızda AutoML, seçtiğiniz aracın göz önünde bulundurmanız gerekir. Çoğu AutoML aracı, gözetimli birçok farklı makine öğrenimi algoritmaları ve giriş verisi türleri.
Problem çerçeveleme hakkında daha fazla bilgi için Makine Öğrenimi Problem Çerçevesine Giriş
Veri toplama
Bir AutoML aracıyla çalışmaya başlamadan önce verilerinizi toplamanız gerekir tek bir veri kaynağına ekleyebilirsiniz. Ürün belgelerini kontrol ederek Aracınız şunları destekler: veri kaynağınız, veri kümenizdeki veri türleri, boyut veri kümenizin özelliklerini ayarlayın.
Veri hazırlama
Veri hazırlama, AutoML araçlarının size yardımcı olabileceği bir alandır. aracı her şeyi otomatik olarak yapabilir. Bu nedenle, aracı göndermeden önce verilerinizi araca aktarabilirsiniz. AutoML için veri hazırlığı, ne yapmanız gerektiğini açıklayacağım. Daha fazla bilgi edinmek isterseniz hakkında bilgi edinmek için Veri Hazırlama'ya göz atın. bölümüne ekleyin.
Verilerinizi hazırlama konusunda daha fazla bilgi için sayısal verilerle çalışma ve kategorik verilerle çalışma modüllerinde yer alır.
AutoML eğitimi için verilerinizi içe aktarmadan önce şu adımları tamamlamanız gerekir: için şu adımları izleyin:
Verilerinizi etiketleme
Veri kümenizdeki her örneğin bir etiketi olmalıdır.
Verileri temizleme ve biçimlendirme
Gerçek dünya verileri dağınık olma eğilimindedir. Bu nedenle, kullanmadan önce verilerinizi temizlemeyi düşünebilirsiniz. somut olarak ortaya koyar. AutoML’le bile işletmeniz için en iyi çözümleri belirlemeniz gerekir. ve problemi çözmek için. Bunun için araştırma yapmanız ve en iyi sonuçları elde etmeden önce birden fazla AutoML'in çalışması ihtimali vardır.
Özellik dönüştürme işlemleri gerçekleştirme
Bazı AutoML araçları, belirli özellik dönüştürme işlemlerini sizin için gerçekleştirir. Ancak, kullandığınız araç, ihtiyacınız olan bir özellik dönüşümünü desteklemiyor veya iyi desteklemediğinden, dönüşümleri önceden yapmanız gerekebilir. kazanıyor.
Model geliştirme (kodsuz AutoML ile)
AutoML, eğitim sırasında bu işlemleri sizin yerinize yapar. Ancak, başlamadan önce denemenizi yapılandırmanız gerekir. AutoML eğitimi ayarlamak için genellikle şu üst düzey adımları belirtmeniz gerekir:
Verilerinizi içe aktarın
Verilerinizi içe aktarmak için veri kaynağınızı belirtin. İçe aktarma sırasında işleminde, AutoML aracı her veri değerine bir anlamsal veri türü atar.
Verilerinizi analiz etme
AutoML ürünleri genellikle öğreneceğiz. En iyi uygulama olarak bu analiz araçlarını verilerinizi anlayıp doğrulayın.
Verilerinizi hassaslaştırma
AutoML araçları genellikle hazırlamayı da unutmayın. Aşağıda tamamlamak isteyebileceğiniz birkaç görev verilmiştir verilerinizi ayrıntılandırmak için:
Anlamsal Kontrol: İçe aktarma işlemi sırasında, AutoML araçları ancak bunlar yalnızca tahminidir. Tüm özelliklere atanan türleri kontrol etmeli ve bunları değiştirmelisiniz .
Örneğin, Londra'daki bir sütunda sayı olarak depolanmış posta kodları yardımcı olur. Çoğu AutoML sistemi verileri sürekli olarak algılar. sayısal verilerdir. Bu, posta kodu ve kullanıcı için yanlış olur anlamsal türü, kategorik olarak devamlı durumundan daha iyidir.
Dönüşümler: Bazı araçlar, kullanıcıların verileri özelleştirmesine olanak tanır. dönüşümlerine dayanıyor. Bazen bu, potansiyel olarak tahmine dayalı özellikler içeren veri kümeleriyle AutoML araçları için zor olacak şekilde dönüştürülemez veya birleştirilemez. yardım almadan belirleyebileceğinizdir.
Örneğin, tahmin yapmak için kullandığınız bir barındırma veri kümesini ele alalım. bir evin indirimli fiyatıdır. Her bir anahtar kelime için
description
adlı bir ev listelemesinin açıklamasını, adlı yeni bir özellik oluşturmak için bu verileri kullanmakdescription_length
. Bazı AutoML sistemleri, özel dönüşümlerine dahil edilir. Bu örnekte birLENGTH
işlevi olabilir. yeni bir açıklama uzunluğu özelliği oluşturmak için:LENGTH(description)
.
AutoML çalıştırma parametrelerini yapılandırma
Eğitim denemenizi çalıştırmadan önceki son adım, birkaç test yapılandırma ayarlarınızı kullanarak araca, modelinizi nasıl eğitmesini istediğinizi bildirin. Her AutoML aracının kendine özgü yapılandırma seçenekleri olsa da yapmanız gerekebilecek önemli yapılandırma görevlerinden tamamlandı:
- Çözmeyi planladığınız makine öğrenimi problemi türünü seçin. Örneğin, Yeşil Ofis veya regresyon problemi çözmeyi nasıl başarabilirsiniz?
- Veri kümenizdeki hangi sütunun etiket olduğunu seçin.
- Modeli eğitmek için kullanılacak özellik grubunu seçin.
- AutoML'in model aramada dikkate aldığı ML algoritmaları grubunu seçin.
- AutoML'in en iyi modeli seçmek için kullandığı değerlendirme metriğini seçin.
AutoML denemenizi yapılandırdıktan sonra eğitime başlayabilirsiniz. gerekir. Eğitimin tamamlanması biraz zaman alabilir (saatlere göre).
Modeli değerlendir
Eğitimden sonra AutoML'inizin araçlarını kullanarak sonuçları inceleyebilirsiniz. size şu konularda yardımcı olur:
- Özellik önem metriklerini inceleyerek özelliklerinizi değerlendirin.
- Kullanılan mimariyi ve hiperparametreleri inceleyerek modelinizi anlayın sahip olacaksınız.
- Modelleme sırasında toplanan grafikler ve metriklerle üst düzey model performansını değerlendirin ve çıktı modeli eğitimine dayalıdır.
Üretimleştirme
Bu modülün kapsamı dışında olsa da bazı AutoML sistemleri, modelinizi test edip dağıtın.
Modeli yeniden eğit
Modeli yeni verilerle yeniden eğitmeniz gerekebilir. Bu işlem, modelinizin birkaç gün için üretim aşamasında olmasını sağlayarak gerekir. Her iki durumda da AutoML sistemleri yeniden eğitime yardımcı olabilir. değil bir AutoML çalıştırıldıktan sonra verilerinize bir kez daha göz atmak ve veri kümesi oluşturur.
Sırada ne var?
Tebrikler, bu modülü tamamladınız.
Çeşitli MLCC modüllerini incelemenizi öneririz istediğiniz zaman ve çıkarım yapabilirsiniz. Önerilen bir siparişi uygulamak isterseniz Şu modüle geçmenizi öneririz: Makine Öğreniminde Adalet.