إذا كنت تفكر في استخدام "الذكاء الاصطناعي التلقائي"، قد تكون لديك أسئلة حول كيفية عمله والخطوات التي يجب اتّخاذها للبدء. يتناول هذا القسم بالتفصيل أنماط AutoML الشائعة، ويستكشف آلية عمل AutoML، ويفحص الخطوات التي قد تحتاج إلى اتّخاذها قبل بدء استخدام AutoML في مشروعك.
أدوات AutoML
تندرج أدوات AutoML ضمن فئتين رئيسيتين:
- الأدوات التي لا تتطلّب أيّ ترميز تكون عادةً على شكل تطبيقات ويب تتيح لك ضبط التجارب وتنفيذها من خلال واجهة مستخدم للعثور على أفضل نموذج لبياناتك بدون كتابة أيّ رموز برمجية.
- توفّر أدوات واجهة برمجة التطبيقات وواجهة سطر الأوامر ميزات متقدّمة للتشغيل الآلي، ولكنها تتطلّب المزيد من (في بعض الأحيان بشكل كبير) الخبرة في البرمجة والتعلم الآلي.
يمكن أن تكون أدوات AutoML التي تتطلّب استخدام الرموز أكثر فعالية ومرونة من الأدوات التي لا تتطلّب استخدام الرموز، ولكن قد يكون من الصعب استخدامها أيضًا. تركّز هذه الوحدة على خيارات تطوير النماذج بدون استخدام رموز برمجية، ولكن يُرجى العِلم أنّ خيارات واجهة برمجة التطبيقات وCLI يمكن أن تساعدك إذا كنت بحاجة إلى عمليات مبرمَجة مخصّصة.
سير عمل AutoML
لنطّلِع على سير عمل نموذجي للذكاء الاصطناعي ونرى كيف تعمل الأمور عند استخدام AutoML. الخطوات الأساسية في سير العمل هي نفسها الخطوات التي تستخدمها في التدريب المخصّص، والفرق الرئيسي هو أنّ ميزة "التعلم الآلي التلقائي" تعالج بعض المهام نيابةً عنك.
تعريف المشكلة
تتمثل الخطوة الأولى في أيّ سير عمل للذكاء الاصطناعي في تحديد مشكلتك. عند استخدام AutoML، تأكَّد من أنّ الأداة التي تختارها يمكنها دعم أهداف مشروعك المتعلّق بالذكاء الاصطناعي. تتوافق معظم أدوات AutoML مع مجموعة متنوعة من خوارزميات التعلم الآلي الخاضعة للإشراف وأنواع البيانات التي يتم إدخالها.
لمزيد من المعلومات عن تحديد المشكلة، اطّلِع على الوحدة المتعلّقة بموضوع مقدّمة عن تحديد المشاكل في التعلم الآلي.
جمع البيانات
قبل أن تتمكّن من بدء العمل باستخدام إحدى أدوات AutoML، عليك جمع بياناتك في مصدر بيانات واحد. راجِع مستندات المنتج للتأكّد من أنّ أداتك متوافقة مع: مصدر البيانات وأنواع البيانات في مجموعة البيانات وحجم مجموعة البيانات.
إعداد البيانات
تُعدّ عملية إعداد البيانات من المجالات التي يمكن أن تساعدك فيها أدوات AutoML، ولكن لا يمكن لأي أداة تنفيذ كل شيء تلقائيًا، لذا عليك توقع تنفيذ بعض الأعمال قبل أن تتمكّن من استيراد بياناتك إلى الأداة. يشبه إعداد البيانات لخدمة AutoML الخطوات التي يجب اتّباعها لتدريب نموذج يدويًا. إذا كنت بحاجة إلى معرفة المزيد حول كيفية إعداد بياناتك للتدريب، اطّلِع على القسم "إعداد البيانات".
لمزيد من المعلومات عن إعداد بياناتك، اطّلِع على وحدتَي المحتوى التاليتَين: العمل مع البيانات الرقمية و العمل مع البيانات الفئوية.
قبل استيراد بياناتك لتدريب AutoML، عليك إكمال الخطوات التالية:
تصنيف بياناتك
يجب أن يتضمّن كل مثال في مجموعة البيانات تصنيفًا.
تنظيف البيانات وتنسيقها
غالبًا ما تكون البيانات في العالم الواقعي فوضوية، لذا من المتوقّع أن تنظّف بياناتك قبل استخدامها. حتى مع استخدام ميزة "الذكاء الاصطناعي التلقائي"، عليك تحديد أفضل الحلول لمعالجة مجموعة البيانات والمشكلة المحدّدتين. قد يتطلّب ذلك بعض الاستكشاف و ربما تنفيذ عمليات متعددة من "تعلُّم الآلة التلقائي" قبل الحصول على أفضل النتائج.
تنفيذ عمليات تحويل العناصر
تتعامل بعض أدوات AutoML مع عمليات تحويل ميزات معيّنة نيابةً عنك. ولكن إذا كانت الأدوات التي تستخدمها لا تتيح تحويل العناصر التي تحتاج إليها أو لا تتيحها بشكل جيد، قد تحتاج إلى إجراء عمليات التحويل مسبقًا.
تطوير النماذج (باستخدام ميزة AutoML بدون استخدام رموز برمجية)
تُجري تكنولوجيات الذكاء الاصطناعي التلقائي العمل نيابةً عنك أثناء عملية التدريب. ومع ذلك، قبل بدء التدريب، عليك ضبط تجربتك. لإعداد عملية تدريب باستخدام "الذكاء الاصطناعي التلقائي"، تحتاج عادةً إلى تحديد الخطوات العالية المستوى التالية:
استيراد بياناتك
لاستيراد بياناتك، حدِّد مصدر البيانات. أثناء عملية الاستيراد، تحدّد أداة AutoML نوع بيانات دلاليًا لكل قيمة بيانات.
تحليل بياناتك
توفّر منتجات AutoML عادةً أدوات لتحليل مجموعة البيانات قبل التدريب وبعده. من أفضل الممارسات استخدام أدوات التحليل هذه لفهم بياناتك والتحقق منها قبل بدء تشغيل AutoML.
تحسين بياناتك
غالبًا ما توفّر أدوات AutoML آليات لمساعدتك في تحسين بياناتك بعد استيرادها وقبل التدريب. في ما يلي بعض المهام التي ننصحك بإكمالها لتحسين بياناتك:
التحقّق من الدلالات: أثناء الاستيراد، تحاول أدوات AutoML تحديد نوع الدلالة الصحيح لكل ميزة، ولكن هذه مجرد تخمينات. يجب التحقّق من الأنواع المحدّدة لجميع العناصر وتغييرها إذا تمّ تعيينها بشكلٍ غير صحيح.
على سبيل المثال، قد تكون لديك رموز بريدية مخزّنة كأرقام في عمود في قاعدة بياناتك. سترصد معظم أنظمة AutoML البيانات على أنّها data رقمية مستمرة. سيكون هذا الإجراء غير صحيح للرمز البريدي، ومن المحتمل أن يريد المستخدم تغيير النوع الدلالي إلى تصنيفي بدلاً من مستمر لعمود الميزة هذا.
عمليات التحويل: تسمح بعض الأدوات للمستخدمين بتخصيص عمليات تحويل البيانات كجزء من عملية التحسين. يكون ذلك ضروريًا في بعض الأحيان عندما تحتوي مجموعة البيانات على ميزات توقّعية يلزم تحويلها أو دمجها بطريقة يصعب على أدوات AutoML تحديدها بدون مساعدة.
على سبيل المثال، لنفترض أنّ لديك مجموعة بيانات عن المساكن تستخدمها للتنبؤ بسعر بيع منزل. لنفترض أنّ هناك سمة تمثّل الوصف لبطاقة بيانات منزل باسم
description
وأردت استخدام هذه البيانات لإنشاء سمة جديدة باسمdescription_length
. توفّر بعض أنظمة AutoML طرقًا لاستخدام عمليات التحويل المخصّصة. في هذا المثال، قد تكون هناك دالةLENGTH
لإنشاء ميزة جديدة لطول الوصف على النحو التالي:LENGTH(description)
.
ضبط مَعلمات تشغيل AutoML
الخطوة الأخيرة قبل تنفيذ تجربة التدريب هي اختيار بعض إعدادات الضبط لإعلام الأداة بالطريقة التي تريدها لتدريب النموذج. على الرغم من أنّ كل أداة من أدوات AutoML تتضمّن مجموعة فريدة من خيارات الضبط، في ما يلي بعض مهام الضبط المهمة التي قد تحتاج إلى إكمالها:
- اختَر نوع مشكلة تعلُّم الآلة التي تخطّط لحلّها. على سبيل المثال، هل يتم حلّ مشكلة تصنيف أو مشكلة انحدار؟
- اختَر العمود الذي يمثّل التصنيف في مجموعة البيانات.
- اختَر مجموعة الميزات التي تريد استخدامها لتدريب النموذج.
- اختَر مجموعة خوارزميات الذكاء الاصطناعي التي تأخذها ميزة "الذكاء الاصطناعي التلقائي" في الاعتبار أثناء البحث عن النماذج.
- اختَر مقياس التقييم الذي تستخدمه ميزة "الذكاء الاصطناعي التلقائي" لاختيار أفضل نموذج.
بعد ضبط تجربة AutoML، تكون مستعدًا لبدء عملية التدريب. قد يستغرق إكمال الدورة التدريبية بعض الوقت (بضع ساعات).
تقييم النموذج
بعد التدريب، يمكنك فحص النتائج باستخدام الأدوات التي يوفّرها منتج AutoML لمساعدتك في ما يلي:
- تقييم ميزاتك من خلال فحص مقاييس أهمية الميزات
- فهم النموذج من خلال فحص البنية والمَعلمات الفائقة المستخدَمة لإنشائه
- تقييم أداء النموذج على مستوى أعلى باستخدام الرسومات البيانية والمقاييس التي تم جمعها أثناء تدريب نموذج الإخراج
الإصدار العلني
على الرغم من أنّ ذلك خارج نطاق هذه الوحدة، يمكن أن تساعدك بعض أنظمة AutoML في اختبار النموذج ونشره.
إعادة تدريب النموذج
قد تحتاج إلى إعادة تدريب النموذج باستخدام بيانات جديدة. قد يحدث ذلك بعد تقييم عملية تدريب AutoML أو بعد استخدام نموذجك في مرحلة الإنتاج لبعض الوقت. وفي كلتا الحالتَين، يمكن أن تساعد أنظمة AutoML في إعادة التدريب أيضًا. ليس من غير المألوف أن تطّلِع مرة أخرى على بياناتك بعد تنفيذ ميزة "التعلم الآلي التلقائي"، ثمّ تعيد تدريبها باستخدام مجموعة بيانات محسّنة.
الخطوات التالية
تهانينا على إكمال هذه الوحدة.
ننصحك باستكشاف وحدات MLCC المختلفة بالوتيرة التي تناسبك وباهتمامك. إذا أردت اتّباع ترتيب مقترَح، نقترح عليك الانتقال إلى الوحدة التالية: إنصاف الذكاء الاصطناعي.