فهم المشكلة

لفهم المشكلة، قم بتنفيذ المهام التالية:

  • حدد هدف المنتج الذي تقوم بتطويره أو إعادة بناءه.
  • حدِّد ما إذا كان الهدف هو حل المشكلة على أفضل نحو باستخدام تعلُّم الآلة التنبؤي أو الذكاء الاصطناعي التوليدي أو حلّ غير تعلّم الآلة.
  • تأكّد من توفّر البيانات المطلوبة لتدريب نموذج إذا كنت تستخدم منهج تعلُّم الآلة التنبؤي.

حدد الهدف

ابدأ بذكر هدفك بمصطلحات غير تعلّم الآلة. الهدف هو الإجابة على السؤال، "ما الذي أحاول تحقيقه؟"

يوضح الجدول التالي بوضوح أهداف التطبيقات الافتراضية:

التطبيق الهدف
تطبيق الطقس حساب هطول الأمطار بزيادات ست ساعات لمنطقة جغرافية.
تطبيق الموضة إنشاء مجموعة متنوعة من تصميمات القمصان.
تَطْبِيقْ فِيدْيُوهَاتْ اقتراح فيديوهات مفيدة
تطبيق البريد رصد الرسائل غير المرغوب فيها
تطبيق مالي لخّص المعلومات المالية من مصادر أخبار متعددة.
تطبيق الخريطة حساب وقت الرحلة:
تطبيق الخدمات المصرفية تحديد المعاملات الاحتيالية
تطبيق تناول الطعام يمكنك التعرّف على المأكولات حسب قائمة الطعام في المطعم.
تطبيق تجارة إلكترونية الردّ على المراجعات بإجابات مفيدة

حالة استخدام واضحة لتعلُّم الآلة

ويرى البعض أنّ تعلُّم الآلة هو أداة شاملة يمكن تطبيقها على جميع المشاكل. في الواقع، إنّ تعلُّم الآلة هو أداة متخصصة ومناسبة لمشاكل معيّنة فقط. لن تحتاج إلى تنفيذ حلّ معقد خاص بتعلُّم الآلة إذا كان الحل الأبسط غير المستنِد إلى تعلُّم الآلة.

يمكن تقسيم أنظمة تعلُّم الآلة إلى فئتَين واسعتَين: تعلُّم الآلة القائم على التوقّعات والذكاء الاصطناعي التوليدي. يسرد الجدول التالي خصائصها المحددة:

الإدخال الناتج أسلوب التدريب
تعلُّم الآلة التوقّع نص
صورة
صوت
فيديو
رقمي
يقدّم توقّعًا، مثل تصنيف رسالة إلكترونية على أنّها غير مرغوب فيها أو غير مرغوب فيها، أو تخمين هطول الأمطار غدًا، أو توقُّع سعر السهم. يمكن عادةً التحقق من المخرجات مع الواقع. يتم عادةً استخدام الكثير من البيانات لتدريب نموذج تعلُّم معزز أو خاضع للإشراف أو غير خاضع للإشراف بهدف تنفيذ مهمة محدّدة.
الذكاء الاصطناعي التوليدي نص
صورة
صوت
فيديو
رقمي
تنشئ الخلاصة استنادًا إلى قصد المستخدم، مثل تلخيص مقالة أو إنتاج مقطع صوتي أو فيديو قصير. يتم عادةً استخدام الكثير من البيانات غير المصنَّفة لتدريب نموذج لغوي كبير أو أداة إنشاء صور لملء البيانات غير المتوفّرة. يمكن بعد ذلك استخدام النموذج للمهام التي يمكن تأطيرها كمهام ملء الفراغ، أو يمكن تحسينه من خلال تدريبه على البيانات المصنَّفة لبعض المهام المحددة، مثل التصنيف.

للتأكد من أنّ تعلُّم الآلة هو النهج الصحيح، عليك أولاً التحقّق من أنّه تم تحسين الحلول الحالية غير المستندة إلى تعلُّم الآلة. إذا لم يتم تنفيذ حلّ غير تعلُّم الآلة، حاوِل حل المشكلة يدويًا باستخدام طريقة استدلالية.

إنّ الحل غير المرتبط بتعلُّم الآلة هو المعيار الذي ستستخدمه لتحديد ما إذا كان تعلُّم الآلة هو حالة استخدام جيدة لمشكلتك. ضع في اعتبارك الأسئلة التالية عند مقارنة نهج غير تعلّم الآلة بنهج تعلّم الآلة:

  • الجودة: إلى أي مدى يمكن أن يكون حل تعلُّم الآلة أفضل من وجهة نظرك؟ إذا كنت تعتقد أن حل تعلُّم الآلة قد يكون تحسينًا بسيطًا فقط، فقد يشير ذلك إلى أن الحل الحالي هو الأفضل.

  • التكلفة والصيانة: ما مدى تكلفة حل تعلُّم الآلة على المدى القصير والطويل؟ وفي بعض الحالات، تتكبد تكاليف أكبر بكثير من حيث موارد الحوسبة ووقت تنفيذ تعلُّم الآلة. ضع في اعتبارك الأسئلة التالية:

    • هل يمكن أن يبرّر حل تعلُّم الآلة الزيادة في التكلفة؟ لاحظ أن التحسينات الصغيرة في الأنظمة الكبيرة يمكن أن تبرر بسهولة تكلفة وصيانة تنفيذ حل التعلم الآلي.
    • ما مقدار الصيانة التي سيتطلبها الحل؟ وفي كثير من الحالات، تحتاج تطبيقات تعلُّم تعلُّم الآلة إلى صيانة مخصّصة على المدى الطويل.
    • هل يحتوي منتجك على الموارد اللازمة لدعم التدريب أو توظيف أشخاص لديهم خبرة في تعلُّم الآلة؟

التحقّق من استيعابك

ما سبب أهمية استخدام حل غير تعلُّم الآلة أو استدلال إرشادي قبل تحليل حلّ تعلُّم الآلة؟
ويُعتبر الحل غير المستنِد إلى تعلُّم الآلة هو المعيار لقياس استخدام حلّ تعلُّم الآلة في مقابله.
تساعدك الحلول غير المستنِدة إلى تعلُّم الآلة في تحديد تكلفة استخدام حلّ تعلُّم الآلة.

تعلُّم الآلة والبيانات القائمة على التوقّعات

البيانات هي القوة الدافعة لتعلُّم الآلة التنبؤية. لتقديم توقّعات جيدة، يجب أن تتوفّر بيانات تحتوي على ميزات تعتمد على القدرة التنبؤية. يجب أن تتمتع بياناتك بالخصائص التالية:

  • وفرة: وكلما كانت أمثلة أكثر صلةً وفائدةً في مجموعة البيانات، كان النموذج أفضل.

  • الاتساق والموثوقية: إن وجود بيانات يتم جمعها باستمرار وموثوقًا به سينتج نموذجًا أفضل. على سبيل المثال، سيستفيد نموذج الطقس المستند إلى تعلُّم الآلة من البيانات التي تم جمعها على مدار سنوات عديدة من نفس الأدوات الموثوقة.

  • موثوق به. فهم من أين ستأتي بياناتك. هل ستكون البيانات من مصادر موثوقة يمكنك التحكم فيها، مثل السجلات من منتجك، أم ستكون من مصادر لا لديك الكثير من المعلومات عنها، مثل مخرجات نظام تعلُّم الآلة الآخر؟

  • متوفّرة: تأكد من أن جميع المدخلات متوفرة في وقت التنبؤ بالتنسيق الصحيح. إذا كان من الصعب الحصول على قيم ميزات معينة في وقت التنبؤ، فاحذف هذه الميزات من مجموعات البيانات لديك.

  • صحيح. في مجموعات البيانات الكبيرة، لا مفرّ من أنّ بعض التصنيفات تتضمّن قيمًا غير صحيحة، ولكن إذا كانت هناك نسبة صغيرة من التصنيفات غير صحيحة، سينتج عن النموذج توقّعات سيئة.

  • تمثيلي: يجب أن تكون مجموعات البيانات ممثلة للعالم الحقيقي قدر الإمكان. بعبارة أخرى، يجب أن تعكس مجموعات البيانات بدقة الأحداث و/أو سلوكيات المستخدم و/أو ظواهر العالم الحقيقي الذي يتم تصميمه. يمكن أن يتسبب التدريب على مجموعات البيانات غير التمثيلية في ضعف الأداء عندما يُطلب من النموذج إجراء تنبؤات في العالم الحقيقي.

إذا لم تتمكن من الحصول على البيانات التي تحتاجها بالتنسيق المطلوب، سيقدم نموذجك تنبؤات سيئة.

قوة التوقّع

لكي يقدم أي نموذج تنبؤات جيدة، يجب أن تتمتع الميزات في مجموعة البيانات بقوة تنبؤية. كلما زاد ارتباط الميزة بالتسمية، زاد احتمال التنبؤ بها.

سيكون لبعض الميزات قدرة تنبؤية أكبر من غيرها. على سبيل المثال، في مجموعة بيانات الطقس، تكون الخصائص مثل cloud_coverage وtemperature وdew_point مؤشّرات أفضل لتساقط الأمطار من moon_phase أو day_of_week. بالنسبة إلى مثال تطبيق الفيديو، يمكنك أن تضع افتراضية بأن ميزات مثل video_description وlength وviews قد تكون مؤشرات جيدة عن الفيديوهات التي قد يرغب المستخدم في مشاهدتها.

كن على علم بأن القدرة التنبؤية للميزة يمكن أن تتغير بسبب تغير السياق أو النطاق. على سبيل المثال، في تطبيق الفيديو، قد تكون ميزة مثل upload_date بشكل عام مرتبطة بالتصنيف. في المقابل، في النطاق الفرعي لفيديوهات الألعاب، قد نجد أنّ السمة upload_date مرتبطة ارتباطًا وثيقًا بالتصنيف.

يمكن أن يستغرق تحديد الميزات ذات القدرة التنبؤية عملية تستغرق وقتًا طويلاً. يمكنك استكشاف القوة التنبؤية للميزة يدويًا عن طريق إزالتها وإضافتها أثناء تدريب أي نموذج. يمكنك أتمتة العثور على القدرة التنبؤية لميزة ما باستخدام خوارزميات مثل ارتباط بيرسون والمعلومات المتبادلة المعدَّلة (AMI) وقيمة Shapley، التي توفر تقييمًا رقميًا لتحليل قوة التنبؤ بالميزة بدون الحاجة إلى

التحقّق من استيعابك

عند تحليل مجموعات البيانات، ما هي السمات الرئيسية الثلاث التي يجب البحث عنها؟
تمثل العالم الحقيقي.
تحتوي على قيم صحيحة.
لدى الميزات قوة تنبؤية للتصنيف.
حجم صغير بما يكفي للتحميل على جهاز محلي.
تم جمعها من مجموعة متنوعة من المصادر غير المتوقعة.

لمزيد من الإرشادات حول تحليل وإعداد مجموعات البيانات، راجع إعداد البيانات وهندسة الميزات للتعلم الآلي.

التوقعات مقابل الإجراءات

فليس هناك أي قيمة في التنبؤ بشيء ما إذا لم تتمكن من تحويل التنبؤ إلى إجراء يساعد المستخدمين. أي، يجب أن يتخذ منتجك إجراءً من ناتج النموذج.

على سبيل المثال، النموذج الذي يتنبأ بما إذا كان المستخدم سيجد فيديو مفيدًا يجب أن يدخل في تطبيق يقترح مقاطع فيديو مفيدة. نموذج يتنبأ بما إذا كانت هطول المطر يجب أن يغذي تطبيق الطقس.

التحقّق من استيعابك

استنادًا إلى السيناريو التالي، حدِّد ما إذا كان استخدام تعلُّم الآلة هو أفضل نهج لحلّ المشكلة.

يتحمّل فريق هندسي في مؤسسة كبيرة مسؤولية إدارة المكالمات الهاتفية الواردة.

الهدف: يتم إعلام المتصلين بالمدة التي يجب انتظارها مؤقتًا حسب حجم المكالمة الحالية.

وليس لديهم أي حل، لكنهم يعتقدون أنّ الطريقة الإرشادية ستكون قسمة العدد الحالي للعملاء الخاضعين للانتظار على عدد الموظفين الذين يجيبون عن المكالمات، ثم ضرب الناتج في 10 دقائق. ومع ذلك، يعلم الفريق أن بعض العملاء قد تم حل مشاكلهم خلال دقيقتين، في حين يمكن أن يستغرق البعض الآخر مدة تصل إلى 45 دقيقة أو أكثر.

وربما لن يحصل عليه مساعدته الإرشادية على عدد دقيق بما فيه الكفاية. ويمكنهم إنشاء مجموعة بيانات بالأعمدة التالية: number_of_callcenter_phones وuser_issue وtime_to_resolve وcall_time وtime_on_hold.

استخدام تعلُّم الآلة: الفريق الهندسي لديه هدف محدد بوضوح. ولن يكون منهجه الاستكشافي مناسبًا لحالة الاستخدام الخاصة به. يبدو أنّ مجموعة البيانات تتضمّن ميزات توقّعية للتصنيف time_on_hold.
لا تستخدِم تعلُّم الآلة. على الرغم من أنّ أهدافها المحدّدة بوضوح، إلا أنّ عليها أولاً تطبيق وتحسين أي حل لا يعتمد على تعلُّم الآلة. ولا يبدو أيضًا أنّ مجموعة البيانات الخاصة به تحتوي على ميزات كافية بإمكانات توقّعية.