فهم المشكلة

لفهم المشكلة، عليك تنفيذ المهام التالية:

  • حدِّد هدف المنتج الذي تُطوّره أو تُعيد هيكلته.
  • حدِّد ما إذا كان من الأفضل حلّ الهدف باستخدام الذكاء الاصطناعي التوقّعي أو الذكاء الاصطناعي التوليدي أو حلّ غير مستند إلى الذكاء الاصطناعي.
  • تأكَّد من توفّر البيانات المطلوبة لتدريب نموذج إذا كنت تستخدِم أسلوبًا تعلُّم آلة تنبؤيًا.

تحديد الهدف

ابدأ بتحديد هدفك بمصطلحات غير متعلّقة بالذكاء الاصطناعي. الهدف هو الإجابة عن السؤال "ما الذي أحاول تحقيقه؟"

يوضّح الجدول التالي بوضوح أهداف التطبيقات النموذجية:

التطبيق الهدف
تطبيق الطقس احتساب كميات الأمطار المتساقطة على فترات ست ساعات في منطقة جغرافية
تطبيق أزياء إنشاء مجموعة متنوعة من تصاميم القمصان
تطبيق فيديو اقتراح فيديوهات مفيدة
تطبيق البريد رصد المحتوى غير المرغوب فيه
تطبيق مالي تلخيص المعلومات المالية من مصادر أخبار متعددة
تطبيق الخريطة احتساب مدة الرحلة
تطبيق الخدمات المصرفية تحديد المعاملات الاحتيالية
تطبيق تناول الطعام تحديد نوع المأكولات من خلال قائمة الطعام في المطعم
تطبيق للتجارة الإلكترونية الردّ على المراجعات من خلال تقديم إجابات مفيدة

حالة استخدام واضحة لاستخدام تعلُّم الآلة

يرى البعض أنّ الذكاء الاصطناعي هو أداة عالمية يمكن تطبيقها على جميع المشاكل. في الواقع، الذكاء الاصطناعي هو أداة متخصّصة مناسبة فقط لمشاكل معيّنة. إذا كان لديك حلّ أبسط غير مستند إلى تعلُّم الآلة، لن تحتاج إلى تنفيذ حلّ معقّد مستند إلى تعلُّم الآلة.

يمكن تقسيم أنظمة تعلُّم الآلة إلى فئتين عامتَين: تعلُّم الآلة التوقّعي و الذكاء الاصطناعي التوليدي. يسرد الجدول التالي الخصائص المحدّدة لكل منها:

الإدخال النتيجة أسلوب التدريب
تعلُّم الآلة التوقّعي نص
صورة
صوت
فيديو
رقمي
إجراء توقّعات، على سبيل المثال، تصنيف رسالة إلكترونية على أنّها غير مرغوب فيها أو مرغوب فيها، أو توقّع كمية الأمطار التي ستتساقط غدًا، أو توقّع سعر سهم يمكن عادةً التحقّق من صحة النتائج بالرجوع إلى الواقع. يستخدم هذا الأسلوب عادةً الكثير من البيانات لتدريب نموذج تعلُّم مراقَب أو غير مراقَب أو تعلُّم تحفيزي لتنفيذ مهمة معيّنة.
الذكاء الاصطناعي التوليدي نص
صورة
صوت
فيديو
رقمي
إنشاء مخرجات استنادًا إلى نية المستخدم، على سبيل المثال، تلخيص مقالة أو إنشاء مقطع صوتي أو فيديو قصير يستخدم هذا الأسلوب عادةً الكثير من البيانات غير المصنَّفة لتدريب نموذج لغوي كبير أو أداة إنشاء صور من أجل ملء البيانات غير المتوفّرة. يمكن بعد ذلك استخدام النموذج للمهام التي يمكن صياغتها كمهام ملء الفراغات، أو يمكن ضبطه من خلال تدريبه على بيانات مصنّفة لبعض المهام المحدّدة، مثل التصنيف.

للتأكّد من أنّ الذكاء الاصطناعي هو النهج المناسب، عليك أولاً التأكّد من تحسين الحلول الحالية التي لا تعتمد على الذكاء الاصطناعي. إذا لم يكن لديك حلّ غير مستند إلى الذكاء الاصطناعي، حاوِل حلّ المشكلة يدويًا باستخدام إحصاءات تقريبية.

يُعدّ الحلّ غير المستنِد إلى تعلُّم الآلة هو المقياس الذي ستستخدمه لتحديد ما إذا كان تعلُّم الآلة هو حالة استخدام جيدة لمشكلتك. ضع في اعتبارك الأسئلة التالية عند مقارنة النهج غير المستنِد إلى الذكاء الاصطناعي بالنهج المستنِد إليه:

  • الجودة: ما مدى تحسين حلّ الذكاء الاصطناعي في رأيك؟ إذا كان برأيك أنّ حلّ تعلُّم الآلة قد يحقّق تحسينًا بسيطًا فقط، قد يشير ذلك إلى أنّ الحلّ الحالي هو الأفضل.

  • التكلفة والصيانة: ما هي تكلفة حلّ الذكاء الاصطناعي على الصعيدين القصير والطويل المدى؟ في بعض الحالات، ترتفع التكلفة بشكل كبير من حيث موارد الحوسبة والوقت اللازم لتنفيذ الذكاء الاصطناعي. ضع في اعتبارك الأسئلة التالية:

    • هل يمكن أن يبرر حلّ تعلُّم الآلة الزيادة في التكلفة؟ يُرجى العِلم أنّه يمكن بسهولة تبرير تكلفة تنفيذ حلّ تعلُّم الآلة وجدول صيانته من خلال التحسينات الصغيرة في الأنظمة الكبيرة.
    • ما هو مستوى الصيانة المطلوب للحلّ؟ في كثير من الحالات، تحتاج عمليات تنفيذ الذكاء الاصطناعي إلى صيانة مخصّصة طويلة الأمد.
    • هل يتوفّر في منتجك موارد لدعم تدريب أو تعيين أشخاص لديهم خبرة في الذكاء الاصطناعي؟

التحقّق من الفهم

ما أهمية توفُّر حلّ أو طريقة استقرائية غير مستندة إلى تعلُّم الآلة قبل تحليل حلّ مستند إلى تعلُّم الآلة؟
يُعدّ الحلّ غير المستنِد إلى تعلُّم الآلة هو المقياس الذي يتم قياس حلّ تعلُّم الآلة وفقًا له.
تساعدك الحلول غير المستندة إلى تعلُّم الآلة في تحديد تكلفة حلّ مستنِد إلى تعلُّم الآلة.

الذكاء الاصطناعي التوقّعي والبيانات

البيانات هي القوة الدافعة لتكنولوجيا تعلُّم الآلة التوقّعي. لإجراء توقّعات جيدة، تحتاج إلى بيانات تحتوي على سمات ذات قدرة توقّعية جيدة. يجب أن تتسم بياناتك بالسمات التالية:

  • متوفرة بكثرة: كلما زاد عدد الأمثلة ذات الصلة والمفيدة في مجموعة البيانات، كان النموذج أفضل.

  • متّسق وموثوق: سيؤدي تجميع البيانات بشكلٍ منتظم وموثوق إلى إنشاء نموذج أفضل. على سبيل المثال، سيستفيد ملف تعريف الطقس استنادًا إلى الذكاء الاصطناعي من البيانات التي تم جمعها على مدار سنوات عديدة من الأدوات الموثوقة نفسها.

  • موثوق: فهم مصدر بياناتك هل ستكون البيانات من مصادر موثوق بها تتحكّم فيها، مثل السجلات من منتجك، أم ستكون من مصادر لا تتوفّر لديك إحصاءات كثيرة عنها، مثل النتائج الواردة من نظام تعلُّم آلي آخر؟

  • متاحة: تأكَّد من توفّر جميع المدخلات في وقت التوقّعات بالتنسيق الصحيح. إذا كان من الصعب الحصول على قيم معيّنة للسمات في وقت التنبؤ، يمكنك حذف هذه السمات من مجموعات البيانات.

  • صحيح. في مجموعات البيانات الكبيرة، من المحتمَل أن تحتوي بعض التصنيفات على قيم غير صحيحة، ولكن إذا كانت أكثر من نسبة مئوية صغيرة من التصنيفات غير صحيحة، سيؤدي النموذج إلى تقديم توقّعات سيئة.

  • الممثّل: يجب أن تمثّل مجموعات البيانات الواقع بأكبر قدر ممكن. بعبارة أخرى، يجب أن تعكس مجموعات البيانات بدقة الأحداث و/أو سلوكيات المستخدمين و/أو ظواهر العالم الحقيقي التي يتم وضع نماذج لها. يمكن أن يؤدي التدريب على مجموعات بيانات غير تمثيلية إلى ضعف الأداء عندما يُطلب من النموذج إجراء توقّعات في العالم الواقعي.

إذا لم تتمكّن من الحصول على البيانات التي تحتاجها بالتنسيق المطلوب، سيقدّم نموذجك توقّعات سيئة.

إمكانيات التوقّع

لكي يقدّم النموذج توقّعات جيدة، يجب أن تمتلك السمات في مجموعة البيانات قدرة تنبؤية. وكلما زادت الصلة بين السمة والعلامة، زاد احتمال التوقّع.

ستكون بعض الميزات أكثر قدرة على التنبؤ من غيرها. على سبيل المثال، في مجموعة بيانات الطقس، تكون السمات مثل cloud_coverage وtemperature و dew_point مؤشرات أفضل لتساقط الأمطار من moon_phase أو day_of_week. في مثال تطبيق الفيديو، يمكنك افتراض أنّ الميزات مثل video_description وlength وviews قد تكون مؤشرات جيدة لتحديد الفيديوهات التي قد يرغب المستخدم في مشاهدتها.

قد يستغرق تحديد الميزات التي تتضمّن قدرة تنبؤية وقتًا طويلاً. يمكنك استكشاف قدرة الميزة على التوقّع يدويًا من خلال إزالتها و إضافتها أثناء تدريب نموذج. يمكنك إجراء عملية العثور على القدرة التنبؤية للسمة تلقائيًا باستخدام خوارزميات مثل معامل الارتباط بين متغيرَين (Pearson correlation) ومعلومات متبادلة معدَّلة (AMI) وقيمة Shapley، التي تقدّم تقييمًا رقميًا لتحليل القدرة التنبؤية لسمة معيّنة.

التحقّق من الفهم

عند تحليل مجموعات البيانات، ما هي السمات الثلاث الرئيسية التي يجب البحث عنها؟
يحتوي على قيم صحيحة.
صغيرة بما يكفي لتحميلها على جهاز محلي
تمثيل العالم الحقيقي
يتم جمعها من مجموعة متنوعة من المصادر غير المتوقّعة.
تتمتع الميزات بقدرة توقّعية للتصنيف.

لمزيد من الإرشادات حول تحليل مجموعات البيانات وإعدادها، اطّلِع على مقالة إعداد البيانات وهندسة الميزات لتكنولوجيات تعلُّم الآلة.

التوقّعات في مقابل الإجراءات

لا فائدة من توقّع حدوث أمر ما إذا لم تتمكّن من تحويل التوقّع إلى إجراء يساعد المستخدمين. وهذا يعني أنّ منتجك يجب أن يتّخذ إجراءً بناءً على ناتج النموذج.

على سبيل المثال، يجب أن يقدّم نموذج يتنبّأ بما إذا كان المستخدم سيجد الفيديو مفيدًا إلى تطبيق يقترح فيديوهات مفيدة. يجب أن يقدّم النموذج الذي يتوقّع سقوط الأمطار معلومات إلى تطبيق الطقس.

التحقّق من الفهم

استنادًا إلى السيناريو التالي، حدِّد ما إذا كان استخدام الذكاء الاصطناعي هو الأسلوب الأنسب لحلّ المشكلة.

يتولّى فريق هندسي في مؤسسة كبيرة إدارة المكالمات الهاتفية الواردة.

الهدف: إعلام المتصلين بالمدة التي سينتظرونها في وضع الانتظار نظرًا لحجم المكالمات الحالي

لا يتوفّر لديهم أي حلّ، ولكنّهم يعتقدون أنّه يمكنهم استخدام منهج استقرائي يقترح ناتج القسمة بين العدد الحالي للعملاء في الانتظار وعدد الموظفين الذين يردون المكالمات، ثم ضرب الناتج في 10 دقائق. ومع ذلك، يعلم الفريق أنّه يمكن حلّ مشاكل بعض العملاء في دقيقتين، في حين أنّ حلّ مشاكل آخرين قد يستغرق 45 دقيقة أو أكثر.

من المحتمل ألا تؤدي الطريقة الاستكشافية إلى الحصول على رقم دقيق بما يكفي. ويمكنهم إنشاء مجموعة بيانات تتضمّن الأعمدة التالية: number_of_callcenter_phones وuser_issue time_to_resolve وcall_time time_on_hold.

عدم استخدام تكنولوجيات تعلُّم الآلة على الرغم من أنّها تمتلك هدفًا محدّدًا بوضوح، يجب أن تطبّق حلًا غير مستند إلى الذكاء الاصطناعي (ML) وتُحسّنه أولاً. بالإضافة إلى ذلك، يبدو أنّ مجموعة البيانات لا تحتوي على ميزات كافية ذات قدرة تنبؤية.
استخدام تكنولوجيات تعلُّم الآلة لدى الفريق الهندسي هدف محدّد بوضوح. لن تكون استراتيجية البحث heuristic التي يستخدمونها جيدة بما يكفي لحالة الاستخدام الخاصة بهم. يبدو أنّ مجموعة البيانات تتضمّن ميزات توقّعية للتصنيف time_on_hold.