فهم المشكلة

لفهم المشكلة، عليك تنفيذ المهام التالية:

  • حدِّد هدف المنتج الذي تُطوّره أو تُعيد هيكلته.
  • حدِّد ما إذا كان من الأفضل حلّ الهدف باستخدام الذكاء الاصطناعي التوقّعي أو الذكاء الاصطناعي التوليدي أو حلّ غير مستند إلى الذكاء الاصطناعي.
  • تأكَّد من توفّر البيانات المطلوبة لتدريب نموذج إذا كنت تستخدِم أسلوبًا تعلُّم آلة تنبؤيًا.

تحديد الهدف

ابدأ بتحديد هدفك بمصطلحات غير متعلّقة بالذكاء الاصطناعي. الهدف هو الإجابة عن السؤال "ما الذي أحاول تحقيقه؟"

يوضّح الجدول التالي بوضوح أهداف التطبيقات النموذجية:

التطبيق الهدف
تطبيق الطقس احتساب كميات الأمطار المتساقطة على فترات ست ساعات في منطقة جغرافية
تطبيق أزياء إنشاء مجموعة متنوعة من تصاميم القمصان
تطبيق فيديو اقتراح فيديوهات مفيدة
تطبيق البريد رصد المحتوى غير المرغوب فيه
تطبيق مالي تلخيص المعلومات المالية من مصادر أخبار متعددة
تطبيق الخريطة احتساب مدة الرحلة
تطبيق مصرفي تحديد المعاملات الاحتيالية
تطبيق تناول الطعام تحديد نوع المأكولات من خلال قائمة الطعام في المطعم
تطبيق للتجارة الإلكترونية الردّ على المراجعات من خلال تقديم إجابات مفيدة

حالة استخدام واضحة لاستخدام تعلُّم الآلة

يرى البعض أنّ الذكاء الاصطناعي هو أداة عالمية يمكن تطبيقها على جميع المشاكل. في الواقع، الذكاء الاصطناعي هو أداة متخصّصة مناسبة فقط لمشاكل معيّنة. لا تريد تنفيذ حلّ معقّد قائم على تعلُّم الآلة عندما يكون حلّ أبسط غير قائم على تعلُّم الآلة مناسبًا.

يمكن تقسيم أنظمة تعلُّم الآلة إلى فئتين عامتَين: تعلُّم الآلة التوقّعي و الذكاء الاصطناعي التوليدي. يسرد الجدول التالي الخصائص المحدّدة لها:

الإدخال النتيجة أسلوب التدريب
تعلُّم الآلة التنبؤي نص
صورة
صوت
فيديو
رقمي
إجراء توقّعات، على سبيل المثال، تصنيف رسالة إلكترونية على أنّها غير مرغوب فيها أو مرغوب فيها، أو توقّع كمية الأمطار التي ستتساقط غدًا، أو توقّع سعر سهم يمكن عادةً التحقّق من صحة النتائج بالرجوع إلى الواقع. يستخدم هذا الأسلوب عادةً الكثير من البيانات لتدريب نموذج تعلُّم مراقَب أو غير مراقَب أو تعلُّم تحفيزي لتنفيذ مهمة معيّنة.
الذكاء الاصطناعي التوليدي نص
صورة
صوت
فيديو
رقمي
إنشاء مخرجات استنادًا إلى نية المستخدم، على سبيل المثال، تلخيص مقالة أو إنشاء مقطع صوتي أو فيديو قصير يستخدم هذا النوع عادةً الكثير من البيانات غير المصنَّفة لتدريب نموذج لغوي كبير أو أداة إنشاء صور لملء البيانات غير المتوفّرة. يمكن بعد ذلك استخدام النموذج للمهام التي يمكن تصنيفها على أنّها مهام ملء الفراغات، أو يمكن ضبطه من خلال تدريبه على بيانات مصنّفة لبعض المهام المحدّدة، مثل التصنيف.

للتأكّد من أنّ الذكاء الاصطناعي هو النهج المناسب، عليك أولاً التأكّد من تحسين الحلول الحالية التي لا تعتمد على الذكاء الاصطناعي. إذا لم يكن لديك حلّ غير مستند إلى الذكاء الاصطناعي، حاوِل حلّ المشكلة يدويًا باستخدام إحصاءات تقريبية.

يُعدّ الحلّ غير المستنِد إلى تعلُّم الآلة هو المقياس الذي ستستخدمه لتحديد ما إذا كان تعلُّم الآلة هو حالة استخدام جيدة لمشكلتك. ضع في اعتبارك الأسئلة التالية عند مقارنة النهج غير المستنِد إلى الذكاء الاصطناعي بالنهج المستنِد إليه:

  • الجودة: ما مدى تحسين حلّ الذكاء الاصطناعي في رأيك؟ إذا كان برأيك أنّ حلّ تعلُّم الآلة قد يحقّق تحسينًا بسيطًا فقط، قد يشير ذلك إلى أنّ الحلّ الحالي هو الأفضل.

  • التكلفة والصيانة: ما هي تكلفة حلّ الذكاء الاصطناعي على الصعيدين القصير والطويل المدى؟ في بعض الحالات، ترتفع التكلفة بشكل كبير من حيث موارد الحوسبة والوقت اللازم لتنفيذ الذكاء الاصطناعي. فكِّر في الأسئلة التالية:

    • هل يمكن أن يبرر حلّ تعلُّم الآلة الزيادة في التكلفة؟ تجدر الإشارة إلى أنّه يمكن بسهولة تبرير تكلفة تنفيذ حلّ تعلُّم الآلة و صيانته من خلال التحسينات الصغيرة في الأنظمة الكبيرة.
    • ما هو مستوى الصيانة المطلوب للحلّ؟ في كثير من الحالات، تحتاج عمليات تنفيذ الذكاء الاصطناعي إلى صيانة مخصّصة طويلة الأمد.
    • هل يتوفّر في منتجك موارد لدعم تدريب أو تعيين أشخاص لديهم خبرة في الذكاء الاصطناعي؟

التحقّق من الفهم

ما أهمية توفُّر حلّ أو طريقة استقرائية غير مستندة إلى تعلُّم الآلة قبل تحليل حلّ مستند إلى تعلُّم الآلة؟
يُعدّ الحلّ غير المستنِد إلى تعلُّم الآلة هو مقياس الأداء الذي يتم قياس أداء الحلّ المستنِد إلى تعلُّم الآلة وفقًا له.
تساعدك الحلول غير المستندة إلى تعلُّم الآلة في تحديد تكلفة حلّ مستنِد إلى تعلُّم الآلة.

الذكاء الاصطناعي التوقّعي والبيانات

البيانات هي القوة الدافعة لتكنولوجيا تعلُّم الآلة التوقّعي. لإجراء توقّعات جيدة، تحتاج إلى بيانات تحتوي على سمات ذات قدرة توقّعية. يجب أن تتسم بياناتك بالسمات التالية:

  • متوفرة بكثرة: كلما زاد عدد الأمثلة الملائمة والمفيدة في مجموعة البيانات، كان النموذج أفضل.

  • متّسق وموثوق: سيؤدي تجميع البيانات باستمرار وبطريقة موثوقة إلى إنشاء نموذج أفضل. على سبيل المثال، سيستفيد ملف ناتج عن التعلم الآلي لتوقع الطقس من البيانات التي تم جمعها على مدار سنوات عديدة من الأدوات الموثوقة نفسها.

  • موثوق: فهم مصدر بياناتك هل ستكون البيانات من مصادر موثوق بها يمكنك التحكّم فيها، مثل السجلات من منتجك، أم ستكون من مصادر لا تتوفّر لديك إحصاءات كثيرة عنها، مثل النتائج الواردة من نظام تعلُّم آلي آخر؟

  • متاحة: تأكَّد من توفّر جميع المدخلات في وقت التوقّعات بالتنسيق الصحيح. إذا كان من الصعب الحصول على قيم معيّنة للسمات في وقت التنبؤ، يمكنك حذف هذه السمات من مجموعات البيانات.

  • صحيح. في مجموعات البيانات الكبيرة، من المحتمَل أن تحتوي بعض التصنيفات على قيم غير صحيحة، ولكن إذا كانت أكثر من نسبة مئوية صغيرة من التصنيفات غير صحيحة، سيؤدي النموذج إلى تقديم توقّعات سيئة.

  • الممثّل: يجب أن تمثّل مجموعات البيانات الواقع بأكبر قدر ممكن. بعبارة أخرى، يجب أن تعكس مجموعات البيانات بدقة الأحداث و/أو سلوكيات المستخدمين و/أو ظواهر العالم الحقيقي التي يتم وضع نماذج لها. يمكن أن يؤدي التدريب على مجموعات بيانات غير تمثيلية إلى ضعف الأداء عندما يُطلب من النموذج إجراء توقّعات في العالم الواقعي.

إذا لم تتمكّن من الحصول على البيانات التي تحتاجها بالتنسيق المطلوب، سيقدّم نموذجك توقّعات سيئة.

قدرة التوقّع

لكي يقدّم النموذج توقّعات جيدة، يجب أن تمتلك السمات في مجموعة البيانات قدرة تنبؤية. وكلما زادت الصلة بين السمة والعلامة، زاد احتمال التوقّع.

وستكون بعض الميزات أكثر قدرة على التنبؤ من غيرها. على سبيل المثال، في مجموعة بيانات الطقس، ستكون ميزات مثل cloud_coverage وtemperature و dew_point مؤشرات أفضل لتساقط الأمطار من moon_phase أو day_of_week. في مثال تطبيق الفيديو، يمكنك افتراض أنّ الميزات مثل video_description وlength وviews قد تكون مؤشرات جيدة لتحديد الفيديوهات التي قد يرغب المستخدم في مشاهدتها.

قد يستغرق تحديد الميزات التي تتضمّن قدرة تنبؤية وقتًا طويلاً. يمكنك استكشاف قدرة الميزة على التوقّع يدويًا من خلال إزالتها وإضافتها أثناء تدريب نموذج. يمكنك إجراء عملية البحث عن قدرة التنبؤ لإحدى الميزات بشكل آلي باستخدام خوارزميات مثل معامل الارتباط بين متغيرَين (Pearson correlation)، معلومات متبادلة معدَّلة (AMI)، وقيمة Shapley، التي تقدّم تقييمًا رقميًا لتحليل قدرة التنبؤ لإحدى الميزات.

التحقّق من الفهم

عند تحليل مجموعات البيانات، ما هي السمات الثلاث الرئيسية التي يجب البحث عنها؟
تمثيل العالم الحقيقي
يحتوي على قيم صحيحة.
تتمتع الميزات بقدرة تنبؤية للتصنيف.
صغيرة بما يكفي لتحميلها على جهاز محلي
يتم جمعها من مجموعة متنوعة من المصادر غير المتوقّعة.

لمزيد من الإرشادات حول تحليل مجموعات البيانات وإعدادها، اطّلِع على مقالة إعداد البيانات وهندسة الميزات لتكنولوجيات تعلُّم الآلة.

التوقّعات في مقابل الإجراءات

لا فائدة من توقّع حدوث أمر ما إذا لم تتمكّن من تحويل التوقّع إلى إجراء يساعد المستخدمين. وهذا يعني أنّ منتجك يجب أن يتّخذ إجراءً بناءً على مخرجات النموذج.

على سبيل المثال، يجب أن يقدّم نموذج يتنبّأ بما إذا كان المستخدم سيجد فيديو مفيدًا إلى تطبيق يقترح فيديوهات مفيدة. يجب أن يُغذّي النموذج الذي يتوقّع سواء كان سيسقط المطر تطبيق الطقس.

التحقّق من الفهم

استنادًا إلى السيناريو التالي، حدِّد ما إذا كان استخدام الذكاء الاصطناعي هو الأسلوب الأنسب لحلّ المشكلة.

يتولّى فريق هندسي في مؤسسة كبيرة إدارة المكالمات الهاتفية الواردة.

الهدف: إعلام المتصلين بالمدة التي سينتظرونها في وضع الانتظار نظرًا لحجم المكالمات الحالي

لا يتوفّر لدى الفريق أيّ حلّ، ولكنّه يعتقد أنّه يمكن استخدام طريقة تقريبية لتحديد عدد المكالمات التي تنتظر الردّ مقسومًا على عدد الموظفين الذين يردون المكالمات، ثم ضرب الناتج في 10 دقائق. ومع ذلك، يعلم الفريق أنّه يتم حلّ مشاكل بعض العملاء في دقيقتين، في حين أنّ حلّ مشاكل آخرين قد يستغرق 45 دقيقة أو أكثر.

من المرجّح ألا تؤدي الطريقة الاستكشافية إلى الحصول على رقم دقيق بما يكفي. ويمكنهم إنشاء مجموعة بيانات تتضمّن الأعمدة التالية: number_of_callcenter_phones وuser_issue time_to_resolve وcall_time time_on_hold.

استخدام تكنولوجيات تعلُّم الآلة لدى الفريق الهندسي هدف محدّد بوضوح. لن تكون المنهجية التي يستخدمونها جيدة بما يكفي لحالة الاستخدام. يبدو أنّ مجموعة البيانات تتضمّن ميزات توقّعية للتصنيف time_on_hold.
عدم استخدام تعلُّم الآلة على الرغم من أنّها تمتلك هدفًا محدّدًا بوضوح، يجب أن تطبّق حلًا غير مستند إلى الذكاء الاصطناعي (ML) وتُحسّنه أولاً. بالإضافة إلى ذلك، يبدو أنّ مجموعة البيانات لا تحتوي على ميزات كافية تتيح وضع التوقّعات.