أنظمة تعلّم الآلة في العالم الحقيقي: الأدب

في هذا الدرس، ستتعلّق بحلّ مسألة تعلُّم الآلة الواقعية* والمتعلقة بالأدب الذي يعود إلى القرن الثامن عشر.

مثال من عالم الواقع: أدب من القرن الثامن عشر

  • أراد أستاذ الأدب في القرن الثامن عشر توقع الانتماء السياسي للمؤلفين فقط استنادًا إلى الاستعارة والاقتباس المستخدمة.
الكتب القديمة
  • أراد أستاذ الأدب في القرن الثامن عشر توقع الانتماء السياسي للمؤلفين فقط استنادًا إلى الاستعارة والاقتباس المستخدمة.
  • طوّر فريق من الباحثين مجموعة كبيرة من البيانات المصنّفة باستخدام عدد كبير من المؤلفين، "الجُمل جملة واحدة" وتقسيمها إلى مجموعات من مجموعات الاختبار/الاختبار/الاختبار.
الكتب القديمة
  • أراد أستاذ الأدب في القرن الثامن عشر توقع الانتماء السياسي للمؤلفين فقط استنادًا إلى الاستعارة والاقتباس المستخدمة.
  • طوّر فريق من الباحثين مجموعة كبيرة من البيانات المصنّفة باستخدام عدد كبير من المؤلفين، "الجُمل جملة واحدة" وتقسيمها إلى مجموعات من مجموعات الاختبار/الاختبار/الاختبار.
  • نجح النموذج المدرّب في العمل على بيانات الاختبار على نحو مثالي، ولكن شعر الباحثون بأن النتائج دقيقة بشكل مريب. ما المشكلة التي حدثت؟
الكتب القديمة

لماذا تعتقد أن دقة الاختبار كانت عالية بشكل مريب؟ حاوِل حلّ المشكلة، ثم انقر على الزر "تشغيل" ▶ أدناه لمعرفة ما إذا كانت الإجابة صحيحة أم لا.

  • تقسيم البيانات (أ): وضع الباحثون بعضًا من أمثلة كل مؤلف في مجموعة التدريب، بعضها في مجموعة التحقق، وبعضها في مجموعة اختبار.
قد تكون جميع الأمثلة على مستوى ريتشاردسون في مجموعة التدريب، في حين أن جميع أمثلة Swift&39s قد تكون في مجموعة التحقق.
رسم بياني يوضّح تفاصيل أمثلة المؤلفين في مجموعات التدريب والتحقّق من الصحة والاختبار. ويتم تمثيل الأمثلة من كل مؤلف من ثلاثة مؤلفين في كل مجموعة.
  • تقسيم البيانات (ب): يضع الباحثون جميع أمثلة المؤلفين، في مجموعة واحدة.
رسم بياني يوضّح تفاصيل أمثلة المؤلفين في مجموعات التدريب والتحقّق من الصحة والاختبار. تحتوي مجموعة التدريب على أمثلة فقط من Swift، وتحتوي مجموعة التحقق على أمثلة من Blake فقط، وتحتوي مجموعة الاختبار على أمثلة من Defoe فقط.
  • تقسيم البيانات (أ): وضع الباحثون بعضًا من أمثلة كل مؤلف في مجموعة التدريب، بعضها في مجموعة التحقق، وبعضها في مجموعة اختبار.
  • تقسيم البيانات (ب): يضع الباحثون جميع أمثلة المؤلفين، في مجموعة واحدة.
  • النتائج: كان النموذج الذي تم تدريبه على تقسيم البيانات "أ" أكثر دقة بكثير من النموذج الذي تم تدريبه على تقسيم البيانات "ب".

الْعِبْرَة: يَجِبُ التَّفْكِيرْ بِشَكْلٍ عَنْ قِسْمِةِ الْأَمْثِلَة.

اعرف ما تمثله البيانات.

* استندنا إلى هذه الوحدة بشكلٍ سائد (لإجراء بعض التعديلات على طول الطريق) في "Meaning and التعدين: تأثير الافتراضات الضمنية في عملية استخراج البيانات للإنسانيات&quot، من تأليف Sculley and Pasanek.