عمليات التضمين: الترجمة إلى مساحة منخفضة الأبعاد

يمكنك حلّ المشاكل الأساسية المتعلّقة بإدخالات ضئيلة من خلال ربط بياناتك العالية الأبعاد بمساحة أصغر.

كما رأيت في التمارين السينمائية في وقت سابق، توفر لك مساحة صغيرة متعددة الأبعاد حرية تجميع العناصر المتشابهة دلاليًا معًا والاحتفاظ بعناصر مختلفة عن بعضها البعض. الموضع (المسافة والاتجاه) في المساحة المتّجه يمكن أن يشفّر الدلالات في تضمين جيد. على سبيل المثال، تُظهر الرسومات البيانية التالية للتضمينات الحقيقية العلاقات الهندسية التي تلتقط العلاقات الدلالية، مثل العلاقة بين البلد ورأس المال:

ثلاثة أمثلة على تضمينات الكلمات التي تمثّل العلاقات الهندسية: الجنس (الرجل/المرأة والملك/الملكة) وزمن الأفعال (مشي/المشي والسباحة) والعاصمة (تركيا/أنقرة وفيتنام/هانوي)

الشكل 4: يمكن أن تؤدي عمليات التضمين إلى إنشاء تشابهات ملحوظة.

ويتيح هذا النوع من المساحات المفيدة لنظام تعلُّم الآلة فرص رصد الأنماط التي قد تساعد في تنفيذ مهمة التعلُّم.

تقليص الشبكة

علمًا أننا نريد سمات كافية لترميز العلاقات الدلالية المنسّقة، فإننا نريد أيضًا مساحة تضمين صغيرة كافية تتيح لنا تدريب نظامنا بسرعة أكبر. وقد يتم تضمين العنصر المضمّن في ترتيب مئات السمات. ومن المرجح أن يكون حجم هذا الطلب بعدة ترتيبات أقل من حجم مفرداتك لتنفيذ مهمة بلغة طبيعية.