الاسترداد

لنفترض أنّ لديك نموذج تضمين. بالنظر إلى المستخدم، كيف لتحديد الأصناف التي يجب اقتراحها؟

وفي وقت العرض، بالنسبة إلى طلب بحث، تبدأ بتنفيذ أحد الإجراءات التالية:

  • بالنسبة لنموذج تحليل المصفوفة إلى عوامل، يكون تضمين طلب البحث (أو المستخدم) معروفًا بشكل ثابت، ويمكن للنظام ببساطة البحث عنها من مصفوفة تضمين المستخدمين.
  • بالنسبة إلى نموذج DNN، يحسب النظام تضمين طلب البحث \(\psi(x)\) في وقت العرض عن طريق تشغيل الشبكة على الخط المتجه للسمة \(x\).

بعد الانتهاء من تضمين طلب البحث \(q\)، ابحث عن تضمينات العناصر. \(V_j\) على مقربة من \(q\) في مساحة التضمين. وهذه هي مشكلة الجار الأقرب. على سبيل المثال، يمكنك إرجاع أعلى k العناصر وفقًا لدرجة التشابه \(s(q, V_j)\).

صورة طيف ثنائي الأبعاد تعرض عدة أفلام ومستخدمين مرتبة
من أفلام الأطفال إلى أفلام الكبار،
والفنون الرائجة هناك مستخدم واحد
مميزين بالإضافة إلى فيلمين قريبين.

ويمكنك استخدام منهج مشابه في الاقتراحات ذات الصلة. على سبيل المثال: عندما يشاهد المستخدم مقطع فيديو على YouTube، يمكن للنظام أولاً البحث عن تضمين هذا العنصر، ثم البحث عن تضمينات لعناصر أخرى \(V_j\) القريبة من مساحة التضمين

استرداد البيانات على نطاق واسع

لحساب معامل الجار الأقرب في مساحة التضمين، يطبق النظام يمكنها تسجيل نتائج شاملة لكل مرشح محتمل. النتيجة مُجهدة قد يكون مكلفًا للشركات الكبيرة جدًا، ولكن يمكنك استخدام أي من الاستراتيجيات التالية لجعلها أكثر كفاءة:

  • إذا كان طلب البحث المضمّن معروفًا بشكل ثابت، يمكن للنظام تنفيذ نتائج شاملة بلا اتصال بالإنترنت، وإجراء حوسبة مسبقة وتخزين قائمة أفضل المرشحين لكل طلب بحث. هذه ممارسة شائعة توصية البند ذي الصلة.
  • استخدِم بيانات الجيران الأقرب.