تستخدم التصفية المستندة إلى المحتوى ميزات العناصر لاقتراح عناصر أخرى ما يشابه ما يعجب المستخدم، بناءً على إجراءاته السابقة أو عمليات الملاحظات.
لتوضيح التصفية القائمة على المحتوى، يجب أن نصمم بعض الميزات يدويًا لمتجر Google Play. يوضح الشكل التالي مصفوفة خصائص حيث يمثل كل صف تطبيقًا ويمثل كل عمود ميزة. الميزات يمكن أن تتضمن فئات (مثل التعليم، غير الرسمية، الصحة)، استخدم للتطبيق، وغير ذلك الكثير. ولتبسيط، لنفترض أنّ مصفوفة الخصائص هذه تكون ثنائية: إذا كانت القيمة غير صفرية، فهذا يعني أن التطبيق يحتوي على هذه الميزة.
ويمكنك أيضًا تمثيل المستخدم في مساحة الميزات نفسها. قد تتضمن بعض البيانات المتعلقة بالمستخدم الميزات التي يمكن أن يوفرها المستخدم بشكل صريح. على سبيل المثال، يختار المستخدم "تطبيقات الترفيه" في ملفه الشخصي. يمكن أن تكون ميزات أخرى ضمنية، استنادًا إلى التطبيقات التي سبق له تثبيتها. على سبيل المثال، قد يرغب المستخدم تطبيقًا آخر تم نشره من قِبل Science R Us.
يجب أن يقترح النموذج عناصر ذات صلة بهذا المستخدم. للقيام بذلك، يجب عليك عليك أولاً اختيار مقياس التشابه (على سبيل المثال، حاصل الضرب النقطي). بعد ذلك، يجب عليك إعداد النظام لتقييم كل عنصر مرشّح وفقًا لهذا التشابه المقياس. تجدر الإشارة إلى أن التوصيات خاصة بهذا المستخدم، حيث إن النموذج لم تستخدم أي معلومات عن مستخدمين آخرين.
استخدام حاصل الضرب النقطي كمقياس للتشابه
مراعاة الحالة التي يضمِّن فيها المستخدم \(x\) والتطبيق التضمين \(y\) كلاهما متجهان ثنائيان. منذ \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)، تظهر في كل من \(x\) \(y\) وتساهم بنسبة 1 في المجموع. بعبارة أخرى، \(\langle x, y \rangle\) هو الرقم الخصائص النشطة في كلا الخطين المتجهين في وقت واحد. مرتفع فإن ناتج الضرب النقطي يشير إلى المزيد من الخصائص الشائعة، وبالتالي إلى تشابه أعلى.
جربه بنفسك!
احسب المنتج النقطي لكل تطبيق في مشكلة التطبيق السابقة. بعد ذلك، استخدم هذه المعلومات للإجابة عن السؤال أدناه: