الفلترة المستِندة إلى المحتوى
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
تستخدم التصفية المستندة إلى المحتوى ميزات العناصر لاقتراح عناصر أخرى
ما يشابه ما يعجب المستخدم، بناءً على إجراءاته السابقة أو عمليات
الملاحظات.
لتوضيح التصفية القائمة على المحتوى، يجب أن نصمم بعض الميزات يدويًا
لمتجر Google Play. يوضح الشكل التالي مصفوفة خصائص حيث
يمثل كل صف تطبيقًا ويمثل كل عمود ميزة. الميزات
يمكن أن تتضمن فئات (مثل التعليم، غير الرسمية، الصحة)، استخدم
للتطبيق، وغير ذلك الكثير. ولتبسيط، لنفترض أنّ مصفوفة الخصائص هذه تكون ثنائية:
إذا كانت القيمة غير صفرية، فهذا يعني أن التطبيق يحتوي على هذه الميزة.
ويمكنك أيضًا تمثيل المستخدم في مساحة الميزات نفسها. قد تتضمن بعض البيانات المتعلقة بالمستخدم
الميزات التي يمكن أن يوفرها المستخدم بشكل صريح. على سبيل المثال، يختار المستخدم
"تطبيقات الترفيه" في ملفه الشخصي. يمكن أن تكون ميزات أخرى ضمنية،
استنادًا إلى التطبيقات التي سبق له تثبيتها. على سبيل المثال، قد يرغب المستخدم
تطبيقًا آخر تم نشره من قِبل Science R Us.
يجب أن يقترح النموذج عناصر ذات صلة بهذا المستخدم. للقيام بذلك، يجب عليك
عليك أولاً اختيار مقياس التشابه (على سبيل المثال، حاصل الضرب النقطي). بعد ذلك، يجب عليك
إعداد النظام لتقييم كل عنصر مرشّح وفقًا لهذا التشابه
المقياس. تجدر الإشارة إلى أن التوصيات خاصة بهذا المستخدم، حيث إن النموذج
لم تستخدم أي معلومات عن مستخدمين آخرين.
استخدام حاصل الضرب النقطي كمقياس للتشابه
مراعاة الحالة التي يضمِّن فيها المستخدم \(x\) والتطبيق
التضمين \(y\) كلاهما متجهان ثنائيان. منذ
\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)،
تظهر في كل من \(x\) \(y\) وتساهم بنسبة 1 في
المجموع. بعبارة أخرى، \(\langle x, y \rangle\) هو الرقم
الخصائص النشطة في كلا الخطين المتجهين في وقت واحد. مرتفع
فإن ناتج الضرب النقطي يشير إلى المزيد من الخصائص الشائعة، وبالتالي إلى تشابه أعلى.
جربه بنفسك!
احسب المنتج النقطي لكل تطبيق في مشكلة التطبيق السابقة.
بعد ذلك، استخدم هذه المعلومات للإجابة عن السؤال أدناه:
إِيهِ التَّطْبِيقِ الْمُقْتَرَحْ؟
التطبيق التعليمي من إنشاء Science R Us.
إجابتك صحيحة! يتضمّن هذا العنصر أعلى ضرب نقطي.
في 2. يحب المستخدم تطبيقات العلوم والتعليم.
تطبيق الصحة الذي أنشأته مؤسسة Healthcare
حصل هذا التطبيق على نتيجة 1. إنه ليس أسوأ اقتراح لدينا
الذي يمكن أن يصنعه النظام، لكنه بالتأكيد ليس الأفضل.
هذا التطبيق البسيط الذي أنشأه TimeWastr.
يحتوي هذا التطبيق على أدنى ضرب نقطي عند 0. إنّ
المستخدم غير مهتم بالتطبيقات البسيطة مثل الألعاب.
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2024-07-26 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2024-07-26 (حسب التوقيت العالمي المتفَّق عليه)"],[[["\u003cp\u003eContent-based filtering suggests items similar to a user's preferences by analyzing item features and user interactions.\u003c/p\u003e\n"],["\u003cp\u003eUser and item features are represented in a feature matrix, where common features indicate higher similarity.\u003c/p\u003e\n"],["\u003cp\u003eDot product is used as a similarity metric, with higher values indicating stronger relevance between user and item.\u003c/p\u003e\n"],["\u003cp\u003eRecommendations are tailored to individual users based on their specific features and interactions, without using data from other users.\u003c/p\u003e\n"],["\u003cp\u003eThe system identifies the best recommendations by calculating dot products and selecting items with the highest scores.\u003c/p\u003e\n"]]],[],null,["# Content-based filtering uses item features to recommend other items\nsimilar to what the user likes, based on their previous actions or explicit\nfeedback.\n\nTo demonstrate content-based filtering, let's hand-engineer some features\nfor the Google Play store. The following figure shows a feature matrix where\neach row represents an app and each column represents a feature. Features\ncould include categories (such as Education, Casual, Health), the publisher\nof the app, and many others. To simplify, assume this feature matrix is binary:\na non-zero value means the app has that feature.\n\nYou also represent the user in the same feature space. Some of the user-related\nfeatures could be explicitly provided by the user. For example, a user selects\n\"Entertainment apps\" in their profile. Other features can be implicit,\nbased on the apps they have previously installed. For example, the user\ninstalled another app published by Science R Us.\n\nThe model should recommend items relevant to this user. To do so, you must\nfirst pick a similarity metric (for example, dot product). Then, you must\nset up the system to score each candidate item according to this similarity\nmetric. Note that the recommendations are specific to this user, as the model\ndid not use any information about other users.\n\nUsing dot product as a similarity measure\n-----------------------------------------\n\nConsider the case where the user embedding \\\\(x\\\\) and the app\nembedding \\\\(y\\\\) are both binary vectors. Since\n\\\\(\\\\langle x, y \\\\rangle = \\\\sum_{i = 1}\\^d x_i y_i\\\\), a\nfeature appearing in both \\\\(x\\\\) and \\\\(y\\\\) contributes a 1 to\nthe sum. In other words, \\\\(\\\\langle x, y \\\\rangle\\\\) is the number\nof features that are active in both vectors simultaneously. A high\ndot product then indicates more common features, thus a higher similarity.\n\nTry it yourself!\n----------------\n\nCalculate the dot product for each app in the preceding app problem.\nThen use that information to answer the question below: \nWhich app should we recommend? \nThe educational app created by Science R Us. \nYou are correct! This item has the highest dot product at 2. Our user really likes science and educational apps. \nThe health app created by Healthcare. \nThis app scores a 1. It isn't the worst recommendation our system could make, but it certainly isn't the best. \nThe casual app created by TimeWastr. \nThis app actually has the lowest dot product at 0. Our user isn't interested in casual apps like games."]]