فیلترینگ مبتنی بر محتوا
با مجموعهها، منظم بمانید
ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
فیلتر مبتنی بر محتوا از ویژگیهای مورد استفاده میکند تا موارد دیگری مشابه آنچه کاربر دوست دارد، بر اساس اقدامات قبلی یا بازخورد صریح او توصیه کند.
برای نشان دادن فیلتر مبتنی بر محتوا، اجازه دهید برخی از ویژگیهای فروشگاه Google Play را به صورت دستی مهندسی کنیم. شکل زیر یک ماتریس ویژگی را نشان می دهد که در آن هر ردیف نشان دهنده یک برنامه و هر ستون نشان دهنده یک ویژگی است. ویژگی ها می تواند شامل دسته بندی ها (مانند آموزش، گاه به گاه، بهداشت)، ناشر برنامه و بسیاری دیگر باشد. برای ساده کردن، فرض کنید این ماتریس ویژگی باینری است: یک مقدار غیر صفر به این معنی است که برنامه دارای آن ویژگی است.
شما همچنین کاربر را در همان فضای ویژگی نشان می دهید. برخی از ویژگی های مربوط به کاربر می تواند به صراحت توسط کاربر ارائه شود. به عنوان مثال، یک کاربر "برنامه های سرگرمی" را در نمایه خود انتخاب می کند. سایر ویژگی ها بر اساس برنامه هایی که قبلاً نصب کرده اند، می توانند ضمنی باشند. به عنوان مثال، کاربر برنامه دیگری را که توسط Science R Us منتشر شده است نصب کرده است.
مدل باید موارد مرتبط با این کاربر را توصیه کند. برای انجام این کار، ابتدا باید یک معیار تشابه (به عنوان مثال، محصول نقطه ای) را انتخاب کنید. سپس، باید سیستمی را تنظیم کنید تا به هر آیتم نامزد با توجه به این معیار شباهت امتیاز دهد. توجه داشته باشید که توصیهها مختص این کاربر است، زیرا مدل از هیچ اطلاعاتی در مورد سایر کاربران استفاده نکرده است.

استفاده از محصول نقطه ای به عنوان معیار تشابه
موردی را در نظر بگیرید که کاربر \(x\) و برنامه جاسازی کننده \(y\) هر دو بردار باینری هستند. از آنجایی که\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)، یک ویژگی که در هر دو \(x\) و \(y\) ظاهر می شود، 1 را به مجموع کمک می کند. به عبارت دیگر، \(\langle x, y \rangle\) تعداد ویژگی هایی است که در هر دو بردار به طور همزمان فعال هستند. سپس یک محصول با نقطه بالا ویژگیهای رایجتر را نشان میدهد، بنابراین شباهت بیشتری دارد.
خودت آن را امتحان کن!
محصول نقطه ای را برای هر برنامه در مشکل برنامه قبلی محاسبه کنید. سپس از این اطلاعات برای پاسخ به سوال زیر استفاده کنید:
کدام اپلیکیشن را توصیه کنیم؟
برنامه آموزشی ایجاد شده توسط Science R Us.
شما درست می گویید! این مورد دارای بالاترین نقطه نقطه در 2 است. کاربر ما واقعاً برنامه های علمی و آموزشی را دوست دارد.
برنامه سلامت ایجاد شده توسط Healthcare.
این برنامه امتیاز 1 را می گیرد. این بدترین توصیه ای نیست که سیستم ما می تواند ارائه دهد، اما مطمئنا بهترین نیست.
برنامه معمولی ایجاد شده توسط TimeWastr.
این برنامه در واقع کمترین نقطه نقطه را در 0 دارد. کاربر ما علاقه ای به برنامه های معمولی مانند بازی ها ندارد.
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2024-07-27 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-07-27 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eContent-based filtering suggests items similar to a user's preferences by analyzing item features and user interactions.\u003c/p\u003e\n"],["\u003cp\u003eUser and item features are represented in a feature matrix, where common features indicate higher similarity.\u003c/p\u003e\n"],["\u003cp\u003eDot product is used as a similarity metric, with higher values indicating stronger relevance between user and item.\u003c/p\u003e\n"],["\u003cp\u003eRecommendations are tailored to individual users based on their specific features and interactions, without using data from other users.\u003c/p\u003e\n"],["\u003cp\u003eThe system identifies the best recommendations by calculating dot products and selecting items with the highest scores.\u003c/p\u003e\n"]]],[],null,["# Content-based filtering uses item features to recommend other items\nsimilar to what the user likes, based on their previous actions or explicit\nfeedback.\n\nTo demonstrate content-based filtering, let's hand-engineer some features\nfor the Google Play store. The following figure shows a feature matrix where\neach row represents an app and each column represents a feature. Features\ncould include categories (such as Education, Casual, Health), the publisher\nof the app, and many others. To simplify, assume this feature matrix is binary:\na non-zero value means the app has that feature.\n\nYou also represent the user in the same feature space. Some of the user-related\nfeatures could be explicitly provided by the user. For example, a user selects\n\"Entertainment apps\" in their profile. Other features can be implicit,\nbased on the apps they have previously installed. For example, the user\ninstalled another app published by Science R Us.\n\nThe model should recommend items relevant to this user. To do so, you must\nfirst pick a similarity metric (for example, dot product). Then, you must\nset up the system to score each candidate item according to this similarity\nmetric. Note that the recommendations are specific to this user, as the model\ndid not use any information about other users.\n\nUsing dot product as a similarity measure\n-----------------------------------------\n\nConsider the case where the user embedding \\\\(x\\\\) and the app\nembedding \\\\(y\\\\) are both binary vectors. Since\n\\\\(\\\\langle x, y \\\\rangle = \\\\sum_{i = 1}\\^d x_i y_i\\\\), a\nfeature appearing in both \\\\(x\\\\) and \\\\(y\\\\) contributes a 1 to\nthe sum. In other words, \\\\(\\\\langle x, y \\\\rangle\\\\) is the number\nof features that are active in both vectors simultaneously. A high\ndot product then indicates more common features, thus a higher similarity.\n\nTry it yourself!\n----------------\n\nCalculate the dot product for each app in the preceding app problem.\nThen use that information to answer the question below: \nWhich app should we recommend? \nThe educational app created by Science R Us. \nYou are correct! This item has the highest dot product at 2. Our user really likes science and educational apps. \nThe health app created by Healthcare. \nThis app scores a 1. It isn't the worst recommendation our system could make, but it certainly isn't the best. \nThe casual app created by TimeWastr. \nThis app actually has the lowest dot product at 0. Our user isn't interested in casual apps like games."]]