বিষয়বস্তু-ভিত্তিক ফিল্টারিং তাদের পূর্ববর্তী ক্রিয়া বা স্পষ্ট প্রতিক্রিয়ার উপর ভিত্তি করে ব্যবহারকারীর পছন্দের অনুরূপ অন্যান্য আইটেমগুলির সুপারিশ করতে আইটেম বৈশিষ্ট্যগুলি ব্যবহার করে।
বিষয়বস্তু-ভিত্তিক ফিল্টারিং প্রদর্শন করতে, আসুন গুগল প্লে স্টোরের জন্য কিছু বৈশিষ্ট্য হ্যান্ড-ইঞ্জিনিয়ার করি। নিম্নলিখিত চিত্রটি একটি বৈশিষ্ট্য ম্যাট্রিক্স দেখায় যেখানে প্রতিটি সারি একটি অ্যাপকে প্রতিনিধিত্ব করে এবং প্রতিটি কলাম একটি বৈশিষ্ট্য উপস্থাপন করে। বৈশিষ্ট্যগুলির মধ্যে বিভাগগুলি অন্তর্ভুক্ত থাকতে পারে (যেমন শিক্ষা, নৈমিত্তিক, স্বাস্থ্য), অ্যাপের প্রকাশক এবং আরও অনেক কিছু। সহজ করার জন্য, ধরে নিন এই বৈশিষ্ট্য ম্যাট্রিক্সটি বাইনারি: একটি অ-শূন্য মান মানে অ্যাপটিতে সেই বৈশিষ্ট্যটি রয়েছে।
আপনি একই বৈশিষ্ট্য স্থান ব্যবহারকারী প্রতিনিধিত্ব. ব্যবহারকারী-সম্পর্কিত কিছু বৈশিষ্ট্য ব্যবহারকারীর দ্বারা স্পষ্টভাবে প্রদান করা যেতে পারে। উদাহরণস্বরূপ, একজন ব্যবহারকারী তাদের প্রোফাইলে "বিনোদন অ্যাপস" নির্বাচন করে। অন্যান্য বৈশিষ্ট্যগুলি অন্তর্নিহিত হতে পারে, তারা পূর্বে ইনস্টল করা অ্যাপগুলির উপর ভিত্তি করে। উদাহরণস্বরূপ, ব্যবহারকারী সায়েন্স আর ইউ দ্বারা প্রকাশিত অন্য একটি অ্যাপ ইনস্টল করেছেন।
মডেল এই ব্যবহারকারীর সাথে প্রাসঙ্গিক আইটেম সুপারিশ করা উচিত. এটি করার জন্য, আপনাকে প্রথমে একটি মিল মেট্রিক বাছাই করতে হবে (উদাহরণস্বরূপ, ডট পণ্য)। তারপরে, আপনাকে এই সাদৃশ্য মেট্রিক অনুযায়ী প্রতিটি প্রার্থী আইটেম স্কোর করার জন্য সিস্টেম সেট আপ করতে হবে। নোট করুন যে সুপারিশগুলি এই ব্যবহারকারীর জন্য নির্দিষ্ট, কারণ মডেলটি অন্য ব্যবহারকারীদের সম্পর্কে কোনো তথ্য ব্যবহার করেনি৷
একটি সাদৃশ্য পরিমাপ হিসাবে ডট পণ্য ব্যবহার করে
বিবেচনা করুন যেখানে ব্যবহারকারী এম্বেডিং \(x\) এবং অ্যাপ এম্বেডিং \(y\) উভয়ই বাইনারি ভেক্টর। যেহেতু\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), \(x\) এবং \(y\) উভয় ক্ষেত্রেই প্রদর্শিত একটি বৈশিষ্ট্য যোগফলের জন্য একটি 1 অবদান রাখে। অন্য কথায়, \(\langle x, y \rangle\) হল একই সাথে উভয় ভেক্টরে সক্রিয় বৈশিষ্ট্যের সংখ্যা। একটি উচ্চ বিন্দু পণ্য তারপর আরো সাধারণ বৈশিষ্ট্য নির্দেশ করে, এইভাবে একটি উচ্চ সাদৃশ্য.
এটি নিজে চেষ্টা করো!
পূর্ববর্তী অ্যাপ সমস্যায় প্রতিটি অ্যাপের জন্য ডট পণ্য গণনা করুন। তারপর নিচের প্রশ্নের উত্তর দিতে সেই তথ্য ব্যবহার করুন: