একটি সুপারিশ ব্যবস্থার চূড়ান্ত পর্যায়ে, সিস্টেম অতিরিক্ত মানদণ্ড বা সীমাবদ্ধতা বিবেচনা করার জন্য প্রার্থীদের পুনরায় র্যাঙ্ক করতে পারে। একটি রি-র্যাঙ্কিং পদ্ধতি হল ফিল্টার ব্যবহার করা যা কিছু প্রার্থীকে সরিয়ে দেয়।
আরেকটি রি-র্যাঙ্কিং পদ্ধতি হ'ল র্যাঙ্কারের দ্বারা ফিরে আসা স্কোরকে ম্যানুয়ালি রূপান্তর করা।
এই বিভাগে সংক্ষিপ্তভাবে সতেজতা, বৈচিত্র্য এবং ন্যায্যতা নিয়ে আলোচনা করা হয়েছে। এই কারণগুলি অনেকের মধ্যে রয়েছে যা আপনার সুপারিশ ব্যবস্থাকে উন্নত করতে সাহায্য করতে পারে। এই কারণগুলির মধ্যে কয়েকটির জন্য প্রায়শই প্রক্রিয়াটির বিভিন্ন পর্যায়ে পরিবর্তনের প্রয়োজন হয়। প্রতিটি বিভাগ এমন সমাধান অফার করে যা আপনি ব্যক্তিগতভাবে বা সম্মিলিতভাবে প্রয়োগ করতে পারেন।
সতেজতা
বেশিরভাগ সুপারিশ সিস্টেমের লক্ষ্য সাম্প্রতিক ব্যবহার তথ্য, যেমন বর্তমান ব্যবহারকারীর ইতিহাস এবং নতুন আইটেম অন্তর্ভুক্ত করা। মডেলটিকে তাজা রাখা মডেলটিকে ভালো সুপারিশ করতে সাহায্য করে।
সমাধান
- সর্বশেষ প্রশিক্ষণ ডেটা শিখতে যতবার সম্ভব প্রশিক্ষণ পুনরায় চালান। আমরা প্রশিক্ষণটি উষ্ণভাবে শুরু করার পরামর্শ দিই যাতে মডেলটিকে স্ক্র্যাচ থেকে পুনরায় শিখতে না হয়। উষ্ণ শুরু প্রশিক্ষণের সময় উল্লেখযোগ্যভাবে কমাতে পারে। উদাহরণস্বরূপ, ম্যাট্রিক্স ফ্যাক্টরাইজেশনে, মডেলের পূর্ববর্তী উদাহরণে উপস্থিত আইটেমগুলির জন্য এমবেডিংগুলিকে উষ্ণ-শুরু করুন৷
- ম্যাট্রিক্স ফ্যাক্টরাইজেশন মডেলগুলিতে নতুন ব্যবহারকারীদের প্রতিনিধিত্ব করতে একটি "গড়" ব্যবহারকারী তৈরি করুন। প্রতিটি ব্যবহারকারীর জন্য আপনার একই এম্বেডিংয়ের প্রয়োজন নেই—আপনি ব্যবহারকারীর বৈশিষ্ট্যের উপর ভিত্তি করে ব্যবহারকারীদের ক্লাস্টার তৈরি করতে পারেন।
- একটি DNN ব্যবহার করুন যেমন একটি সফটম্যাক্স মডেল বা টু-টাওয়ার মডেল। যেহেতু মডেলটি ইনপুট হিসাবে বৈশিষ্ট্য ভেক্টর নেয়, তাই এটি এমন একটি প্রশ্ন বা আইটেমে চালানো যেতে পারে যা প্রশিক্ষণের সময় দেখা যায়নি।
- একটি বৈশিষ্ট্য হিসাবে নথি বয়স যোগ করুন. উদাহরণস্বরূপ, YouTube একটি বৈশিষ্ট্য হিসাবে একটি ভিডিওর বয়স বা এটির শেষ দেখার সময় যোগ করতে পারে৷
বৈচিত্র্য
যদি সিস্টেম সবসময় আইটেমগুলি সুপারিশ করে যেগুলি কোয়েরি এমবেডিংয়ের জন্য "সবচেয়ে কাছাকাছি" হয়, প্রার্থীরা একে অপরের সাথে খুব মিল থাকে। এই বৈচিত্র্যের অভাব একটি খারাপ বা বিরক্তিকর ব্যবহারকারীর অভিজ্ঞতার কারণ হতে পারে। উদাহরণস্বরূপ, যদি ইউটিউব ব্যবহারকারী বর্তমানে যে ভিডিওটি দেখছে তার সাথে খুব মিল ভিডিওগুলি সুপারিশ করে, যেমন পেঁচা ভিডিও ছাড়া আর কিছুই নয় (যেমন চিত্রটিতে দেখানো হয়েছে), ব্যবহারকারী সম্ভবত দ্রুত আগ্রহ হারাবেন৷
সমাধান
- বিভিন্ন উত্স ব্যবহার করে একাধিক প্রার্থী জেনারেটর প্রশিক্ষণ.
- বিভিন্ন উদ্দেশ্যমূলক ফাংশন ব্যবহার করে একাধিক র্যাঙ্কারদের প্রশিক্ষণ দিন।
- বৈচিত্র্য নিশ্চিত করতে জেনার বা অন্যান্য মেটাডেটার উপর ভিত্তি করে আইটেমগুলিকে পুনরায় র্যাঙ্ক করুন।
ন্যায্যতা
আপনার মডেল সব ব্যবহারকারীদের ন্যায্য আচরণ করা উচিত। অতএব, নিশ্চিত করুন যে আপনার মডেল প্রশিক্ষণের ডেটা থেকে অসচেতন পক্ষপাতিত্ব শিখছে না।
সমাধান
- নকশা এবং উন্নয়নে বিভিন্ন দৃষ্টিভঙ্গি অন্তর্ভুক্ত করুন।
- ব্যাপক ডেটা সেটগুলিতে এমএল মডেলগুলিকে প্রশিক্ষণ দিন। আপনার ডেটা খুব বিরল হলে সহায়ক ডেটা যোগ করুন (উদাহরণস্বরূপ, যখন কিছু বিভাগ কম-প্রতিনিধিত্বিত হয়)।
- পক্ষপাতগুলি দেখার জন্য প্রতিটি জনসংখ্যার উপর মেট্রিক্স (উদাহরণস্বরূপ, নির্ভুলতা এবং পরম ত্রুটি) ট্র্যাক করুন।
- অনুন্নত গোষ্ঠীর জন্য আলাদা মডেল তৈরি করুন।