در مرحله نهایی یک سیستم توصیه، سیستم می تواند نامزدها را مجدداً رتبه بندی کند تا معیارها یا محدودیت های اضافی را در نظر بگیرند. یکی از رویکردهای رتبه بندی مجدد استفاده از فیلترهایی است که برخی از نامزدها را حذف می کند.
یکی دیگر از رویکردهای رتبهبندی مجدد، تبدیل دستی امتیازی است که توسط رتبهبندی بازگردانده شده است.
این بخش به طور مختصر به تازگی، تنوع و انصاف می پردازد. این عوامل از جمله عواملی هستند که می توانند به بهبود سیستم توصیه شما کمک کنند. برخی از این عوامل اغلب نیازمند اصلاح مراحل مختلف فرآیند هستند. هر بخش راه حل هایی را ارائه می دهد که ممکن است به صورت جداگانه یا جمعی از آنها استفاده کنید.
خنکی
هدف اکثر سیستمهای توصیه، ترکیب آخرین اطلاعات استفاده، مانند تاریخچه کاربر فعلی و جدیدترین موارد است. تازه نگه داشتن مدل به مدل کمک می کند تا توصیه های خوبی ارائه دهد.
راه حل ها
- آموزش را تا جایی که ممکن است دوباره اجرا کنید تا از آخرین داده های آموزشی یاد بگیرید. توصیه می کنیم آموزش را گرم شروع کنید تا مدل مجبور به یادگیری مجدد از ابتدا نباشد. شروع گرم می تواند زمان تمرین را به میزان قابل توجهی کاهش دهد. به عنوان مثال، در فاکتورسازی ماتریسی، جاسازیها را برای مواردی که در نمونه قبلی مدل وجود داشتند، گرم شروع کنید.
- یک کاربر "متوسط" ایجاد کنید تا کاربران جدید را در مدل های فاکتورسازی ماتریسی نشان دهد. شما نیازی به جاسازی یکسان برای هر کاربر ندارید—شما می توانید دسته هایی از کاربران را بر اساس ویژگی های کاربر ایجاد کنید.
- از یک DNN مانند مدل سافت مکس یا مدل دو برج استفاده کنید. از آنجایی که مدل بردارهای ویژگی را به عنوان ورودی می گیرد، می توان آن را روی یک پرس و جو یا موردی اجرا کرد که در طول آموزش دیده نشد.
- اضافه کردن سن سند به عنوان یک ویژگی. برای مثال، یوتیوب میتواند سن ویدیو یا زمان آخرین مشاهده آن را به عنوان یک ویژگی اضافه کند.
تنوع
اگر سیستم همیشه مواردی را توصیه میکند که «نزدیکترین» به جاسازی پرس و جو هستند، کاندیداها بسیار شبیه به یکدیگر هستند. این عدم تنوع می تواند باعث ایجاد یک تجربه کاربری بد یا خسته کننده شود. به عنوان مثال، اگر یوتیوب فقط ویدیوهایی بسیار شبیه به ویدیویی که کاربر در حال تماشای آن است توصیه کند، مانند ویدیوهای جغد (همانطور که در تصویر نشان داده شده است)، احتمالاً کاربر به سرعت علاقه خود را از دست خواهد داد.
راه حل ها
- چندین ژنراتور نامزد را با استفاده از منابع مختلف آموزش دهید.
- چندین رتبه بندی را با استفاده از توابع هدف مختلف آموزش دهید.
- برای اطمینان از تنوع، موارد را بر اساس ژانر یا سایر ابردادهها رتبهبندی مجدد کنید.
انصاف
مدل شما باید با همه کاربران منصفانه رفتار کند. بنابراین، مطمئن شوید که مدل شما سوگیری های ناخودآگاه را از داده های آموزشی یاد نمی گیرد.
راه حل ها
- شامل دیدگاه های متنوع در طراحی و توسعه.
- آموزش مدل های ML بر روی مجموعه داده های جامع. زمانی که دادههای شما خیلی کم است (مثلاً وقتی دستههای خاصی کمتر ارائه میشوند) دادههای کمکی را اضافه کنید.
- معیارها (به عنوان مثال، دقت و خطای مطلق) را در هر جمعیت ردیابی کنید تا تعصبات را مشاهده کنید.
- مدل های جداگانه ای برای گروه های محروم بسازید.