امتیاز دهی

پس از تولید نامزد، مدل دیگری نامزدهای تولید شده را برای انتخاب مجموعه ای از موارد برای نمایش امتیاز می دهد و رتبه بندی می کند. سیستم توصیه ممکن است چندین مولد نامزد داشته باشد که از منابع مختلفی استفاده می کنند، مانند موارد زیر:

مثال ها
  • موارد مرتبط از یک مدل فاکتورسازی ماتریسی.
  • ویژگی های کاربر که شخصی سازی را به حساب می آورند.
  • موارد "محلی" در مقابل "دور"؛ یعنی با در نظر گرفتن اطلاعات جغرافیایی.
  • اقلام محبوب یا پرطرفدار
  • یک نمودار اجتماعی؛ یعنی مواردی که دوستان دوست دارند یا توصیه می کنند.

این سیستم این منابع مختلف را در یک مجموعه مشترک از نامزدها ترکیب می کند که سپس توسط یک مدل امتیازدهی شده و بر اساس آن امتیاز رتبه بندی می شوند. به عنوان مثال، این سیستم می تواند مدلی را برای پیش بینی احتمال تماشای یک ویدیو در یوتیوب توسط کاربر با توجه به موارد زیر آموزش دهد:

  • ویژگی های پرس و جو (به عنوان مثال، سابقه تماشای کاربر، زبان، کشور، زمان)
  • ویژگی های ویدیو (به عنوان مثال، عنوان، برچسب ها، جاسازی ویدیو)

سپس سیستم می‌تواند ویدیوها را در گروه نامزدها بر اساس پیش‌بینی مدل رتبه‌بندی کند.

چرا به کاندیدای مولد امتیاز نمی دهیم؟

از آنجایی که مولدهای نامزد یک امتیاز را محاسبه می کنند (مانند اندازه گیری شباهت در فضای جاسازی)، ممکن است وسوسه شوید که از آنها برای انجام رتبه بندی نیز استفاده کنید. با این حال، به دلایل زیر باید از این عمل اجتناب کنید:

  • برخی از سیستم ها به چندین ژنراتور نامزد متکی هستند. نمرات این ژنراتورهای مختلف ممکن است قابل مقایسه نباشند.
  • با تعداد کمتری از نامزدها، سیستم می‌تواند از ویژگی‌های بیشتر و مدل پیچیده‌تری استفاده کند که ممکن است زمینه را بهتر به تصویر بکشد.

انتخاب تابع هدف برای امتیازدهی

همانطور که ممکن است از مقدمه ای بر چارچوب بندی مشکلات ML به یاد داشته باشید، ML می تواند مانند یک جن بدجنس عمل کند: بسیار خوشحالم که هدفی را که ارائه می کنید را یاد می گیرید، اما باید مراقب باشید که چه آرزویی دارید. این کیفیت شیطانی در مورد سیستم های توصیه نیز صدق می کند. انتخاب تابع امتیاز دهی می تواند به طور چشمگیری بر رتبه بندی اقلام و در نهایت کیفیت توصیه ها تأثیر بگذارد.

مثال:

روی نمادهای پلاس کلیک کنید تا بدانید در نتیجه استفاده از هر هدف چه اتفاقی می افتد.

تصویری از صفحه اصلی فروشگاه Google Play که بازی‌های جدید و به‌روزرسانی شده و همچنین برنامه‌های پیشنهادی را با موارد پایین برجسته نشان می‌دهد.

سوگیری موقعیتی در امتیازدهی

مواردی که در پایین‌تر ظاهر می‌شوند نسبت به مواردی که بالاتر روی صفحه نمایش داده می‌شوند کمتر مورد کلیک قرار می‌گیرند. با این حال، هنگام به ثمر رساندن ویدیوها، سیستم معمولاً نمی داند در نهایت پیوند آن ویدیو در کجای صفحه نمایش داده می شود. جستجوی مدل با تمام موقعیت های ممکن بسیار گران است. حتی اگر پرس و جو از چندین موقعیت امکان پذیر بود، سیستم هنوز ممکن است رتبه بندی ثابتی را در بین چندین امتیاز رتبه بندی پیدا نکند.

راه حل ها

  • رتبه بندی های مستقل از موقعیت ایجاد کنید.
  • همه کاندیداها را طوری رتبه بندی کنید که گویی در موقعیت بالای صفحه هستند.