مزایای
بدون نیاز به دانش دامنه
ما به دانش دامنه نیاز نداریم زیرا جاسازی ها به طور خودکار یاد می گیرند.سرندیپیتی
این مدل می تواند به کاربران در کشف علایق جدید کمک کند. به طور مجزا، سیستم ML ممکن است نداند کاربر به یک مورد خاص علاقه دارد، اما مدل همچنان ممکن است آن را توصیه کند زیرا کاربران مشابه به آن آیتم علاقه مند هستند.نقطه شروع عالی
تا حدودی، سیستم فقط به ماتریس بازخورد نیاز دارد تا مدل فاکتورسازی ماتریسی را آموزش دهد. به طور خاص، سیستم به ویژگی های متنی نیاز ندارد. در عمل، این می تواند به عنوان یکی از چندین مولد کاندید مورد استفاده قرار گیرد.
معایب
نمی تواند با اقلام تازه کار کند
پیشبینی مدل برای یک جفت معین (کاربر، آیتم) حاصل ضرب نقطهای جاسازیهای مربوطه است. بنابراین، اگر آیتمی در حین آموزش دیده نشد، سیستم نمی تواند برای آن جاسازی ایجاد کند و نمی تواند مدل را با این آیتم پرس و جو کند. این مسئله اغلب مشکل شروع سرد نامیده می شود. با این حال، تکنیک های زیر می توانند مشکل شروع سرد را تا حدودی برطرف کنند:
فرافکنی در WALS. با توجه به یک آیتم جدید \(i_0\) که در آموزش دیده نمی شود، اگر سیستم چند تعامل با کاربران داشته باشد، سیستم می تواند به راحتی یک \(v_{i_0}\) تعبیه شده را برای این مورد محاسبه کند بدون اینکه نیازی به آموزش مجدد کل مدل باشد. سیستم به سادگی باید معادله زیر یا نسخه وزنی را حل کند:
\[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]
معادله قبلی با یک تکرار در WALS مطابقت دارد: جاسازیهای کاربر ثابت نگه داشته میشوند و سیستم برای جاسازی مورد \(i_0\)حل میکند. همین کار را می توان برای یک کاربر جدید انجام داد.
اکتشافی برای ایجاد جاسازی اقلام تازه. اگر سیستم تعاملی نداشته باشد، سیستم میتواند با میانگینگیری تعبیههای موارد از همان دسته، از همان آپلودکننده (در یوتیوب) و غیره، میزان جاسازی آن را تقریبی کند.
گنجاندن ویژگیهای جانبی برای پرس و جو/مورد سخت است
ویژگی های جانبی هر ویژگی فراتر از پرس و جو یا شناسه مورد هستند. برای توصیههای فیلم، ویژگیهای جانبی ممکن است شامل کشور یا سن باشد. گنجاندن ویژگی های جانبی موجود کیفیت مدل را بهبود می بخشد. اگرچه ممکن است گنجاندن ویژگی های جانبی در WALS آسان نباشد،تعمیم WALS این امکان را فراهم می کند.
برای تعمیم WALS، با تعریف یک ماتریس بلوکی \(\bar A\)، ماتریس ورودی را با ویژگی ها تقویت کنید ، که در آن:
- بلوک (0، 0) ماتریس بازخورد اصلی \(A\)است.
- بلوک (0، 1) یک رمزگذاری چندگانه از ویژگی های کاربر است.
- بلوک (1، 0) یک رمزگذاری چندگانه از ویژگی های مورد است.