Ưu điểm của tính năng lọc cộng tác & nhược điểm

Ưu điểm

Không cần kiến thức về miền

Chúng ta không cần kiến thức về miền vì các mục nhúng được học tự động.

Niềm tin

Mô hình này có thể giúp người dùng khám phá các mối quan tâm mới. Riêng biệt, hệ thống ML có thể không biết người dùng quan tâm đến một mặt hàng nhất định, nhưng mô hình có thể vẫn đề xuất mặt hàng này vì những người dùng tương tự quan tâm đến mặt hàng đó.

Điểm khởi đầu phù hợp

Ở mức độ nào đó, hệ thống chỉ cần ma trận phản hồi để huấn luyện ma trận mô hình phân tích. Cụ thể, hệ thống này không cần các tính năng theo bối cảnh. Trong thực tế, hàm này có thể được sử dụng như một trong nhiều trình tạo đề xuất.

Nhược điểm

Không thể xử lý các mục mới

Dự đoán của mô hình cho một cặp (người dùng, mặt hàng) cụ thể là dấu chấm tích của các mục nhúng tương ứng. Vì vậy, nếu một mục không được nhìn thấy trong quá trình huấn luyện, hệ thống không thể tạo một nhúng và không thể truy vấn mô hình bằng mục này. Vấn đề này thường được gọi là sự cố khởi động nguội. Tuy nhiên, các kỹ thuật sau đây có thể giải quyết sự cố khởi động nguội ở một mức độ nào đó:

  • Phép chiếu trong WALS. Với một mục mới \(i_0\) không thấy trong huấn luyện, nếu hệ thống có một vài tương tác với người dùng, thì hệ thống có thể dễ dàng tính toán mục nhúng \(v_{i_0}\) cho mục này mà không cần huấn luyện lại toàn bộ mô hình. Hệ thống chỉ cần giải quyết những vấn đề sau phương trình hoặc phiên bản có trọng số:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    Phương trình trên tương ứng với một lần lặp trong WALS: các mục nhúng của người dùng được cố định và hệ thống giải quyết việc nhúng về mục \(i_0\). Bạn có thể làm tương tự cho người dùng mới.

  • Kỹ thuật có liên quan để tạo các mục nhúng cho các mục mới. Nếu hệ thống không có tương tác, hệ thống có thể ước chừng việc nhúng tính trung bình số lượt nhúng của các mục trong cùng một danh mục, từ cùng một người tải lên (trong YouTube), v.v.

Khó thêm các tính năng phụ cho truy vấn/mặt hàng

Tính năng bên là bất kỳ tính năng nào ngoài truy vấn hoặc mã mặt hàng. Để xem phim đề xuất, các tính năng bên có thể bao gồm quốc gia hoặc độ tuổi. Bao gồm các tính năng phụ hiện có cải thiện chất lượng của mô hình. Mặc dù có thể không dễ dàng đưa các tính năng phụ vào WALS, việc tổng quát hoá WALS giúp thực hiện được điều này.

Để khái quát hoá WALS, hãy tăng cường ma trận đầu vào bằng các tính năng bằng cách định nghĩa một ma trận khối \(\bar A\), trong đó:

  • Khối (0, 0) là ma trận phản hồi gốc \(A\).
  • Khối (0, 1) là mã hoá đa nóng cho các đặc điểm của người dùng.
  • Khối (1, 0) là mã hoá đa nóng cho các đối tượng của mục.