Xếp hạng lại

Trong giai đoạn cuối cùng của hệ thống đề xuất, hệ thống có thể xếp hạng lại đề xuất để xem xét tiêu chí hoặc ràng buộc bổ sung. Một phương pháp xếp hạng lại là sử dụng bộ lọc loại bỏ một số ứng viên.

Một phương pháp xếp hạng lại khác là biến đổi điểm số được trả về theo cách thủ công theo thứ hạng.

Phần này thảo luận ngắn gọn về độ mới, tính đa dạng và tính công bằng. Đây là một trong nhiều yếu tố có thể giúp cải thiện nội dung đề xuất cho bạn hệ thống. Một số yếu tố thường yêu cầu điều chỉnh các giai đoạn khác nhau của quy trình. Mỗi phần cung cấp các giải pháp mà bạn có thể áp dụng riêng lẻ hoặc tập thể.

Độ mới mẻ

Hầu hết các hệ thống đề xuất đều nhắm đến việc kết hợp thông tin sử dụng mới nhất, chẳng hạn như lịch sử người dùng hiện tại và các mục mới nhất. Luôn giữ cho mô hình luôn mới giúp mô hình này đưa ra các đề xuất phù hợp.

Giải pháp

  • Chạy lại quá trình đào tạo thường xuyên nhất có thể để nắm được dữ liệu huấn luyện mới nhất. Bạn nên bắt đầu khởi động khoá đào tạo để mô hình không để học lại từ đầu. Khởi động ấm có thể làm giảm đáng kể quá trình tập luyện bất cứ lúc nào. Ví dụ: trong quá trình phân tích ma trận, hãy khởi động khởi động các mục nhúng cho các mục có trong thực thể trước của mô hình.
  • Tạo mức "trung bình" người dùng đại diện cho người dùng mới trong phân tích ma trận người mẫu. Bạn không cần cùng một nhúng cho mỗi người dùng—bạn có thể tạo nhóm người dùng dựa trên các tính năng của người dùng.
  • Sử dụng một công ty dựa trên nền tảng kỹ thuật số (DNN) chẳng hạn như mô hình tối đa hoá hiệu suất hoặc mô hình hai toà tháp. Vì mô hình này lấy các vectơ đối tượng làm dữ liệu đầu vào, nó có thể được chạy trên một truy vấn hoặc một mục không được nhìn thấy trong quá trình huấn luyện.
  • Thêm tuổi tài liệu làm tính năng. Ví dụ: YouTube có thể thêm tuổi của video hoặc thời điểm lần cuối xem tính năng.

Hình ảnh đề xuất 4 video về cú.

Tính đa dạng

Nếu hệ thống luôn đề xuất các mặt hàng "gần nhất" cho truy vấn nhúng, các ứng viên có xu hướng rất giống nhau. Chiến dịch này thiếu tính đa dạng có thể dẫn đến trải nghiệm người dùng kém hoặc nhàm chán. Ví dụ: YouTube chỉ đề xuất các video rất giống với video của người dùng hiện đang xem, chẳng hạn như không có gì ngoài video cú (như trong hình), người dùng có thể sẽ nhanh chóng mất hứng thú.

Giải pháp

  • Huấn luyện nhiều trình tạo đề xuất bằng nhiều nguồn.
  • Đào tạo nhiều người xếp hạng bằng cách sử dụng các hàm mục tiêu khác nhau.
  • Sắp xếp lại các mặt hàng theo thể loại hoặc siêu dữ liệu khác để đảm bảo tính đa dạng.

Tính công bằng

Mô hình của bạn phải đối xử công bằng với tất cả người dùng. Do đó, hãy đảm bảo mô hình của bạn không học được các thành kiến vô thức từ dữ liệu huấn luyện.

Giải pháp

  • Đưa ra những quan điểm đa dạng trong quá trình thiết kế và phát triển.
  • Huấn luyện các mô hình học máy dựa trên các tập dữ liệu toàn diện. Thêm dữ liệu phụ khi dữ liệu của bạn quá thưa thớt (ví dụ: khi các danh mục nhất định được thể hiện dưới mức).
  • Theo dõi các chỉ số (ví dụ: độ chính xác và sai số tuyệt đối) trên mỗi thông tin nhân khẩu học để phát hiện ra các thiên kiến.
  • Tạo mô hình riêng cho các nhóm ít được quan tâm.