Sau khi tạo đề xuất, một mô hình khác sẽ chấm điểm và xếp hạng mô hình được tạo đề xuất để chọn tập hợp các mục cần hiển thị. Hệ thống đề xuất có thể có nhiều trình tạo đề xuất sử dụng các nguồn khác nhau, chẳng hạn như như sau:
- Các mục có liên quan trong mô hình phân tích ma trận.
- Những tính năng của người dùng có tính đến hoạt động cá nhân hoá.
- "Địa phương" so với "xa" items; tức là lấy thông tin địa lý tính đến.
- Các mặt hàng phổ biến hoặc thịnh hành.
- Biểu đồ xã hội; tức là những mục được thích hoặc đề xuất bởi kết bạn.
Hệ thống kết hợp những nguồn khác nhau này thành một nhóm chung gồm các đề xuất mà sau đó được một mô hình duy nhất cho điểm và được xếp hạng theo điểm số đó. Ví dụ: hệ thống có thể huấn luyện một mô hình để dự đoán xác suất người dùng xem video trên YouTube như sau:
- tính năng truy vấn (ví dụ: nhật ký xem, ngôn ngữ, quốc gia, thời gian)
- tính năng cho video (ví dụ: tiêu đề, thẻ, nhúng video)
Sau đó, hệ thống có thể xếp hạng video trong nhóm đề xuất theo vào thông tin dự đoán của mô hình.
Tại sao không để trình tạo ứng viên tính điểm?
Vì trình tạo đề xuất tính toán điểm số (chẳng hạn như phép đo độ tương đồng trong không gian nhúng), bạn có thể muốn sử dụng chúng để xếp hạng như tốt. Tuy nhiên, bạn nên tránh thực hành này vì những lý do sau:
- Một số hệ thống dựa vào nhiều trình tạo đề xuất. Điểm số của những câu hỏi này các trình tạo khác nhau có thể không so sánh được.
- Với nhóm ứng viên nhỏ hơn, hệ thống có thể đủ khả năng để sử dụng nhiều tính năng hơn và một mô hình phức tạp hơn có thể nắm bắt bối cảnh tốt hơn.
Chọn một hàm mục tiêu để tính điểm
Như bạn có thể nhớ trong phần Giới thiệu về vấn đề học máy Lấy khung hình, Học máy có thể hành động như một vị thần tinh nghịch: rất vui khi biết được mục tiêu bạn cung cấp, nhưng bạn phải cẩn thận với những gì bạn muốn. Trò tinh nghịch này chất lượng cũng áp dụng cho hệ thống đề xuất. Lựa chọn tính điểm có thể ảnh hưởng đáng kể đến thứ hạng của các mục và cuối cùng là chất lượng của các đề xuất.
Ví dụ:
Nhấp vào biểu tượng dấu cộng để tìm hiểu điều gì xảy ra sau khi sử dụng từng của bạn.
Thiên vị về vị trí trong cách tính điểm
Những mục xuất hiện ở vị trí thấp hơn trên màn hình ít có khả năng được nhấp vào hơn các mục xuất hiện cao hơn trên màn hình. Tuy nhiên, khi tính điểm cho video, hệ thống thường không biết một liên kết đến video đó sẽ xuất hiện ở vị trí nào trên màn hình cuối cùng sẽ xuất hiện. Quá trình truy vấn mô hình với tất cả các vị trí có thể có cũng rất đắt đỏ. Ngay cả khi việc truy vấn nhiều vị trí khả thi, hệ thống vẫn có thể không tìm thấy thứ hạng nhất quán dựa trên nhiều điểm xếp hạng.
Giải pháp
- Tạo thứ hạng độc lập về vị trí.
- Xếp hạng tất cả các ứng viên như thể họ đang ở vị trí hàng đầu trên màn hình.