Lọc dựa trên nội dung

Tính năng lọc dựa trên nội dung sử dụng các tính năng về mặt hàng để đề xuất các mặt hàng khác tương tự với nội dung người dùng thích, dựa trên hành động trước đây của họ hoặc ý kiến phản hồi.

Để minh hoạ cách lọc dựa trên nội dung, hãy thiết kế thủ công một số tính năng cho cửa hàng Google Play. Hình dưới đây thể hiện một ma trận tính năng trong đó mỗi hàng đại diện cho một ứng dụng và mỗi cột đại diện cho một tính năng. Đặc điểm có thể bao gồm các danh mục (chẳng hạn như Giáo dục, phổ thông, Y tế), nhà xuất bản của ứng dụng và nhiều nội dung khác. Để đơn giản hoá, hãy giả định ma trận tính năng này là tệp nhị phân: một giá trị khác 0 có nghĩa là ứng dụng có tính năng đó.

Bạn cũng đại diện cho người dùng trong cùng không gian tính năng. Một số chính sách liên quan đến người dùng có thể được người dùng cung cấp rõ ràng. Ví dụ: người dùng chọn "Ứng dụng giải trí" trong hồ sơ của họ. Các tính năng khác có thể được ẩn, dựa trên các ứng dụng họ đã cài đặt trước đó. Ví dụ: người dùng đã cài đặt một ứng dụng khác do Science R Us phát hành.

Mô hình phải đề xuất các mục có liên quan đến người dùng này. Để làm như vậy, bạn phải trước tiên, hãy chọn một chỉ số tương tự (ví dụ: sản phẩm chấm). Sau đó, bạn phải thiết lập hệ thống tính điểm từng mục ứng viên theo điểm tương đồng này chỉ số. Lưu ý rằng các đề xuất dành riêng cho người dùng này do mô hình không sử dụng bất kỳ thông tin nào về người dùng khác.

Hình ảnh ma trận hiển thị người dùng và các ứng dụng có thể được đề xuất

Dùng tích vô hướng làm phép đo độ tương đồng

Xem xét trường hợp người dùng nhúng \(x\) và ứng dụng nhúng \(y\) đều là vectơ nhị phân. Từ \(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), một xuất hiện trong cả \(x\) và \(y\) đóng góp 1 cho tổng. Nói cách khác, \(\langle x, y \rangle\) là số lượng của các đối tượng hoạt động đồng thời trong cả hai vectơ. Cao thì sản phẩm dấu chấm sẽ cho biết các tính năng phổ biến hơn, do đó có sự tương đồng cao hơn.

Hãy thử ngay nào!

Tính tích vô hướng cho mỗi ứng dụng trong bài toán ứng dụng trước đó. Sau đó, hãy sử dụng thông tin đó để trả lời câu hỏi bên dưới:

Bạn nên dùng ứng dụng nào?
Ứng dụng giáo dục do Science R Us tạo ra.
Bạn đã đúng! Mặt hàng này có sản phẩm được chấm cao nhất lúc 2. Người dùng của chúng tôi thực sự thích các ứng dụng khoa học và giáo dục.
Ứng dụng sức khoẻ do Healthcare.
Ứng dụng này được 1. Đó không phải là đề xuất tồi tệ nhất của chúng tôi có thể tạo ra nhưng chắc chắn không phải là tốt nhất.
Ứng dụng phổ thông do Time Wastr tạo ra.
Trên thực tế, ứng dụng này có sản phẩm điểm thấp nhất là 0. người dùng không quan tâm đến các ứng dụng phổ thông như trò chơi.