Truy xuất

Giả sử bạn có một mô hình nhúng. Giả sử bạn sẽ chọn mục nào để đề xuất cho người dùng?

Tại thời điểm phân phát, với một truy vấn, bạn bắt đầu bằng cách thực hiện một trong những thao tác sau:

  • Đối với mô hình hệ số ma trận, việc truy vấn (hoặc người dùng) nhúng sẽ được biết đến tĩnh và hệ thống có thể chỉ cần tìm kiếm nội dung đó từ ma trận nhúng người dùng.
  • Đối với mô hình DNN, hệ thống sẽ tính toán việc nhúng truy vấn \(\psi(x)\) tại thời điểm phân phát bằng cách chạy mạng trên vectơ tính năng \(x\).

Sau khi bạn có video nhúng truy vấn \(q\), hãy tìm các mục nhúng mục \(V_j\) gần với \(q\) trong không gian nhúng. Đây là sự cố lân cận gần nhất. Ví dụ: bạn có thể trả về k mục hàng đầu theo điểm tương đồng \(s(q, V_j)\).

Hình ảnh quang phổ hai chiều với một số bộ phim và người dùng được sắp xếp
từ phim dành cho trẻ em cho đến người lớn, phim nghệ thuật đến phim bom tấn. Một người dùng được đánh dấu cũng như hai bộ phim gần đó.

Bạn có thể sử dụng phương pháp tương tự trong các đề xuất mặt hàng có liên quan. Ví dụ: khi người dùng đang xem một video trên YouTube, trước tiên, hệ thống có thể tra cứu tính năng nhúng của mục đó rồi nhúng nội dung của các mục khác\(V_j\) gần với không gian nhúng.

Truy xuất quy mô lớn

Để tính toán các đối tượng lân cận gần nhất trong không gian nhúng, hệ thống có thể chấm điểm toàn bộ mọi đề xuất tiềm năng. Việc tính điểm tốn kém có thể gây tốn kém cho tập sao lục rất lớn, nhưng bạn có thể sử dụng một trong các chiến lược sau đây để đạt hiệu quả cao hơn:

  • Nếu việc nhúng truy vấn được biết tĩnh, hệ thống có thể thực hiện tính điểm toàn diện khi không có mạng, tính trước và lưu trữ danh sách ứng viên hàng đầu cho mỗi truy vấn. Đây là phương pháp phổ biến để đề xuất mục liên quan.
  • Sử dụng khoảng lân cận gần nhất.