Bảng thuật ngữ máy học: Hệ thống đề xuất

Trang này chứa các thuật ngữ trong bảng thuật ngữ Hệ thống Đề xuất. Đối với tất cả các thuật ngữ, hãy nhấp vào đây.

C

tạo ứng viên

#recsystems

Bộ đề xuất ban đầu do hệ thống đề xuất chọn. Ví dụ: hãy xem xét nhà sách cung cấp 100.000 đầu sách. Giai đoạn tạo ứng cử viên tạo một danh sách nhỏ hơn nhiều cuốn sách phù hợp cho một người dùng cụ thể, chẳng hạn như 500. Nhưng ngay cả 500 cuốn sách cũng có quá nhiều người để giới thiệu cho người dùng. Các giai đoạn sau đó, tốn kém hơn, của hệ thống đề xuất (chẳng hạn như tính điểmxếp hạng lại) sẽ giảm 500 hệ thống đó xuống một tập hợp đề xuất nhỏ hơn, hữu ích hơn nhiều.

lọc cộng tác

#recsystems

Đề xuất về mối quan tâm của một người dùng dựa trên mối quan tâm của nhiều người dùng khác. Tính năng lọc cộng tác thường được dùng trong các hệ thống đề xuất.

I

ma trận mục

#recsystems

Trong hệ thống đề xuất, ma trận các vectơ nhúng được tạo bởi hệ số ma trận giữ các tín hiệu tiềm ẩn về từng mục. Mỗi hàng của ma trận mục chứa giá trị của một tính năng ẩn cho tất cả các mục. Ví dụ: hãy xem xét một hệ thống đề xuất phim. Mỗi cột trong ma trận mục đại diện cho một phim. Các tín hiệu tiềm ẩn có thể thể hiện các thể loại hoặc có thể là tín hiệu khó hiểu hơn liên quan đến hoạt động tương tác phức tạp giữa thể loại, ngôi sao, tuổi phim hoặc các yếu tố khác.

Ma trận mục có cùng số cột với ma trận mục tiêu đang được phân tích. Ví dụ: trong một hệ thống đề xuất phim đánh giá 10.000 tiêu đề phim, ma trận mục sẽ có 10.000 cột.

items

#recsystems

Trong hệ thống đề xuất, các thực thể mà một hệ thống đề xuất. Ví dụ: video là những mặt hàng mà cửa hàng video đề xuất, còn sách là những mặt hàng mà hiệu sách đề xuất.

T2

phân tích ma trận

#recsystems

Trong toán học, một cơ chế để tìm các ma trận có tích tích xấp xỉ của một ma trận mục tiêu.

Trong hệ thống đề xuất, ma trận mục tiêu thường lưu giữ điểm xếp hạng của người dùng đối với các mục. Ví dụ: ma trận mục tiêu của hệ thống đề xuất phim có thể có dạng như sau, trong đó số nguyên dương là điểm xếp hạng từ người dùng và bằng 0 có nghĩa là người dùng chưa xếp hạng phim:

  Casablanca Câu chuyện ở Philadelphia Black Panther (Chiến binh Báo Đen) Wonder Woman (Cô gái kỳ diệu) Tiểu thuyết kịch liên
Người dùng 1 5 3 0,0 2 0,0
Người dùng 2 4 0,0 0,0 1 5
Người dùng 3 3 1 4 5 0,0

Hệ thống đề xuất phim nhằm dự đoán điểm xếp hạng của người dùng cho các bộ phim chưa được xếp hạng. Ví dụ: Người dùng 1 có thích Black Panther không?

Một phương pháp tiếp cận cho hệ thống đề xuất là sử dụng tính năng hệ số hoá ma trận để tạo hai ma trận sau:

  • Ma trận người dùng, được định hình theo số lượng người dùng X với số lượng thứ nguyên nhúng.
  • Một ma trận mục có hình dạng là số lượng kích thước nhúng (X) số lượng mục.

Ví dụ: việc sử dụng tính năng bao gồm ma trận cho 3 người dùng và 5 mục có thể mang lại được ma trận người dùng và ma trận mục như sau:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Sản phẩm dạng chấm của ma trận người dùng và ma trận mặt hàng tạo ra ma trận đề xuất không chỉ chứa thông tin xếp hạng của người dùng ban đầu mà còn cả các dự đoán cho những bộ phim mà mỗi người dùng chưa xem. Ví dụ: hãy xem xét điểm xếp hạng của người dùng 1 về Casablanca là 5.0. Sản phẩm chấm tương ứng với ô đó trong ma trận đề xuất sẽ nằm trong khoảng 5.0 và là:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Quan trọng hơn, liệu Người dùng 1 có thích Black Panther không? Việc lấy sản phẩm dạng dấu chấm tương ứng với hàng đầu tiên và cột thứ ba sẽ mang lại tỷ lệ dự đoán là 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Hệ số ma trận thường cho ma trận người dùng và ma trận mục cùng nhau, nhỏ gọn hơn đáng kể so với ma trận mục tiêu.

(phải)

hệ thống đề xuất

#recsystems

Một hệ thống chọn cho mỗi người dùng một tập hợp tương đối nhỏ các mục mong muốn từ một tập sao lục lớn. Ví dụ: một hệ thống đề xuất video có thể đề xuất hai video từ kho dữ liệu 100.000 video, chọn CasablancaThe Philadelphia Story cho một người dùng và Wonder WomanBlack Panther cho một người dùng khác. Hệ thống đề xuất video có thể đưa ra đề xuất dựa trên các yếu tố như:

  • Phim mà người dùng tương tự đã xếp hạng hoặc xem.
  • Thể loại, đạo diễn, diễn viên, nhân khẩu học mục tiêu...

xếp hạng lại

#recsystems

Giai đoạn cuối cùng của hệ thống đề xuất, trong đó các mục được tính điểm có thể được phân loại lại theo một số thuật toán khác (thường là không phải công nghệ học máy). Việc xếp hạng lại sẽ đánh giá danh sách các mục do giai đoạn chấm điểm tạo, thực hiện các thao tác như:

  • Loại bỏ các mục mà người dùng đã mua.
  • Tăng số điểm của mục mới hơn.

CN

ghi bàn

#recsystems

Một phần của hệ thống đề xuất cung cấp giá trị hoặc thứ hạng cho từng mục do giai đoạn tạo ứng viên tạo ra.

U

ma trận người dùng

#recsystems

Trong hệ thống đề xuất, một vectơ nhúng được tạo bằng hệ số ma trận chứa các tín hiệu tiềm ẩn về lựa chọn ưu tiên của người dùng. Mỗi hàng của ma trận người dùng chứa thông tin về độ mạnh tương đối của nhiều tín hiệu tiềm ẩn cho một người dùng. Ví dụ: hãy xem xét một hệ thống đề xuất phim. Trong hệ thống này, các tín hiệu tiềm ẩn trong ma trận người dùng có thể thể hiện mối quan tâm của từng người dùng đối với một số thể loại, hoặc có thể là tín hiệu khó hiểu hơn liên quan đến tương tác phức tạp trên nhiều yếu tố.

Ma trận người dùng có một cột cho mỗi đối tượng địa lý tiềm ẩn và một hàng cho mỗi người dùng. Tức là ma trận người dùng có cùng số hàng với ma trận mục tiêu đang được phân tích. Ví dụ: trong một hệ thống đề xuất phim cho 1.000.000 người dùng, ma trận người dùng sẽ có 1.000.000 hàng.

W

Hình vuông xoay chiều ít xoay vòng (WALS)

#recsystems

Một thuật toán giúp giảm thiểu hàm mục tiêu trong quá trình tính hệ số ma trận trong hệ thống đề xuất, cho phép tính trọng số cho các ví dụ bị thiếu. WALS giảm thiểu lỗi bình phương có trọng số giữa ma trận ban đầu và quá trình tái tạo bằng cách thay thế khi phân bổ giai thừa của hàng và giai thừa. Mỗi phương pháp tối ưu hoá này có thể được giải quyết bằng ít nhất chế độ tối ưu hoá lồi hình vuông. Để biết thông tin chi tiết, vui lòng xem khóa học Hệ thống đề xuất.