Bảng thuật ngữ về học máy: Hệ thống đề xuất

Trang này chứa các thuật ngữ trong từ điển về Hệ thống đề xuất. Để xem tất cả các thuật ngữ trong từ điển, hãy nhấp vào đây.

C

tạo đề xuất

#recsystems

Bộ đề xuất ban đầu do một hệ thống đề xuất chọn. Ví dụ: hãy xem xét một hiệu sách cung cấp 100.000 đầu sách. Giai đoạn tạo đề xuất tạo một danh sách sách phù hợp nhỏ hơn nhiều cho một người dùng cụ thể, giả sử là 500 cuốn. Nhưng ngay cả 500 cuốn sách cũng là quá nhiều để đề xuất cho người dùng. Các giai đoạn tiếp theo, tốn kém hơn của hệ thống đề xuất (chẳng hạn như đánh giáxếp hạng lại) sẽ giảm 500 đề xuất đó xuống một nhóm đề xuất nhỏ hơn và hữu ích hơn nhiều.

Hãy xem phần Tổng quan về việc tạo đề xuất trong khoá học Hệ thống đề xuất để biết thêm thông tin.

lọc cộng tác

#recsystems

Dự đoán mối quan tâm của một người dùng dựa trên mối quan tâm của nhiều người dùng khác. Lọc cộng tác thường được dùng trong hệ thống đề xuất.

Hãy xem phần Lọc cộng tác trong khoá học Hệ thống đề xuất để biết thêm thông tin.

I

ma trận mặt hàng

#recsystems

Trong hệ thống đề xuất, một ma trận vectơ nhúng được tạo bằng phân tích nhân ma trận chứa các tín hiệu tiềm ẩn về từng mục. Mỗi hàng của ma trận mục chứa giá trị của một đặc điểm tiềm ẩn duy nhất cho tất cả các mục. Ví dụ: hãy xem xét một hệ thống đề xuất phim. Mỗi cột trong ma trận mục đại diện cho một bộ phim. Các tín hiệu tiềm ẩn có thể đại diện cho các thể loại hoặc có thể là các tín hiệu khó diễn giải hơn liên quan đến các hoạt động tương tác phức tạp giữa thể loại, diễn viên, độ tuổi của phim hoặc các yếu tố khác.

Ma trận mục có cùng số cột với ma trận mục tiêu đang được phân tích. Ví dụ: giả sử hệ thống đề xuất phim đánh giá 10.000 bộ phim, thì ma trận mục sẽ có 10.000 cột.

mục

#recsystems

Trong hệ thống đề xuất, các thực thể mà hệ thống đề xuất. Ví dụ: video là các mặt hàng mà cửa hàng video đề xuất, còn sách là các mặt hàng mà hiệu sách đề xuất.

M

phân tích ma trận

#recsystems

Trong toán học, một cơ chế để tìm các ma trận có tích vô hướng xấp xỉ với ma trận mục tiêu.

Trong hệ thống đề xuất, ma trận mục tiêu thường chứa điểm xếp hạng của người dùng về các mục. Ví dụ: ma trận mục tiêu cho hệ thống đề xuất phim có thể có dạng như sau, trong đó các số nguyên dương là điểm xếp hạng của người dùng và 0 có nghĩa là người dùng không xếp hạng phim:

  Casablanca The Philadelphia Story Black Panther (Chiến binh Báo Đen) Wonder Woman Pulp Fiction
Người dùng 1 5 3 0,0 2 0,0
Người dùng 2 4 0,0 0,0 1.0 5
Người dùng 3 3 1.0 4 5 0,0

Hệ thống đề xuất phim nhằm mục đích dự đoán điểm xếp hạng của người dùng đối với các bộ phim chưa được phân loại. Ví dụ: Người dùng 1 có thích Black Panther không?

Một phương pháp cho hệ thống đề xuất là sử dụng phép phân tích ma trận để tạo ra hai ma trận sau:

Ví dụ: việc sử dụng phép phân tích ma trận trên 3 người dùng và 5 mặt hàng có thể tạo ra ma trận người dùng và ma trận mặt hàng sau:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Sản phẩm nội tích của ma trận người dùng và ma trận mặt hàng sẽ tạo ra một ma trận đề xuất không chỉ chứa điểm xếp hạng ban đầu của người dùng mà còn chứa cả dự đoán cho những bộ phim mà mỗi người dùng chưa xem. Ví dụ: hãy xem xét điểm xếp hạng của Người dùng 1 cho Casablanca là 5.0. Sản phẩm dấu chấm tương ứng với ô đó trong ma trận đề xuất hy vọng sẽ là khoảng 5, 0 và là:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Quan trọng hơn, Người dùng 1 có thích Black Panther không? Lấy tích vô hướng tương ứng với hàng đầu tiên và cột thứ ba sẽ cho ra điểm xếp hạng dự đoán là 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Quá trình phân tích ma trận thường tạo ra một ma trận người dùng và một ma trận mặt hàng, cùng với nhau, chúng nhỏ gọn hơn đáng kể so với ma trận mục tiêu.

Điểm

hệ thống đề xuất

#recsystems

Một hệ thống chọn cho mỗi người dùng một nhóm tương đối nhỏ các mục mong muốn từ một tập hợp lớn. Ví dụ: hệ thống đề xuất video có thể đề xuất hai video trong một tập hợp gồm 100.000 video, chọn CasablancaThe Philadelphia Story cho một người dùng và Wonder WomanBlack Panther cho người dùng khác. Hệ thống đề xuất video có thể dựa trên các yếu tố như:

  • Những bộ phim mà người dùng tương tự đã đánh giá hoặc xem.
  • Thể loại, đạo diễn, diễn viên, đối tượng mục tiêu...

xếp hạng lại

#recsystems

Giai đoạn cuối cùng của một hệ thống đề xuất, trong đó các mục được tính điểm có thể được chấm lại theo một số thuật toán khác (thường là không phải thuật toán học máy). Việc xếp hạng lại sẽ đánh giá danh sách các mục do giai đoạn đánh giá tạo ra, thực hiện các hành động như:

  • Xoá những mặt hàng mà người dùng đã mua.
  • Tăng điểm số của các mục mới hơn.

S

tính điểm

#recsystems

Một phần của hệ thống đề xuất cung cấp giá trị hoặc thứ hạng cho từng mục do giai đoạn tạo đề xuất tạo ra.

U

ma trận người dùng

#recsystems

Trong hệ thống đề xuất, vectơ nhúng do phân tích ma trận tạo ra chứa các tín hiệu tiềm ẩn về lựa chọn ưu tiên của người dùng. Mỗi hàng của ma trận người dùng chứa thông tin về cường độ tương đối của nhiều tín hiệu tiềm ẩn cho một người dùng. Ví dụ: hãy xem xét một hệ thống đề xuất phim. Trong hệ thống này, các tín hiệu tiềm ẩn trong ma trận người dùng có thể thể hiện mối quan tâm của từng người dùng đối với các thể loại cụ thể, hoặc có thể là các tín hiệu khó diễn giải hơn liên quan đến các hoạt động tương tác phức tạp trên nhiều yếu tố.

Ma trận người dùng có một cột cho mỗi đặc điểm tiềm ẩn và một hàng cho mỗi người dùng. Tức là ma trận người dùng có cùng số hàng với ma trận mục tiêu đang được phân tích. Ví dụ: với một hệ thống đề xuất phim cho 1.000.000 người dùng, ma trận người dùng sẽ có 1.000.000 hàng.

W

Phương pháp bình phương tối thiểu luân phiên có trọng số (WALS)

#recsystems

Thuật toán để giảm thiểu hàm mục tiêu trong quá trình phân tích ma trận trong hệ thống đề xuất, cho phép giảm trọng số của các ví dụ bị thiếu. WALS giảm thiểu lỗi bình phương có trọng số giữa ma trận ban đầu và ma trận được tái tạo bằng cách luân phiên giữa việc sửa đổi phép phân tích theo hàng và phép phân tích theo cột. Bạn có thể giải quyết từng phương pháp tối ưu hoá này bằng tối ưu hoá lồi theo phương pháp bình phương nhỏ nhất. Để biết thông tin chi tiết, hãy xem khoá học Hệ thống đề xuất.