Bảng thuật ngữ về học máy: Hệ thống đề xuất

Trang này chứa các thuật ngữ trong bảng thuật ngữ của Hệ thống đề xuất. Đối với tất cả các thuật ngữ trong bảng thuật ngữ, nhấp vào đây.

C

tạo ứng viên

#recsystems

Bộ đề xuất ban đầu do hệ thống đề xuất. Ví dụ: hãy cân nhắc hiệu sách cung cấp 100.000 đầu sách. Giai đoạn tạo ứng viên tạo một danh sách nhỏ hơn nhiều gồm các sách phù hợp cho một người dùng cụ thể, chẳng hạn như 500. Nhưng ngay cả khi 500 cuốn sách là quá nhiều để giới thiệu cho người dùng. Sau đó, đắt hơn, các giai đoạn của hệ thống đề xuất (chẳng hạn như tính điểmxếp hạng lại), hãy giảm 500 thành phần đó xuống bộ đề xuất hữu ích hơn.

lọc cộng tác

#recsystems

Đưa ra dự đoán về mối quan tâm của một người dùng dựa trên sở thích của nhiều người dùng khác. Lọc cộng tác thường được dùng trong hệ thống đề xuất.

I

ma trận mục

#recsystems

Trong hệ thống đề xuất, ma trận vectơ nhúng do phân tích ma trận giữ tín hiệu tiềm ẩn về từng mục. Mỗi hàng của ma trận mặt hàng chứa giá trị của một trạng thái tiềm ẩn cho tất cả các mục. Ví dụ: hãy cân nhắc sử dụng hệ thống đề xuất phim. Mỗi cột trong ma trận mục biểu thị một phim. Tín hiệu tiềm ẩn có thể đại diện cho thể loại hoặc có thể khó hiểu hơn tín hiệu liên quan đến hoạt động tương tác phức tạp giữa các thể loại, ngôi sao tuổi của phim hoặc các yếu tố khác.

Ma trận mặt hàng có cùng số lượng cột với mục tiêu ma trận được phân tích. Ví dụ: giả sử một bộ phim hệ thống đề xuất đánh giá 10.000 tựa phim, ma trận mục sẽ có 10.000 cột.

items

#recsystems

Trong hệ thống đề xuất, các pháp nhân do hệ thống đề xuất. Ví dụ: video là các mặt hàng mà cửa hàng video khuyên dùng, trong khi sách là mặt hàng mà hiệu sách khuyên dùng.

M

phân tích ma trận

#recsystems

Trong toán học, một cơ chế để tìm ma trận có tích vô hướng xấp xỉ một ma trận mục tiêu.

Trong hệ thống đề xuất, ma trận mục tiêu thường nắm giữ thông tin xếp hạng cho mặt hàng. Ví dụ: mục tiêu ma trận cho hệ thống đề xuất phim có thể trông giống như theo sau, trong đó số nguyên dương là xếp hạng của người dùng và 0 có nghĩa là người dùng không xếp hạng phim:

  Casablanca Câu chuyện về Floodlight Black Panther (Chiến binh Báo Đen) Nữ thần chiến binh Sách hư cấu về thịt
Người dùng 1 5 3 0,0 2 0,0
Người dùng 2 4 0,0 0,0 1.0 5
Người dùng 3 3 1.0 4 5 0,0

Hệ thống đề xuất phim dùng để dự đoán điểm xếp hạng của người dùng cho phim chưa được xếp hạng. Ví dụ: Người dùng 1 có thích Báo đen không?

Một phương pháp tiếp cận cho các hệ thống đề xuất là dùng ma trận phân tích nhân tử để tạo hai ma trận sau:

  • Ma trận người dùng, có hình dạng bằng số người dùng X số lượng phương diện nhúng.
  • Một ma trận mục, có hình dạng bằng số lượt nhúng X số lượng mặt hàng.

Ví dụ: chúng tôi sử dụng phân tích ma trận cho 3 người dùng và 5 mục có thể mang lại ma trận người dùng và ma trận mục sau:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Tích vô hướng của ma trận người dùng và ma trận mặt hàng đưa ra một đề xuất ma trận không chỉ chứa xếp hạng ban đầu của người dùng mà còn cả các dự đoán cho những bộ phim mà từng người dùng chưa xem. Ví dụ: hãy xem xét điểm xếp hạng của Người dùng 1 về Casablanca là 5.0. Dấu chấm tích tương ứng với ô đó trong ma trận đề xuất phải hy vọng vào khoảng 5.0 và đó là:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Quan trọng hơn, Người dùng 1 có thích Báo đen không? Lấy tích vô hướng tương ứng với hàng đầu tiên và cột thứ ba mang lại kết quả dự đoán. điểm xếp hạng 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Phân tích ma trận thường tạo ra ma trận người dùng và ma trận mục mà kết hợp với nhau nhỏ gọn hơn đáng kể so với ma trận mục tiêu.

Điểm

hệ thống đề xuất

#recsystems

Một hệ thống chọn cho mỗi người dùng một nhóm tương đối nhỏ gồm các các mục trong một tập sao lục lớn. Ví dụ: hệ thống đề xuất video có thể đề xuất hai video từ kho video gồm 100.000 video, chọn CasablancaCâu chuyện của Phi hành đoàn mỹ phẩm dành cho một người dùng và Wonder WomenBlack Panther cho một trò chơi khác. Hệ thống đề xuất video có thể đưa ra đề xuất dựa trên các yếu tố như:

  • Phim mà những người dùng tương tự đã xếp hạng hoặc xem.
  • Thể loại, đạo diễn, diễn viên, đối tượng nhân khẩu học mục tiêu...

xếp hạng lại

#recsystems

Giai đoạn cuối cùng của hệ thống đề xuất, trong thời gian đó, các mục được tính điểm có thể được chấm điểm lại theo một số (thường là thuật toán không phải học máy). Việc xếp hạng lại sẽ đánh giá danh sách các mục được tạo bởi giai đoạn tính điểm, thực hiện các hành động như:

  • Loại bỏ các mặt hàng mà người dùng đã mua.
  • Tăng điểm số cho các mục mới hơn.

CN

ghi điểm

#recsystems

Thuộc hệ thống đề xuất mà cung cấp giá trị hoặc thứ hạng cho mỗi mặt hàng do Giai đoạn tạo đề xuất.

U

ma trận người dùng

#recsystems

Trong hệ thống đề xuất, vectơ nhúng do phân tích ma trận lưu giữ tín hiệu tiềm ẩn về lựa chọn ưu tiên của người dùng. Mỗi hàng của ma trận người dùng chứa thông tin về biến thể tương đối cường độ của nhiều tín hiệu tiềm ẩn cho một người dùng. Ví dụ: hãy cân nhắc sử dụng hệ thống đề xuất phim. Trong hệ thống này, các tín hiệu tiềm ẩn trong ma trận người dùng có thể thể hiện mối quan tâm của từng người dùng thể loại cụ thể hoặc có thể là những tín hiệu khó diễn giải hơn liên quan đến tương tác phức tạp dựa trên nhiều yếu tố.

Ma trận người dùng có một cột cho từng tính năng tiềm ẩn và một hàng cho từng người dùng. Tức là ma trận người dùng có cùng số hàng với mục tiêu ma trận được phân tích. Ví dụ: giả sử một bộ phim hệ thống đề xuất cho 1.000.000 người dùng, ma trận người dùng sẽ có 1.000.000 hàng.

W

Hình vuông ít thay thế thay thế có trọng số (WALS)

#recsystems

Một thuật toán để giảm thiểu hàm mục tiêu trong khoảng thời gian phân tích ma trận trong hệ thống đề xuất, cho phép giảm trọng số của các ví dụ bị thiếu. WALS giúp giảm thiểu trọng số sai số bình phương giữa ma trận ban đầu và quá trình tái tạo bằng cách xen kẽ giữa sửa lỗi phân tích hàng và phân tích cột. Có thể giải mỗi loại tối ưu hoá này bằng số bình phương tối thiểu tối ưu hoá mặt đồng hồ. Để biết chi tiết, hãy xem Khoá học về Hệ thống đề xuất.