Hệ thống học máy sản xuất: Suy luận tĩnh so với suy luận động
Suy luận là quá trình
đưa ra dự đoán bằng cách áp dụng mô hình đã huấn luyện cho
các ví dụ chưa được gắn nhãn.
Nói chung, mô hình có thể dự đoán theo một trong hai cách:
Suy luận tĩnh (còn được gọi là suy luận ngoại tuyến hoặc
suy luận theo lô) nghĩa là mô hình đưa ra các dự đoán về một loạt
các ví dụ phổ biến chưa được gắn nhãn
rồi lưu các dự đoán đó vào bộ nhớ đệm ở một nơi nào đó.
Suy luận động (còn được gọi là suy luận trực tuyến hoặc theo thời gian thực
suy luận) có nghĩa là mô hình chỉ đưa ra dự đoán theo nhu cầu,
ví dụ như khi khách hàng yêu cầu thông tin dự đoán.
Để sử dụng một ví dụ cực đoan, hãy tưởng tượng một mô hình rất phức tạp
mất 1 giờ để dự đoán.
Đây có thể là một tình huống lý tưởng để suy luận tĩnh:
Giả sử cùng một mô hình phức tạp này sử dụng nhầm suy luận động thay vì
suy luận tĩnh. Nếu có nhiều khách hàng yêu cầu gợi ý cùng một lúc,
hầu hết họ sẽ không nhận được cụm từ gợi ý đó trong giờ hoặc ngày.
Bây giờ, hãy xem xét một mô hình có khả năng suy luận nhanh chóng,
có thể trong 2 mili giây bằng cách sử dụng
tối thiểu tương đối của tài nguyên điện toán. Trong tình huống này, khách hàng có thể
nhận được các dự đoán một cách nhanh chóng và hiệu quả thông qua suy luận động, như
được đề xuất trong Hình 5.
Suy luận tĩnh
Suy luận tĩnh mang lại một số ưu điểm và nhược điểm nhất định.
Ưu điểm
Không cần lo lắng nhiều về chi phí suy luận.
Có thể thực hiện quy trình xác minh thông tin dự đoán sau khi gửi thông tin dự đoán.
Nhược điểm
Chỉ có thể cung cấp các dự đoán được lưu vào bộ nhớ đệm, vì vậy, hệ thống có thể không
có thể phân phát nội dung dự đoán cho các ví dụ đầu vào không phổ biến.
Độ trễ cập nhật có thể được tính bằng giờ hoặc ngày.
Suy luận động
Suy luận động mang lại một số ưu điểm và nhược điểm nhất định.
Ưu điểm
Có thể dự đoán về bất kỳ mục mới nào khi mục đó xuất hiện, điều này
rất phù hợp với các dự đoán dài (ít phổ biến).
Nhược điểm
Điện toán chuyên sâu và nhạy cảm về độ trễ. Sự kết hợp này có thể giới hạn mô hình
phức tạp; tức là bạn có thể phải xây dựng một mô hình đơn giản hơn
dự đoán nhanh hơn so với một mô hình phức tạp.
Nhu cầu giám sát ngày càng cao hơn.
Bài tập: Kiểm tra mức độ hiểu biết của bạn
Ba câu nào trong số bốn câu sau đây là
đúng về suy luận tĩnh không?
Mô hình phải tạo thông tin dự đoán cho tất cả dữ liệu đầu vào có thể có.
Có, mô hình phải đưa ra dự đoán cho tất cả dữ liệu đầu vào có thể có và
lưu trữ chúng trong bộ nhớ đệm hoặc bảng tra cứu.
Nếu tập hợp những thứ mà mô hình đang dự đoán có giới hạn, thì
suy luận tĩnh có thể là lựa chọn phù hợp.
Tuy nhiên, đối với đầu vào dạng tự do như truy vấn của người dùng có
của những mặt hàng hiếm hoặc lạ, suy luận tĩnh không thể cung cấp
thông tin toàn cảnh.
Hệ thống có thể xác minh cụm từ gợi ý được dự đoán trước khi phân phát
chúng.
Có, đây là một khía cạnh hữu ích của suy luận tĩnh.
Đối với một đầu vào nhất định, mô hình có thể phân phát thông tin dự đoán nhanh hơn
so với suy luận động.
Có, suy luận tĩnh hầu như luôn có thể cung cấp các dự đoán nhanh hơn
so với suy luận động.
Bạn có thể phản ứng nhanh chóng với những thay đổi trên thế giới.
Không, đây là một bất lợi của suy luận tĩnh.
Một câu lệnh nào sau đây là
đúng về suy luận động không?
Bạn có thể đưa ra dự đoán cho tất cả các mục có thể có.
Vâng, đây là một thế mạnh của suy luận động. Bất kỳ yêu cầu nào
sẽ có điểm số. Suy luận động xử lý các đuôi dài
(những bản phân phối có nhiều vật phẩm hiếm), như không gian của tất cả
những câu có thể được viết trong bài đánh giá phim.
Bạn có thể thực hiện quy trình xác minh cụm từ gợi ý sau khi chúng được hiển thị
thường được sử dụng.
Nhìn chung, bạn không thể thực hiện quy trình sau khi xác minh tất cả
các dự đoán trước khi chúng được sử dụng bởi vì các dự đoán đang được
được tạo theo yêu cầu. Tuy nhiên, bạn có thể theo dõi
tổng hợp chất lượng dự đoán để đưa ra mức độ phù hợp
kiểm tra chất lượng, nhưng những thông tin này sẽ chỉ phát tín hiệu chuông báo cháy sau
đám cháy đã lan rộng.
Khi tiến hành suy luận động, bạn không cần phải lo lắng
về độ trễ của thông tin dự đoán (thời gian trễ của việc trả lại thông tin gợi ý)
nhiều như khi thực hiện suy luận tĩnh.
Độ trễ dự đoán thường là mối quan tâm thực sự trong suy luận động.
Rất tiếc, không phải lúc nào bạn cũng có thể khắc phục các vấn đề về độ trễ của cụm từ gợi ý
bằng cách thêm nhiều máy chủ suy luận.