Đóng khung vấn đề máy học

Sau khi xác minh rằng bài toán của bạn được giải quyết một cách hiệu quả nhất bằng cách sử dụng phương pháp dự đoán bằng công nghệ học máy hoặc một hướng tiếp cận dựa trên AI tạo sinh, thì bạn đã sẵn sàng trình bày vấn đề của mình bằng thuật ngữ học máy. Bạn xác định vấn đề trong các thuật ngữ học máy bằng cách hoàn thành các việc sau:

  • Xác định kết quả lý tưởng và mục tiêu của mô hình.
  • Xác định đầu ra của mô hình.
  • Xác định các chỉ số thành công.

Xác định kết quả lý tưởng và mục tiêu của mô hình

Khi độc lập với mô hình ML, kết quả lý tưởng là gì? Nói cách khác, điều gì sẽ làm tác vụ chính xác mà bạn muốn sản phẩm hoặc tính năng của mình thực hiện? Điều này cũng giống nhau câu lệnh mà bạn đã xác định trước đó trong Nêu mục tiêu .

Liên kết mục tiêu của mô hình với kết quả lý tưởng bằng cách xác định rõ ràng những gì bạn muốn mô hình thực hiện. Bảng sau đây trình bày các kết quả lý tưởng và mục tiêu của mô hình này cho các ứng dụng giả định:

Ứng dụng Kết quả lý tưởng Mục tiêu của mô hình
Ứng dụng thời tiết Tính lượng mưa theo gia số 6 giờ cho một khu vực địa lý. Dự đoán lượng mưa trong 6 giờ cho các khu vực địa lý cụ thể.
Ứng dụng thời trang Tạo ra nhiều kiểu dáng áo sơ mi. Tạo 3 loại thiết kế áo sơ mi từ văn bản và hình ảnh, trong đó văn bản cho biết kiểu và màu sắc, còn hình ảnh là loại áo sơ mi (áo phông, áo cài cúc, áo thun cổ bẻ).
Ứng dụng video Đề xuất video hữu ích. Dự đoán xem người dùng có nhấp vào video hay không.
Ứng dụng thư Phát hiện nội dung làm phiền. Dự đoán xem một email có phải là thư rác hay không.
Ứng dụng tài chính Tóm tắt thông tin tài chính từ nhiều nguồn tin tức. Tạo bản tóm tắt dài 50 từ về các xu hướng tài chính chính từ 7 ngày trước.
Ứng dụng Bản đồ Tính thời gian di chuyển. Dự đoán thời gian để đi giữa hai điểm.
Ứng dụng ngân hàng Xác định giao dịch gian lận. Dự đoán liệu một giao dịch có phải do chủ thẻ thực hiện hay không.
Ứng dụng ăn uống Xác định món ăn thông qua thực đơn của nhà hàng. Dự đoán loại hình nhà hàng.
Ứng dụng thương mại điện tử Tạo câu trả lời hỗ trợ khách hàng về sản phẩm của công ty. Tạo câu trả lời bằng cách sử dụng phân tích quan điểm và cơ sở kiến thức.

Xác định đầu ra bạn cần

Lựa chọn của bạn về loại mô hình phụ thuộc vào bối cảnh cụ thể và các hạn chế của vấn đề của bạn. Đầu ra của mô hình phải hoàn thành tác vụ được xác định trong kết quả lý tưởng. Do đó, câu hỏi đầu tiên cần trả lời là "Tôi cần loại dữ liệu đầu ra nào để giải quyết vấn đề của mình?"

Nếu cần phân loại nội dung nào đó hoặc đưa ra dự đoán dạng số, có thể bạn sẽ sử dụng công nghệ học máy dự đoán. Nếu bạn cần tạo nội dung mới hoặc sản xuất đầu ra liên quan đến việc hiểu ngôn ngữ tự nhiên, bạn có thể sẽ dùng AI tạo sinh.

Các bảng sau đây liệt kê kết quả của công nghệ học máy dự đoán và AI tạo sinh:

Bảng 1. Công nghệ học máy dự đoán
hệ thống học máy Kết quả ví dụ
Phân loại Tệp nhị phân Phân loại email là thư rác hoặc không phải thư rác.
Nhãn một nhãn cho nhiều lớp Phân loại động vật trong hình ảnh.
Nhiều lớp cho nhiều nhãn Phân loại tất cả các loài động vật trong một hình ảnh.
Số Hồi quy đơn chiều Dự đoán số lượt xem mà một video sẽ nhận được.
Hồi quy đa chiều Dự đoán huyết áp, nhịp tim và mức cholesterol cho một cá nhân.
Bảng 2. AI tạo sinh
Loại mô hình Kết quả ví dụ
Văn bản
Tóm tắt bài viết.

Trả lời bài đánh giá của khách hàng.

Dịch tài liệu từ tiếng Anh sang tiếng Quan thoại.

Viết nội dung mô tả sản phẩm.

Phân tích tài liệu pháp lý.
Bài đăng có hình ảnh
Tạo hình ảnh tiếp thị.

Áp dụng hiệu ứng hình ảnh cho ảnh.

Tạo các biến thể thiết kế sản phẩm.
Âm thanh
Tạo hội thoại bằng một giọng cụ thể.

Sáng tạo một bản sáng tác nhạc ngắn theo một thể loại cụ thể, chẳng hạn như nhạc jazz.
Video
Tạo video trông như thật.

Phân tích cảnh quay video và áp dụng hiệu ứng hình ảnh.
Đa phương thức Tạo nhiều loại đầu ra, chẳng hạn như một video có phụ đề dạng văn bản.

Phân loại

Mô hình phân loại dự đoán xem dữ liệu đầu vào thuộc danh mục nào, ví dụ: liệu đầu vào phải được phân loại là A, B hoặc C.

Một mô hình phân loại đang đưa ra dự đoán.

Hình 1. Mô hình phân loại đưa ra dự đoán.

Dựa trên thông tin dự đoán của mô hình, ứng dụng của bạn có thể đưa ra quyết định. Ví dụ: nếu dự đoán là danh mục A, thì làm X; nếu cụm từ gợi ý là danh mục B, thì làm, Y; nếu dự đoán là danh mục C, thì thực hiện Z. Trong một số trường hợp, việc dự đoán kết quả của ứng dụng.

Mã sản phẩm sử dụng kết quả của mô hình để đưa ra quyết định.

Hình 2. Đầu ra của mô hình phân loại được sử dụng trong mã sản phẩm để đưa ra quyết định.

Hồi quy

Mô hình hồi quy dự đoán một giá trị số.

Mô hình hồi quy đang đưa ra dự đoán.

Hình 3. Mô hình hồi quy đưa ra dự đoán dạng số.

Dựa trên thông tin dự đoán của mô hình, ứng dụng của bạn có thể đưa ra quyết định. Ví dụ: nếu dự đoán thuộc phạm vi A thì X; nếu thông tin dự đoán nằm trong phạm vi B, do Y; nếu thông tin dự đoán nằm trong phạm vi C, hãy thực hiện Z. Trong một số trường hợp, thông tin dự đoán kết quả của ứng dụng.

Mã sản phẩm sử dụng kết quả của mô hình để đưa ra quyết định.

Hình 4. Đầu ra của mô hình hồi quy được sử dụng trong mã sản phẩm để tạo quyết định.

Hãy xem xét trường hợp sau:

Bạn muốn lưu vào bộ nhớ đệm dựa trên mức độ phổ biến theo dự đoán. Nói cách khác, nếu mô hình của bạn dự đoán rằng một video sẽ phổ biến, bạn muốn nhanh chóng phân phát video đó tới người dùng. Người nhận làm như vậy, bạn sẽ sử dụng bộ nhớ đệm hiệu quả và đắt tiền hơn. Đối với các video khác, bạn sẽ sử dụng một bộ nhớ đệm khác. Tiêu chí lưu vào bộ nhớ đệm của bạn như sau:

  • Nếu một video được dự đoán sẽ có 50 lượt xem trở lên, bạn sẽ sử dụng phương pháp bộ nhớ đệm.
  • Nếu một video được dự đoán sẽ nhận được từ 30 đến 50 lượt xem, bạn sẽ sử dụng chiến lược giá rẻ bộ nhớ đệm.
  • Nếu video được dự đoán có ít hơn 30 lượt xem, bạn sẽ không lưu video.

Bạn cho rằng mô hình hồi quy là phương pháp phù hợp vì bạn sẽ dự đoán một giá trị số — số lượt xem. Tuy nhiên, khi huấn luyện hàm hồi quy vào một mô hình, bạn nhận thấy rằng nó sẽ tạo ra thua cho dự đoán là 28 và 32 cho video có 30 lượt xem. Nói cách khác, mặc dù ứng dụng của bạn sẽ có nếu dự đoán là 28 so với 32 thì mô hình sẽ xem xét cả đều tốt như nhau.

Một mô hình đang được huấn luyện và tổn thất trong mô hình được đánh giá.

Hình 5. Đào tạo mô hình hồi quy.

Mô hình hồi quy không biết đến các ngưỡng do sản phẩm xác định. Do đó, nếu hành vi của ứng dụng thay đổi đáng kể do những khác biệt nhỏ về dự đoán của mô hình hồi quy, bạn nên cân nhắc triển khai mô hình phân loại.

Trong trường hợp này, mô hình phân loại sẽ tạo ra hành vi chính xác vì mô hình phân loại sẽ tổn thất cao hơn cho một dự đoán 28 hơn 32. Về mặt nào đó, mô hình phân loại sẽ tạo ra các ngưỡng theo mặc định.

Tình huống này nêu bật hai điểm quan trọng:

  • Dự đoán quyết định. Khi có thể, hãy dự đoán quyết định mà ứng dụng của bạn sẽ đưa ra thực hiện. Trong ví dụ dạng video, mô hình phân loại sẽ dự đoán cho biết liệu các danh mục mà nó phân loại video là "không có bộ nhớ đệm" "rẻ " và "bộ nhớ đệm đắt đỏ". Việc ẩn hành vi của ứng dụng khỏi mô hình có thể khiến ứng dụng của bạn thực hiện hành vi không chính xác.

  • Tìm hiểu những hạn chế của bài toán. Nếu ứng dụng của bạn thực hiện dựa trên các ngưỡng khác nhau, hãy xác định xem các ngưỡng đó cố định hoặc động.

    • Ngưỡng động: Nếu các ngưỡng là động, hãy sử dụng mô hình hồi quy và đặt giới hạn cho các ngưỡng trong mã của ứng dụng. Nhờ đó, bạn có thể dễ dàng cập nhật các ngưỡng trong khi vẫn để mô hình làm cho hợp lý dự đoán.
    • Ngưỡng cố định: Nếu các ngưỡng được cố định, hãy sử dụng mô hình phân loại và gắn nhãn tập dữ liệu dựa trên giới hạn ngưỡng.

    Nhìn chung, hầu hết quy trình cấp phép bộ nhớ đệm đều diễn ra linh động và các ngưỡng sẽ thay đổi theo thời gian. Do đó, do đây là vấn đề cụ thể về việc lưu vào bộ nhớ đệm, mô hình hồi quy là lựa chọn tốt nhất. Tuy nhiên, đối với nhiều vấn đề, việc các ngưỡng sẽ được khắc phục, khiến cho mô hình phân loại trở thành giải pháp tốt nhất.

Hãy xem một ví dụ khác. Nếu bạn đang tạo một ứng dụng thời tiết có kết quả lý tưởng là cho người dùng biết lượng mưa trong 6 giờ tới, bạn có thể sử dụng mô hình hồi quy dự đoán nhãn precipitation_amount.

Kết quả lý tưởng Nhãn lý tưởng
Cho người dùng biết lượng mưa ở khu vực của họ theo sáu giờ tới. precipitation_amount

Trong ví dụ về ứng dụng thời tiết, nhãn trực tiếp đề cập đến kết quả lý tưởng. Tuy nhiên, trong một số trường hợp, mối quan hệ một với một không rõ ràng giữa kết quả lý tưởng và nhãn. Ví dụ: trong ứng dụng video, kết quả lý tưởng là để đề xuất video hữu ích. Tuy nhiên, không có nhãn nào trong tập dữ liệu được gọi useful_to_user.

Kết quả lý tưởng Nhãn lý tưởng
Đề xuất video hữu ích. ?

Do đó, bạn phải tìm một nhãn proxy.

Nhãn proxy

Nhãn proxy thay thế cho không có trong tập dữ liệu. Cần có nhãn proxy khi bạn không thể trực tiếp đo lường những gì bạn muốn dự đoán. Trong ứng dụng video, chúng tôi không thể trực tiếp đo lường xem người dùng có thấy một video hữu ích hay không. Thật tuyệt nếu có tính năng useful và người dùng đã đánh dấu tất cả video mà họ tìm thấy hữu ích, nhưng do tập dữ liệu không hữu ích, nên chúng ta cần một nhãn proxy giá trị thay thế cho tính hữu ích.

Nhãn proxy về mức độ hữu ích có thể là việc người dùng có chia sẻ hoặc thích hay không video.

Kết quả lý tưởng Nhãn proxy
Đề xuất video hữu ích. shared OR liked

Hãy thận trọng với các nhãn proxy vì chúng không trực tiếp đo lường những gì bạn muốn dự đoán. Ví dụ: bảng sau đây trình bày các vấn đề có thể xảy ra nhãn proxy cho Đề xuất video hữu ích:

Nhãn proxy Vấn đề
Dự đoán xem liệu người dùng có nhấp vào nút "thích" . Hầu hết người dùng không bao giờ nhấp vào "thích".
Dự đoán xem một video có phổ biến hay không. Không được cá nhân hoá. Một số người dùng có thể không thích các video phổ biến.
Dự đoán xem người dùng có chia sẻ video hay không. Một số người dùng không chia sẻ video. Đôi khi, mọi người chia sẻ video vì nhưng không thích.
Dự đoán xem người dùng có nhấp vào phát hay không. Tối đa hoá tỷ lệ dụ nhấp.
Dự đoán thời gian họ xem video. Ưu tiên video dài khác với video ngắn.
Dự đoán số lần người dùng sẽ xem lại video đó. Ưu tiên video "có thể xem lại" video vượt quá những thể loại video không xem lại được.

Không có nhãn đại diện nào có thể thay thế hoàn hảo cho kết quả lý tưởng của bạn. Tất cả sẽ có thể gặp vấn đề. Hãy chọn phương án ít gặp vấn đề nhất với trường hợp sử dụng.

Kiểm tra sự hiểu biết của bạn

Một công ty muốn sử dụng công nghệ học máy trong ứng dụng sức khoẻ thể chất và tinh thần để hỗ trợ mọi người sẽ cảm thấy tốt hơn. Bạn có nghĩ rằng họ sẽ cần sử dụng nhãn proxy để hoàn thành mục tiêu của mình?
Có, công ty cần tìm các nhãn proxy. Các danh mục như hạnh phúc và sức khoẻ thể chất không thể đo lường trực tiếp được. Thay vào đó, họ cần được ước chừng so với một số tính năng khác, chẳng hạn như số giờ đã sử dụng tập thể dục mỗi tuần hoặc thời gian dành cho sở thích hoặc tương tác với bạn bè.
Không, công ty sẽ không cần sử dụng nhãn proxy. Hạnh phúc và sức khoẻ đo lường trực tiếp.

Thế hệ

Trong hầu hết trường hợp, bạn sẽ không tự huấn luyện mô hình tạo sinh của mình vì làm như vậy đòi hỏi lượng lớn dữ liệu huấn luyện và tài nguyên điện toán. Thay vào đó, bạn sẽ tuỳ chỉnh một mô hình tạo sinh luyện sẵn. Để tải mô hình tạo sinh tạo đầu ra mong muốn, bạn có thể cần phải sử dụng một hoặc nhiều kỹ thuật:

  • chưng cất. Để tạo một phiên bản nhỏ hơn của mô hình lớn hơn, bạn sẽ tạo một tập dữ liệu tổng hợp có gắn nhãn từ mô hình lớn hơn mà bạn sử dụng để huấn luyện mô hình nhỏ hơn. Tạo sinh các mô hình thường có kích thước khổng lồ và tiêu tốn nhiều tài nguyên (như bộ nhớ) và điện). Phương pháp chưng cất giúp giảm bớt công sức và tiêu tốn tài nguyên để ước tính hiệu suất của mô hình lớn hơn.

  • Điều chỉnh hoặc điều chỉnh hiệu quả về tham số. Để cải thiện hiệu suất của mô hình trong một tác vụ cụ thể, bạn cần tiếp tục huấn luyện mô hình trên một tập dữ liệu chứa các ví dụ về loại dữ liệu đầu ra mà bạn muốn sản xuất.

  • Kỹ thuật câu lệnh. Người nhận tìm hiểu mô hình để thực hiện một tác vụ cụ thể hoặc tạo đầu ra ở một định dạng cụ thể, bạn cho mô hình biết tác vụ bạn muốn để làm hoặc giải thích cách bạn muốn định dạng đầu ra. Nói cách khác, câu lệnh có thể bao gồm hướng dẫn bằng ngôn ngữ tự nhiên về cách thực hiện nhiệm vụ hoặc ví dụ minh hoạ với kết quả mong muốn.

    Ví dụ: nếu muốn bản tóm tắt ngắn về các bài viết, bạn có thể nhập sau:

    Produce 100-word summaries for each article.
    

    Nếu bạn muốn mô hình này tạo văn bản cho một cấp độ đọc cụ thể, bạn có thể nhập các thông tin sau:

    All the output should be at a reading level for a 12-year-old.
    

    Nếu muốn mô hình cung cấp kết quả ở một định dạng cụ thể, bạn có thể giải thích cách định dạng đầu ra—ví dụ: "định dạng kết quả trong bảng" – hoặc bạn có thể minh hoạ nhiệm vụ bằng cách đưa ra ví dụ. Ví dụ: bạn có thể nhập như sau:

    Translate words from English to Spanish.
    
    English: Car
    Spanish: Auto
    
    English: Airplane
    Spanish: Avión
    
    English: Home
    Spanish:______
    

Quá trình chưng cất và tinh chỉnh sẽ cập nhật tham số. Kỹ thuật đặt câu lệnh không cập nhật các thông số của mô hình. Thay vào đó, kỹ thuật câu lệnh giúp mô hình này tìm hiểu cách tạo đầu ra mong muốn từ ngữ cảnh của câu lệnh.

Trong một số trường hợp, bạn cũng sẽ cần có tập dữ liệu thử nghiệm để đánh giá đầu ra của mô hình tạo sinh so với các giá trị đã biết, chẳng hạn như kiểm tra xem bản tóm tắt của mô hình tương tự với bản tóm tắt do con người tạo hoặc bản tóm tắt mà con người đánh giá các tóm tắt của mô hình là tốt.

AI tạo sinh cũng có thể dùng để triển khai công nghệ học máy có tính dự đoán như phân loại hoặc hồi quy. Ví dụ: nhờ hiểu biết sâu sắc về ngôn ngữ tự nhiên, mô hình ngôn ngữ lớn (LLM) thường có thể thực hiện nhiệm vụ phân loại văn bản hiệu quả hơn so với công nghệ học máy dự đoán được huấn luyện cho nhiệm vụ cụ thể.

Xác định chỉ số thành công

Xác định các chỉ số mà bạn sẽ sử dụng để xác định xem có triển khai công nghệ học máy hay không đã thành công. Chỉ số thành công xác định những điều bạn quan tâm, như mức độ tương tác hay giúp người dùng thực hiện hành động thích hợp, chẳng hạn như xem video mà họ sẽ tìm thấy hữu ích. Chỉ số thành công khác với chỉ số đánh giá của mô hình, chẳng hạn như tính chính xác, độ chính xác, khơi gợi, hoặc AUC.

Ví dụ: chỉ số thành công và không thành công của ứng dụng thời tiết có thể được định nghĩa là như sau:

Thành công Người dùng mở mục "Liệu trời có mưa không?" mô tả thường xuyên hơn 50% so với trước đây.
Không thành công Người dùng mở mục "Liệu trời có mưa không?" giới thiệu không thường xuyên hơn trước đó.

Chỉ số ứng dụng video có thể được xác định như sau:

Thành công Trung bình, người dùng dành thêm 20% thời gian trên trang web.
Không thành công Trung bình, người dùng không dành nhiều thời gian trên trang web hơn trước đây.

Bạn nên xác định các chỉ số thành công đầy tham vọng. Tham vọng quá lớn có thể tạo ra khoảng cách giữa thành công và không thành công. Ví dụ: mức chi tiêu trung bình của người dùng Tăng 10% thời gian trên trang web so với trước đây không phải là thành công cũng không thất bại. Khoảng cách không xác định không phải là điều quan trọng.

Điều quan trọng là khả năng di chuyển gần hơn của mô hình của bạn, hoặc vượt trội—định nghĩa của thành công. Ví dụ: khi phân tích hãy xem xét câu hỏi sau: Việc cải thiện mô hình có giúp bạn nâng cao hiệu suất gần với tiêu chí thành công bạn đã xác định hơn? Ví dụ: một mô hình có thể có các chỉ số đánh giá, nhưng không giúp bạn tiến gần hơn đến tiêu chí thành công, cho biết rằng ngay cả với một mô hình hoàn hảo, bạn sẽ không đáp ứng được các tiêu chí thành công mà bạn xác định. Mặt khác, một mô hình có thể có các chỉ số đánh giá kém, nhưng đưa bạn đến gần tiêu chí thành công hơn, cho thấy rằng việc cải thiện mô hình sẽ giúp đưa bạn đến gần thành công hơn.

Sau đây là các phương diện cần xem xét khi xác định giá trị của mô hình cải thiện:

  • Chưa đủ, hãy tiếp tục. Mô hình không nên được sử dụng trong một nhưng môi trường này có thể được cải thiện đáng kể theo thời gian.

  • Đủ lợi ích và tiếp tục. Mô hình này có thể được sử dụng trong phiên bản chính thức môi trường xung quanh và có thể được cải thiện hơn nữa.

  • Đủ tốt, nhưng không thể cải thiện hơn. Mô hình này đang ở giai đoạn phát hành chính thức nhưng có thể sẽ tốt nhất có thể.

  • Chưa đủ tốt, và sẽ không bao giờ tốt. Mô hình không nên được sử dụng trong một và môi trường sản xuất và không cần phải đào tạo nhiều.

Khi quyết định cải thiện mô hình, hãy đánh giá lại xem có tăng nguồn lực hay không, như thời gian kỹ thuật và chi phí điện toán, hãy biện minh cho sự cải thiện dự đoán của mô hình.

Sau khi xác định chỉ số thành công và không thành công, bạn cần xác định tần suất bạn sẽ đo lường chúng. Ví dụ: bạn có thể đo lường 6 chỉ số thành công ngày, sáu tuần hoặc sáu tháng sau khi triển khai hệ thống.

Khi phân tích các chỉ số về lỗi, hãy cố gắng xác định lý do hệ thống gặp lỗi. Cho có thể là mô hình dự đoán người dùng sẽ nhấp vào video nào, nhưng có thể bắt đầu đề xuất các tiêu đề mồi nhử nhấp chuột khiến người dùng tương tác bỏ ngang. Trong ví dụ về ứng dụng thời tiết, mô hình có thể dự đoán chính xác thời điểm sẽ mưa nhưng ở phạm vi quá rộng của một khu vực địa lý.

Kiểm tra sự hiểu biết của bạn

Một hãng thời trang muốn bán nhiều quần áo hơn. Có người đề xuất sử dụng công nghệ học máy để xác định loại quần áo mà công ty nên sản xuất. Họ cho rằng mình có thể huấn luyện người mẫu để xác định loại trang phục nào hợp thời trang. Sau họ huấn luyện mô hình, họ muốn áp dụng mô hình đó vào danh mục của mình để quyết định nên may quần áo nào.

Công ty này nên trình bày vấn đề của mình bằng thuật ngữ học máy như thế nào?

Kết quả lý tưởng: Xác định những sản phẩm nên sản xuất.

Mục tiêu của người mẫu: Dự đoán loại sản phẩm quần áo thời trang.

Đầu ra của mô hình: Phân loại nhị phân, in_fashion, not_in_fashion

Chỉ số thành công: Bán được 70% quần áo trở lên đã thực hiện.

Kết quả lý tưởng: Xác định số lượng vải và nguồn cung cấp để đặt hàng.

Mục tiêu của mô hình: Dự đoán giá trị sản xuất của mỗi mặt hàng.

Đầu ra của mô hình: Phân loại nhị phân, make, do_not_make

Chỉ số thành công: Bán được 70% quần áo trở lên đã thực hiện.

Kết quả lý tưởng không phải là xác định số lượng vải và nguồn cung cấp đơn đặt hàng. Thuộc tính này xác định xem một mặt hàng có nên được sản xuất hay không. Do đó, thì mục tiêu của mô hình đề cập không đúng mục tiêu.