Công nghệ học máy tự động (AutoML)

Nếu đang bắt đầu một dự án học máy (ML) mới, bạn có thể thắc mắc nếu huấn luyện thủ công là lựa chọn duy nhất để xây dựng mô hình học máy. Bằng quy trình huấn luyện thủ công, bạn sẽ viết mã bằng khung máy học để tạo mô hình. Trong quá trình này, bạn chọn thuật toán nào để khám phá và điều chỉnh lặp lại siêu tham số để tìm ra mô hình phù hợp.

Tất nhiên, huấn luyện mô hình không phải là điều duy nhất bạn cần phải cân nhắc. Trong thực hành, xây dựng một mô hình học máy từ nguyên mẫu đến sản xuất liên quan đến những công việc lặp đi lặp lại và kỹ năng chuyên môn. Một công nghệ học máy khám phá đơn giản sẽ có dạng như sau:

Hình 1. Quy trình học máy đơn giản.
Hình 1. Quy trình khám phá bằng công nghệ học máy đơn giản.

Các công việc lặp lại – Quy trình công việc của công nghệ học máy có thể bao gồm các công việc lặp đi lặp lại và thử nghiệm. Ví dụ: trong quá trình phát triển mô hình, thông thường bạn cần hãy khám phá các tổ hợp khác nhau của thuật toán và siêu tham số để xác định mô hình phù hợp nhất. Thông qua quy trình đào tạo thủ công, bạn phải viết mã chuyên biệt để huấn luyện mô hình, sau đó điều chỉnh mã để chạy các thử nghiệm với nhiều kiểu máy học các thuật toán và siêu tham số để tìm ra mô hình tốt nhất. Cho khách du lịch nhỏ hoặc mang tính khám phá dự án, quy trình thủ công này có thể không phải là vấn đề, nhưng đối với các dự án lớn hơn, công việc lặp đi lặp lại có thể tốn thời gian.

Kỹ năng chuyên môn – Xây dựng một mô hình học máy theo cách thủ công liên quan đến kỹ năng. Trong thực tế, không phải nhóm nào cũng có kế hoạch phát triển mô hình học máy có thể có những kỹ năng này. Nếu một nhóm không có nhà khoa học dữ liệu chuyên trách, công việc này theo cách thủ công thậm chí có thể không khả thi.

Thật may là một số bước nhất định trong quá trình phát triển mô hình có thể được tự động hoá để giảm gánh nặng của công việc lặp đi lặp lại và nhu cầu về các kỹ năng chuyên môn. Tự động hoá các thành phần này nhiệm vụ là chủ đề của mô-đun này về học máy tự động (AutoML).

AutoML là gì?

AutoML là một quá trình tự động hoá một số công việc cụ thể trong quy trình của công nghệ học máy. Bạn có thể xem AutoML là một bộ công cụ và công nghệ giúp tạo mô hình học máy nhanh hơn và dễ tiếp cận hơn cho một nhóm người dùng rộng hơn. Mặc dù tự động hoá có thể giúp ích trong suốt quy trình công việc của học máy, nhưng những công việc thường liên kết với AutoML là những chỉ số được đưa vào chu trình phát triển mô hình được minh hoạ trong Hình 1. Những công việc lặp lại này bao gồm:

  • Kỹ thuật dữ liệu
    • Kỹ thuật tính năng.
    • Lựa chọn tính năng.
  • Đào tạo
    • Xác định thuật toán học máy phù hợp.
    • Chọn các siêu tham số tốt nhất.
  • Phân tích
    • Đánh giá các chỉ số được tạo ra trong quá trình đào tạo dựa trên thử nghiệm và xác thực.

Nhờ AutoML, bạn có thể tập trung vào dữ liệu và vấn đề về máy học thay vì tính năng lựa chọn, điều chỉnh siêu tham số và chọn thuật toán phù hợp.