AutoML: Lợi ích và hạn chế
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Phần này thảo luận một số lợi ích và hạn chế của
AutoML và có thể
giúp bạn quyết định xem AutoML có phù hợp với dự án của mình không.
Lợi ích
Một số lý do phổ biến nhất khiến bạn có thể chọn sử dụng AutoML bao gồm:
- Để tiết kiệm thời gian: Nhiều người chọn AutoML để tiết kiệm thời gian bằng cách tránh
thử nghiệm thủ công mở rộng để tìm ra mô hình tốt nhất.
- Để cải thiện chất lượng của mô hình học máy: Các công cụ AutoML có thể tìm kiếm một cách toàn diện
cho mô hình có chất lượng cao nhất.
- Để xây dựng mô hình máy học mà không cần có kỹ năng chuyên môn: Tác dụng phụ
của việc tự động hoá các công việc học máy, đó là dân chủ hoá việc học máy. Người dùng không cần phải có
hiểu sâu về các thuật toán hoặc lập trình máy học để
phát triển một mô hình ML.
- Để kiểm thử xác thực tập dữ liệu: Ngay cả khi bạn là chuyên gia xây dựng mô hình, AutoML
có thể nhanh chóng cung cấp cho bạn ước tính cơ sở về việc liệu một tập dữ liệu có đủ
trong mọi tín hiệu nhiễu. Nếu công cụ AutoML không thể tạo một giải pháp
của bạn, thì có thể không đáng để bạn dành thời gian cố gắng xây dựng một mô hình phù hợp
thủ công.
- Cách đánh giá một tập dữ liệu: Nhiều hệ thống AutoML không chỉ giúp bạn đánh giá
các mô hình họ tạo ra, mà còn giúp đánh giá các tính năng liên quan đến
để huấn luyện các mô hình đó. Ngay cả khi bạn không sử dụng mô hình thu được, AutoML
có thể giúp bạn xác định những tính năng nào có thể không mang lại giá trị
để thu thập và đưa vào tập dữ liệu cuối cùng.
- Cách thực thi các phương pháp hay nhất: Tính năng tự động hoá có tính năng hỗ trợ tích hợp để áp dụng
Các phương pháp hay nhất về học máy cho từng mô hình tìm kiếm
Các điểm hạn chế
Tuy nhiên, trước khi chọn AutoML, bạn nên cân nhắc một số giới hạn sau:
- Chất lượng mô hình có thể không tốt bằng việc huấn luyện thủ công. Sử dụng phương pháp tổng quát
thuật toán tối ưu hoá để tìm ra tổ hợp cấu trúc tốt nhất,
siêu tham số và kỹ thuật tính năng cho bất kỳ tập dữ liệu ngẫu nhiên nào thường có nghĩa là
rằng một chuyên gia có động lực có đủ thời gian có thể tạo ra mô hình tốt hơn
chất lượng dự đoán.
- Việc tìm kiếm và độ phức tạp của mô hình có thể không rõ ràng. Với AutoML, thật khó để
để có thông tin chi tiết về cách công cụ có được mô hình tốt nhất. Trên thực tế, việc
bản thân mô hình đầu ra có thể được tạo từ nhiều cấu trúc,
siêu tham số và các chiến lược kỹ thuật tính năng. Các mô hình được tạo bằng
AutoML rất khó tái tạo theo cách thủ công.
- Nhiều lần chạy AutoML có thể cho thấy nhiều sự chênh lệch hơn: Do cách
thuật toán tối ưu hoá sẽ liên tục tìm các giá trị mà thuật toán cho là giá trị tốt nhất
để xây dựng mô hình, các lần chạy AutoML có thể tìm kiếm các phần khác nhau
không gian và giảm dần thời gian vừa phải (hoặc thậm chí có thể đáng kể)
những nơi khác nhau. Tái điều chỉnh bằng AutoML để tạo một cấu trúc mô hình mới
có thể cho thấy nhiều phương sai hơn là chỉ đào tạo lại mô hình đầu ra trước đó
cấu trúc.
- Không thể tuỳ chỉnh mô hình trong quá trình huấn luyện. Nếu trường hợp sử dụng của bạn yêu cầu
hoặc tinh chỉnh trong quá trình đào tạo, AutoML có thể không phải là
lựa chọn phù hợp cho bạn.
Yêu cầu dữ liệu
Cho dù bạn đang sử dụng hệ thống đào tạo tuỳ chỉnh hay hệ thống AutoML, một điều bạn có thể
khi bạn xây dựng một mô hình từ đầu, bạn cần
lượng dữ liệu. Ưu điểm của AutoML là bạn hầu như có thể bỏ qua
cấu trúc và siêu thông số (siêu tham số) tìm kiếm và tập trung chủ yếu vào chất lượng của
dữ liệu của bạn.
Ngoài ra còn có các hệ thống AutoML chuyên dụng có thể huấn luyện các mô hình bằng
ít dữ liệu hơn đáng kể vì chúng sử dụng
học chuyển giao. Để
thay vì phải dùng hàng trăm nghìn ví dụ để tạo
một mô hình phân loại hình ảnh, các hệ thống AutoML chuyên dụng này chỉ có thể sử dụng
thêm vài trăm hình ảnh được gắn nhãn cùng với
công nghệ học chuyển
mô hình khung phân loại hình ảnh.
AutoML có phù hợp với dự án của bạn không?
AutoML có thể giúp mọi người, từ người mới bắt đầu cho đến chuyên gia, sử dụng công nghệ học máy để tạo sản phẩm và
giải quyết vấn đề. Nếu bạn đang cố gắng quyết định xem AutoML có phù hợp với dự án của mình hay không,
hãy cân nhắc các yếu tố đánh đổi sau:
- AutoML là một lựa chọn tuyệt vời cho những nhóm có ít kinh nghiệm trong việc xây dựng công nghệ học máy
các mô hình hoặc nhóm giàu kinh nghiệm đang tìm cách tăng năng suất và
không có yêu cầu tuỳ chỉnh.
- Chương trình huấn luyện tuỳ chỉnh (thủ công) phù hợp hơn khi chất lượng mô hình đạt
và nhóm cần có khả năng tuỳ chỉnh mô hình của mình. Trong các
Trong trường hợp cụ thể, việc huấn luyện thủ công có thể
cần nhiều thời gian hơn để thử nghiệm và
đang xây dựng giải pháp, nhưng nhóm thường có thể đạt được mô hình chất lượng cao hơn
so với giải pháp AutoML.
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
Cập nhật lần gần đây nhất: 2024-08-13 UTC.
[null,null,["Cập nhật lần gần đây nhất: 2024-08-13 UTC."],[[["\u003cp\u003eAutoML helps save time and improve the quality of machine learning models by automating the model selection and training process.\u003c/p\u003e\n"],["\u003cp\u003eAutoML democratizes ML by enabling users without specialized skills to build models and is useful for dataset evaluation and enforcing best practices.\u003c/p\u003e\n"],["\u003cp\u003eAutoML may have limitations such as potentially lower model quality compared to manual training, limited customization during training, and opacity in the model search process.\u003c/p\u003e\n"],["\u003cp\u003eLarge amounts of data are generally required for AutoML, although specialized systems utilizing transfer learning can reduce this need.\u003c/p\u003e\n"],["\u003cp\u003eAutoML is suitable for teams with limited ML experience or those seeking productivity gains without customization needs, while manual training is preferred when model quality and customization are paramount.\u003c/p\u003e\n"]]],[],null,["# AutoML: Benefits and limitations\n\nThis section discusses some of the benefits and limitations of\n[**AutoML**](/machine-learning/glossary#automl) and can\nhelp you decide if AutoML is right for your project.\n\nBenefits\n--------\n\nSome of the most common reasons you might choose to use AutoML include:\n\n- **To save time**: Many people choose AutoML to save time by avoiding extensive manual experimentation to find the best model.\n- **To improve quality of ML model**: AutoML tools can comprehensively search for the highest quality model.\n- **To build an ML model without needing specialized skills**: A side effect of automating ML tasks is that it democratizes ML. Users don't need to have a deep understanding of machine learning algorithms or programming to develop an ML model.\n- **To smoke test a dataset**: Even if you're an expert model builder, AutoML can quickly give you a baseline estimate for whether a dataset has enough signal in all of its noise. If the AutoML tool can't build even a mediocre model, it might not be worth spending your time trying to build a good model by hand.\n- **To evaluate a dataset**: Many AutoML systems help you evaluate not just the models they produce but also help evaluate the features that go into training those models. Even if you don't use the resulting model, AutoML tools may help you determine which of your features might not be worth gathering and including in your final dataset.\n- **To enforce best practices**: Automation includes built-in support to apply ML best practices to each model search\n\nLimitations\n-----------\n\nHowever, before choosing AutoML there are some limitations you should consider:\n\n- **Model quality may not be as good as manual training.** Using a generalized optimization algorithm to find the best combination of architecture, hyperparameters, and feature engineering for any random dataset often means that a motivated expert with enough time can create a model with better prediction quality.\n- **Model search and complexity can be opaque.** With AutoML, it is difficult to have insight into how the tool arrived at the best model. In fact, the output models themselves may be made from different architectures, hyperparameters, and feature engineering strategies. Models generated with AutoML are difficult to reproduce manually.\n- **Multiple AutoML runs may show more variance**: Because of how the optimization algorithm iteratively finds what it thinks are the best values for building the model, different AutoML runs may search different portions of the space and wind up in moderately (or even possibly significantly) different places. Retuning with AutoML to create a new model architecture may show more variance than simply retraining the previous output model architecture.\n- **Models can't be customized during training.** If your use case requires customization or tweaking during the training process, AutoML may not be the right choice for you.\n\nData requirements\n-----------------\n\nWhether you're using custom training or an AutoML system, one thing you can\ncount on when you are building a model from scratch is that you need large\namounts of data. The advantage with AutoML is that you can mostly ignore the\narchitecture and hyperparameters search and focus primarily on the quality of\nyour data.\n\nThere are also specialized AutoML systems that can train models with\nsignificantly less data because they use\n[**transfer learning**](/machine-learning/glossary#transfer-learning). For\nexample, instead of requiring hundreds of thousands of examples to build\nan image classification model, these specialized AutoML systems can use only\na few hundred labeled images along with transfer learning from an existing\nimage classification framework model.\n\nIs AutoML right for your project?\n---------------------------------\n\nAutoML can help anyone---from novices to experts---use ML to build products and\nsolve problems. If you are trying to decide if AutoML is right for your project,\nconsider these trade offs:\n\n- **AutoML** is a great choice for a team with limited experience building ML models or experienced teams that are looking for productivity gains and don't have customization requirements.\n- **Custom (manual) training** is more appropriate when model quality is important and the team needs to be able to customize their model. In these cases, manual training may require more time for experimentation and building a solution, but the team can often achieve a higher quality model than with an AutoML solution.\n\n| **Key terms:**\n|\n| - [AutoML](/machine-learning/glossary#automl)\n- [Transfer Learning](/machine-learning/glossary#transfer-learning) \n[Help Center](https://support.google.com/machinelearningeducation)"]]