Công nghệ học máy (ML) hỗ trợ một số công nghệ quan trọng nhất mà chúng ta sử dụng, từ ứng dụng dịch đến xe tự lái. Khoá học này giải thích các khái niệm cốt lõi đằng sau ML.
Công nghệ học máy (ML) mang đến một cách mới để giải quyết vấn đề, trả lời các câu hỏi phức tạp và tạo nội dung mới. Công nghệ học máy có thể dự đoán thời tiết, ước tính thời gian di chuyển, đề xuất bài hát, tự động hoàn thành câu, tóm tắt bài viết và tạo hình ảnh chưa từng thấy.
Về cơ bản, học máy là quá trình huấn luyện một phần mềm (gọi là mô hình) để đưa ra dự đoán hữu ích hoặc tạo nội dung từ dữ liệu.
Ví dụ: giả sử chúng ta muốn tạo một ứng dụng để dự đoán lượng mưa. Chúng ta có thể sử dụng phương pháp truyền thống hoặc phương pháp học máy. Khi sử dụng phương pháp truyền thống, chúng ta sẽ tạo một bản trình bày dựa trên vật lý của bầu khí quyển và bề mặt Trái Đất, tính toán một lượng lớn phương trình động lực học chất lưu. Việc này cực kỳ khó.
Khi sử dụng phương pháp học máy, chúng ta sẽ cung cấp cho mô hình học máy một lượng lớn dữ liệu thời tiết cho đến khi mô hình học máy học được mối quan hệ toán học giữa các mẫu thời tiết tạo ra lượng mưa khác nhau. Sau đó, chúng ta sẽ cung cấp cho mô hình dữ liệu thời tiết hiện tại và mô hình sẽ dự đoán lượng mưa.
Kiểm tra mức độ hiểu biết
Các loại hệ thống học máy
Các hệ thống học máy thuộc một hoặc nhiều danh mục sau đây dựa trên cách chúng học để dự đoán hoặc tạo nội dung:
- Học có giám sát
- Học không giám sát
- Học tăng cường
- AI tạo sinh
Học có giám sát
Mô hình học có giám sát có thể đưa ra dự đoán sau khi xem nhiều dữ liệu có câu trả lời chính xác, sau đó khám phá mối liên kết giữa các phần tử trong dữ liệu tạo ra câu trả lời chính xác. Điều này giống như một học sinh học tài liệu mới bằng cách nghiên cứu các bài kiểm tra cũ chứa cả câu hỏi và câu trả lời. Sau khi được đào tạo về đủ bài thi cũ, học viên sẽ được chuẩn bị kỹ lưỡng để làm bài thi mới. Các hệ thống học máy này được "giám sát" theo nghĩa là con người cung cấp cho hệ thống học máy dữ liệu có kết quả chính xác đã biết.
Hai trong số các trường hợp sử dụng phổ biến nhất của phương pháp học có giám sát là hồi quy và phân loại.
Hồi quy
Mô hình hồi quy dự đoán một giá trị số. Ví dụ: mô hình thời tiết dự đoán lượng mưa, tính bằng inch hoặc mm, là mô hình hồi quy.
Hãy xem bảng dưới đây để biết thêm ví dụ về mô hình hồi quy:
Trường hợp | Dữ liệu đầu vào có thể có | Dự đoán dạng số |
---|---|---|
Giá nhà trong tương lai | Diện tích, mã zip, số phòng ngủ và phòng tắm, diện tích lô đất, lãi suất thế chấp, thuế suất bất động sản, chi phí xây dựng và số lượng nhà cần bán trong khu vực. | Giá của nhà. |
Thời gian đi trong tương lai | Tình trạng giao thông trước đây (thu thập từ điện thoại thông minh, cảm biến giao thông, ứng dụng gọi xe và các ứng dụng chỉ đường khác), khoảng cách từ đích đến và điều kiện thời tiết. | Thời gian đến đích tính bằng phút và giây. |
Phân loại
Mô hình phân loại dự đoán khả năng một nội dung thuộc một danh mục. Không giống như mô hình hồi quy, giá trị đầu ra là một con số, mô hình phân loại sẽ cho ra một giá trị cho biết liệu một đối tượng có thuộc một danh mục cụ thể hay không. Ví dụ: mô hình phân loại được dùng để dự đoán xem một email có phải là email vi phạm hay không hoặc một bức ảnh có chứa hình ảnh mèo hay không.
Mô hình phân loại được chia thành hai nhóm: phân loại nhị phân và phân loại nhiều lớp. Mô hình phân loại nhị phân sẽ xuất ra một giá trị từ một lớp chỉ chứa hai giá trị, ví dụ: một mô hình xuất ra rain
hoặc no rain
. Mô hình phân loại nhiều lớp sẽ xuất ra một giá trị từ một lớp chứa nhiều hơn hai giá trị, ví dụ: một mô hình có thể xuất ra rain
, hail
, snow
hoặc sleet
.
Kiểm tra mức độ hiểu biết
Học không giám sát
Mô hình học không giám sát đưa ra dự đoán bằng cách được cung cấp dữ liệu không chứa câu trả lời chính xác nào. Mục tiêu của mô hình học không giám sát là xác định các mẫu có ý nghĩa trong dữ liệu. Nói cách khác, mô hình không có gợi ý về cách phân loại từng phần dữ liệu, mà phải suy luận các quy tắc của riêng mô hình.
Một mô hình học không giám sát thường dùng sử dụng một kỹ thuật có tên là nhóm. Mô hình này tìm các điểm dữ liệu phân định các nhóm tự nhiên.
Hình 1 Mô hình máy học phân cụm các điểm dữ liệu tương tự.
Hình 2. Các nhóm cụm có ranh giới tự nhiên.
Tính năng cụm khác với tính năng phân loại vì bạn không xác định các danh mục. Ví dụ: một mô hình không giám sát có thể nhóm một tập dữ liệu thời tiết dựa trên nhiệt độ, cho thấy các phân khúc xác định mùa. Sau đó, bạn có thể đặt tên cho các cụm đó dựa trên hiểu biết của mình về tập dữ liệu.
Hình 3. Mô hình học máy phân cụm các mẫu thời tiết tương tự.
Hình 4. Các cụm mẫu thời tiết được gắn nhãn là tuyết, mưa đá, mưa và không mưa.
Kiểm tra mức độ hiểu biết
Học tăng cường
Mô hình học tăng cường đưa ra dự đoán bằng cách nhận phần thưởng hoặc bị phạt dựa trên các hành động được thực hiện trong một môi trường. Hệ thống học quy tắc củng cố tạo ra một chính sách xác định chiến lược tốt nhất để nhận được nhiều phần thưởng nhất.
Học tăng cường được dùng để huấn luyện robot thực hiện các nhiệm vụ, chẳng hạn như đi bộ quanh phòng, và các chương trình phần mềm như AlphaGo để chơi trò chơi Go.
AI tạo sinh
AI tạo sinh là một lớp mô hình tạo nội dung từ dữ liệu đầu vào của người dùng. Ví dụ: AI tạo sinh có thể tạo hình ảnh, bản nhạc và câu chuyện cười độc đáo; có thể tóm tắt bài viết, giải thích cách thực hiện một nhiệm vụ hoặc chỉnh sửa ảnh.
AI tạo sinh có thể nhận nhiều dữ liệu đầu vào và tạo ra nhiều dữ liệu đầu ra, chẳng hạn như văn bản, hình ảnh, âm thanh và video. Phương thức này cũng có thể lấy và tạo các tổ hợp của các giá trị này. Ví dụ: một mô hình có thể lấy hình ảnh làm dữ liệu đầu vào và tạo hình ảnh và văn bản làm dữ liệu đầu ra, hoặc lấy hình ảnh và văn bản làm dữ liệu đầu vào và tạo video làm dữ liệu đầu ra.
Chúng ta có thể thảo luận về các mô hình tạo sinh theo dữ liệu đầu vào và đầu ra, thường được viết là "loại dữ liệu đầu vào"-"loại dữ liệu đầu ra". Ví dụ: sau đây là một phần danh sách một số đầu vào và đầu ra cho mô hình tạo sinh:
- Văn bản sang văn bản
- Chuyển văn bản thành hình ảnh
- Chuyển văn bản sang video
- Chuyển văn bản sang mã
- Chuyển văn bản thành giọng nói
- Hình ảnh và chuyển văn bản thành hình ảnh
Bảng sau đây liệt kê các ví dụ về mô hình tạo sinh, dữ liệu đầu vào và ví dụ về kết quả có thể có của mô hình:
Mẫu | Đầu vào | Kết quả ví dụ |
---|---|---|
Văn bản sang văn bản | Ai đã phát minh ra cuộc đua Le Mans? |
Giải đua 24 giờ Le Mans do Automobile Club de l'Ouest (ACO) thành lập, đây là một tổ chức đua xe được thành lập vào năm 1906. Cuộc đua đầu tiên được tổ chức vào ngày 26 và 27 tháng 5 năm 1923 trên Đường đua Sarthe, một đường đua dài 13,426 km (8,345 dặm) nằm gần thị trấn Le Mans ở Pháp.
Ban đầu, cuộc đua này được hình thành để quảng bá ACO và vùng Sarthe. Nguồn: Bard |
Chuyển văn bản thành hình ảnh | Một con bạch tuộc ngoài hành tinh trôi qua một cổng thông tin trong khi đọc báo. |
Nguồn: Imagen |
Chuyển văn bản sang video | Một chú gấu bông chân thực đang bơi trong đại dương ở San Francisco. Gấu bông chìm xuống nước. Gấu bông tiếp tục bơi dưới nước cùng những chú cá đầy màu sắc. Một chú gấu trúc đang bơi dưới nước. |
Nguồn: Phenaki |
Chuyển văn bản sang mã | Viết một vòng lặp Python lặp lại một danh sách các số và in các số nguyên tố. |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) Nguồn: Bard |
Chuyển hình ảnh thành văn bản |
Đây là một con hồng hạc. Loài này có ở vùng biển Caribe. Nguồn: Google DeepMind |
AI tạo sinh hoạt động như thế nào? Ở cấp độ cao, các mô hình tạo sinh học hỏi các mẫu trong dữ liệu với mục tiêu tạo ra dữ liệu mới nhưng tương tự. Các mô hình tạo sinh có dạng như sau:
- Các diễn viên hài học cách bắt chước người khác bằng cách quan sát hành vi và cách nói của mọi người
- Những nghệ sĩ học cách vẽ theo một phong cách cụ thể bằng cách nghiên cứu nhiều bức tranh theo phong cách đó
- Ban nhạc cover học cách chơi nhạc giống một nhóm nhạc cụ thể bằng cách nghe nhiều bản nhạc của nhóm nhạc đó
Để tạo ra kết quả độc đáo và sáng tạo, ban đầu, các mô hình tạo sinh được huấn luyện bằng phương pháp không giám sát, trong đó mô hình học cách bắt chước dữ liệu được huấn luyện. Đôi khi, mô hình được huấn luyện thêm bằng cách sử dụng phương pháp học có giám sát hoặc học tăng cường trên dữ liệu cụ thể liên quan đến các nhiệm vụ mà mô hình có thể được yêu cầu thực hiện, chẳng hạn như tóm tắt bài viết hoặc chỉnh sửa ảnh.
AI tạo sinh là một công nghệ phát triển nhanh chóng với các trường hợp sử dụng mới liên tục được khám phá. Ví dụ: các mô hình tạo sinh đang giúp các doanh nghiệp tinh chỉnh hình ảnh sản phẩm thương mại điện tử bằng cách tự động xoá phông nền gây mất tập trung hoặc cải thiện chất lượng của hình ảnh có độ phân giải thấp.