Công nghệ máy học là gì?

Công nghệ học máy (ML) hỗ trợ một số công nghệ quan trọng nhất mà chúng tôi sử dụng, từ ứng dụng dịch thuật cho đến phương tiện tự động. Khoá học này giải thích các yếu tố cốt lõi các khái niệm đằng sau công nghệ học máy.

Công nghệ học máy mang đến một cách mới để giải quyết vấn đề, trả lời các câu hỏi phức tạp và tạo ra nội dung. Công nghệ học máy có thể dự đoán thời tiết, ước tính thời gian di chuyển, đề xuất bài hát, câu tự động hoàn thành, tóm tắt bài viết và tạo những hình ảnh chưa từng thấy trước đây.

Về cơ bản, công nghệ học máy là quá trình đào tạo một phần mềm, được gọi là mô hình (để hữu ích) dự đoán hoặc tạo nội dung từ .

Ví dụ: giả sử chúng ta muốn tạo một ứng dụng để dự đoán lượng mưa. Chúng tôi có thể sử dụng phương pháp truyền thống hoặc phương pháp học máy. Sử dụng chiến lược giá thầu truyền thống phương pháp tiếp cận, chúng ta sẽ tạo một bản trình bày dựa trên vật lý của khí quyển Trái Đất và bề mặt, tính toán lượng lớn phương trình động lực học chất lỏng. Đây là vô cùng khó khăn.

Bằng cách sử dụng phương pháp học máy, chúng tôi sẽ cung cấp cho một mô hình học máy lượng dữ liệu thời tiết khổng lồ cho đến khi mô hình ML cuối cùng học được mối quan hệ toán học giữa kiểu thời tiết tạo ra lượng mưa khác nhau. Sau đó, chúng tôi sẽ cung cấp lập mô hình dữ liệu thời tiết hiện tại và dự đoán lượng mưa.

Kiểm tra sự hiểu biết của bạn

"Mô hình" là gì trong công nghệ học máy?
Mô hình là một mối quan hệ toán học bắt nguồn từ dữ liệu mà máy học hệ thống sử dụng để đưa ra dự đoán
Mô hình là một phần của phần cứng máy tính
Mô hình là một bản trình bày nhỏ hơn về nội dung bạn đang học.

Các loại hệ thống học máy

Các hệ thống học máy thuộc một hoặc nhiều danh mục sau đây dựa trên cách chúng tìm hiểu cách đưa ra dự đoán hoặc tạo nội dung:

  • Học tập có giám sát
  • Học không giám sát
  • Củng cố kiến thức
  • AI tạo sinh

Học tập có giám sát

Học tập có giám sát mô hình có thể đưa ra dự đoán sau khi xem nhiều dữ liệu với câu trả lời đúng sau đó khám phá mối liên hệ giữa các phần tử trong dữ liệu đưa ra câu trả lời đúng. Điều này giống như một học sinh đang học tài liệu mới bằng cách nghiên cứu các bài kiểm tra cũ có chứa cả câu hỏi và câu trả lời. Sau khi học viên có được đào tạo về các bài kiểm tra cũ, học sinh sẽ được chuẩn bị tốt để tham gia kỳ thi mới. Các hệ thống học máy này "được giám sát" khi con người đưa ra hệ thống học máy với các kết quả chính xác đã biết.

Hai trong số những trường hợp sử dụng phổ biến nhất cho phương pháp học có giám sát là hồi quy và của bạn.

Hồi quy

Mô hình hồi quy dự đoán giá trị số. Ví dụ: một mô hình thời tiết dự đoán lượng mưa, theo inch hay milimet là mô hình hồi quy.

Hãy xem bảng bên dưới để biết thêm ví dụ về mô hình hồi quy:

Trường hợp Dữ liệu đầu vào có thể có Dự đoán bằng số
Giá nhà trong tương lai Bộ vuông, mã bưu chính, số phòng ngủ và phòng tắm, diện tích lô đất, lãi suất thế chấp, thuế suất bất động sản, chi phí xây dựng và số lượng nhà rao bán trong khu vực. Giá nhà.
Thời gian đạp xe trong tương lai Tình trạng giao thông trước đây (được thu thập từ điện thoại thông minh, tình hình giao thông cảm biến, gọi xe và các ứng dụng chỉ đường khác), khoảng cách từ điểm đến và điều kiện thời tiết. Thời gian tính bằng phút và giây để tới một điểm đến.

Phân loại

Mô hình phân loại dự đoán khả năng một nội dung nào đó thuộc một danh mục. Không giống như mô hình hồi quy, có kết quả là một số, các mô hình phân loại sẽ đưa ra một giá trị cho biết liệu một nội dung nào đó có thuộc một danh mục cụ thể hay không. Ví dụ: các mô hình phân loại được dùng để dự đoán liệu một email có phải là thư rác hoặc một ảnh có chứa một con mèo.

Mô hình phân loại được chia thành hai nhóm: phân loại nhị phân và để phân loại nhiều lớp. Mô hình phân loại nhị phân xuất ra một giá trị từ một lớp chỉ chứa hai giá trị, ví dụ: mô hình đầu ra rain hoặc no rain. Mô hình phân loại nhiều lớp cho ra một giá trị từ một chứa nhiều hơn hai giá trị, ví dụ: một mô hình có thể cho ra rain, hail, snow hoặc sleet.

Kiểm tra sự hiểu biết của bạn

Nếu bạn muốn sử dụng mô hình học máy để dự đoán mức sử dụng năng lượng cho mục đích thương mại bạn sẽ sử dụng loại mô hình nào?
Hồi quy
Mức sử dụng năng lượng được đo bằng kilowatt giờ (kWh), một con số, do đó, bạn muốn sử dụng mô hình hồi quy.
Phân loại
Mô hình phân loại dự đoán xem một nội dung nào đó có thuộc một danh mục hay không, trong khi mô hình hồi quy dự đoán một con số. Vì mức sử dụng năng lượng được đo bằng kilowatt-giờ (kWh), là một con số mà bạn sẽ dùng mô hình hồi quy.

Học không giám sát

Học tập không có giám sát mô hình đưa ra dự đoán bằng cách được cung cấp dữ liệu không chứa bất kỳ giá trị chính xác nào của chúng tôi. Mục tiêu của mô hình học tập không có giám sát là xác định những bài học có ý nghĩa mẫu giữa các dữ liệu. Nói cách khác, mô hình này không có gợi ý về cách phân loại từng phần dữ liệu, mà phải suy ra các quy tắc riêng.

Một mô hình học tập không có giám sát thường dùng sử dụng một kỹ thuật có tên là phân cụm. Mô hình này tìm các điểm dữ liệu phân tách các nhóm tự nhiên.

Hình ảnh hiển thị các chấm màu trong cụm.

Hình 1 Mô hình học máy tập hợp các điểm dữ liệu tương tự nhau.

Hình ảnh hiển thị các chấm màu trong cụm được bao quanh theo một hình dạng và đường viền nhau.

Hình 2. Các nhóm cụm có ranh giới tự nhiên.

Việc phân cụm khác với cách phân loại vì các danh mục không được xác định theo bạn. Ví dụ: mô hình không được giám sát có thể nhóm một tập dữ liệu thời tiết dựa trên nhiệt độ, cho thấy các phân đoạn xác định các mùa. Sau đó, bạn có thể hãy thử đặt tên cho các cụm đó dựa trên hiểu biết của bạn về tập dữ liệu.

Hình ảnh cho thấy các chấm màu trong những cụm có nhãn là tuyết, mưa, mưa đá và không có mưa.

Hình 3. Một mô hình học máy tập hợp các mô hình thời tiết tương tự nhau.

Hình ảnh cho thấy các chấm màu trong những cụm có nhãn là tuyết, mưa, mưa đá và không có mưa được bao quanh theo một hình dạng và viền nhau.

Hình 4. Cụm mẫu thời tiết được gắn nhãn là tuyết, mưa tuyết, không có mưa.

Kiểm tra sự hiểu biết của bạn

Điểm khác biệt giữa phương pháp có giám sát và phương pháp không được giám sát là gì?
Phương pháp được giám sát sẽ cung cấp dữ liệu chứa câu trả lời đúng.
Phương pháp được giám sát sẽ cung cấp dữ liệu chứa câu trả lời đúng. Công việc của mô hình này là tìm các kết nối trong dữ liệu tạo ra . Phương pháp không được giám sát sẽ cung cấp dữ liệu mà không có câu trả lời chính xác. Nhiệm vụ là tìm các nhóm trong dữ liệu.
Phương pháp được giám sát thường sử dụng phân cụm.
Phương pháp không được giám sát sử dụng phân cụm.
Phương pháp không được giám sát sẽ biết cách gắn nhãn các cụm dữ liệu.
Phương pháp tiếp cận không được giám sát sẽ không biết ý nghĩa của các cụm dữ liệu. Dựa trên hiểu biết của bạn về dữ liệu, việc xác định chúng là tuỳ thuộc vào bạn.

Củng cố kiến thức

Học củng cố mô hình đưa ra dự đoán nhờ nhận phần thưởng hoặc hình phạt dựa trên hành động được thực hiện trong một môi trường. Củng cố hệ thống học tập tạo ra một chính sách xác định chiến lược tốt nhất để nhận được nhiều phần thưởng nhất.

Học tăng cường được dùng để huấn luyện rô-bốt thực hiện các nhiệm vụ, chẳng hạn như đi bộ trong một căn phòng và các chương trình phần mềm như AlphaGo để chơi cờ vây.

AI tạo sinh

AI tạo sinh là một loại mô hình để tạo nội dung dựa trên hoạt động đầu vào của người dùng. Ví dụ: AI tạo sinh có thể tạo ra hình ảnh, bản sáng tác nhạc và truyện cười độc đáo; công cụ này có thể tóm tắt các bài viết, giải thích cách thực hiện một thao tác hoặc chỉnh sửa ảnh.

AI tạo sinh có thể lấy nhiều thông tin đầu vào và tạo ra nhiều kết quả, chẳng hạn như văn bản, hình ảnh, âm thanh và video. Chiến dịch này cũng có thể kết hợp này. Ví dụ: một mô hình có thể lấy hình ảnh làm dữ liệu đầu vào rồi tạo hình ảnh và văn bản làm đầu ra hoặc lấy hình ảnh và văn bản làm đầu vào và tạo video làm đầu ra.

Chúng ta có thể thảo luận về các mô hình tạo sinh thông qua dữ liệu đầu vào và kết quả đầu ra của các mô hình đó, thường được viết dưới dạng "loại đầu vào"-loại đầu ra". Ví dụ: sau đây là một phần danh sách một số dữ liệu đầu vào và đầu ra của các mô hình tạo sinh:

  • Chuyển văn bản thành văn bản
  • Chuyển văn bản thành hình ảnh
  • Chuyển văn bản sang video
  • Chuyển văn bản thành mã
  • Chuyển văn bản thành giọng nói
  • Hình ảnh và văn bản thành hình ảnh

Bảng sau đây liệt kê ví dụ về các mô hình tạo sinh, dữ liệu đầu vào và một ví dụ về kết quả có thể có:

Mẫu Đầu vào Kết quả ví dụ
Chuyển văn bản thành văn bản Ai phát minh ra cuộc đua Le Mans? Giải đua 24 Giờ Le Mans do Automobile Club de l'Ouest thành lập (ACO), một tổ chức lái xe được thành lập vào năm 1906. Cuộc tranh cử đầu tiên đã diễn ra vào ngày 26 và 27 tháng 5 năm 1923 trên đường đua Sarthe Circuit, dài 13,426 km (8,345 dặm) mạch đường nằm gần thị trấn Le Mans ở Pháp. Cuộc đua này ban đầu được hình thành như một cách để quảng bá ACO và Vùng Sarthe.
Nguồn: Bard
Chuyển văn bản thành hình ảnh Một con bạch tuộc ngoài hành tinh bay qua cổng thông tin để đọc báo.
Hình ảnh một con bạch tuộc hoạt hình. Nguồn: Imagen
Chuyển văn bản sang video Một chú gấu bông ảnh thực tế đang bơi trong đại dương tại San Francisco. Gấu bông bị chìm dưới nước. Chú gấu bông liên tục bơi dưới vùng nước có những chú cá sặc sỡ. Một chú gấu trúc Mỹ đang bơi dưới nước.
Video về một chú gấu bông đang bơi dưới nước. Nguồn: Phenaki
Chuyển văn bản thành mã Viết một vòng lặp Python để lặp lại một danh sách các số và in ra các số nguyên tố.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)
Nguồn: Bard
Hình ảnh thành văn bản Hình ảnh một con hồng hạc. Đây là tiếng chim hồng hạc. Chúng được tìm thấy ở Caribbean.
Nguồn: Trí tuệ nhân tạo của Google

AI tạo sinh hoạt động như thế nào? Ở cấp độ cao, các mô hình tạo sinh sẽ học hỏi trong dữ liệu nhằm tạo ra dữ liệu mới nhưng tương tự nhau. Tạo sinh có dạng như sau:

  • Những diễn viên hài học cách bắt chước người khác bằng cách quan sát hành vi của mọi người và phong cách nói chuyện
  • Những nghệ sĩ học vẽ theo một phong cách cụ thể bằng cách học nhiều bức tranh theo phong cách đó
  • Bản hát lại của các ban nhạc học cách nghe giống một nhóm nhạc cụ thể bằng cách nghe rất nhiều nhạc của nhóm đó

Để tạo ra kết quả sáng tạo và độc đáo, các mô hình tạo sinh ban đầu được huấn luyện bằng phương pháp không được giám sát, trong đó mô hình sẽ học bắt chước dữ liệu được đào tạo. Đôi khi, mô hình được huấn luyện thêm bằng cách sử dụng tính năng giám sát hoặc học tăng cường về dữ liệu cụ thể liên quan đến nhiệm vụ mà mô hình có thể được yêu cầu thực hiện, ví dụ: tóm tắt bài viết hoặc chỉnh sửa ảnh.

AI tạo sinh là một công nghệ phát triển nhanh chóng và liên tục phát triển những trường hợp sử dụng mới được khám phá. Ví dụ: các mô hình tạo sinh đang giúp doanh nghiệp tinh chỉnh hình ảnh sản phẩm thương mại điện tử của họ bằng cách tự động xoá nền gây rối mắt hoặc cải thiện chất lượng của hình ảnh có độ phân giải thấp.