Dữ liệu phân loại: Tính năng nhiều bài tập thể dục

Playground là một cho phép bạn thao tác các khía cạnh của việc huấn luyện và kiểm thử một mô hình học máy. Với Playground, bạn có thể chọn các tính năng và điều chỉnh siêu tham số, và sau đó khám phá cách các lựa chọn của bạn ảnh hưởng đến một mô hình.

Trang này chứa 2 bài tập trên Playground.

Bài tập 1: Một số tính năng cơ bản

Đối với bài tập này, hãy tập trung vào các phần sau của Playground giao diện người dùng:

  • Bên dưới TÍNH NĂNG, hãy chú ý 3 tính năng tiềm năng của mô hình:
    • x1
    • x2
    • x1x2
  • Bên dưới OUTPUT, bạn sẽ thấy một hình vuông chứa màu cam và chấm màu xanh dương. Hãy tưởng tượng rằng bạn đang nhìn vào một khu rừng hình vuông, các chấm màu cam đánh dấu vị trí của cây bị bệnh và các chấm màu xanh dương đánh dấu vị trí của cây bệnh vị trí của cây khoẻ.
  • Giữa TÍNH NĂNG và ĐẦU RA, nếu bạn nhìn thật kỹ, bạn sẽ thấy ba các đường nét đứt mờ kết nối từng tính năng với đầu ra. Chiều rộng của mỗi đường nét đứt biểu thị trọng lượng hiện đang liên kết cho từng tính năng. Những đường này rất mờ vì trọng số ban đầu cho mỗi tính năng được khởi tạo bằng 0. Khi cân nặng tăng lên hoặc co lại, vì vậy độ dày của các đường này.

Nhiệm vụ 1: Khám phá Playground bằng cách làm như sau:

  1. Nhấp vào đường mờ nối tính năng x1 với kết quả. Một cửa sổ bật lên sẽ xuất hiện.
  2. Trong cửa sổ bật lên, hãy nhập trọng số 1.0.
  3. Nhấn phím Enter.

Hãy lưu ý những điều sau:

  • Đường nét đứt của x1 trở nên dày hơn khi trọng lượng tăng lên từ 0 đến 1.0.
  • Lúc này, nền màu cam và xanh dương sẽ xuất hiện.
    • Nền màu cam là suy đoán của mô hình về nơi cây bị bệnh là thế nào.
    • Phông nền màu xanh dương là dự đoán của mô hình về nơi có cây khoẻ là thế nào. Mô hình này đang làm rất tệ; khoảng một nửa số dự đoán của mô hình là không chính xác.
  • Vì trọng số là 1 đối với x1 và là 0 đối với các đối tượng khác, mô hình khớp chính xác với giá trị của x1.

Nhiệm vụ 2: Thay đổi trọng số của bất kỳ hoặc cả 3 tính năng để người mẫu (màu nền) dự đoán thành công tình trạng ốm đau và sức khoẻ cây xanh. Giải pháp này xuất hiện ngay bên dưới Playground.



Bài tập 2: Một số tính năng tinh vi hơn

Đối với bài tập thứ hai, hãy quan sát cách sắp xếp các chấm màu cam (cây bệnh) và chấm màu xanh dương (cây khoẻ mạnh) trong mô hình đầu ra, chú ý đến những điều sau:

  • Các chấm tạo thành các mẫu gần như hình cầu.
  • Sự sắp xếp các dấu chấm là nhiễu; ví dụ: hãy chú ý đến màu xanh dương, thỉnh thoảng các chấm nằm trong hình cầu bên ngoài gồm các chấm màu cam. Do đó, ngay cả một mô hình khó có thể dự đoán chính xác từng dấu chấm.

Nhiệm vụ 1: Khám phá giao diện người dùng Playground bằng cách làm như sau:

  1. Nhấp vào nút Chạy/Tạm dừng là một hình tam giác màu trắng bên trong màu đen vòng kết nối. Playground sẽ bắt đầu huấn luyện mô hình; quan sát bộ đếm Epochs tăng lên.
  2. Sau khi hệ thống đã huấn luyện trong ít nhất 300 khoảng thời gian bắt đầu của hệ thống, hãy nhấn vào cùng một khoảng thời gian Nút Chạy/Tạm dừng để tạm dừng quá trình huấn luyện.
  3. Xem mô hình. Mô hình này có đưa ra các dự đoán chính xác không? Nói cách khác, các chấm màu xanh dương thường được bao quanh bởi nền màu xanh dương và là các chấm màu cam thường có nền màu cam bao quanh?
  4. Kiểm tra giá trị của mức mất Test (Mất kiểm thử), xuất hiện ngay bên dưới OUTPUT. Đây có phải là có giá trị gần 1,0 (độ tổn thất cao hơn) hay gần bằng 0 (độ tổn thất thấp hơn)?
  5. Đặt lại Playground bằng cách nhấn mũi tên cong ở bên trái Nút Chạy/Tạm dừng.

Nhiệm vụ 2: Xây dựng mô hình tốt hơn bằng cách thực hiện các bước sau:

  1. Chọn hoặc bỏ chọn bất kỳ kết hợp nào trong số năm tính năng có thể sử dụng.
  2. Điều chỉnh tốc độ học.
  3. Huấn luyện hệ thống trong ít nhất 500 khoảng thời gian bắt đầu của hệ thống.
  4. Kiểm tra giá trị của trường hợp ngừng kiểm thử. Bạn có thể nhận được tỷ lệ mất kiểm thử dưới 0,2 không?

Các giải pháp sẽ xuất hiện bên dưới Playground.