Giảm dần xuống máy học: Hồi quy tuyến tính

Từ lâu, người ta đã biết rằng dế (loài côn trùng) thường xuyên kêu nhiều hơn vào những ngày nóng hơn so với những ngày lạnh hơn. Trong nhiều thập kỷ, các nhà khoa học chuyên nghiệp và nghiệp dư đã thu thập dữ liệu theo danh mục về thời gian và nhiệt độ trên mỗi phút. Là món quà sinh nhật, Dì Ruth cung cấp cho bạn cơ sở dữ liệu bóng gậy và yêu cầu bạn tìm hiểu một mô hình để dự đoán mối quan hệ này. Khi dùng dữ liệu này, bạn muốn khám phá mối quan hệ này.

Trước tiên, hãy kiểm tra dữ liệu của bạn bằng cách vẽ biểu đồ:

Dữ liệu thô của chirps/minutes (Trục x) so với nhiệt độ (Trục y).

Hình 1. Nhiệt độ chênh lệch mỗi phút so với nhiệt độ theo độ C.

Theo dự đoán, đồ thị này cho thấy nhiệt độ đang tăng theo số lượng kim loại. Mối quan hệ này giữa chilings và nhiệt độ tuyến tính? Bạn có thể vẽ một đường thẳng như sau để ước tính mối quan hệ này:

Mối quan hệ tốt nhất trong việc thiết lập dòng của chirps/minutes (Trục x) và nhiệt độ (Trục y).

Hình 2. Mối quan hệ tuyến tính.

Đúng, đường kẻ này không đi qua mọi dấu chấm, nhưng đường kẻ cho thấy rõ mối quan hệ giữa chirp và nhiệt độ. Bằng cách sử dụng phương trình cho một dòng, bạn có thể viết ra mối quan hệ này như sau:

$$ y = mx + b $$

nơi:

  • \(y\) là nhiệt độ theo độ C – giá trị mà chúng ta đang cố gắng dự đoán.
  • \(m\) là độ dốc của đường kẻ.
  • \(x\) là số lượng chilings (phút) mỗi phút – giá trị của tính năng đầu vào.
  • \(b\) là giao điểm y.

Theo quy ước trong máy học, bạn sẽ viết phương trình cho một mô hình hơi khác nhau:

$$ y' = b + w_1x_1 $$

nơi:

  • \(y'\) là nhãn được dự đoán (một kết quả mong muốn).
  • \(b\) là độ chệch (lượt chặn y), đôi khi được gọi là \(w_0\).
  • \(w_1\) là trọng số của tính năng 1. Trọng số cũng là khái niệm tương tự như "slope" \(m\) trong phương trình truyền thống của một đường.
  • \(x_1\) là một tính năng (dữ liệu đầu vào đã biết).

Để dự đoán (giá trị dự đoán) nhiệt độ \(y'\) cho một giá trị mới mỗi phút \(x_1\), chỉ cần thay thế \(x_1\) giá trị vào mô hình này.

Mặc dù mô hình này chỉ sử dụng một tính năng, nhưng mô hình tinh vi hơn có thể phụ thuộc vào nhiều tính năng, mỗi tính năng có trọng số riêng (\(w_1\), \(w_2\), v.v.). Ví dụ: một mô hình dựa trên 3 tính năng có thể có dạng như sau:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$