Hồi quy tuyến tính: Mất

Mất là chỉ số bằng số mô tả dự đoán của một mô hình sai đến mức nào là thế nào. Chỉ số tổn thất đo lường khoảng cách giữa các dự đoán của mô hình và các dữ liệu thực tế . Mục tiêu của việc huấn luyện một mô hình là giảm thiểu tổn thất, giảm giá trị thấp nhất có thể.

Trong hình sau, bạn có thể trình bày trực quan tình trạng mất mát qua các mũi tên lấy từ dữ liệu trỏ đến mô hình. Các mũi tên cho biết tiến độ dự đoán của mô hình các giá trị thực tế.

Hình 9. Đường mất kết nối các điểm dữ liệu với
mô hình.

Hình 9. Mức giảm sút được đo lường từ giá trị thực tế đến giá trị dự đoán.

Khoảng cách mất mát

Trong số liệu thống kê và công nghệ học máy, dữ liệu thiếu hụt đo lường mức chênh lệch giữa giá trị dự đoán và giá trị thực tế. Tổn thất tập trung vào khoảng cách giữa các giá trị, chứ không phải chỉ đường. Ví dụ: nếu mô hình dự đoán là 2, nhưng giá trị thực tế là 5, chúng ta không quan tâm đến việc tổn thất là âm $ -3 $ ($ 2-5=-3 $). Thay vào đó, chúng ta quan tâm rằng khoảng cách giữa các giá trị là $ 3 $. Như vậy, tất cả phương pháp tính tổn thất thì loại bỏ dấu.

Sau đây là 2 phương pháp phổ biến nhất để xoá biển báo:

  • Lấy giá trị tuyệt đối của hiệu số giữa giá trị thực tế và truy vấn dự đoán.
  • Bình phương mức chênh lệch giữa giá trị thực tế và giá trị dự đoán.

Các kiểu tổn thất

Có 4 kiểu mất mát chính trong hồi quy tuyến tính được nêu trong bảng sau.

Loại tổn thất Định nghĩa Phương trình
L1 giảm sút Tổng các giá trị tuyệt đối của hiệu số giữa giá trị dự đoán và giá trị thực tế. $ ∑ | giá trị thực\ - giá trị dự đoán\ | USD
Lỗi tuyệt đối trung bình (MAE) Giá trị trung bình của mức tổn thất L1 trong một nhóm ví dụ. $ \frac{1}{N} ∑ | giá trị thực\ - giá trị dự đoán\ | USD
Mất L2 Tổng hiệu của bình phương giữa giá trị dự đoán và giá trị thực tế. $ ∑(giá trị thực\ - giá trị dự đoán\)^2 $
Lỗi bình phương trung bình (MSE) Giá trị trung bình của mức tổn thất L2 trong một nhóm ví dụ. $ \frac{1}{N} ∑ (giá trị thực tế\ - giá trị dự đoán\)^2 $

Sự khác biệt về chức năng giữa tổn thất L1 và tổn thất L2 (hoặc giữa MAE và MSE) là bình phương. Khi sự khác biệt giữa và nhãn là lớn, thì việc bình phương làm cho tổn thất còn lớn hơn nữa. Khi chênh lệch nhỏ (nhỏ hơn 1), bình phương làm cho tổn thất thậm chí nhỏ hơn.

Khi xử lý nhiều ví dụ cùng một lúc, bạn nên tính giá trị trung bình cho những tổn thất trên tất cả các ví dụ, cho dù sử dụng MAE hay MSE.

Ví dụ về cách tính khoản tổn thất

Sử dụng dòng phù hợp nhất trước đó, chúng tôi sẽ tính mức tổn thất L2 cho một ví dụ. Từ phù hợp nhất, chúng tôi có các giá trị sau đây cho trọng số và độ chệch:

  • $ \small{Trọng lượng: -3,6} $
  • $ \small{Bias: 30} $

Nếu mô hình dự đoán rằng một chiếc xe 2.370 pound sẽ nhận được 21,5 dặm mỗi gallon, nhưng nó thực tế nhận được 24 dặm mỗi gallon, chúng ta sẽ tính được mức tổn thất L2 là sau:

Giá trị Phương trình Kết quả
Dự đoán

$\small{bias + (trọng số * tính năng\ giá trị)}$

$\small{30 + (-3,6*2,37)}$

$\small{21,5}$
Giá trị thực tế $ \small{ label } $ $ \small{ 24 } $
Giảm L2

$ \small{ (dự đoán - giá trị thực tế\)^2} $

$\small{ (21,5 – 24)^2 }$

$\small{6,25}$

Trong ví dụ này, mức tổn thất L2 cho một điểm dữ liệu là 6,25.

Chọn mức giảm

Việc quyết định dùng MAE hay MSE phụ thuộc vào tập dữ liệu và cách bạn muốn xử lý một số dự đoán nhất định. Thông thường, hầu hết các giá trị đối tượng trong một tập dữ liệu đều nằm trong một phạm vi riêng biệt. Ví dụ: xe ô tô thường nằm trong khoảng từ năm 2000 đến 5.000 pound và đi được từ 8 đến 50 dặm mỗi gallon. Một chiếc xe hơi nặng 8.000 pound, hay một chiếc xe chạy được 160 km/gallon, nằm ngoài phạm vi thông thường và sẽ được coi là điểm ngoại lai.

Giá trị ngoại lệ cũng có thể đề cập đến khoảng cách giữa các dự đoán của mô hình với giá trị. Ví dụ: một chiếc xe hơi nặng 3.000 pound hoặc một chiếc xe đi được 40 dặm mỗi gallon đều nằm trong phạm vi thông thường. Tuy nhiên, một chiếc xe nặng 3.000 pound 40 dặm/gallon sẽ là một điểm ngoại lai về mặt dự đoán của mô hình bởi vì mô hình này sẽ dự đoán rằng một chiếc xe hơi 3.000 pound sẽ nhận được khoảng từ 18 đến 20 dặm/gallon.

Khi chọn hàm suy giảm phù hợp nhất, hãy cân nhắc cách bạn muốn mô hình xử lý các điểm ngoại lai. Ví dụ: MSE hướng mô hình hướng về các điểm ngoại lai, trong khi MAE thì không. Trận thua L2 dẫn đến mức phạt cao hơn nhiều so với L1 bị mất. Ví dụ: các hình ảnh sau đây cho thấy một mô hình đã được huấn luyện bằng MAE và một mô hình được huấn luyện bằng MSE. Đường màu đỏ biểu thị đầy đủ mô hình đã huấn luyện sẽ được dùng để đưa ra dự đoán. Các điểm ngoại lai gần hơn với mô hình được huấn luyện bằng MSE thay vì mô hình được huấn luyện bằng MAE.

Hình 10. Mô hình nghiêng nhiều hơn về các điểm ngoại lai.

Hình 10. Một mô hình được huấn luyện bằng MSE sẽ đưa mô hình đó đến gần các điểm ngoại lai hơn.

Hình 11. Mô hình bị nghiêng xa hơn các điểm ngoại lai.

Hình 11 Một mô hình được huấn luyện bằng MAE sẽ khác xa với các bên ngoài.

Lưu ý mối quan hệ giữa mô hình và dữ liệu:

  • MSE. Mô hình này gần các điểm ngoại lai hơn nhưng cũng cách xa hầu hết các điểm ngoại lai các điểm dữ liệu khác.

  • MAE. Mô hình này cách xa các điểm ngoại lai hơn nhưng gần với hầu hết các điểm ngoại lai các điểm dữ liệu khác.

Kiểm tra sự hiểu biết của bạn

Hãy xem xét 2 sơ đồ sau:

Một biểu đồ gồm 10 điểm.
      Một đường thẳng chạy qua 6 điểm. 2 điểm tương ứng với 1 đơn vị
      trên đường kẻ; 2 điểm khác cách đường kẻ 1 đơn vị. Một biểu đồ gồm 10 điểm. Một đường kẻ chạy
      qua 8 điểm. 1 điểm là 2 đơn vị
      trên đường kẻ; 1 điểm khác cách đường kẻ 2 đơn vị.
Tập dữ liệu nào trong số hai tập dữ liệu được hiển thị ở biểu đồ trước có sai số bình phương trung bình (MSE) cao hơn không?
Tập dữ liệu ở bên trái.
Sáu ví dụ trên dòng chịu tổng tổn thất là 0. Bốn các ví dụ không có trên dây cũng không quá xa vời, vì vậy ngay cả bình phương độ lệch của chúng vẫn mang lại giá trị thấp: $MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0,4$
Tập dữ liệu ở bên phải.
Tám ví dụ trên dòng chịu tổng tổn thất là 0. Tuy nhiên, mặc dù chỉ có hai điểm cách xa đường thẳng, nhưng cả hai điểm đó đều điểm cách điểm ngoại lai hai lần trong hình bên trái. Tổn thất bình phương làm tăng sự khác biệt đó, do đó, bù trừ là 2 sẽ dẫn đến tổn thất lớn gấp 4 lần so với bù trừ của một: $MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0,8 đô la