Среднеквадратическая ошибка
Рассмотрим следующие два графика:
Изучите варианты ниже.
Какой из двух наборов данных, показанных на предыдущих графиках, имеет более высокую среднеквадратичную ошибку (MSE)?
Набор данных слева.
Шесть примеров в строке несут общую потерю 0. Четыре примера не в строке не очень далеко от линии, поэтому даже возведение их смещения в квадрат дает небольшое значение: $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 +
0^2} {10} = 0.4$$
Набор данных справа.
Восемь примеров на линии несут общую потерю 0. Однако, хотя только две точки отходят от линии, обе эти точки находятся в два раза дальше от линии, чем точки-выбросы на левом рисунке. Убыток в квадрате усиливает эти различия, поэтому смещение, равное двум, влечет за собой убыток в четыре раза больше, чем смещение, равное единице.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 +
0^2} {10} = 0.8$$