Спуск в ML: проверьте свое понимание

Среднеквадратическая ошибка

Рассмотрим следующие два графика:

Сюжет 10 баллов. Линия проходит через 6 точек. 2 балла это 1Сюжет 10 баллов. Линия проходит через 8 точек. 1 балл равен 2

Изучите варианты ниже.

Какой из двух наборов данных, показанных на предыдущих графиках, имеет более высокую среднеквадратичную ошибку (MSE)?
Набор данных слева.
Шесть примеров в строке несут общую потерю 0. Четыре примера не в строке не очень далеко от линии, поэтому даже возведение их смещения в квадрат дает небольшое значение: $$ MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$$
Набор данных справа.
Восемь примеров на линии несут общую потерю 0. Однако, хотя только две точки отходят от линии, обе эти точки находятся в два раза дальше от линии, чем точки-выбросы на левом рисунке. Убыток в квадрате усиливает эти различия, поэтому смещение, равное двум, влечет за собой убыток в четыре раза больше, чем смещение, равное единице.
$$ MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8$$