Обобщение

Обобщение относится к способности вашей модели должным образом адаптироваться к новым, ранее неизвестным данным, взятым из того же распределения, которое использовалось для создания модели.

Обобщение

Цикл модели, прогноз, выборка, обнаружение истинного распределения, дополнительная выборка
  • Цель: хороший прогноз на основе новых данных, полученных из (скрытого) истинного распределения.
  • Проблема: мы не видим правды.
    • Мы получаем только образец от него.
Цикл модели, прогноз, выборка, обнаружение истинного распределения, дополнительная выборка
  • Цель: хороший прогноз на основе новых данных, полученных из (скрытого) истинного распределения.
  • Проблема: мы не видим правды.
    • Мы получаем только образец от него.
  • Если модель h хорошо соответствует нашей текущей выборке, как мы можем быть уверены, что она будет хорошо предсказывать другие новые выборки?
  • Теоретически:
    • Интересная область: теория обобщения
    • Основан на идеях измерения простоты/сложности модели
  • Интуиция: формализация принципа бритвы Оккама
    • Чем менее сложна модель, тем больше вероятность того, что хороший эмпирический результат обусловлен не только особенностями нашей выборки.
  • Эмпирически:
    • Вопрос: будет ли наша модель хорошо работать с новой выборкой данных?
    • Оценить: получить новый образец данных — назовем его тестовым набором.
    • Хорошая производительность на тестовом наборе является полезным индикатором хорошей производительности на новых данных в целом:
      • Если набор тестов достаточно велик
      • Если мы не будем обманывать, используя тестовый набор снова и снова

Три основных допущения во всем вышеизложенном:

  1. Мы берем примеры независимо и одинаково (iid) наугад из распределения
  2. Распределение является стационарным : оно не меняется со временем.
  3. Мы всегда берем из одного и того же дистрибутива : включая обучающие, проверочные и тестовые наборы.