Практикум по машинному обучению: классификация изображений

Предотвращение переобучения

Как и в случае с любой моделью машинного обучения, ключевой проблемой при обучении сверточной нейронной сети является переобучение : модель настолько настроена на специфику обучающих данных, что ее невозможно обобщить на новые примеры. Два метода предотвращения переобучения при построении CNN:

  • Увеличение данных : искусственное увеличение разнообразия и количества обучающих примеров путем выполнения случайных преобразований существующих изображений для создания набора новых вариантов (см. рисунок 7). Увеличение данных особенно полезно, когда исходный набор обучающих данных относительно невелик.
  • Регуляризация отсева : случайное удаление единиц из нейронной сети на этапе обучения градиенту.

Схема увеличения данных на одном изображении собаки, создание 9 новых изображений с помощью случайные преобразования Рисунок 7. Увеличение данных на одном изображении собаки (взято из набора данных «Собаки против кошек», доступного на Kaggle). Слева : исходное изображение собаки из тренировочного набора. Справа : девять новых изображений, созданных из исходного изображения с использованием случайных преобразований.