Категориальные данные: перекрестные упражнения по функциям.

Playground — это интерактивное приложение, позволяющее управлять различными аспектами обучения и тестирования модели машинного обучения. С помощью Playground вы можете выбирать признаки и настраивать гиперпараметры, а затем наблюдать, как ваши решения влияют на модель.

На этой странице содержатся два упражнения с использованием встроенных виджетов Playground, расположенных под инструкциями.

Упражнение 1: Базовый кросс-функционал

В этом упражнении сосредоточьтесь на следующих частях пользовательского интерфейса Playground:

  • Под СВОЙСТВАМИ обратите внимание на три потенциальные особенности модели:
    • х 1
    • х 2
    • х 1 х 2
  • Под надписью ВЫХОД вы увидите квадрат с оранжевыми и синими точками. Представьте, что вы смотрите на квадратный лес, где оранжевые точки обозначают положение больных деревьев, а синие — положение здоровых.
  • Между FEATURES и OUTPUT, если присмотреться, можно увидеть три едва заметные пунктирные линии, соединяющие каждый объект с выходом. Толщина каждой пунктирной линии символизирует текущий вес, связанный с каждым объектом. Эти линии очень незначительные, поскольку начальный вес каждого объекта равен 0. По мере увеличения или уменьшения веса толщина этих линий меняется.

Задание 1: Исследуйте игровую площадку, выполнив следующие действия:

  1. Щелкните по тонкой линии, соединяющей элемент x 1 с выходом. Появится всплывающее окно.
  2. Во всплывающем окне введите вес 1.0 .
  3. Нажмите Enter.

Обратите внимание на следующее:

  • Пунктирная линия для x 1 становится толще по мере увеличения веса от 0 до 1,0.
  • Теперь появится оранжевый и синий фон.
    • Оранжевый фон — это догадки модели о том, где находятся больные деревья.
    • Синий фон — это догадки модели о местоположении здоровых деревьев. Модель работает ужасно: примерно половина догадок модели неверны.
  • Поскольку вес равен 1,0 для x 1 и 0 для остальных признаков, модель точно соответствует значениям x 1 .

Задача 2: Измените веса любого или всех трёх признаков так, чтобы модель (цвета фона) успешно предсказывала больные и здоровые деревья. Решение показано чуть ниже игровой площадки.



Упражнение 2: более сложное пересечение признаков

Для второго упражнения посмотрите на расположение оранжевых точек (больные деревья) и синих точек (здоровые деревья) в выходной модели, обратив внимание на следующее:

  • Точки образуют приблизительно сферические узоры.
  • Расположение точек нестабильный: например, обратите внимание на отдельные синие точки внутри внешней сферы оранжевых точек. Следовательно, даже самая лучшая модель вряд ли сможет правильно предсказать положение каждой точки.

Задание 1: Изучите пользовательский интерфейс Playground, выполнив следующие действия:

  1. Нажмите кнопку «Запуск/Пауза» — белый треугольник внутри чёрного круга. Playground начнёт обучение модели; наблюдайте, как увеличивается счётчик эпох.
  2. После того как система обучится не менее 300 эпох, нажмите ту же кнопку «Запуск/Пауза», чтобы приостановить обучение.
  3. Посмотрите на модель. Даёт ли модель хорошие прогнозы? Другими словами, окружён ли синий фон синим точками, а оранжевые точки — оранжевым?
  4. Обратите внимание на значение Test loss, которое отображается сразу под OUTPUT. Ближе ли это значение к 1,0 (больший убыток) или к 0 (меньший убыток)?
  5. Сбросьте настройки Playground, нажав на изогнутую стрелку слева от кнопки «Запуск/Пауза».

Задание 2: Создайте лучшую модель, выполнив следующие действия:

  1. Выберите или отмените выбор любой комбинации из пяти возможных функций.
  2. Отрегулируйте скорость обучения.
  3. Обучайте систему не менее 500 эпох.
  4. Проверьте значение тестового убытка. Можно ли получить тестовый убыток меньше 0,2?

Решения представлены ниже в разделе «Игровая площадка».