Введение

Леса решений предоставляют следующие преимущества:

  • Их проще настроить , чем нейронные сети. Леса решений имеют меньше гиперпараметров ; кроме того, гиперпараметры в лесах решений обеспечивают хорошие значения по умолчанию .
  • Они изначально обрабатывают числовые, категориальные и недостающие функции. Это означает, что вы можете написать гораздо меньше кода предварительной обработки, чем при использовании нейронной сети, что сэкономит ваше время и уменьшит количество источников ошибок.
  • Они часто дают хорошие результаты «из коробки» , устойчивы к зашумленным данным и имеют интерпретируемые свойства.
  • Они делают выводы и обучаются на небольших наборах данных (<1 млн примеров) гораздо быстрее, чем нейронные сети.

Леса решений дают отличные результаты в соревнованиях по машинному обучению и широко используются во многих промышленных задачах.

В этом курсе представлены деревья решений и леса решений. Леса решений — это семейство интерпретируемых алгоритмов машинного обучения, которые превосходно работают с табличными данными. Леса решений могут выполнять:

Код YDF
В этом курсе объясняется, как работают леса решений, не заостряя внимание на каких-либо конкретных библиотеках. Однако на протяжении всего курса в текстовых полях демонстрируются примеры кода, которые основаны на библиотеке леса решений YDF , но могут быть преобразованы в другие библиотеки леса решений.

Предварительные условия

Этот курс предполагает, что вы прошли следующие курсы или обладаете эквивалентными знаниями:

Приятного обучения!