Florestas de decisão

Uma floresta de decisão é um termo genérico para descrever modelos feitos de várias árvores de decisão. A previsão de uma floresta de decisão é a agregação das previsões das árvores de decisão. A implementação dessa agregação depende do algoritmo usado para treinar a floresta de decisão. Por exemplo, em uma floresta aleatória de classificação de várias classes (um tipo de floresta de decisão), cada árvore vota em uma única classe, e a previsão da floresta aleatória é a classe mais representada. Em uma árvore de classificação binária com aumento de gradiente (GBT, na sigla em inglês) (outro tipo de floresta de decisão), cada árvore gera um logito (um valor de ponto flutuante) e a previsão da árvore com aumento de gradiente é a soma desses valores seguida por uma função de ativação (por exemplo, sigmoide).

Os próximos dois capítulos detalham esses dois algoritmos de florestas de decisão.