Os modelos de floresta de decisão são compostos por árvores de decisão. Floresta de decisão de machine learning (como florestas aleatórias) dependem, pelo menos em parte, dos dados e o aprendizado das árvores de decisão.
Nesta seção do curso, você vai estudar um pequeno conjunto de dados de exemplo e aprender e como uma única árvore de decisão é treinada. Nas próximas seções, você vai aprender como as árvores de decisão são combinadas para treinar florestas de decisão.
No YDF, use o aprendiz CART para treinar modelos de árvore de decisão individuais:
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
O modelo
Uma árvore de decisão é um modelo composto por uma coleção de "perguntas" organizado hierarquicamente, na forma de uma árvore. As perguntas geralmente são chamadas de condition, uma split ou um test. Usaremos o termo "condição" no essa classe. Cada nó não folha contém uma condição, e cada nó de folha contém uma previsão.
As árvores botânicas geralmente crescem com a raiz na parte inferior. No entanto, a decisão as árvores geralmente são representadas com a raiz (o primeiro nó) na parte superior.
Figura 1. Uma árvore de decisão de classificação simples. A legenda em verde não faz parte da árvore de decisão. .
A inferência de um modelo de árvore de decisão é calculada roteando um exemplo do raiz (na parte superior) para um dos nós de folha (na parte inferior) de acordo com o pelas condições O valor da folha alcançada é a previsão da árvore de decisão. O conjunto de nós visitados é chamado de caminho de inferência. Por exemplo: Considere os seguintes valores de atributo:
num_legs | num_eyes |
---|---|
4 | 2 |
A previsão seria dog. O caminho de inferência seria:
- num_legs ≥ 3 → Sim
- num_eyes ≥ 3 → Não
Figura 2. O caminho de inferência que culmina na folha *cachorro* no exemplo *{num_legs : 4, num_eyes : 2}*. .
No exemplo anterior, as folhas da árvore de decisão contêm previsões ou seja, cada folha contém uma espécie animal entre um conjunto de possíveis espécies.
Da mesma forma, árvores de decisão podem prever valores numéricos rotulando folhas com previsões retroativas (valores numéricos). Por exemplo, a seguinte decisão prevê uma pontuação numérica de fofura de um animal entre 0 e 10.
Figura 3. Uma árvore de decisão que faz previsão numérica. .