Árvores de decisão

Os modelos de floresta de decisão são compostos por árvores de decisão. Floresta de decisão de machine learning (como florestas aleatórias) dependem, pelo menos em parte, dos dados e o aprendizado das árvores de decisão.

Nesta seção do curso, você vai estudar um pequeno conjunto de dados de exemplo e aprender e como uma única árvore de decisão é treinada. Nas próximas seções, você vai aprender como as árvores de decisão são combinadas para treinar florestas de decisão.

Código YDF

No YDF, use o aprendiz CART para treinar modelos de árvore de decisão individuais:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

O modelo

Uma árvore de decisão é um modelo composto por uma coleção de "perguntas" organizado hierarquicamente, na forma de uma árvore. As perguntas geralmente são chamadas de condition, uma split ou um test. Usaremos o termo "condição" no essa classe. Cada nó não folha contém uma condição, e cada nó de folha contém uma previsão.

As árvores botânicas geralmente crescem com a raiz na parte inferior. No entanto, a decisão as árvores geralmente são representadas com a raiz (o primeiro nó) na parte superior.

Uma árvore de decisão contendo duas condições e três folhas. A primeira
condição (a raiz) é num_legs >= 3; a segunda condição é
num_eyes >= 3. As três folhas são pinguim, aranha,
e o cachorro.

Figura 1. Uma árvore de decisão de classificação simples. A legenda em verde não faz parte da árvore de decisão. .

 

A inferência de um modelo de árvore de decisão é calculada roteando um exemplo do raiz (na parte superior) para um dos nós de folha (na parte inferior) de acordo com o pelas condições O valor da folha alcançada é a previsão da árvore de decisão. O conjunto de nós visitados é chamado de caminho de inferência. Por exemplo: Considere os seguintes valores de atributo:

num_legs num_eyes
4 2

A previsão seria dog. O caminho de inferência seria:

  1. num_legs ≥ 3 → Sim
  2. num_eyes ≥ 3 → Não

A mesma ilustração da Figura 1, mas esta ilustração mostra
  caminho de inferência em duas condições, terminando na folha para "cão".

Figura 2. O caminho de inferência que culmina na folha *cachorro* no exemplo *{num_legs : 4, num_eyes : 2}*. .

 

No exemplo anterior, as folhas da árvore de decisão contêm previsões ou seja, cada folha contém uma espécie animal entre um conjunto de possíveis espécies.

Da mesma forma, árvores de decisão podem prever valores numéricos rotulando folhas com previsões retroativas (valores numéricos). Por exemplo, a seguinte decisão prevê uma pontuação numérica de fofura de um animal entre 0 e 10.

Árvore de decisão em que cada folha contém um ponto flutuante diferente.
  número

Figura 3. Uma árvore de decisão que faz previsão numérica. .