Tipos de condiciones

Esta unidad se centra en diferentes tipos de condiciones que se usan para tomar decisiones. árboles.

Condiciones alineadas con ejes versus oblicuas

Una condición alineada con ejes implica solo un atributo. Una oblicua condition implica varios atributos. Por ejemplo, el siguiente es un Condición de alineación al eje:

num_legs ≥ 2

A su vez, la siguiente es una condición oblicua:

num_legs ≥ num_fingers

A menudo, los árboles de decisión se entrenan solo con condiciones alineadas con los ejes. Sin embargo, las divisiones oblicuas son más poderosas porque pueden expresar expresiones más complejas o patrones. Las divisiones oblicuas a veces producen mejores resultados a expensas mayores costos de inferencia y entrenamiento.

Código de YDF
En YDF, los árboles de decisión se entrenan con una condición alineada al eje de forma predeterminada. Puedes habilitar árboles oblicuos de decisión con el Parámetro split_axis="SPARSE_OBLIQUE".

La condición alineada al eje es "num_legs >= 3". La condición oblicua es
  "núm_patas + peso * 5 >= 12".

Figura 4: Ejemplos de una condición alineada a los ejes y una condición oblicua.

 

Graficar las dos condiciones anteriores genera el siguiente espacio de atributos separación:

Un gráfico de peso frente a num_legs. La condición alineada al eje no
  ignora el peso y, por lo tanto, es solo una línea vertical. El oblicuo
  estado muestra una línea con una inclinación negativa.

Figura 5: Separación de espacio de atributos para las condiciones de la Figura 4.

 

Condiciones binarias y no binarias

Las condiciones con dos resultados posibles (por ejemplo, verdadero o falso) se denominan condiciones binarias. Los árboles de decisión que solo contienen condiciones binarias llamados árboles de decisión binarios.

Las condiciones no binarias tienen más de dos resultados posibles. Por lo tanto, Las condiciones no binarias tienen más poder discriminativo que las condiciones binarias. Las decisiones que contienen una o más condiciones no binarias se denominan decisión no binaria árboles.

Comparación entre árboles de decisión binarios y no binarios La decisión binaria
  el árbol contiene dos condiciones binarias: el árbol de decisiones no binario
  contiene una condición no binaria.

Figura 6: Árboles de decisión binarios frente a no binarios.

 

Condiciones con demasiado energía también tienen más probabilidades de sobreajustarse. Por este motivo, los bosques de decisión generalmente utilizan árboles de decisión binarios, por lo que este curso se centrará en ellos.

El tipo de condición más común es la condición de umbral que se expresa de la siguiente manera:

featurethreshold

Por ejemplo:

num_legs ≥ 2

Existen otros tipos de condiciones. Estos son otros tipos de uso frecuente Condiciones binarias:

 

Tabla 2. Tipos comunes de condiciones binarias

Nombre Afección Ejemplo
condición de umbral $\mathrm{feature}_i \geq \mathrm{umbral}$ $\mathrm{num\_legs} \geq 2$
condición de igualdad $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``gato"$
condición en la configuración $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``gato”, ``perro”, ``pájaro"\}$
condición oblicua $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
falta la función $\mathrm{feature}_i \mathrm{is} \mathrm{Faltante}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Faltante}$