Esta unidad se centra en diferentes tipos de condiciones que se usan para tomar decisiones. árboles.
Condiciones alineadas con ejes versus oblicuas
Una condición alineada con ejes implica solo un atributo. Una oblicua condition implica varios atributos. Por ejemplo, el siguiente es un Condición de alineación al eje:
num_legs ≥ 2
A su vez, la siguiente es una condición oblicua:
num_legs ≥ num_fingers
A menudo, los árboles de decisión se entrenan solo con condiciones alineadas con los ejes. Sin embargo, las divisiones oblicuas son más poderosas porque pueden expresar expresiones más complejas o patrones. Las divisiones oblicuas a veces producen mejores resultados a expensas mayores costos de inferencia y entrenamiento.
split_axis="SPARSE_OBLIQUE"
.
Figura 4: Ejemplos de una condición alineada a los ejes y una condición oblicua.
Graficar las dos condiciones anteriores genera el siguiente espacio de atributos separación:
Figura 5: Separación de espacio de atributos para las condiciones de la Figura 4.
Condiciones binarias y no binarias
Las condiciones con dos resultados posibles (por ejemplo, verdadero o falso) se denominan condiciones binarias. Los árboles de decisión que solo contienen condiciones binarias llamados árboles de decisión binarios.
Las condiciones no binarias tienen más de dos resultados posibles. Por lo tanto, Las condiciones no binarias tienen más poder discriminativo que las condiciones binarias. Las decisiones que contienen una o más condiciones no binarias se denominan decisión no binaria árboles.
Figura 6: Árboles de decisión binarios frente a no binarios.
Condiciones con demasiado energía también tienen más probabilidades de sobreajustarse. Por este motivo, los bosques de decisión generalmente utilizan árboles de decisión binarios, por lo que este curso se centrará en ellos.
El tipo de condición más común es la condición de umbral que se expresa de la siguiente manera:
feature ≥ threshold
Por ejemplo:
num_legs ≥ 2
Existen otros tipos de condiciones. Estos son otros tipos de uso frecuente Condiciones binarias:
Tabla 2. Tipos comunes de condiciones binarias
Nombre | Afección | Ejemplo |
condición de umbral | $\mathrm{feature}_i \geq \mathrm{umbral}$ | $\mathrm{num\_legs} \geq 2$ |
condición de igualdad | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``gato"$ |
condición en la configuración | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \{``gato”, ``perro”, ``pájaro"\}$ |
condición oblicua | $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
falta la función | $\mathrm{feature}_i \mathrm{is} \mathrm{Faltante}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{Faltante}$ |