Bedingungstypen

In diesem Modul geht es um verschiedene Arten von Bedingungen, die zum Erstellen von Entscheidungsbäumen verwendet werden.

Achsenorientierte und schräge Bedingungen

Eine Achsenausrichtungsbedingung bezieht sich nur auf ein einzelnes Element. Eine schräge Bedingung bezieht sich auf mehrere Features. Hier ist beispielsweise eine achsenunabhängige Bedingung zu sehen:

num_legs ≥ 2

Die folgende Bedingung ist indirekt:

num_legs ≥ num_fingers

Häufig werden Entscheidungsbäume nur mit achsorientierten Bedingungen trainiert. Schrägachsen sind jedoch leistungsfähiger, da sie komplexere Muster ausdrücken können. Schrägachsen-Splits führen manchmal zu besseren Ergebnissen, allerdings zu höheren Trainings- und Inferenzkosten.

YDF-Code
In YDF werden Entscheidungsbäume standardmäßig mit einer achsenunabhängigen Bedingung trainiert. Sie können Entscheidungsachsenbäume mit dem Parameter split_axis="SPARSE_OBLIQUE" aktivieren.

Die achsenunabhängige Bedingung lautet „num_legs >= 3“. Die schräge Bedingung lautet „num_legs + weight * 5 >= 12“.

Abbildung 4. Beispiele für eine achsenunabhängige Bedingung und eine schräge Bedingung.

 

Wenn Sie die beiden vorherigen Bedingungen grafisch darstellen, ergibt sich die folgende Trennung des Merkmalsraums:

Ein Diagramm mit dem Gewicht im Vergleich zu „num_legs“. Bei der achsenunabhängigen Bedingung wird das Gewicht ignoriert und es wird nur eine vertikale Linie angezeigt. Für die schräge Bedingung wird eine negativ geneigte Linie angezeigt.

Abbildung 5. Trennung des Feature-Bereichs für die Bedingungen in Abbildung 4.

 

Binäre und nicht binäre Bedingungen

Bedingungen mit zwei möglichen Ergebnissen (z. B. wahr oder falsch) werden als binäre Bedingungen bezeichnet. Entscheidungsbäume, die nur binäre Bedingungen enthalten, werden als binäre Entscheidungsbäume bezeichnet.

Nicht binäre Bedingungen haben mehr als zwei mögliche Ergebnisse. Daher haben nicht binäre Bedingungen eine größere Unterscheidungskraft als binäre Bedingungen. Entscheidungen mit einer oder mehreren nicht binären Bedingungen werden als nicht binäre Entscheidungsbäume bezeichnet.

Vergleich von binären und nicht binären Entscheidungsbäumen Der binäre Entscheidungsbaum enthält zwei binäre Bedingungen, der nicht binäre Entscheidungsbaum eine nicht binäre Bedingung.

Abbildung 6: Binäre und nicht binäre Entscheidungsbäume.

 

Bei Bedingungen mit zu viel Gewichtung ist die Wahrscheinlichkeit einer Überanpassung ebenfalls höher. Aus diesem Grund werden in Entscheidungswäldern in der Regel binäre Entscheidungsbäume verwendet. In diesem Kurs liegt der Schwerpunkt daher auf diesen.

Die gängigste Art von Bedingung ist die Grenzwertbedingung, die so ausgedrückt wird:

featurethreshold

Beispiel:

num_legs ≥ 2

Es gibt noch weitere Arten von Bedingungen. Im Folgenden finden Sie weitere häufig verwendete Arten von binären Bedingungen:

 

Tabelle 2. Gängige Arten binärer Bedingungen.

Name Bedingung Beispiel
Schwellenwertbedingung $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
Gleichheitsbedingung $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
Bedingung im Set $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$
Schrägachsenprojektion $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
Funktion fehlt $\mathrm{feature}_i \mathrm{is} \mathrm{Missing}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Missing}$