Clustering-Workflow

So clustern Sie Ihre Daten:

  1. Daten vorbereiten.
  2. Ähnlichkeitsmesswert erstellen.
  3. Clustering-Algorithmus ausführen.
  4. Interpretieren Sie die Ergebnisse und passen Sie das Clustering an.

Auf dieser Seite werden die einzelnen Schritte kurz erläutert. Wir werden in den folgenden .

Daten vorbereiten

Wie bei jedem ML-Problem müssen Sie Featuredaten normalisieren, skalieren und transformieren. bevor Sie ein Modell anhand dieser Daten trainieren oder optimieren. Außerdem können Sie sollten Sie überprüfen, ob Sie mit den vorbereiteten Daten Ähnlichkeit zwischen Beispielen.

Messwert für Ähnlichkeit erstellen

Bevor ein Clustering-Algorithmus Daten gruppieren kann, muss er wissen, Beispielpaare sind. Sie können die Ähnlichkeit zwischen Beispielen quantifizieren, Erstellen eines Ähnlichkeitsmesswerts. Dies erfordert ein sorgfältiges Verständnis der Daten.

Clustering-Algorithmus ausführen

Ein Clustering-Algorithmus verwendet den Messwert für die Ähnlichkeit zu Clusterdaten. In diesem Kurs wird k-Means verwendet.

Ergebnisse interpretieren und anpassen

Da Clustering keine Grundwahrheit erzeugt oder enthält, gegen die Sie die Ausgabe überprüfen können, ist es wichtig, das Ergebnis mit den sowohl auf Cluster- als auch auf Beispielebene. Wenn das Ergebnis seltsam oder schlecht aussehen, testen Sie die vorherigen drei Schritte. Weiter bis die Qualität der Ausgabe Ihren Anforderungen entspricht.