Fazit

Die Textklassifizierung ist ein grundlegendes Problem des maschinellen Lernens bei Anwendungen in verschiedenen Produkten. In diesem Leitfaden wurde der Workflow für die Textklassifizierung in mehrere Schritte unterteilt. Für jeden Schritt haben wir einen individuellen Ansatz vorgeschlagen, der auf den Merkmalen Ihres spezifischen Datasets basiert. Insbesondere empfehlen wir unter Verwendung des Verhältnisses der Anzahl der Stichproben zur Anzahl der Wörter pro Stichprobe einen Modelltyp, mit dem Sie schnell der besten Leistung annähern. Die anderen Schritte basieren auf dieser Auswahl. Der entsprechende Code und das Flussdiagramm sollen Ihnen dabei helfen, Ihr Problem mit der Textklassifizierung besser zu verstehen und schnell eine Lösung für den Einstieg zu finden.