Die Textklassifizierung ist ein grundlegendes Problem des maschinellen Lernens, das in verschiedenen Produkten Anwendung findet. In diesem Leitfaden haben wir den Workflow für die Textklassifizierung in mehrere Schritte unterteilt. Für jeden Schritt haben wir einen individuellen Ansatz vorgeschlagen, der auf den Merkmalen Ihres spezifischen Datasets basiert. Insbesondere anhand des Verhältnisses der Anzahl der Stichproben zur Anzahl der Wörter pro Stichprobe schlagen wir einen Modelltyp vor, mit dem Sie schnell die beste Leistung erzielen. Die anderen Schritte sind auf diese Auswahl abgestimmt. Wir hoffen, dass Sie mit dieser Anleitung, dem Begleitcode und dem Flussdiagramm schnell eine erste Lösung für Ihr Problem bei der Textklassifizierung finden.
Fazit
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-07-27 (UTC).
[null,null,["Zuletzt aktualisiert: 2025-07-27 (UTC)."],[[["\u003cp\u003eThis guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics.\u003c/p\u003e\n"],["\u003cp\u003eModel selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eThe guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem.\u003c/p\u003e\n"]]],[],null,["# Conclusion\n\nText classification is a fundamental machine learning problem with applications\nacross various products. In this guide, we have broken down the text\nclassification workflow into several steps. For each step, we have suggested a\ncustomized approach based on the characteristics of your specific dataset. In\nparticular, using the ratio of number of samples to the number of words per\nsample, we suggest a model type that gets you closer to the best performance\nquickly. The other steps are engineered around this choice. We hope that\nfollowing the guide, the\n[accompanying code](https://github.com/google/eng-edu/tree/master/ml/guides/text_classification),\nand the\n[flowchart](/machine-learning/guides/text-classification/step-2-5#figure-5)\nwill help you learn, understand, and get a swift first-cut solution to your text\nclassification problem."]]