Klasifikasi teks adalah masalah machine learning mendasar dengan aplikasi di berbagai produk. Dalam panduan ini, kami telah menguraikan alur kerja klasifikasi teks menjadi beberapa langkah. Untuk setiap langkah, kami telah menyarankan pendekatan yang disesuaikan berdasarkan karakteristik set data spesifik Anda. Khususnya, dengan menggunakan rasio jumlah sampel terhadap jumlah kata per sampel, kami menyarankan jenis model yang dapat membantu Anda mendapatkan performa terbaik dengan cepat. Langkah-langkah lainnya dirancang berdasarkan pilihan ini. Kami harap dengan mengikuti panduan, kode yang disertakan, dan diagram alur, Anda dapat mempelajari, memahami, dan mendapatkan solusi cepat untuk masalah klasifikasi teks Anda.
Kesimpulan
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-07-27 UTC.
[null,null,["Terakhir diperbarui pada 2025-07-27 UTC."],[[["\u003cp\u003eThis guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics.\u003c/p\u003e\n"],["\u003cp\u003eModel selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance.\u003c/p\u003e\n"],["\u003cp\u003eThe guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem.\u003c/p\u003e\n"]]],[],null,["# Conclusion\n\nText classification is a fundamental machine learning problem with applications\nacross various products. In this guide, we have broken down the text\nclassification workflow into several steps. For each step, we have suggested a\ncustomized approach based on the characteristics of your specific dataset. In\nparticular, using the ratio of number of samples to the number of words per\nsample, we suggest a model type that gets you closer to the best performance\nquickly. The other steps are engineered around this choice. We hope that\nfollowing the guide, the\n[accompanying code](https://github.com/google/eng-edu/tree/master/ml/guides/text_classification),\nand the\n[flowchart](/machine-learning/guides/text-classification/step-2-5#figure-5)\nwill help you learn, understand, and get a swift first-cut solution to your text\nclassification problem."]]