La classification de texte est un problème fondamental de machine learning qui concerne les applications dans divers produits. Dans ce guide, nous avons décomposé le workflow de classification de texte en plusieurs étapes. Pour chaque étape, nous avons suggéré une approche personnalisée en fonction des caractéristiques de votre ensemble de données spécifique. Plus spécifiquement, en utilisant le ratio entre le nombre d'échantillons et le nombre de mots par échantillon, nous vous suggérons un type de modèle qui vous rapproche rapidement des meilleures performances. Les autres étapes sont conçues autour de ce choix. Nous espérons que le respect du guide, du code d'accompagnement et de l'organigramme vous aidera à apprendre, à comprendre et à trouver rapidement une solution directe à votre problème de classification de texte.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2023/10/23 (UTC).
[null,null,["Dernière mise à jour le 2023/10/23 (UTC)."],[[["This guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics."],["Model selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance."],["The guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem."]]],[]]