A classificação de texto é um problema fundamental de machine learning com aplicativos em vários produtos. Neste guia, dividimos o fluxo de trabalho de classificação de texto em várias etapas. Para cada etapa, sugerimos uma abordagem personalizada com base nas características do conjunto de dados específico. Especificamente, usando a proporção entre o número de amostras e o número de palavras por amostra, sugerimos um tipo de modelo que aproxima você do melhor desempenho rapidamente. As outras etapas são projetadas com base nessa escolha. Esperamos que seguir o guia, o código de acompanhamento e o fluxograma ajudem você a aprender, entender e ter uma solução rápida e rápida para seu problema de classificação de texto.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2023-10-23 UTC.
[null,null,["Última atualização 2023-10-23 UTC."],[[["This guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics."],["Model selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance."],["The guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem."]]],[]]