Conclusão

A classificação de texto é um problema fundamental de machine learning com aplicativos em vários produtos. Neste guia, dividimos o fluxo de trabalho de classificação de texto em várias etapas. Para cada etapa, sugerimos uma abordagem personalizada com base nas características do conjunto de dados específico. Especificamente, usando a proporção entre o número de amostras e o número de palavras por amostra, sugerimos um tipo de modelo que aproxima você do melhor desempenho rapidamente. As outras etapas são projetadas com base nessa escolha. Esperamos que seguir o guia, o código de acompanhamento e o fluxograma ajudem você a aprender, entender e ter uma solução rápida e rápida para seu problema de classificação de texto.