文本分类是各种产品中的应用的基本机器学习问题。在本指南中,我们已将文本分类工作流程细分为几个步骤。对于每个步骤,我们都根据您特定数据集的特征推荐了一种自定义方法。特别是,根据样本数量与每个样本字词数量的比率,我们建议一种可让您快速接近最佳性能的模型类型。其他步骤是围绕这一选择而设计的。我们希望,以下指南、附带的代码和流程图可以帮助您学习和理解文本分类问题,并迅速获得针对文本分类问题的初步解决方案。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2023-10-23。
[null,null,["最后更新时间 (UTC):2023-10-23。"],[[["This guide provides a structured workflow for text classification, breaking it down into manageable steps tailored to your dataset's characteristics."],["Model selection is guided by the ratio of samples to words per sample, helping you quickly identify a suitable model for optimal performance."],["The guide includes code and a flowchart to facilitate learning, understanding, and implementing a first-cut solution for your text classification problem."]]],[]]