练习 7a:您的问题,公式为机器学习问题

记下或点击您认为最适合您问题的技术解决方案的复选框。我们的问题最好采用如下表述方式:
用于预测或生成:

如果您的解决方案最适合用于构建预测性机器学习,请参阅以下问题。如果您的解决方案被构建为生成式 AI 框架,请参阅 MakerSuite,这是一款基于浏览器的 IDE,可让您尝试使用不同的提示来快速生成式语言模型原型。

练习 7b:将问题作为简单的问题解决

刚开始使用时,较简单的问题编写更容易推断和实现。接受您的给定问题并将其声明为二元分类和/或单向回归问题。

练习 8:为模型设计数据

编写您希望预测性机器学习模型用于进行预测的数据。
一个空表,包含 3 行 4 列,分别标记为:input1、input 2、input3 和 output(标签)
取得成功的建议
  • 一行构成一项数据,并据此做出一项预测。
  • 仅包含进行预测时可用的信息。
  • 每个输入可以是整数、浮点数或字节(包括字符串)的标量或一维列表。
  • 如果输入的结构与标量或 1D 列表不同,您可能会考虑此输入是否最适合您的数据。 例如:
    • 如果某个单元格在 1D 列表中表示两个或多个语义不同的内容,您可能希望将它们拆分为单独的输入。
    • 如果单元格代表嵌套协议缓冲区,您可能希望展平嵌套协议缓冲区的每个字段。
    • 例外情况:音频、图片和视频数据,其中单元格是字节 blob。

练习 9:数据来源

写下每个输入源的来源。 评估开发数据流水线为某一行构建每一列的工作量。
一个空表,包含 2 行 4 列,分别标记为:input1、input 2、input3 和 output
取得成功的建议
示例输出何时可用于训练目的?
  • 如果示例输出难以获取,您可能需要重新进行练习 5(使用输出),并检查是否可以针对模型采用其他输出。
确保所有输入内容(输出除外)都可用时(采用预测结果时)采用您正记录的格式。
  • 如果难以在传送时以完全相同的格式获取所有输入,您可能需要重新进行练习 8(为模型设计数据)以重新考虑输入,或者锻炼 5 以重新考虑何时可以传送。

练习 10:轻松获取的输入

在练习 8 中列出的多项意见中,请选择 1-3 条易于获得的输入内容,并且您认为这些内容会得出合理的初始结果。
一个空表,包含 2 行和 4 列,分别标记为输入 1、输入 2、输入 3 和输出
取得成功的建议
  • 在练习 6 中,您列出了一组您可以使用的启发法。哪些输入有助于实现这些启发法?
  • 请考虑用于开发数据流水线以准备输入的工程费用,以及在模型中包含每个输入的预期好处。
  • 重点关注可通过简单流水线从单个系统获取的输入。刚开始时,建议尽可能使用最小基础架构。

打印或保存

点击下方按钮即可打印回复或将其保存为 .pdf 文件。

打印页面