什么是机器学习?

机器学习 (ML) 为我们使用的一些最重要的技术提供支持, 从翻译应用到自动驾驶汽车。本课程介绍 概念。

机器学习提供了一种全新的方法来解决问题、回答复杂问题, 内容。机器学习可以预测天气、估算行程时间, 自动完成句子、总结文章并生成 从未见过的图像。

从根本上来说,机器学习就是 训练一款软件,我们称之为 模型联想查询或根据 数据。

例如,假设我们想创建一个应用来预测降雨量。我们可以 采用传统方法或机器学习方法。使用传统的 方法,我们要根据物理学来呈现地球的大气层, 和表面,计算大量流体动力方程。这是 非常困难

使用机器学习方法,我们可以为机器学习模型提供大量天气数据 直到机器学习模型最终学到 不同降雨量的天气模式。然后,我们赋予 对当前天气数据进行建模,从而预测降雨量。

检查您的理解情况

什么是“模型”该怎么办?
模型是根据机器学习 系统用来进行预测
模型是指计算机硬件
模型是您所研究的事物的较小表示形式。

机器学习系统的类型

机器学习系统可分为以下一个或多个类别,具体取决于 学习如何进行预测或生成内容:

  • 监督式学习
  • 非监督式学习
  • 强化学习
  • 生成式 AI

监督式学习

监督式学习 模型在看到大量数据以及正确答案后就能做出预测 然后在此基础上找出数据中 生成正确答案。这就像学生通过 并学习既有题目又有答案的旧考试。学生完成 受过足够多的老考试培训,能够为参加新考试做好充分准备。 这些机器学习系统是“监督式”人类让机器学习系统 具有已知正确结果的数据。

监督式学习的两个最常见的应用场景是回归 分类。

回归

回归模型可预测 数值。例如,预测降雨量的天气模型在 英寸或毫米)是一个回归模型。

如需查看更多回归模型示例,请参阅下表:

场景 可能的输入数据 数值预测
未来房价 面积、邮政编码、卧室和浴室数、场地大小 抵押贷款利率、房产税率、建设成本以及 该地区待售住宅的数量。 房屋价格。
未来行程时间 历史路况信息(收集自智能手机、路况 传感器、约车和其他导航应用)、与 目的地、天气状况等 到达目的地所需的时间(分钟和秒)。

分类

分类模型 某事物属于某个类别的可能性。与回归模型不同, 分类模型会输出一个 产品是否属于特定类别。例如: 分类模型用于预测电子邮件是否为垃圾邮件或照片 包含一只猫。

分类模型分为两组:二元分类和 多类别分类。二元分类模型会基于 类,例如,一个模型可以输出 rainno rain。多类别分类模型会输出 类别,例如,可以输出 rainhailsnowsleet

检查您的理解情况

如果您想使用机器学习模型预测商业用能 您会使用哪种类型的模型?
回归
能耗以千瓦时 (kWh) 为单位,千瓦时是一个数字, 因此建议您使用回归模型。
分类
分类模型可预测某项内容是否属于某个类别, 来预测某个数值。由于能源使用情况是以 千瓦时 (kWh) 是一个数字,则可以使用回归模型。

非监督式学习

非监督式学习 模型会根据给定的不含任何正确词元的数据 回答。非监督式学习模型的目标是 数据之间的差异。换句话说,模型没有提示, 对每一项数据进行分类,但必须推断出自己的规则。

常用的非监督式学习模型采用一种称为 聚类。模型查找数据点 用于划分自然分组的方法。

一张图片,显示聚类中的彩色圆点。

图 1. 对类似数据点进行聚类的机器学习模型。

一张图片,显示由不同形状包围起来且相互边框的聚类中的彩色点。

图 2. 有自然分界线的聚类组。

聚类与分类不同,因为类别并非由 。例如,非监督式模型可能会根据 温度,揭示了定义季节的细分。然后, 尝试根据您对数据集的了解来命名这些集群。

图片中显示聚类中的彩色圆点,标记为“雪”、“雨”、“冰雹”和“无雨”。

图 3. 对类似天气模式进行聚类的机器学习模型。

图片:以“雪”“雨”“冰雹”和“无雨”等标记的聚类中的彩色圆点组成的图片,这些圆点被包围在一个形状中并彼此相接。

图 4. 标记为雪、雨夹雪、 有雨,也有没有下雨。

检查您的理解情况

监督式方法与非监督式方法的区别是什么?
监督式方法提供包含正确答案的数据。
监督式方法提供包含正确答案的数据。 模型的任务是在数据中寻找能够产生正确结果的连接, 回答。 非监督式方法提供的数据没有正确答案。职责 是在数据中查找分组。
监督式方法通常使用聚类。
无监督方法使用聚类。
非监督式方法知道如何为数据聚类添加标签。
非监督式方法不知道数据聚类的含义。 根据您对数据的理解,您可以自行定义这些数据。

强化学习

强化学习 模型进行预测,以获得奖励 或因在环境中执行的操作而受到的惩罚。强化 学习系统生成政策, 定义了获得最多奖励的最佳策略。

强化学习用于训练机器人执行各种任务,例如步行 而软件程序 AlphaGo 来玩围棋。

生成式 AI

生成式 AI 是一类模型。例如,生成式 AI 可以 独特的图像、乐曲和笑话;它可以总结文章, 介绍如何执行任务或编辑照片。

生成式 AI 可以接受各种输入并创建各种输出,例如 文字、图片、音频和视频它还可以接受和创建 这些。例如,模型可以将图像作为输入并创建图像, 文本作为输出,或者将图片和文本作为输入并创建视频作为输出。

我们可以通过输入和输出来讨论生成模型,这些输入和输出通常采用书面形式 “输入类型”到“输出类型”。例如,以下是 生成模型的一些输入和输出的列表:

  • 文本到文本
  • 文本到图像
  • 文本到视频
  • 文本到代码
  • 文本转语音
  • 图片和文字转图片

下表列出了生成模型的示例、其输入以及 可能输出的示例:

型号 输入 输出示例
文本到文本 谁发明了勒芒比赛? 勒芒 24 小时耐力赛由西汽车俱乐部 (Automobile Club de l'Ouest) 创立 (ACO) 是一家成立于 1906 年的汽车组织。第一场比赛举行了 于 1923 年 5 月 26 日和 27 日在萨特赛道上行驶,全长 13.426 公里 (全长 8.345 英里)的环法自行车赛,位于法国勒芒镇附近。 这一比赛最初被认为是一种宣传 ACO 和 萨尔特地区。
来源:Bard
文本到图像 一只外星章鱼飘过一个阅读报纸的传送门。 一只卡通章鱼的图片。
来源:Imagen
文本到视频 一只仿真泰迪熊在旧金山的海洋中游泳。 泰迪熊入水了。泰迪熊在下面游泳 生活着五颜六色的鱼一只熊猫正在水下游泳。 泰迪熊在水下游泳的视频。
来源:Phenaki
文本到代码 编写一个 Python 循环,用于遍历数字列表并输出质数。
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

来源:Bard
图片转文字 一只火烈鸟的图片。 这是火烈鸟的声音。它们来自加勒比地区。
<ph type="x-smartling-placeholder"></ph> 来源: Google DeepMind

生成式 AI 的工作原理是什么?概括来讲,生成模型会学习 以生成类似的新数据。生成式 如下所示:

  • 通过观察人们的行为来模仿他人的幽默搞笑者 说话风格
  • 那些通过研究大量内容来学习特定风格的绘画 那种风格的画作
  • 翻唱乐队,通过聆听让自己听起来像是特定音乐团体 这个乐队的很多音乐

为了生成独特且富有创意的输出,生成模型最初 使用非监督式方法,即模型学习模仿 模型。模型有时会使用监督式学习或 针对与模型可能的任务相关的特定数据的强化学习 例如总结某篇文章或编辑照片。

生成式 AI 是一项快速发展的技术,不断涌现新的应用场景 被用户发现。例如,生成模型正在帮助企业优化 通过自动移除干扰性背景来制作电子商务产品图片 或改进低分辨率图片的质量。