什么是机器学习?

机器学习 (ML) 为我们使用的一些最重要的技术提供支持,从翻译应用到自动驾驶车辆。本课程介绍机器学习背后的核心概念。

机器学习提供了一种解决问题、回答复杂问题和创建新内容的新方法。机器学习可以预测天气、估算行程时间、推荐歌曲、自动填充句子、总结文章,以及生成以前从未见过的图片。

简单来说,机器学习是训练一段软件(称为模型model)以做出有用的预测或从数据生成内容的过程。

例如,假设我们想要创建一个预测降雨的应用。我们可以使用传统方法或机器学习方法。通过使用传统方法,我们可以创建基于物理学的地球大气层和表面,计算大量的流体动力方程。这非常困难

通过使用机器学习方法,我们可以为机器学习模型提供大量的天气数据,直到机器学习模型最终学习到产生不同降雨量的天气模式之间的数学关系。然后,我们会向模型提供当前天气数据,并预测降雨量。

检查您的理解情况

机器学习中的“模型”是什么?
模型是衍生自机器学习系统进行预测时所用数据的数学关系
模型是指计算机硬件的组成部分
模型是你所研究事物的较小代表。

机器学习系统的类型

根据机器学习系统学习进行预测或生成内容的方式,机器学习系统可分为以下一个或多个类别:

  • 监督式学习
  • 非监督式学习
  • 强化学习
  • 生成式 AI

监督式学习

监督式学习模型可以在看到大量具有正确答案的数据后进行预测,然后发现数据中生成正确答案的元素之间的关联。这就像学生通过学习同时包含题目和答案的旧考试来学习新资料。一旦学生接受了足够多的老考试,就为参加新考试做好了充分的准备。这些机器学习系统是“监督式”的,也就是说,人工为机器学习系统提供已知正确结果的数据。

监督式学习的两个最常见的使用场景是回归和分类。

回归

回归模型可预测数值。例如,预测降雨量(以英寸或毫米为单位)的天气模型就属于回归模型。

如需查看回归模型的更多示例,请参阅下表:

场景 可能的输入数据 数值预测
未来房价 相应区域内的面积、邮政编码、卧室与浴室数量、地块面积、抵押贷款利率、房产税率、建筑费用以及待售房屋数。 房屋的价格。
未来的行程时间 历史路况信息(收集自智能手机、交通传感器、约车和其他导航应用信息)、与目的地的距离和天气状况。 到达目的地所需的时间(以分钟和秒为单位)。

分类

分类模型可预测内容属于某个类别的可能性。与输出为数字的回归模型不同,分类模型会输出一个值来说明某事物是否属于特定类别。例如,分类模型可用于预测电子邮件是否为垃圾邮件或照片是否包含猫。

分类模型分为两组:二元分类和多类别分类。二元分类模型会从仅包含两个值的类输出值,例如输出 rainno rain 的模型。多类别分类模型会从包含两个以上值的类别中输出一个值,例如可以输出 rainhailsnowsleet 的模型。

检查您的理解情况

如果要使用机器学习模型来预测商业建筑的能源使用情况,您会使用哪种模型?
回归
能耗以千瓦时 (kWh) 为单位,这是一个数字,因此您需要使用回归模型。
分类
分类模型可预测某事物是否属于某个类别,而回归模型则可预测数字。由于能耗是以千瓦时 (kWh) 为单位衡量的,这是一个数字,因此您需要使用回归模型。

非监督式学习

非监督式学习模型通过接受不包含任何正确答案的数据进行预测。非监督式学习模型的目标是从数据中识别有意义的模式。换句话说,模型没有关于如何对每段数据进行分类的提示,而是必须推断自己的规则。

常用的非监督式学习模型采用一种称为聚类的技术。模型会查找划分自然分组的数据点。

图片中显示聚类中的彩色圆点。

图 1. 对相似数据点进行聚类的机器学习模型。

一张图片,其中以彩色圆点为中心,这些彩色圆点封装在一个形状中,彼此相邻。

图 2. 具有自然分界点的集群组。

聚类与分类的不同之处在于,类别并不是由您定义的。例如,非监督式模型可能会根据温度对天气数据集进行聚类,从而揭示定义季节的细分。然后,您可以尝试根据自己对数据集的了解为这些集群命名。

一张图片,其中以彩色圆点显示集群,这些彩色圆点被标记为下雪、雨、冰雹和无雨。

图 3. 一个对类似天气模式进行聚类的机器学习模型。

一张图片,其中以彩色圆点标记了雪、雨、冰雹和无雨,这些彩色圆点被封闭成一个形状,彼此相邻。

图 4. 一组标记为下雪、雨夹雪、下雨和无雨的天气模式。

检查您的理解情况

监督式方法与非监督式方法的区别是什么?
监督式方法获得包含正确答案的数据。
监督式方法获得包含正确答案的数据。 模型的任务是在数据中查找能产生正确答案的连接。非监督式方法获得的是没有正确答案的数据。它的作用是在数据中查找分组。
监督式方法通常使用聚类。
非监督式方法使用聚类。
非监督式方法知道如何为数据聚类添加标签。
非监督式方法不知道数据聚类的含义。您可以根据您对数据的理解来对其进行定义。

强化学习

强化学习模型通过基于在环境中执行的操作获取奖励或惩罚来进行预测。强化学习系统会生成政策,用于定义获得最多奖励的最佳策略。

强化学习用于训练机器人执行任务(例如在房间内走动),以及训练 AlphaGo 等软件程序玩 Go 游戏。

生成式 AI

生成式 AI 是一类根据用户输入创建内容的模型。例如,生成式 AI 可以创作新颖的图像、乐曲和笑话,还可以总结文章、说明如何执行某项任务或编辑照片。

生成式 AI 可以接受各种输入并创建各种输出,如文本、图片、音频和视频。它也可以接受并创建这些组合的组合。例如,模型可以将图片作为输入并创建图片和文本作为输出,或者将图片和文本作为输入并创建视频作为输出。

我们可以按生成模型的输入和输出来讨论生成模型,通常写为“输入类型”到“输出类型”。例如,以下是生成模型的一些输入和输出的部分列表:

  • 文本到文本
  • 文本到图像
  • 文本到视频
  • 文本到代码
  • 文字转语音
  • 图片和文字到图片

下表列出了生成模型的示例、输入模型以及可能的输出示例:

模型 输入 输出示例
文本到文本 勒芒赛的创作者是谁? 勒芒 24 小时耐力赛由成立于 1906 年的西欧汽车俱乐部 (ACO) 创立。首届比赛于 1923 年 5 月 26 日和 27 日在萨尔特赛道举行,这是位于法国勒芒镇附近的一条长 13.426 公里(8.345 英里)的公路赛道。这场比赛最初被认为是宣传 ACO 和萨尔特地区的一种方式。
来源:Bard
文本到图像 一只外星章鱼漂浮在门上,阅读报纸。 卡通章鱼的图片。
来源:Imagen
文本到视频 一只逼真的泰迪熊在旧金山的海中游泳。 泰迪熊在水下。泰迪熊在水下一直游动,还有五颜六色的鱼。一只熊猫在水下游泳。 泰迪熊在水下游泳的视频。
来源:Phenaki
文本到代码 编写一个 Python 循环,该循环遍历一系列数字并输出质数。
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

来源:Bard
图片转文字 火烈鸟的图片。 这是火烈鸟的声音。它们位于加勒比地区。
来源: Google DeepMind

生成式 AI 如何运作?概括来讲,生成模型会学习数据中的模式,目标是生成新的但类似的数据。生成模型如下所示:

  • 通过观察人们的行为和说话方式来学模仿他人的幽默搞笑者
  • 通过学习大量特定风格的画作学习特定风格的艺术家
  • 翻唱乐队,通过聆听某个乐队的大量音乐,学习听起来像一个特定乐队的音乐

为了生成独特的且富有创意的输出,生成模型最初是使用非监督式方法进行训练的,其中模型会学习模拟训练模型所用的数据。有时,模型会通过监督式学习或强化学习对模型可能需要执行的任务(例如总结一篇文章或编辑照片)相关的特定数据进行进一步训练。

生成式 AI 是一项快速发展的技术,人们在不断探索新的使用场景。例如,生成模型可以帮助企业自动移除干扰性背景或提高低分辨率图片的质量,从而优化其电子商务商品图片。