什么是机器学习?

机器学习 (ML) 是许多我们常用的关键技术的助力,从翻译应用到自动驾驶车辆,都离不开机器学习。本课程介绍了机器学习背后的核心概念。

机器学习提供了一种新的方式来解决问题、解答复杂问题和创作新内容。机器学习可以预测天气、估算行程时间、推荐歌曲、自动补全句子、总结文章,以及生成从未见过的图片。

从基本层面来说,机器学习是指训练一款名为模型的软件,以便做出有用的预测或根据数据生成内容。

例如,假设我们想要创建一个用于预测降雨量的应用。我们可以使用传统方法或机器学习方法。使用传统方法,我们会创建基于物理特性的地球大气和地表表示,并计算大量的流体动力学方程。这非常困难。

使用机器学习方法,我们会向机器学习模型提供大量天气数据,直到机器学习模型最终学习出导致降雨量不同的天气模式之间的数学关系。然后,我们会向该模型提供当前天气数据,它会预测降雨量。

检查您的理解情况

机器学习中的“模型”是什么?
模型是从数据中派生出来的数学关系,机器学习系统会使用这些关系进行预测
模型是一种计算机硬件
模型是对您所研究对象的简化表示。

机器学习系统类型

根据机器学习系统学习预测或生成内容的方式,它们可分为以下一个或多个类别:

  • 监督式学习
  • 非监督式学习
  • 强化学习
  • 生成式 AI

监督式学习

监督式学习模型在看到包含正确答案的大量数据后,可以发现产生正确答案的数据元素之间的关联,然后进行预测。这就像学生通过研究包含问题和答案的旧考试来学习新材料。学生在使用足够多的旧版考试进行训练后,就可以做好准备参加新版考试了。这些机器学习系统是“监督式”的,这意味着人类会向机器学习系统提供包含已知正确结果的数据。

监督式学习的两种最常见用例是回归和分类。

回归

回归模型可预测数值。例如,用于预测降雨量(以英寸或毫米为单位)的天气模型就是回归模型。

如需查看更多回归模型示例,请参阅下表:

场景 可能的输入数据 数值预测
未来的房价 建筑面积、邮政编码、卧室和浴室数量、地块面积、抵押贷款利率、房产税率、建筑费用,以及该地区待售住宅的数量。 住宅的价格。
未来的行程时间 历史路况信息(从智能手机、交通传感器、叫车应用和其他导航应用收集)、与目的地的距离和天气状况。 到达目的地所需的时间(以分钟和秒为单位)。

分类

分类模型可预测某个对象属于某个类别的可能性。与输出为数字的回归模型不同,分类模型输出的值表示某个对象是否属于特定类别。例如,分类模型用于预测电子邮件是否为垃圾邮件,或照片中是否有猫。

分类模型分为两类:二元分类和多类分类。二元分类模型会输出仅包含两个值的类中的值,例如,输出 rainno rain 的模型。多类分类模型会从包含多个值的类中输出一个值,例如,可以输出 rainhailsnowsleet 的模型。

检查您的理解情况

如果您想使用机器学习模型来预测商业建筑的能耗,您会使用哪种类型的模型?
回归
能耗以千瓦时 (kWh) 为单位,这是一个数字,因此您需要使用回归模型。
分类
分类模型可预测某个对象是否属于某个类别,而回归模型可预测数字。由于能耗以千瓦时 (kWh) 为单位,而千瓦时是数字,因此您需要使用回归模型。

非监督式学习

非监督式学习模型通过获得不含任何正确答案的数据来进行预测。非监督式学习模型的目标是找出数据中具有意义的模式。换句话说,模型没有关于如何对每项数据进行分类的提示,而是必须推断自己的规则。

一种常用的非监督式学习模型采用了一种称为聚类的技术。该模型会找到用于划分自然分组的数据点。

一张图片,显示了分组中的彩色圆点。

图 1. 用于对类似数据点进行聚类的机器学习模型。

一张图片,显示了彩色圆点分布在形状中,彼此相邻。

图 2. 具有自然划分的集群组。

聚类与分类不同,因为类别不是由您定义的。例如,无监督模型可能会根据温度对天气数据集进行分组,从而揭示定义季节的分片。然后,您可以尝试根据对数据集的理解为这些集群命名。

一张图片,显示了标记为雪、雨、冰雹和无雨的集群中的彩色圆点。

图 3. 用于对类似天气模式进行分群的机器学习模型。

一张图片,显示了标记为雪、雨、冰雹和无雨的集群彩色圆点,这些圆点被封闭在一个形状中,彼此相邻。

图 4. 标记为雪、雨夹雪、雨和无雨的天气模式集群。

检查您的理解情况

监督式方法与非监督式方法有何区别?
监督式方法会提供包含正确答案的数据。
监督式方法会提供包含正确答案的数据。 模型的任务是在数据中找到可生成正确答案的关联。 非监督式方法会提供没有正确答案的数据。它的任务是查找数据中的分组。
监督式方法通常使用聚类。
非监督式方法使用聚类。
非监督式方法知道如何为数据集群添加标签。
非监督式方法不知道数据集群的含义。 您可以根据对数据的理解来定义这些维度。

强化学习

强化学习模型根据在环境中执行的操作获得奖励或惩罚,从而进行预测。强化学习系统会生成政策,定义用于获得最多奖励的最佳策略。

强化学习用于训练机器人执行任务(例如在房间内四处走动),以及训练 AlphaGo 等软件程序玩围棋。

生成式 AI

生成式 AI 是一类根据用户输入生成内容的模型。例如,生成式 AI 可以创作独特的图片、音乐作品和笑话;它可以总结文章、说明如何执行任务或编辑照片。

生成式 AI 可以接受各种输入,并创建各种输出,例如文本、图片、音频和视频。它还可以接受和创建这些值的组合。例如,模型可以接受图片作为输入,并创建图片和文本作为输出,也可以接受图片和文本作为输入,并创建视频作为输出。

我们可以通过生成模型的输入和输出来讨论它们,通常以“输入类型”到“输出类型”的形式写出。例如,以下是生成式模型的部分输入和输出列表:

  • 文本到文本
  • 文本到图像
  • 文本到视频
  • 文本转代码
  • 文本转语音
  • 图片和文本到图片

下表列出了生成式模型示例、其输入以及可能的输出示例:

型号 输入 输出示例
文本到文本 勒芒耐力赛是谁发明的? 勒芒 24 小时耐力赛由 Automobile Club de l'Ouest (ACO) 发起,该组织成立于 1906 年,是一家汽车运动组织。首届比赛于 1923 年 5 月 26 日和 27 日在 Sarthe 赛道举行,该赛道位于法国勒芒镇附近,全长 13.426 公里(8.345 英里)。 这场比赛最初是为了宣传 ACO 和 Sarthe 地区而设立的。
来源:Bard
文本到图像 外星章鱼在阅读报纸的同时漂浮在门户中。 卡通章鱼的图片。
来源:Imagen
文本到视频 一只逼真的泰迪熊在旧金山的海中游泳。 泰迪熊潜入水中。泰迪熊在水下与五彩缤纷的鱼儿一起游泳。一只熊猫在水下游泳。 泰迪熊在水下游泳的视频。
来源:Phenaki
文本转代码 编写一个 Python 循环,用于遍历数字列表并输出质数。
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

来源:Bard
图片转文字 火烈鸟的图片。 这是一只火烈鸟。它们分布在加勒比地区。
资料来源: Google DeepMind

生成式 AI 如何运作?概括来讲,生成式模型会学习数据中的模式,目标是生成新的但类似的数据。生成式模型如下所示:

  • 喜剧演员,通过观察他人的行为和说话风格来学习模仿他人
  • 通过研究大量特定风格的绘画作品,学习以特定风格绘画的艺术家
  • 翻唱乐队,通过大量聆听特定音乐团体的音乐,学习模仿其声音

为了生成独特且富有创意的输出,生成式模型最初使用非监督式方法进行训练,在这种方法中,模型会学习模仿其训练数据。有时,系统会使用监督学习或强化学习对与模型可能被要求执行的任务(例如总结文章或编辑照片)相关的特定数据进行进一步训练。

生成式 AI 是一项快速发展演进的技术,不断有新的应用场景被发现。例如,生成式模型可以自动移除干扰性背景或提高低分辨率图片的质量,从而帮助企业优化其电子商务商品图片。