什么是机器学习?

机器学习 (ML) 为我们使用的一些最重要的技术提供支持,从翻译应用到自动驾驶车辆。本课程介绍了机器学习背后的核心概念。

机器学习提供了一种新方法来解决问题、解答复杂问题和创建新内容。机器学习可以预测天气、估算行程时间、推荐歌曲、自动填充句子、总结文章,以及生成前所未有的图片。

简单地说,机器学习是训练一个软件(称为模型model)以做出有用的预测或从数据生成内容的过程。

例如,假设我们要开发一款预测降雨的应用。我们可以使用传统方法或机器学习方法。利用传统方法,我们可以创建基于物理学的地球大气层和表面表示法,并计算大量的流体动力学方程。这太难了。

通过使用机器学习方法,我们为机器学习模型提供大量天气数据,直到机器学习模型最终学习到产生不同降雨量的天气模式之间的数学关系。然后,我们向模型提供当前天气数据,并预测降雨量。

检查您的理解情况

机器学习中的“模型”是什么?
模型是指从机器学习系统用于进行预测的数据派生的数学关系
模型是计算机硬件的一部分
模型是你所研究对象的较小表示形式。

机器学习系统的类型

根据机器学习系统学习预测或生成内容的方式,可分为以下一个或多个类别:

  • 监督式学习
  • 非监督式学习
  • 强化学习
  • 生成式 AI

监督式学习

监督式学习模型可以在看到大量具有正确答案的数据后进行预测,然后发现数据中生成正确答案的元素之间的关联。这就好比学生通过学习包含问题和答案的旧考试来学习新资料。学员接受了足够多的老考试后,就可以充分准备参加新考试。 这些机器学习系统属于“监督式”系统,因为人工为机器学习系统提供已知正确结果的数据。

监督式学习的两个最常见使用场景是回归和分类。

回归

回归模型用于预测数值。例如,预测降雨量(以英寸或毫米为单位)的天气模型就是一种回归模型。

如需查看回归模型的更多示例,请参阅下表:

场景 可能的输入数据 数值预测
未来房价 该地区面积(平方英尺、邮政编码、卧室与浴室数、地块面积、抵押贷款利率、房产税率、建筑费用和待售房屋数)。 房屋的价格。
未来的行程时间 历史路况信息(通过智能手机、交通传感器、约车和其他导航应用收集的信息)、与目的地的距离和天气状况。 到达目的地所需的时间(以分钟和秒为单位)。

分类

分类模型可预测某事物属于某个类别的可能性。与输出为数字的回归模型不同,分类模型会输出一个值,指示某事物是否属于特定类别。例如,分类模型可用于预测电子邮件是否为垃圾邮件或某张照片是否包含猫。

分类模型分为两组:二元分类和多类别分类。二元分类模型从仅包含两个值的类(例如输出 rainno rain 的模型)输出一个值。多类别分类模型会从包含两个以上值的类输出值,例如可以输出 rainhailsnowsleet 的模型。

检查您的理解情况

如果要使用机器学习模型来预测商业建筑的能耗,您会使用哪种模型?
回归
能源用量以千瓦时 (kWh) 为单位,这是一个数字,因此您需要使用回归模型。
分类
分类模型用于预测某内容是否属于某个类别,而回归模型用于预测某个数字。由于能源用量以千瓦时 (kWh) 为单位,这是一个数字,因此建议您使用回归模型。

非监督式学习

非监督式学习模型通过接受不含任何正确答案的数据来进行预测。非监督式学习模型的目标是在数据中识别有意义的模式。换句话说,模型没有关于如何对每段数据进行分类的提示,而是必须推断自己的规则。

常用的非监督式学习模型采用一种称为聚类的技术。模型会查找划分自然分组的数据点。

一张显示了聚类中的彩色圆点的图片。

图 1. 对相似数据点进行聚类的机器学习模型。

图片中显示了以彩色圆点排列的形状,这些圆点彼此围成形状并相互边框。

图 2. 具有自然分界点的集群。

聚类与分类不同,因为类别不是由您定义的。例如,非监督式模型可能会根据温度对天气数据集进行聚类,从而揭示定义季节的细分。然后,您可以根据自己对数据集的理解尝试为这些集群命名。

一张图片,其中以彩色圆点标记了雪、雨、冰雹和无雨的聚类。

图 3. 对类似天气模式进行聚类的机器学习模型。

一张图片,其中以彩色圆点标记了雪、雨、冰雹和无雨的聚类,这些圆点由形状封闭且彼此边界。

图 4. 一系列标记为雪、雨、雨和无雨的天气模式。

检查您的理解情况

监督式方法与非监督式方法的区别是什么?
向监督式方法提供包含正确答案的数据。
向监督式方法提供包含正确答案的数据。模型的作用是在数据中查找可生成正确答案的连接。对于非监督式方法,系统会给出没有正确答案的数据。其作用是在数据中查找分组。
监督式方法通常使用聚类。
非监督式方法使用聚类。
非监督式方法知道如何为数据聚类添加标签。
非监督式方法不知道数据聚类的含义。您可以根据自己对数据的理解来定义它们。

强化学习

强化学习模型根据在环境中执行的操作来获得奖励或惩罚,从而进行预测。强化学习系统会生成一条政策,用于定义获得最多奖励的最佳策略。

强化学习用于训练机器人执行任务(例如在房间中走动),以及训练 AlphaGo 等软件程序玩 Go 游戏。

生成式 AI

生成式 AI 是一类根据用户输入创建内容的模型。例如,生成式 AI 可以创建独特的图片、乐曲和笑话,还可以总结文章、说明如何执行某项任务或编辑照片。

生成式 AI 可以接受各种输入并创建各种输出,例如文本、图片、音频和视频。它也可以接受并创建这些内容的组合。例如,模型可以将图片作为输入并创建图片和文本作为输出,也可以将图片和文本作为输入并创建视频作为输出。

我们可以按生成式模型的输入和输出来讨论生成模型,通常写为“输入类型”到“输出类型”。例如,以下是生成模型的一些输入和输出部分列表:

  • 文本到文本
  • 文本到图像
  • 文本到视频
  • 文本到代码
  • 文字转语音
  • 图片和文字到图片

下表列出了生成模型的示例、输入以及可能的输出示例:

模型 输入 输出示例
文本到文本 勒芒赛由谁发明? 勒芒 24 小时车由成立于 1906 年的汽车俱乐部 (ACO) 创立。第一场比赛于 1923 年 5 月 26 日和 27 日在萨尔特赛道举行,这是位于法国勒芒镇附近长达 13.426 公里(8.345 英里)的公路赛道。这场比赛最初被认为是宣传 ACO 和萨尔特地区的一种方式。
来源:Bard
文本到图像 一只外星章鱼漂浮在传送门上,在看报纸。 一只卡通章鱼的图片。
来源:Imagen
文本到视频 在旧金山,一只逼真的泰迪熊在海中游泳。 泰迪熊下水了。泰迪熊在水下与五颜六色的鱼群同游。熊猫在水下游泳。 泰迪熊在水下游泳的视频。
来源:Phenaki
文本到代码 编写一个 Python 循环,该循环遍历数字列表并输出质数。
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

来源:Bard
图片转文字 火烈鸟的图片。 这是火烈鸟的声音。它们位于加勒比海。
来源: Google DeepMind

生成式 AI 如何运作?概括来讲,生成模型会学习数据中的模式,以便生成新的但类似的数据。生成模型如下所示:

  • 通过观察人们的行为和说话方式来学习模仿他人的喜剧演员
  • 学习特定风格画作的艺术家
  • 翻唱乐队 通过聆听某个乐队的大量音乐,学习听起来像特定乐队的音乐

为了生成独特的且富有创造性的输出,生成模型最初是使用非监督式方法训练的,其中模型会学习来模仿训练所用的数据。有时,模型会通过监督式学习或强化学习对与模型可能需要执行的任务相关的特定数据进行进一步训练,例如总结文章或修改照片。

生成式 AI 是一项快速发展的技术,人们在不断探索新的应用场景。例如,生成模型能够自动移除干扰性背景或提高低分辨率图片的质量,从而帮助商家优化其电子商务产品图片。