机器学习 (ML) 为我们使用的一些最重要的技术提供支持, 从翻译应用到自动驾驶汽车。本课程介绍 概念。
机器学习提供了一种全新的方法来解决问题、回答复杂问题, 内容。机器学习可以预测天气、估算行程时间, 自动完成句子、总结文章并生成 从未见过的图像。
从根本上来说,机器学习就是 训练一款软件,我们称之为 模型, 联想查询或根据 数据。
例如,假设我们想创建一个应用来预测降雨量。我们可以 采用传统方法或机器学习方法。使用传统的 方法,我们要根据物理学来呈现地球的大气层, 和表面,计算大量流体动力方程。这是 非常困难
使用机器学习方法,我们可以为机器学习模型提供大量天气数据 直到机器学习模型最终学到 不同降雨量的天气模式。然后,我们赋予 对当前天气数据进行建模,从而预测降雨量。
检查您的理解情况
机器学习系统的类型
机器学习系统可分为以下一个或多个类别,具体取决于 学习如何进行预测或生成内容:
- 监督式学习
- 非监督式学习
- 强化学习
- 生成式 AI
监督式学习
监督式学习 模型在看到大量数据以及正确答案后就能做出预测 然后在此基础上找出数据中 生成正确答案。这就像学生通过 并学习既有题目又有答案的旧考试。学生完成 受过足够多的老考试培训,能够为参加新考试做好充分准备。 这些机器学习系统是“监督式”人类让机器学习系统 具有已知正确结果的数据。
监督式学习的两个最常见的应用场景是回归 分类。
回归
回归模型可预测 数值。例如,预测降雨量的天气模型在 英寸或毫米)是一个回归模型。
如需查看更多回归模型示例,请参阅下表:
场景 | 可能的输入数据 | 数值预测 |
---|---|---|
未来房价 | 面积、邮政编码、卧室和浴室数、场地大小 抵押贷款利率、房产税率、建设成本以及 该地区待售住宅的数量。 | 房屋价格。 |
未来行程时间 | 历史路况信息(收集自智能手机、路况 传感器、约车和其他导航应用)、与 目的地、天气状况等 | 到达目的地所需的时间(分钟和秒)。 |
分类
分类模型 某事物属于某个类别的可能性。与回归模型不同, 分类模型会输出一个 产品是否属于特定类别。例如: 分类模型用于预测电子邮件是否为垃圾邮件或照片 包含一只猫。
分类模型分为两组:二元分类和
多类别分类。二元分类模型会基于
类,例如,一个模型可以输出
rain
或 no rain
。多类别分类模型会输出
类别,例如,可以输出
rain
、hail
、snow
或 sleet
。
检查您的理解情况
非监督式学习
非监督式学习 模型会根据给定的不含任何正确词元的数据 回答。非监督式学习模型的目标是 数据之间的差异。换句话说,模型没有提示, 对每一项数据进行分类,但必须推断出自己的规则。
常用的非监督式学习模型采用一种称为 聚类。模型查找数据点 用于划分自然分组的方法。
图 1. 对类似数据点进行聚类的机器学习模型。
图 2. 有自然分界线的聚类组。
聚类与分类不同,因为类别并非由 。例如,非监督式模型可能会根据 温度,揭示了定义季节的细分。然后, 尝试根据您对数据集的了解来命名这些集群。
图 3. 对类似天气模式进行聚类的机器学习模型。
图 4. 标记为雪、雨夹雪、 有雨,也有没有下雨。
检查您的理解情况
强化学习
强化学习 模型进行预测,以获得奖励 或因在环境中执行的操作而受到的惩罚。强化 学习系统生成政策, 定义了获得最多奖励的最佳策略。
强化学习用于训练机器人执行各种任务,例如步行 而软件程序 AlphaGo 来玩围棋。
生成式 AI
生成式 AI 是一类模型。例如,生成式 AI 可以 独特的图像、乐曲和笑话;它可以总结文章, 介绍如何执行任务或编辑照片。
生成式 AI 可以接受各种输入并创建各种输出,例如 文字、图片、音频和视频它还可以接受和创建 这些。例如,模型可以将图像作为输入并创建图像, 文本作为输出,或者将图片和文本作为输入并创建视频作为输出。
我们可以通过输入和输出来讨论生成模型,这些输入和输出通常采用书面形式 “输入类型”到“输出类型”。例如,以下是 生成模型的一些输入和输出的列表:
- 文本到文本
- 文本到图像
- 文本到视频
- 文本到代码
- 文本转语音
- 图片和文字转图片
下表列出了生成模型的示例、其输入以及 可能输出的示例:
型号 | 输入 | 输出示例 |
---|---|---|
文本到文本 | 谁发明了勒芒比赛? |
勒芒 24 小时耐力赛由西汽车俱乐部 (Automobile Club de l'Ouest) 创立
(ACO) 是一家成立于 1906 年的汽车组织。第一场比赛举行了
于 1923 年 5 月 26 日和 27 日在萨特赛道上行驶,全长 13.426 公里
(全长 8.345 英里)的环法自行车赛,位于法国勒芒镇附近。
这一比赛最初被认为是一种宣传 ACO 和
萨尔特地区。 来源:Bard |
文本到图像 | 一只外星章鱼飘过一个阅读报纸的传送门。 |
来源:Imagen |
文本到视频 | 一只仿真泰迪熊在旧金山的海洋中游泳。 泰迪熊入水了。泰迪熊在下面游泳 生活着五颜六色的鱼一只熊猫正在水下游泳。 |
来源:Phenaki |
文本到代码 | 编写一个 Python 循环,用于遍历数字列表并输出质数。 |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) 来源:Bard |
图片转文字 |
这是火烈鸟的声音。它们来自加勒比地区。 <ph type="x-smartling-placeholder"></ph> 来源: Google DeepMind |
生成式 AI 的工作原理是什么?概括来讲,生成模型会学习 以生成类似的新数据。生成式 如下所示:
- 通过观察人们的行为来模仿他人的幽默搞笑者 说话风格
- 那些通过研究大量内容来学习特定风格的绘画 那种风格的画作
- 翻唱乐队,通过聆听让自己听起来像是特定音乐团体 这个乐队的很多音乐
为了生成独特且富有创意的输出,生成模型最初 使用非监督式方法,即模型学习模仿 模型。模型有时会使用监督式学习或 针对与模型可能的任务相关的特定数据的强化学习 例如总结某篇文章或编辑照片。
生成式 AI 是一项快速发展的技术,不断涌现新的应用场景 被用户发现。例如,生成模型正在帮助企业优化 通过自动移除干扰性背景来制作电子商务产品图片 或改进低分辨率图片的质量。