机器学习术语表：Agentic

本页包含 Agentic 术语。如需查看所有术语，请点击此处。

A

act

#agent

智能体循环中的一个阶段，在此阶段中，智能体会执行在推理阶段选择的操作。例如，行动阶段可以发送 API 请求。

action

#agent

在强化学习中，智能体在环境的状态之间转换的机制。智能体使用政策选择操作。

行动空间

#agent

代理可用于执行任务的一组资源。操作空间可能包括智能体可以调用的工具和 API，以及智能体拥有的权限。一般来说，动作空间应足够大，以便智能体执行任务。如果动作空间过小，智能体可能没有足够的资源来执行任务。如果动作空间过大，智能体往往更容易出错。

代理

#generativeAI

#agent

能够对用户输入进行推理，以便代表用户规划和执行操作的软件。

在强化学习中，智能体是使用政策来最大限度提高从环境的状态转换中获得的预期回报的实体。

代理型

#generativeAI

#agent

agent 的形容词形式。Agentic 是指智能体所具备的特质（例如自主性）。

智能体循环

#agent

智能体反复执行的循环，直到满足终止条件。该周期通常包括以下四个阶段：

观察
原因
行动
反馈

智能体工作流

#generativeAI

#agent

一种动态流程，其中智能体自主规划和执行行动以实现目标。该过程可能涉及推理、调用外部工具和自行纠正方案。

智能体编排

#agent

跨多个子代理或 LLM 调用的任务的集中管理和路由。智能体编排功能可将复杂任务分解为更小的子任务，并将其分配给最能胜任的子智能体。

自主智能体

#agent

一种通过规划、行动和适应来达成复杂目标的智能体，无需持续的人工干预。

E

评估器代理

#agent

在结果最终确定之前评估其他代理的结果的代理。您可以将一个代理想象成制造产品的代理，而将另一个代理（评估代理）想象成在产品发布之前测试该产品的代理。

评价者是评估者代理的同义词。

F

反馈

#agent

智能体循环中的一个阶段，在此阶段，智能体会评估在行动阶段采取的行动。例如，如果代理在行动阶段发送了 API 请求，反馈阶段可能会确定 API 响应是否成功。

G

Gemini 模型

#generativeAI

#agent

Google 基于先进的 Transformer 的多模态模型。Gemini 模型专为与智能体集成而设计。

用户可以通过多种方式与 Gemini 模型互动，包括通过交互式对话界面和 SDK。

生成式智能体（拟像）

#agent

智能体具有独特的角色、记忆和日常安排，可模拟真实的人类行为。

如需了解详情，请参阅生成式代理：人类行为的交互式模拟。

M

经理代理

#agent

控制一个或多个子智能体的智能体。

多智能体协作

#agent

一种框架，其中多个专业 AI 智能体相互互动、辩论或传递任务，以解决复杂问题。

O

观察

#agent

智能体循环中的一个阶段，在此阶段，智能体会检查或评估智能体进度的某个方面。例如，假设 act 阶段生成了一些代码。因此，观察阶段可能会对生成的代码运行测试。

P

plan-and-solve

#agent

一种智能体策略，模型先起草一个明确的多步计划，然后再尝试执行任何操作。

插件

#agent

一种标准化、模块化的工具，可轻松附加到代理以扩展其功能。例如，GitHub 插件可让代理执行读取 GitHub 问题和创建拉取请求等操作。

程序性记忆

#agent

在代理中，指如何做某事的知识。例如，智能体可能会形成有关如何搜索网络然后显示前三个网站的程序性记忆。

R

reason

#agent

agentic loop 中的一个阶段，在此阶段，代理会确定要执行的操作。例如，代理可能会确定应发送特定的 API 请求。

反思

#generativeAI

#agent

一种用于提高智能体工作流质量的策略，即在将某一步骤的输出传递给下一步骤之前，先检查（反思）该输出。

检查者通常是生成回答的同一 LLM（不过也可能是其他 LLM）。生成回答的 LLM 如何才能公平地评判自己的回答？“诀窍”是让 LLM 处于批判性（反思性）思维模式。这个过程类似于作家先以创意的心态撰写初稿，然后切换到批判性思维模式进行编辑。

例如，假设有一个智能体工作流，其第一步是为咖啡杯创建文字。此步骤的提示可能如下所示：

您是创作者。生成幽默风趣且不超过 50 个字符的原创文字，适合印在咖啡杯上。

现在，假设有以下反思性提示：

您是咖啡饮用者。您会觉得上述回答幽默吗？

然后，工作流可能只会将获得高反思得分的文本传递到下一阶段。

路由器代理

#agent

一种对用户查询进行分类，然后调用最合适的代理来处理该查询的代理。

S

自我修正

#agent

智能体检测自身输出中错误的能力，以及尝试不同方法的能力。

州

#agent

在强化学习中，用于描述环境当前配置的参数值，智能体使用这些参数值来选择行动。

状态机代理

#agent

工作流受严格规则约束的代理。状态机代理通常比自主代理犯的错误更少，但无法灵活应对超出其限制的情况。

分代理

#agent

一种由管理代理调用的专业化、专注型模型，用于处理较大问题中的特定子集。子代理的动作空间通常比代理窄。

T

终止条件

#agent

在代理型 AI 中，预定义的标准用于告知代理停止迭代。例如，以下是一些可能的终止条件：

代理已成功完成目标。
智能体无法再使用任何资源。
human-in-the-loop系统检测到问题。

在强化学习中，用于确定episode何时结束的条件，例如智能体何时达到特定状态或超过状态转换的阈值数量。例如，在井字棋（也称为圈叉棋）中，当玩家标记三个连续的空格或所有空格都被标记时，一集就会结束。

机器学习术语表：Agentic 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

A

act

action

行动空间

代理

代理型

智能体循环

智能体工作流

智能体编排

自主智能体

E

评估器代理

F

反馈

G

Gemini 模型

生成式智能体（拟像）

M

经理代理

多智能体协作

O

观察

P

plan-and-solve

插件

程序性记忆

R

reason

反思

路由器代理

S

自我修正

州

状态机代理

分代理

T

终止条件

机器学习术语表：Agentic