用量限额

由于 Google Chat API 是一项共享服务,因此我们设定了配额和限制,以确保所有用户都能公平使用它,并保护 Google Workspace 的整体性能。

如果超出配额,您将收到 429: Too many requests HTTP 状态代码响应。Chat 后端的其他速率限制检查也可能会生成相同的错误响应。如果发生此错误,您应使用指数退避算法,然后稍后重试。只要不超出下表中列出的每分钟配额,您每天可以发出的请求数就没有限制。

Chat API 方法适用两种配额类型:按聊天室配额和按项目配额。

每个空间的配额

每个聊天室的配额会限制给定聊天室中的查询速率,并且会在该聊天室中执行操作的所有 Chat 应用之间共享,这些应用会针对每个配额调用所列的 Chat API 方法。

下表详细说明了每个空间的查询限制:

每个聊天室的配额

Chat API 方法

限制(每 60 秒,
在聊天室中的所有 Chat 应用之间共享)

每分钟读取次数

media.download

spaces.get

spaces.members.get

spaces.members.list

spaces.messages.get

spaces.messages.list

spaces.messages.attachments.get

spaces.messages.reactions.list

900

每分钟写入次数

media.upload

spaces.delete

spaces.patch

spaces.messages.create(也适用于传入的网络钩子

spaces.messages.delete

spaces.messages.patch

spaces.messages.reactions.create

spaces.messages.reactions.delete

60

每个项目的配额

按项目配额会限制 Google Cloud 项目的查询速率,因此适用于针对每个配额调用指定 Chat API 方法的单个 Chat 应用。

下表详细说明了每个项目的查询限制。您也可以在配额页面上找到这些限制。

每个项目的配额

Chat API 方法

限制(每 60 秒)

每分钟消息写入次数

spaces.messages.create

spaces.messages.patch

spaces.messages.delete

3000

每分钟消息读取次数

spaces.messages.get

spaces.messages.list

3000

每分钟会员写入次数

spaces.members.create

spaces.members.delete

300

每分钟成员资格读取次数

spaces.members.get

spaces.members.list

3000

每分钟的空间写入次数

spaces.setup

spaces.create

spaces.patch

spaces.delete

60

每分钟的空间读取次数

spaces.get

spaces.list

spaces.findDirectMessage

3000

每分钟附件写入次数

media.upload

600

每分钟附件读取次数

spaces.messages.attachments.get

media.download

3000

每分钟回应写入次数

spaces.messages.reactions.create

spaces.messages.reactions.delete

600

每分钟回应读取次数

spaces.messages.reactions.list

3000

其他用量限额

创建类型为 GROUP_CHATSPACE 的聊天室(使用 spaces.createspaces.setup 方法)还有额外的配额限制。每分钟创建此类聊天室不得超过 35 个,每小时不得超过 800 个。DIRECT_MESSAGE 类型的聊天室不受这些额外的配额限制。

以同一聊天室为目标的大量 API 流量可能会触发配额页面中不显示的其他内部限制。

解决基于时间的配额错误

对于所有基于时间的错误(每 X 分钟最多 N 个请求),我们建议您的代码捕获异常,并使用截断指数退避算法来确保您的设备不会产生过多的负载。

指数退避算法是网络应用的标准错误处理策略。指数退避算法以指数方式重试请求(不断增加各次请求之间的等待时间,直到达到最大退避时间)。如果请求仍然不成功,那么直到请求成功之前,请求之间的延迟时间都会不断增加。

示例算法

指数退避算法以指数方式重试请求(不断增加各次重试之间的等待时间,直到达到最大退避时间)。例如:

  1. 向 Google Chat API 发出请求。
  2. 如果请求失败,请等待 1 + random_number_milliseconds 秒后再重试请求。
  3. 如果请求失败,请等待 2 + random_number_milliseconds 秒后再重试请求。
  4. 如果请求失败,请等待 4 + random_number_milliseconds 秒后再重试请求。
  5. 依此类推,等待时间上限为 maximum_backoff
  6. 继续等待并重试,直至达到重试次数上限,但不增加重试之间的等待期。

其中:

  • 等待时间为 min(((2^n)+random_number_milliseconds), maximum_backoff),其中,n 会在每次迭代(请求)后增加 1。
  • random_number_milliseconds 是一个小于或等于 1,000 的随机毫秒数。这有助于避免出现以下情况:许多客户端在某些情况下全部同步进行处理并同时执行重试操作,导致同步发送每一波请求。每次重试请求后,系统都会重新计算 random_number_milliseconds 的值。
  • maximum_backoff 通常为 32 或 64 秒。哪个值更为适当,这取决于用例。

在达到 maximum_backoff 时间后,客户端可以继续重试。此后执行的重试不需要继续增加退避时间。例如,如果客户端使用的 maximum_backoff 时间为 64 秒,则在达到此值后,客户端可以每 64 秒重试一次。到了特定时间点后,客户端应停止无限重试。

重试之间的等待时间和重试次数取决于您的使用场景和网络条件。

申请增加每个项目的配额

您可能需要根据项目的资源用量申请增加配额。服务账号的 API 调用会被视为使用单个账号。我们无法保证您的增加配额请求一定会得到批准。而增加大量配额的请求可能需要更长时间才能获得批准。

并非所有项目的配额都完全相同。随着您越来越多地使用 Google Cloud,您的配额可能需要增加。如果您预计自己的用量即将显著增加,可以在 Google Cloud 控制台的配额页面中主动申请调整配额

如需了解详情,请参阅以下资源: