实体提取

除了基本的剪切/复制/粘贴操作之外,大多数应用为用户提供的与文本的互动很少。实体提取功能可以理解文本,并允许您根据上下文添加有用的快捷方式,从而改善应用内的用户体验。

iOS Android

借助 entity Extraction API,您可以识别静态文本中的特定实体以及在输入内容时识别特定实体。识别实体后,您可以根据实体类型轻松为用户启用不同的操作。其中包含的支持实体包括:

实体示例
地址江苏省苏州市观前街 1 号 350 号
日期-时间2019 年 9 月 29 日,我们明天下午 6 点见
电子邮件地址entity-extraction@google.com
航班号(仅限 IATA 航班代码)LX37
IBANCH52 0483 0000 0000 0000 9
ISBN(仅限版本 13)978-1101904190
货币/货币(仅限阿拉伯数字)12 美元、25 美元
付款 / 信用卡4111 1111 1111 1111
电话号码(555) 225-3556
12345
跟踪编号(标准化国际格式)1Z204E380338943508
网址www.google.com
https://zh.wikipedia.org/wiki/Platypus

此 API 更注重精确度,而非识别。为确保准确性,可能无法检测到特定实体的某些实例。

可以跨语言和语言区域检测到大多数实体。检测地址和电话号码的能力取决于所选语言。实体提取支持以下语言:

  • 阿拉伯语
  • 葡萄牙语
  • 英语(美国、英国)
  • 荷兰语
  • 法语
  • 德语
  • 意大利语
  • 日语
  • 韩语
  • 波兰语
  • 俄语
  • 中文(简体、繁体)
  • 西班牙语
  • 泰语
  • 土耳其语

示例

输入文本检测到的实体
我将在 1600 Amphitheatre Parkway, Mountain View, CA, 94043 与我联系 我们可以安排一次会议进行讨论。 实体 1 类型:地址
实体 1 文字:“1600 Ampitheatre Parkway, Mountain View, CA 94043”
您可以明天发送电子邮件至 info@google.com 与测试团队联系,以确定最佳时间表。 实体 1 类型:日期-时间
实体 1 文本:=“2020 年 6 月 24 日”

实体 2 类型:电子邮件地址
实体 2 文本:info@google.com
您的订单已从 Google 发货。如需跟踪包裹的进度,请使用以下跟踪编号:9612804152073070474837 实体类型:跟踪编号
实体文字:“9612804152073070474837”
致电 555-555-1234 联系餐厅支付晚餐的费用。我的卡号是 4111-1111-1111-1111 实体 1 类型:电话号码
实体 1 文字:“555-555-1234”

实体 2 类型:支付卡
实体 2 文字:“4111 1111 1111 1111”