除了基本的剪切/复制/粘贴操作之外,大多数应用为用户提供的与文本的互动很少。实体提取功能可以理解文本,并允许您根据上下文添加有用的快捷方式,从而改善应用内的用户体验。
借助 entity Extraction API,您可以识别静态文本中的特定实体以及在输入内容时识别特定实体。识别实体后,您可以根据实体类型轻松为用户启用不同的操作。其中包含的支持实体包括:
实体 | 示例 |
---|---|
地址 | 江苏省苏州市观前街 1 号 350 号 |
日期-时间 | 2019 年 9 月 29 日,我们明天下午 6 点见 |
电子邮件地址 | entity-extraction@google.com |
航班号(仅限 IATA 航班代码) | LX37 |
IBAN | CH52 0483 0000 0000 0000 9 |
ISBN(仅限版本 13) | 978-1101904190 |
货币/货币(仅限阿拉伯数字) | 12 美元、25 美元 |
付款 / 信用卡 | 4111 1111 1111 1111 |
电话号码 | (555) 225-3556 12345 |
跟踪编号(标准化国际格式) | 1Z204E380338943508 |
网址 | www.google.com https://zh.wikipedia.org/wiki/Platypus |
此 API 更注重精确度,而非识别。为确保准确性,可能无法检测到特定实体的某些实例。
可以跨语言和语言区域检测到大多数实体。检测地址和电话号码的能力取决于所选语言。实体提取支持以下语言:
- 阿拉伯语
- 葡萄牙语
- 英语(美国、英国)
- 荷兰语
- 法语
- 德语
- 意大利语
- 日语
- 韩语
- 波兰语
- 俄语
- 中文(简体、繁体)
- 西班牙语
- 泰语
- 土耳其语
示例
输入文本 | 检测到的实体 |
---|---|
我将在 1600 Amphitheatre Parkway, Mountain View, CA, 94043 与我联系 我们可以安排一次会议进行讨论。 | 实体 1 类型:地址 实体 1 文字:“1600 Ampitheatre Parkway, Mountain View, CA 94043” |
您可以明天发送电子邮件至 info@google.com 与测试团队联系,以确定最佳时间表。 | 实体 1 类型:日期-时间 实体 1 文本:=“2020 年 6 月 24 日” 实体 2 类型:电子邮件地址 实体 2 文本:info@google.com |
您的订单已从 Google 发货。如需跟踪包裹的进度,请使用以下跟踪编号:9612804152073070474837 | 实体类型:跟踪编号 实体文字:“9612804152073070474837” |
致电 555-555-1234 联系餐厅支付晚餐的费用。我的卡号是 4111-1111-1111-1111。 | 实体 1 类型:电话号码 实体 1 文字:“555-555-1234” 实体 2 类型:支付卡 实体 2 文字:“4111 1111 1111 1111” |