文档扫描器

将实体文档数字化,让用户将实体文档转换为数字格式,已成为移动应用中非常常见的用户历程。 ML Kit 的文档扫描器 API 提供了一项全面的解决方案,可在各种 Android 应用和设备上提供高质量且一致的界面流程。从您的应用触发文档扫描器流程后,用户将保留对扫描过程的完全控制权。他们可以选择裁剪扫描的文档、应用滤镜、移除阴影或污渍,并轻松地将数字化文件发送回您的应用。

界面流程、机器学习模型和其他大型资源通过 Google Play 服务交付,这意味着:

  • 对二进制文件大小的影响较小(所有机器学习模型和大型资源都在 Google Play 服务中集中下载)。
  • 无需摄像头权限 - 文档扫描器会利用 Google Play 服务的摄像头权限,并且用户可以控制要与您的应用共享哪些文件。

整个文档扫描器流程都在设备上运行。

Android

主要功能

  • 用于将实体文档数字化的优质且一致的用户界面。
  • 通过文档检测自动拍摄。
  • 准确的边缘检测,可实现理想的剪裁效果。
  • 自动检测旋转,以正向显示文档。
  • 编辑功能,可用于裁剪、应用滤镜、移除阴影、清除污渍,以及将数字化文件无缝发送回应用。
  • 设备端处理,保护用户隐私。
  • 您的应用无需摄像头权限。
  • 对 APK 二进制文件大小的影响较小。

自定义

文档扫描器 API 提供高质量的完整界面流程,可在所有 Android 应用中保持一致。不过,您也可以自定义用户体验的某些方面:

  • 最大页数
    设置扫描的页数上限。

  • 图库导入
    启用或停用从照片库导入的功能。

  • 编辑功能
    从 3 种模式中进行选择,自定义可供用户使用的编辑功能:

    • SCANNER_MODE_BASE:基本编辑功能(裁剪、旋转、重新排序页面等)。
    • SCANNER_MODE_BASE_WITH_FILTER:向 SCANNER_MODE_BASE 模式添加了图片滤镜(灰度、自动图片增强等)。
    • SCANNER_MODE_FULL(默认):向 SCANNER_MODE_BASE_WITH_FILTER 模式添加了支持机器学习的图片清理功能(可擦除污渍、手指印等)。在此模式下,未来的主要功能也会随 Google Play 服务更新自动添加,而其他两种模式将保持其当前的功能集,并且仅接收次要改进。
基本模式 包含过滤条件的基本模式 完整模式

示例结果

原始图片 扫描的文档,已校正透视效果、去除褶皱并应用灰度滤镜
原始图片 扫描的文档自动旋转,移除了污渍并应用了彩色滤镜
原始图片 已移除污渍并应用自动滤镜的扫描文档
原始图片 已扫描的文档,移除了阴影并应用了自动滤镜,还自动旋转了方向
原始图片 扫描的文档在手指移开后自动旋转并应用自动滤镜