ML Kit | Google for Developers

此页面由 Cloud Translation API 翻译。

文档扫描器

将实体文档数字化，让用户将实体文档转换为数字格式，已成为移动应用中非常常见的用户历程。 ML Kit 的文档扫描器 API 提供了一项全面的解决方案，可在各种 Android 应用和设备上提供高质量且一致的界面流程。从您的应用触发文档扫描器流程后，用户将保留对扫描过程的完全控制权。他们可以选择裁剪扫描的文档、应用滤镜、移除阴影或污渍，并轻松地将数字化文件发送回您的应用。

界面流程、机器学习模型和其他大型资源通过 Google Play 服务交付，这意味着：

对二进制文件大小的影响较小（所有机器学习模型和大型资源都在 Google Play 服务中集中下载）。
无需摄像头权限 - 文档扫描器会利用 Google Play 服务的摄像头权限，并且用户可以控制要与您的应用共享哪些文件。

整个文档扫描器流程都在设备上运行。

Android

主要功能

用于将实体文档数字化的优质且一致的用户界面。
通过文档检测自动拍摄。
准确的边缘检测，可实现理想的剪裁效果。
自动检测旋转，以正向显示文档。
编辑功能，可用于裁剪、应用滤镜、移除阴影、清除污渍，以及将数字化文件无缝发送回应用。
设备端处理，保护用户隐私。
您的应用无需摄像头权限。
对 APK 二进制文件大小的影响较小。

自定义

文档扫描器 API 提供高质量的完整界面流程，可在所有 Android 应用中保持一致。不过，您也可以自定义用户体验的某些方面：

最大页数：
设置扫描的页数上限。
图库导入：
启用或停用从照片库导入的功能。
编辑功能：
从 3 种模式中进行选择，自定义可供用户使用的编辑功能：
- SCANNER_MODE_BASE：基本编辑功能（裁剪、旋转、重新排序页面等）。
- SCANNER_MODE_BASE_WITH_FILTER：向 SCANNER_MODE_BASE 模式添加了图片滤镜（灰度、自动图片增强等）。
- SCANNER_MODE_FULL（默认）：向 SCANNER_MODE_BASE_WITH_FILTER 模式添加了支持机器学习的图片清理功能（可擦除污渍、手指印等）。在此模式下，未来的主要功能也会随 Google Play 服务更新自动添加，而其他两种模式将保持其当前的功能集，并且仅接收次要改进。

基本模式	包含过滤条件的基本模式	完整模式

示例结果

原始图片	扫描的文档，已校正透视效果、去除褶皱并应用灰度滤镜

原始图片	扫描的文档自动旋转，移除了污渍并应用了彩色滤镜

原始图片	已移除污渍并应用自动滤镜的扫描文档

原始图片	已扫描的文档，移除了阴影并应用了自动滤镜，还自动旋转了方向

原始图片	扫描的文档在手指移开后自动旋转并应用自动滤镜