在 Android 上使用机器学习套件实现文档扫描器
使用机器学习套件文档扫描器 API 可轻松向您的应用添加文档扫描器功能。
功能 | 详细信息 |
---|---|
SDK 名称 | play-services-mlkit-document-scanner |
实现 | 模型、扫描逻辑和界面流程由 Google Play 服务动态下载。 |
对应用大小的影响 | 下载大小增加约 300 KB。 |
初始化时间 | 用户可能需要等待模型、逻辑和界面流程下载完毕,然后才能首次使用。 |
试试看
请试用示例应用,了解此 API 的使用示例。
准备工作
请务必在项目级
build.gradle
文件中的 buildscript 和 allprojects 部分添加 Google 的 Maven 代码库。将机器学习套件文档扫描器库的依赖项添加到模块的应用级 Gradle 文件(通常为 app/build.gradle):
dependencies {
// …
implementation 'com.google.android.gms:play-services-mlkit-document-scanner:16.0.0-beta1'
}
文档扫描器配置
SDK 提供文档扫描器用户体验流程(包括专用取景器屏幕和预览屏幕)。取景器和预览屏幕支持以下可自定义控件:
- 从图库导入
- 设置扫描的页面数量限制
- 扫描器模式(用于控制流程中的功能集)
您可以检索扫描的文件的 PDF 和 JPEG 文件。
实例化 GmsDocumentScannerOptions
以配置扫描器选项:
Kotlin
val options = GmsDocumentScannerOptions.Builder() .setGalleryImportAllowed(false) .setPageLimit(2) .setResultFormats(RESULT_FORMAT_JPEG, RESULT_FORMAT_PDF) .setScannerMode(SCANNER_MODE_FULL) .build()
Java
GmsDocumentScannerOptions options = new GmsDocumentScannerOptions.Builder() .setGalleryImportAllowed(false) .setPageLimit(2) .setResultFormats(RESULT_FORMAT_JPEG, RESULT_FORMAT_PDF) .setScannerMode(SCANNER_MODE_FULL) .build();
扫描文档
创建 GmsDocumentScannerOptions
后,获取 GmsDocumentScanner
的实例。然后,您可以按照 AndroidX 中引入的 Activity Result API 启动扫描器 activity。
文档扫描完成后,GmsDocumentScanningResult
对象将根据通过 setResultFormats
定义的内容,提供对扫描的页面数量、JPEG 格式图片的 URI 和 PDF 的访问权限:
Kotlin
val scanner = GmsDocumentScanning.getClient(options) val scannerLauncher = registerForActivityResult(StartIntentSenderForResult()) { result -> { if (result.resultCode == RESULT_OK) { val result = GmsDocumentScanningResult.fromActivityResultIntent(result.data) result.getPages()?.let { pages -> for (page in pages) { val imageUri = pages.get(0).getImageUri() } } result.getPdf()?.let { pdf -> val pdfUri = pdf.getUri() val pageCount = pdf.getPageCount() } } } } scanner.getStartScanIntent(activity) .addOnSuccessListener { intentSender -> scannerLauncher.launch(IntentSenderRequest.Builder(intentSender).build()) } .addOnFailureListener { ... }
Java
GmsDocumentScanner scanner = GmsDocumentScanning.getClient(options); ActivityResultLauncher<IntentSenderRequest> scannerLauncher = registerForActivityResult( new StartIntentSenderForResult(), result -> { if (result.getResultCode() == RESULT_OK) { GmsDocumentScanningResult result = GmsDocumentScanningResult.fromActivityResultIntent(result.getData()); for (Page page : result.getPages()) { Uri imageUri = pages.get(0).getImageUri(); } Pdf pdf = result.getPdf(); Uri pdfUri = pdf.getUri(); int pageCount = pdf.getPageCount(); } }); scanner.getStartScanIntent(activity) .addOnSuccessListener(intentSender -> scannerLauncher.launch(new IntentSenderRequest.Builder(intentSender).build())) .addOnFailureListener(...);
提升效果的提示
请注意,生成文档文件需要时间和处理能力,因此请仅请求您实际需要的输出格式(JPEG 或 PDF,或两者兼有)。