Bạn có thể dùng Bộ công cụ học máy để nhận dạng các thực thể trong hình ảnh và gắn nhãn cho các thực thể đó. API này hỗ trợ nhiều mô hình phân loại hình ảnh tuỳ chỉnh. Vui lòng tham khảo Mô hình tuỳ chỉnh bằng Bộ công cụ học máy để biết hướng dẫn về các yêu cầu về khả năng tương thích với mô hình, nơi tìm các mô hình đã huấn luyện trước và cách huấn luyện mô hình của riêng bạn.
Có 2 cách để tích hợp việc gắn nhãn hình ảnh với các mô hình tuỳ chỉnh: bằng cách gói quy trình như một phần của ứng dụng hoặc sử dụng một quy trình chưa được gói phụ thuộc vào Dịch vụ Google Play. Nếu bạn chọn quy trình chưa được gói, ứng dụng của bạn sẽ nhỏ hơn. Hãy xem bảng dưới đây để biết chi tiết.
Gộp chung | Không nhóm | |
---|---|---|
Tên thư viện | com.google.mlkit:image-labeling-custom | com.google.android.gms:play-services-mlkit-image-labeling-custom |
Triển khai | Quy trình được liên kết tĩnh với ứng dụng của bạn tại thời điểm xây dựng. | Pipeline được tải xuống một cách linh động thông qua Dịch vụ Google Play. |
Kích thước ứng dụng | Tăng kích thước khoảng 3,8 MB. | Tăng kích thước khoảng 200 KB. |
Thời gian khởi động | Quy trình sẽ có sẵn ngay. | Có thể phải đợi quy trình tải xuống trước khi sử dụng lần đầu tiên. |
Giai đoạn vòng đời của API | Phát hành rộng rãi (GA) | Beta |
Có 2 cách để tích hợp mô hình tuỳ chỉnh: hãy gói mô hình bằng cách đặt mô hình vào thư mục thành phần của ứng dụng hoặc tự động tải mô hình xuống từ Firebase. Bảng sau đây so sánh hai tuỳ chọn này.
Mô hình theo gói | Mô hình được lưu trữ |
---|---|
Mô hình này là một phần của APK của ứng dụng, giúp tăng kích thước của ứng dụng. | Mô hình này không phải là một phần của tệp APK. Dữ liệu này được lưu trữ bằng cách tải lên Công nghệ học máy của Firebase. |
Mô hình có sẵn ngay lập tức, ngay cả khi thiết bị Android không có kết nối mạng | Mô hình được tải xuống theo yêu cầu |
Không cần dự án Firebase | Cần có một dự án Firebase |
Bạn phải phát hành lại ứng dụng để cập nhật mô hình này | Đẩy bản cập nhật mô hình mà không cần phát hành lại ứng dụng |
Không có thử nghiệm A/B được tích hợp sẵn | Dễ dàng thử nghiệm A/B bằng Cấu hình từ xa Firebase |
Dùng thử
- Hãy xem ứng dụng bắt đầu nhanh bằng tầm nhìn để tham khảo ví dụ về cách sử dụng mô hình đi kèm và ứng dụng khởi động nhanh automl để tham khảo ví dụ về cách sử dụng mô hình được lưu trữ.
Trước khi bắt đầu
Trong tệp
build.gradle
cấp dự án, hãy nhớ đưa kho lưu trữ Maven của Google vào cả hai mụcbuildscript
vàallprojects
.Thêm các phần phụ thuộc cho thư viện Android của Bộ công cụ học máy vào tệp gradle cấp ứng dụng của mô-đun, thường là
app/build.gradle
. Chọn một trong các phần phụ thuộc sau dựa trên nhu cầu của bạn:Cách kết hợp quy trình với ứng dụng:
dependencies { // ... // Use this dependency to bundle the pipeline with your app implementation 'com.google.mlkit:image-labeling-custom:17.0.3' }
Đối với quy trình sử dụng trong Dịch vụ Google Play:
dependencies { // ... // Use this dependency to use the dynamically downloaded pipeline in Google Play Services implementation 'com.google.android.gms:play-services-mlkit-image-labeling-custom:16.0.0-beta5' }
Nếu chọn sử dụng quy trình trong Dịch vụ Google Play, bạn có thể định cấu hình ứng dụng để tự động tải quy trình xuống thiết bị sau khi ứng dụng được cài đặt từ Cửa hàng Play. Để làm như vậy, hãy thêm phần khai báo sau vào tệp
AndroidManifest.xml
của ứng dụng:<application ...> ... <meta-data android:name="com.google.mlkit.vision.DEPENDENCIES" android:value="custom_ica" /> <!-- To use multiple downloads: android:value="custom_ica,download2,download3" --> </application>
Bạn cũng có thể kiểm tra rõ ràng tính sẵn có của quy trình và yêu cầu tải xuống thông qua ModuleInstallClient API của Dịch vụ Google Play.
Nếu bạn không bật tính năng tải xuống quy trình tại thời điểm cài đặt hoặc yêu cầu tải xuống rõ ràng, thì quy trình này sẽ được tải xuống trong lần đầu tiên bạn chạy trình gắn nhãn. Các yêu cầu bạn thực hiện trước khi tải xuống hoàn tất sẽ không có kết quả nào.
Thêm phần phụ thuộc
linkFirebase
nếu bạn muốn tự động tải một mô hình xuống từ Firebase:Để tự động tải một mô hình xuống từ Firebase, hãy thêm phần phụ thuộc
linkFirebase
:dependencies { // ... // Image labeling feature with model downloaded from Firebase implementation 'com.google.mlkit:image-labeling-custom:17.0.3' // Or use the dynamically downloaded pipeline in Google Play Services // implementation 'com.google.android.gms:play-services-mlkit-image-labeling-custom:16.0.0-beta5' implementation 'com.google.mlkit:linkfirebase:17.0.0' }
Nếu muốn tải một mô hình xuống, vui lòng thêm Firebase vào dự án Android của bạn (nếu bạn chưa thực hiện). Bạn không bắt buộc phải thực hiện việc này khi gói mô hình.
1. Tải mô hình
Định cấu hình nguồn mô hình cục bộ
Cách gói mô hình với ứng dụng:
Sao chép tệp mô hình (thường kết thúc bằng
.tflite
hoặc.lite
) vào thư mụcassets/
của ứng dụng. (Trước tiên, bạn có thể cần tạo thư mục này bằng cách nhấp chuột phải vào thư mụcapp/
, rồi nhấp vào New > Library > Asset Directory (Mới > Thư mục > Thư mục tài sản).)Sau đó, hãy thêm nội dung sau vào tệp
build.gradle
của ứng dụng để đảm bảo Gradle không nén tệp mô hình khi xây dựng ứng dụng:android { // ... aaptOptions { noCompress "tflite" // or noCompress "lite" } }
Tệp mô hình sẽ được đưa vào gói ứng dụng và được cung cấp cho Bộ công cụ học máy dưới dạng tài sản thô.
Tạo đối tượng
LocalModel
, chỉ định đường dẫn đến tệp mô hình:Kotlin
val localModel = LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute file path to model file) // or .setUri(URI to model file) .build()
Java
LocalModel localModel = new LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute file path to model file) // or .setUri(URI to model file) .build();
Định cấu hình nguồn mô hình được lưu trữ trên Firebase
Để sử dụng mô hình được lưu trữ từ xa, hãy tạo đối tượng RemoteModel
bằng FirebaseModelSource
, chỉ định tên mà bạn đã chỉ định cho mô hình khi phát hành:
Kotlin
// Specify the name you assigned in the Firebase console. val remoteModel = CustomRemoteModel .Builder(FirebaseModelSource.Builder("your_model_name").build()) .build()
Java
// Specify the name you assigned in the Firebase console. CustomRemoteModel remoteModel = new CustomRemoteModel .Builder(new FirebaseModelSource.Builder("your_model_name").build()) .build();
Sau đó, hãy bắt đầu tác vụ tải mô hình xuống, chỉ định các điều kiện mà bạn muốn cho phép tải xuống. Nếu mô hình không có trên thiết bị hoặc nếu có phiên bản mới hơn của mô hình, tác vụ sẽ tải mô hình xuống không đồng bộ từ Firebase:
Kotlin
val downloadConditions = DownloadConditions.Builder() .requireWifi() .build() RemoteModelManager.getInstance().download(remoteModel, downloadConditions) .addOnSuccessListener { // Success. }
Java
DownloadConditions downloadConditions = new DownloadConditions.Builder() .requireWifi() .build(); RemoteModelManager.getInstance().download(remoteModel, downloadConditions) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(@NonNull Task task) { // Success. } });
Nhiều ứng dụng bắt đầu tác vụ tải xuống trong mã khởi động, nhưng bạn có thể thực hiện việc này bất cứ lúc nào trước khi cần sử dụng mô hình.
Định cấu hình công cụ gắn nhãn hình ảnh
Sau khi bạn định cấu hình các nguồn mô hình, hãy tạo đối tượng ImageLabeler
từ một trong các nguồn đó.
Bạn có thể chọn trong các phương án sau đây:
Tùy chọn | |
---|---|
confidenceThreshold
|
Điểm số tin cậy tối thiểu của các nhãn đã phát hiện. Nếu bạn không đặt chính sách này, hệ thống sẽ sử dụng mọi ngưỡng của thuật toán phân loại mà siêu dữ liệu của mô hình chỉ định. Nếu mô hình không chứa siêu dữ liệu nào hoặc siêu dữ liệu không chỉ định ngưỡng phân loại, thì ngưỡng mặc định là 0.0 sẽ được sử dụng. |
maxResultCount
|
Số lượng nhãn tối đa cần trả về. Nếu bạn không đặt chính sách này, hệ thống sẽ sử dụng giá trị mặc định là 10. |
Nếu chỉ có một mô hình theo gói cục bộ, bạn chỉ cần tạo một trình gắn nhãn từ đối tượng LocalModel
:
Kotlin
val customImageLabelerOptions = CustomImageLabelerOptions.Builder(localModel) .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build() val labeler = ImageLabeling.getClient(customImageLabelerOptions)
Java
CustomImageLabelerOptions customImageLabelerOptions = new CustomImageLabelerOptions.Builder(localModel) .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build(); ImageLabeler labeler = ImageLabeling.getClient(customImageLabelerOptions);
Nếu có một mô hình được lưu trữ từ xa, bạn sẽ phải kiểm tra để đảm bảo rằng mô hình đó đã được tải xuống trước khi chạy. Bạn có thể kiểm tra trạng thái của tác vụ tải mô hình xuống bằng phương thức isModelDownloaded()
của trình quản lý mô hình.
Mặc dù chỉ phải xác nhận điều này trước khi chạy trình gắn nhãn, nhưng nếu có cả mô hình được lưu trữ từ xa và mô hình gói cục bộ, thì bạn nên thực hiện bước kiểm tra này khi tạo thực thể của trình gắn nhãn hình ảnh: tạo trình gắn nhãn từ mô hình từ xa nếu đã tải xuống và từ mô hình cục bộ.
Kotlin
RemoteModelManager.getInstance().isModelDownloaded(remoteModel) .addOnSuccessListener { isDownloaded -> val optionsBuilder = if (isDownloaded) { CustomImageLabelerOptions.Builder(remoteModel) } else { CustomImageLabelerOptions.Builder(localModel) } val options = optionsBuilder .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build() val labeler = ImageLabeling.getClient(options) }
Java
RemoteModelManager.getInstance().isModelDownloaded(remoteModel) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(Boolean isDownloaded) { CustomImageLabelerOptions.Builder optionsBuilder; if (isDownloaded) { optionsBuilder = new CustomImageLabelerOptions.Builder(remoteModel); } else { optionsBuilder = new CustomImageLabelerOptions.Builder(localModel); } CustomImageLabelerOptions options = optionsBuilder .setConfidenceThreshold(0.5f) .setMaxResultCount(5) .build(); ImageLabeler labeler = ImageLabeling.getClient(options); } });
Nếu chỉ có một mô hình được lưu trữ từ xa, bạn nên tắt chức năng liên quan đến mô hình (ví dụ: chuyển sang màu xám hoặc ẩn một phần giao diện người dùng) cho đến khi xác nhận mô hình đã được tải xuống. Bạn có thể thực hiện việc này bằng cách đính kèm trình nghe vào phương thức download()
của trình quản lý mô hình:
Kotlin
RemoteModelManager.getInstance().download(remoteModel, conditions) .addOnSuccessListener { // Download complete. Depending on your app, you could enable the ML // feature, or switch from the local model to the remote model, etc. }
Java
RemoteModelManager.getInstance().download(remoteModel, conditions) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(Void v) { // Download complete. Depending on your app, you could enable // the ML feature, or switch from the local model to the remote // model, etc. } });
2. Chuẩn bị hình ảnh đầu vào
Sau đó, đối với mỗi hình ảnh bạn muốn gắn nhãn, hãy tạo một đối tượngInputImage
từ hình ảnh đó. Trình gắn nhãn hình ảnh sẽ chạy nhanh nhất khi bạn sử dụng Bitmap
hoặc nếu bạn sử dụng API camera2, thì bạn nên dùng YUV_420_888 media.Image
khi có thể.
Bạn có thể tạo đối tượng InputImage
từ nhiều nguồn (từng nguồn được giải thích ở bên dưới).
Sử dụng media.Image
Để tạo đối tượng InputImage
từ đối tượng media.Image
, chẳng hạn như khi bạn chụp ảnh từ máy ảnh của thiết bị, hãy truyền đối tượng media.Image
và độ xoay của hình ảnh đến InputImage.fromMediaImage()
.
Nếu sử dụng thư viện
CameraX, các lớp OnImageCapturedListener
và ImageAnalysis.Analyzer
sẽ tính giá trị xoay cho bạn.
Kotlin
private class YourImageAnalyzer : ImageAnalysis.Analyzer { override fun analyze(imageProxy: ImageProxy) { val mediaImage = imageProxy.image if (mediaImage != null) { val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees) // Pass image to an ML Kit Vision API // ... } } }
Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { @Override public void analyze(ImageProxy imageProxy) { Image mediaImage = imageProxy.getImage(); if (mediaImage != null) { InputImage image = InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees()); // Pass image to an ML Kit Vision API // ... } } }
Nếu không sử dụng thư viện máy ảnh cung cấp cho bạn độ xoay của hình ảnh, bạn có thể tính toán độ xoay dựa trên độ xoay của thiết bị và hướng của cảm biến máy ảnh trong thiết bị:
Kotlin
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 0) ORIENTATIONS.append(Surface.ROTATION_90, 90) ORIENTATIONS.append(Surface.ROTATION_180, 180) ORIENTATIONS.append(Surface.ROTATION_270, 270) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // Get the device's sensor orientation. val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360 } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360 } return rotationCompensation }
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 0); ORIENTATIONS.append(Surface.ROTATION_90, 90); ORIENTATIONS.append(Surface.ROTATION_180, 180); ORIENTATIONS.append(Surface.ROTATION_270, 270); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // Get the device's sensor orientation. CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360; } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360; } return rotationCompensation; }
Sau đó, hãy truyền đối tượng media.Image
và giá trị độ xoay đến InputImage.fromMediaImage()
:
Kotlin
val image = InputImage.fromMediaImage(mediaImage, rotation)
Java
InputImage image = InputImage.fromMediaImage(mediaImage, rotation);
Sử dụng URI tệp
Để tạo đối tượng InputImage
từ URI tệp, hãy truyền ngữ cảnh ứng dụng và URI tệp đến InputImage.fromFilePath()
. Điều này rất hữu ích khi bạn sử dụng ý định ACTION_GET_CONTENT
để nhắc người dùng chọn một hình ảnh từ ứng dụng thư viện của họ.
Kotlin
val image: InputImage try { image = InputImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
Java
InputImage image; try { image = InputImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
Sử dụng ByteBuffer
hoặc ByteArray
Để tạo đối tượng InputImage
từ ByteBuffer
hoặc ByteArray
, trước tiên, hãy tính toán độ xoay hình ảnh như mô tả trước đó cho đầu vào media.Image
.
Sau đó, hãy tạo đối tượng InputImage
bằng vùng đệm hoặc mảng, cùng với chiều cao, chiều rộng, định dạng mã hoá màu và độ xoay của hình ảnh:
Kotlin
val image = InputImage.fromByteBuffer( byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ) // Or: val image = InputImage.fromByteArray( byteArray, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 )
Java
InputImage image = InputImage.fromByteBuffer(byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ); // Or: InputImage image = InputImage.fromByteArray( byteArray, /* image width */480, /* image height */360, rotation, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 );
Sử dụng Bitmap
Để tạo đối tượng InputImage
từ đối tượng Bitmap
, hãy thực hiện khai báo sau:
Kotlin
val image = InputImage.fromBitmap(bitmap, 0)
Java
InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);
Hình ảnh này được biểu thị bằng một đối tượng Bitmap
cùng với độ xoay.
3. Chạy công cụ gắn nhãn hình ảnh
Để gắn nhãn các đối tượng trong một hình ảnh, hãy truyền đối tượng image
vào phương thức process()
của ImageLabeler
.
Kotlin
labeler.process(image) .addOnSuccessListener { labels -> // Task completed successfully // ... } .addOnFailureListener { e -> // Task failed with an exception // ... }
Java
labeler.process(image) .addOnSuccessListener(new OnSuccessListener<List<ImageLabel>>() { @Override public void onSuccess(List<ImageLabel> labels) { // Task completed successfully // ... } }) .addOnFailureListener(new OnFailureListener() { @Override public void onFailure(@NonNull Exception e) { // Task failed with an exception // ... } });
4. Xem thông tin về các thực thể được gắn nhãn
Nếu thao tác gắn nhãn hình ảnh thành công, thì danh sách các đối tượngImageLabel
sẽ được chuyển đến trình nghe thành công. Mỗi đối tượng ImageLabel
đại diện cho một nội dung được gắn nhãn trong hình ảnh. Bạn có thể lấy nội dung mô tả văn bản của từng nhãn (nếu có trong siêu dữ liệu của tệp mô hình TensorFlow Lite), điểm tin cậy và chỉ mục. Ví dụ:
Kotlin
for (label in labels) { val text = label.text val confidence = label.confidence val index = label.index }
Java
for (ImageLabel label : labels) { String text = label.getText(); float confidence = label.getConfidence(); int index = label.getIndex(); }
Mẹo cải thiện hiệu suất theo thời gian thực
Nếu bạn muốn gắn nhãn hình ảnh trong một ứng dụng theo thời gian thực, hãy làm theo các nguyên tắc sau để đạt được tốc độ khung hình tốt nhất:
- Nếu bạn sử dụng API
Camera
hoặccamera2
, hãy điều tiết lệnh gọi đến công cụ gắn nhãn hình ảnh. Nếu có khung video mới khi trình gắn nhãn hình ảnh đang chạy, hãy bỏ khung hình đó. Hãy xem lớpVisionProcessorBase
trong ứng dụng mẫu bắt đầu nhanh để tham khảo ví dụ. - Nếu bạn sử dụng API
CameraX
, hãy nhớ đặt chiến lược backpressure thành giá trị mặc địnhImageAnalysis.STRATEGY_KEEP_ONLY_LATEST
. Việc này đảm bảo mỗi lần chỉ gửi một hình ảnh để phân tích. Nếu nhiều hình ảnh được tạo ra khi trình phân tích bận, các hình ảnh đó sẽ tự động được thả xuống và không được đưa vào hàng đợi phân phối. Sau khi hình ảnh đang được phân tích được đóng bằng lệnh gọi ImageProxy.close(), hình ảnh mới nhất tiếp theo sẽ được phân phối. - Nếu bạn sử dụng đầu ra của công cụ gắn nhãn hình ảnh để phủ đồ hoạ lên hình ảnh đầu vào, trước tiên, hãy lấy kết quả từ Bộ công cụ học máy, sau đó kết xuất hình ảnh và lớp phủ chỉ qua một bước. Điều này chỉ kết xuất trên bề mặt màn hình một lần cho mỗi khung đầu vào. Hãy xem các lớp
CameraSourcePreview
vàGraphicOverlay
trong ứng dụng mẫu bắt đầu nhanh để biết ví dụ. - Nếu bạn sử dụng API Camera2, hãy chụp ảnh ở định dạng
ImageFormat.YUV_420_888
. Nếu bạn sử dụng API Máy ảnh cũ, hãy chụp ảnh ở định dạngImageFormat.NV21
.