Gắn nhãn hình ảnh bằng mô hình được huấn luyện bằng AutoML trên Android
Sau khi bạn huấn luyện mô hình của mình bằng AutoML Vision Edge, bạn có thể dùng mẫu này trong ứng dụng của mình để gắn nhãn cho hình ảnh. Có hai cách để tích hợp các mô hình được huấn luyện từ AutoML Vision Edge: Bạn có thể nhóm mô hình bằng cách đưa mô hình đó vào thư mục thành phần của ứng dụng, hoặc bạn có thể tự động tải xuống từ Firebase.Tuỳ chọn nhóm mô hình | |
---|---|
Được tích hợp trong ứng dụng của bạn |
|
Được lưu trữ bằng Firebase |
|
Dùng thử
- Dùng thử ứng dụng mẫu để xem ví dụ về cách sử dụng API này.
Trước khi bắt đầu
1. Trong tệpbuild.gradle
cấp dự án, hãy nhớ đưa vào
Kho lưu trữ Maven của Google trong cả buildscript
và
allprojects
mục.2. Thêm các phần phụ thuộc cho thư viện Android Bộ công cụ học máy vào mô-đun của bạn tệp gradle cấp ứng dụng, thường là
app/build.gradle
:
Để nhóm mô hình với ứng dụng của bạn:
dependencies { // ... // Image labeling feature with bundled automl model implementation 'com.google.mlkit:image-labeling-automl:16.2.1' }Để tự động tải một mô hình xuống từ Firebase, hãy thêm
linkFirebase
phần phụ thuộc:
dependencies { // ... // Image labeling feature with automl model downloaded // from firebase implementation 'com.google.mlkit:image-labeling-automl:16.2.1' implementation 'com.google.mlkit:linkfirebase:16.0.1' }3. Nếu bạn muốn tải một mô hình xuống, hãy đảm bảo bạn thêm Firebase vào dự án Android của bạn, nếu bạn chưa làm như vậy. Bạn không bắt buộc phải thực hiện việc này khi gói mô hình.
1. Tải mô hình
Định cấu hình nguồn mô hình cục bộ
Cách đóng gói mô hình với ứng dụng:1. Trích xuất mô hình và siêu dữ liệu của mô hình từ tệp lưu trữ zip mà bạn đã tải xuống trong bảng điều khiển của Firebase. Bạn nên dùng các tệp khi tải xuống chúng mà không cần sửa đổi (bao gồm tên tệp).
2. Đưa mô hình của bạn và các tệp siêu dữ liệu của mô hình đó vào gói ứng dụng của bạn:
a. Nếu bạn không có thư mục thành phần trong dự án, hãy tạo một thư mục bằng cách nhấp chuột phải vào thư mục
app/
, rồi nhấp vào
Mới > Thư mục > Thư mục Thành phần.b. Tạo thư mục con trong thư mục thành phần để chứa mô hình tệp.
c. Sao chép các tệp
model.tflite
, dict.txt
và
manifest.json
vào thư mục con (cả ba tệp đều phải nằm trong
cùng thư mục đó).3. Hãy thêm đoạn mã sau vào tệp
build.gradle
của ứng dụng để đảm bảo
Gradle không nén tệp mô hình khi tạo ứng dụng:
android { // ... aaptOptions { noCompress "tflite" } }Tệp mô hình sẽ được đưa vào gói ứng dụng và được cung cấp cho Bộ công cụ học máy dưới dạng nội dung thô.
Lưu ý: kể từ phiên bản 4.1 của trình bổ trợ Android cho Gradle, .tflite sẽ là được thêm vào danh sách noCompress theo mặc định và danh sách nêu trên không còn cần thiết nữa.
4 điểm. Tạo đối tượng
LocalModel
, chỉ định đường dẫn đến tệp kê khai mô hình
tệp:
Kotlin
val localModel = AutoMLImageLabelerLocalModel.Builder() .setAssetFilePath("manifest.json") // or .setAbsoluteFilePath(absolute file path to manifest file) .build()
Java
AutoMLImageLabelerLocalModel localModel = new AutoMLImageLabelerLocalModel.Builder() .setAssetFilePath("manifest.json") // or .setAbsoluteFilePath(absolute file path to manifest file) .build();
Định cấu hình nguồn mô hình được lưu trữ trên Firebase
Để sử dụng mô hình được lưu trữ từ xa, hãy tạo đối tượng RemoteModel
,
chỉ định tên mà bạn đã chỉ định cho mô hình khi xuất bản:
Kotlin
// Specify the name you assigned in the Firebase console. val remoteModel = AutoMLImageLabelerRemoteModel.Builder("your_model_name").build()
Java
// Specify the name you assigned in the Firebase console. AutoMLImageLabelerRemoteModel remoteModel = new AutoMLImageLabelerRemoteModel.Builder("your_model_name").build();
Sau đó, bắt đầu tác vụ tải mô hình xuống, chỉ định các điều kiện mà theo đó mà bạn muốn cho phép tải xuống. Nếu kiểu máy này không có trên thiết bị hoặc nếu là kiểu máy mới hơn phiên bản của mô hình sẵn có, tác vụ sẽ tải xuống không đồng bộ mô hình từ Firebase:
Kotlin
val downloadConditions = DownloadConditions.Builder() .requireWifi() .build() RemoteModelManager.getInstance().download(remoteModel, downloadConditions) .addOnSuccessListener { // Success. }
Java
DownloadConditions downloadConditions = new DownloadConditions.Builder() .requireWifi() .build(); RemoteModelManager.getInstance().download(remoteModel, downloadConditions) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(@NonNull Task task) { // Success. } });
Nhiều ứng dụng bắt đầu tác vụ tải xuống trong mã khởi chạy, nhưng bạn có thể làm như vậy bất cứ lúc nào trước khi cần sử dụng mô hình.
Tạo công cụ gắn nhãn hình ảnh từ mô hình của bạn
Sau khi bạn định cấu hình các nguồn mô hình, hãy tạo đối tượng ImageLabeler
từ một đối tượng
trong số chúng.
Nếu bạn chỉ có mô hình được gói cục bộ, chỉ cần tạo một công cụ gắn nhãn từ
Đối tượng AutoMLImageLabelerLocalModel
và định cấu hình điểm số tin cậy
ngưỡng bạn muốn yêu cầu (xem Đánh giá mô hình của bạn):
Kotlin
val autoMLImageLabelerOptions = AutoMLImageLabelerOptions.Builder(localModel) .setConfidenceThreshold(0) // Evaluate your model in the Firebase console // to determine an appropriate value. .build() val labeler = ImageLabeling.getClient(autoMLImageLabelerOptions)
Java
AutoMLImageLabelerOptions autoMLImageLabelerOptions = new AutoMLImageLabelerOptions.Builder(localModel) .setConfidenceThreshold(0.0f) // Evaluate your model in the Firebase console // to determine an appropriate value. .build(); ImageLabeler labeler = ImageLabeling.getClient(autoMLImageLabelerOptions)
Nếu có mô hình được lưu trữ từ xa, bạn sẽ phải kiểm tra xem mô hình đó đã được
tải xuống trước khi chạy nó. Bạn có thể kiểm tra trạng thái tải mô hình xuống
bằng cách sử dụng phương thức isModelDownloaded()
của trình quản lý mô hình.
Mặc dù bạn chỉ phải xác nhận điều này trước khi chạy nhãn, nếu bạn có cả mô hình được lưu trữ từ xa và mô hình được gói cục bộ, ý nghĩa để thực hiện kiểm tra này khi tạo thực thể cho công cụ gắn nhãn hình ảnh: tạo một nhãn từ mô hình từ xa nếu mô hình đã được tải xuống và từ mô hình khác.
Kotlin
RemoteModelManager.getInstance().isModelDownloaded(remoteModel) .addOnSuccessListener { isDownloaded -> val optionsBuilder = if (isDownloaded) { AutoMLImageLabelerOptions.Builder(remoteModel) } else { AutoMLImageLabelerOptions.Builder(localModel) } // Evaluate your model in the Firebase console to determine an appropriate threshold. val options = optionsBuilder.setConfidenceThreshold(0.0f).build() val labeler = ImageLabeling.getClient(options) }
Java
RemoteModelManager.getInstance().isModelDownloaded(remoteModel) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(Boolean isDownloaded) { AutoMLImageLabelerOptions.Builder optionsBuilder; if (isDownloaded) { optionsBuilder = new AutoMLImageLabelerOptions.Builder(remoteModel); } else { optionsBuilder = new AutoMLImageLabelerOptions.Builder(localModel); } AutoMLImageLabelerOptions options = optionsBuilder .setConfidenceThreshold(0.0f) // Evaluate your model in the Firebase console // to determine an appropriate threshold. .build(); ImageLabeler labeler = ImageLabeling.getClient(options); } });
Nếu chỉ có một mô hình được lưu trữ từ xa, bạn nên tắt tính năng liên quan đến mô hình đó
chức năng (ví dụ: chuyển sang màu xám hoặc ẩn một phần giao diện người dùng) cho đến khi
bạn xác nhận mô hình đã được tải xuống. Bạn có thể thực hiện việc này bằng cách đính kèm một trình nghe
đối với phương thức download()
của trình quản lý mô hình:
Kotlin
RemoteModelManager.getInstance().download(remoteModel, conditions) .addOnSuccessListener { // Download complete. Depending on your app, you could enable the ML // feature, or switch from the local model to the remote model, etc. }
Java
RemoteModelManager.getInstance().download(remoteModel, conditions) .addOnSuccessListener(new OnSuccessListener() { @Override public void onSuccess(Void v) { // Download complete. Depending on your app, you could enable // the ML feature, or switch from the local model to the remote // model, etc. } });
2. Chuẩn bị hình ảnh đầu vào
Sau đó, đối với mỗi hình ảnh bạn muốn gắn nhãn, hãy tạo một InputImage
đối tượng khỏi hình ảnh của bạn. Trình gắn nhãn hình ảnh sẽ chạy nhanh nhất khi bạn sử dụng Bitmap
hoặc nếu bạn sử dụng API camera2, YUV_420_888 media.Image
,
khi có thể.
Bạn có thể tạo một InputImage
đối tượng từ các nguồn khác nhau, mỗi nguồn được giải thích ở bên dưới.
Sử dụng media.Image
Cách tạo InputImage
từ đối tượng media.Image
, chẳng hạn như khi bạn chụp ảnh từ một
camera của thiết bị, hãy truyền đối tượng media.Image
và
xoay thành InputImage.fromMediaImage()
.
Nếu bạn sử dụng
Thư viện CameraX, OnImageCapturedListener
và
Các lớp ImageAnalysis.Analyzer
tính toán giá trị xoay
cho bạn.
Kotlin
private class YourImageAnalyzer : ImageAnalysis.Analyzer { override fun analyze(imageProxy: ImageProxy) { val mediaImage = imageProxy.image if (mediaImage != null) { val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees) // Pass image to an ML Kit Vision API // ... } } }
Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { @Override public void analyze(ImageProxy imageProxy) { Image mediaImage = imageProxy.getImage(); if (mediaImage != null) { InputImage image = InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees()); // Pass image to an ML Kit Vision API // ... } } }
Nếu không sử dụng thư viện máy ảnh cung cấp độ xoay của hình ảnh, bạn có thể tính tỷ lệ khung hình dựa trên độ xoay của thiết bị và hướng của máy ảnh cảm biến trong thiết bị:
Kotlin
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 0) ORIENTATIONS.append(Surface.ROTATION_90, 90) ORIENTATIONS.append(Surface.ROTATION_180, 180) ORIENTATIONS.append(Surface.ROTATION_270, 270) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // Get the device's sensor orientation. val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360 } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360 } return rotationCompensation }
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 0); ORIENTATIONS.append(Surface.ROTATION_90, 90); ORIENTATIONS.append(Surface.ROTATION_180, 180); ORIENTATIONS.append(Surface.ROTATION_270, 270); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // Get the device's sensor orientation. CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360; } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360; } return rotationCompensation; }
Sau đó, hãy truyền đối tượng media.Image
và
giá trị độ xoay thành InputImage.fromMediaImage()
:
Kotlin
val image = InputImage.fromMediaImage(mediaImage, rotation)
Java
InputImage image = InputImage.fromMediaImage(mediaImage, rotation);
Sử dụng URI tệp
Cách tạo InputImage
từ một URI tệp, hãy chuyển ngữ cảnh ứng dụng và URI tệp đến
InputImage.fromFilePath()
. Điều này rất hữu ích khi bạn
sử dụng ý định ACTION_GET_CONTENT
để nhắc người dùng chọn
một bức ảnh trong ứng dụng thư viện của họ.
Kotlin
val image: InputImage try { image = InputImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
Java
InputImage image; try { image = InputImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
Sử dụng ByteBuffer
hoặc ByteArray
Cách tạo InputImage
đối tượng từ ByteBuffer
hoặc ByteArray
, trước tiên hãy tính hình ảnh
độ xoay như mô tả trước đây cho đầu vào media.Image
.
Sau đó, hãy tạo đối tượng InputImage
bằng vùng đệm hoặc mảng, cùng với đối tượng
chiều cao, chiều rộng, định dạng mã hoá màu và độ xoay:
Kotlin
val image = InputImage.fromByteBuffer( byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ) // Or: val image = InputImage.fromByteArray( byteArray, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 )
Java
InputImage image = InputImage.fromByteBuffer(byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ); // Or: InputImage image = InputImage.fromByteArray( byteArray, /* image width */480, /* image height */360, rotation, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 );
Sử dụng Bitmap
Cách tạo InputImage
qua đối tượng Bitmap
, hãy khai báo sau:
Kotlin
val image = InputImage.fromBitmap(bitmap, 0)
Java
InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);
Hình ảnh được biểu thị bằng một đối tượng Bitmap
cùng với độ xoay.
3. Chạy công cụ gắn nhãn hình ảnh
Để gắn nhãn các đối tượng trong hình ảnh, hãy truyền đối tượngimage
vào thuộc tính ImageLabeler
process()
.
Kotlin
labeler.process(image) .addOnSuccessListener { labels -> // Task completed successfully // ... } .addOnFailureListener { e -> // Task failed with an exception // ... }
Java
labeler.process(image) .addOnSuccessListener(new OnSuccessListener<List<ImageLabel>>() { @Override public void onSuccess(List<ImageLabel> labels) { // Task completed successfully // ... } }) .addOnFailureListener(new OnFailureListener() { @Override public void onFailure(@NonNull Exception e) { // Task failed with an exception // ... } });
4. Nhận thông tin về đối tượng được gắn nhãn
Nếu thao tác gắn nhãn hình ảnh thành công, một danh sách ImageLabel
các đối tượng được chuyển đến trình nghe thành công. Mỗi đối tượng ImageLabel
đại diện
một thứ gì đó đã được gắn nhãn trong hình ảnh. Bạn có thể lấy nội dung văn bản của từng nhãn
nội dung mô tả, điểm số tin cậy của kết quả trùng khớp và chỉ mục của kết quả trùng khớp.
Ví dụ:
Kotlin
for (label in labels) { val text = label.text val confidence = label.confidence val index = label.index }
Java
for (ImageLabel label : labels) { String text = label.getText(); float confidence = label.getConfidence(); int index = label.getIndex(); }
Mẹo cải thiện hiệu suất theo thời gian thực
Nếu bạn muốn gắn nhãn cho hình ảnh trong một ứng dụng theo thời gian thực, hãy làm theo các bước sau để đạt được tốc độ khung hình tốt nhất:
- Nếu bạn sử dụng
Camera
hoặc APIcamera2
, điều tiết lệnh gọi cho công cụ gắn nhãn hình ảnh. Nếu một video mới khung có sẵn trong khi trình gắn nhãn hình ảnh đang chạy, hãy thả khung đó. Xem Ví dụ về lớpVisionProcessorBase
trong ứng dụng mẫu khởi động nhanh. - Nếu bạn sử dụng API
CameraX
, đảm bảo rằng chiến lược backpressure được đặt ở giá trị mặc địnhImageAnalysis.STRATEGY_KEEP_ONLY_LATEST
. Việc này giúp đảm bảo mỗi lần hệ thống chỉ gửi một hình ảnh để phân tích. Nếu các hình ảnh khác được tạo khi trình phân tích bận, chúng sẽ tự động bị loại bỏ và không được đưa vào hàng đợi của bạn. Sau khi hình ảnh đang được phân tích được đóng bằng cách gọi ImageProxy.close(), hình ảnh mới nhất tiếp theo sẽ được gửi. - Nếu bạn sử dụng kết quả của công cụ gắn nhãn hình ảnh để phủ đồ hoạ lên
hình ảnh đầu vào, trước tiên hãy lấy kết quả từ Bộ công cụ học máy, sau đó kết xuất hình ảnh
và phủ lên trên
trong một bước duy nhất. Kết xuất này hiển thị trên bề mặt màn hình
một lần cho mỗi khung đầu vào. Xem
CameraSourcePreview
và Ví dụ về các lớpGraphicOverlay
trong ứng dụng mẫu khởi động nhanh. - Nếu bạn sử dụng API Camera2, hãy chụp ảnh trong
Định dạng
ImageFormat.YUV_420_888
. Nếu bạn sử dụng API Máy ảnh cũ, hãy chụp ảnh trong Định dạngImageFormat.NV21
.