تصنيف الصورة الذاتية باستخدام "حزمة تعلّم الآلة" على نظام التشغيل Android

توفّر حزمة تطوير البرامج (SDK) في ML Kit إصدارًا محسّنًا من ميزة "تقسيم الصور الذاتية".

يتم ربط مواد عرض Selfie Segmenter بتطبيقك بشكل ثابت في وقت الإنشاء. سيؤدي ذلك إلى زيادة حجم تنزيل تطبيقك بحوالي 4.5 ميغابايت، ويمكن أن يتراوح وقت استجابة واجهة برمجة التطبيقات بين 25 و65 ملي ثانية حسب حجم الصورة المدخلة، وذلك وفقًا لما تم قياسه على هاتف Pixel 4.

جرِّبه الآن

يمكنك تجربة التطبيق النموذجي للاطّلاع على مثال على كيفية استخدام واجهة برمجة التطبيقات هذه.

قبل البدء

تتطلّب واجهة برمجة التطبيقات هذه المستوى 23 من واجهة برمجة التطبيقات في Android أو مستوى أعلى. تأكَّد من أنّ ملف الإصدار الخاص بتطبيقك يستخدم القيمة minSdkVersion أو قيمة أعلى.

في ملف build.gradle على مستوى مشروعك، تأكَّد من تضمين مستودع Maven من Google في كل من قسمَي buildscript وallprojects.
أضِف الاعتماديات الخاصة بمكتبات ML Kit على Android إلى ملف Gradle على مستوى التطبيق في الوحدة، والذي يكون عادةً app/build.gradle:

dependencies {
  implementation 'com.google.mlkit:segmentation-selfie:16.0.0-beta6'
}

1. إنشاء مثيل من Segmenter

خيارات أداة التقسيم

لتقسيم صورة، عليك أولاً إنشاء مثيل من Segmenter من خلال تحديد الخيارات التالية.

وضع أداة الرصد

تعمل Segmenter بوضعَين. لذلك احرص على اختيار الإعدادات التي تناسب حالة الاستخدام.

STREAM_MODE (default)

تم تصميم هذا الوضع لبث إطارات من الفيديو أو الكاميرا. في هذا الوضع، سيستفيد أداة التقسيم من نتائج اللقطات السابقة لعرض نتائج تقسيم أكثر سلاسة.

SINGLE_IMAGE_MODE

تم تصميم هذا الوضع للصور الفردية غير المرتبطة ببعضها. في هذا الوضع، ستعالج أداة التقسيم كل صورة بشكل مستقل، بدون تنعيم بين اللقطات.

تفعيل قناع الحجم الأولي

يطلب من أداة التقسيم عرض قناع الحجم الأولي الذي يتطابق مع حجم ناتج النموذج.

يكون حجم القناع الأولي (مثل 256x256) عادةً أصغر من حجم الصورة المُدخَلة. يُرجى الاتصال بالرقم SegmentationMask#getWidth() وSegmentationMask#getHeight() للحصول على حجم القناع عند تفعيل هذا الخيار.

في حال عدم تحديد هذا الخيار، سيعيد أداة تقسيم الصور تغيير حجم القناع الأولي ليتطابق مع حجم الصورة المُدخَلة. ننصحك باستخدام هذا الخيار إذا كنت تريد تطبيق منطق إعادة قياس مخصّص أو إذا لم تكن إعادة القياس ضرورية لحالة الاستخدام.

حدِّد خيارات أداة التقسيم:

Kotlin

val options =
        SelfieSegmenterOptions.Builder()
            .setDetectorMode(SelfieSegmenterOptions.STREAM_MODE)
            .enableRawSizeMask()
            .build()

جافا

SelfieSegmenterOptions options =
        new SelfieSegmenterOptions.Builder()
            .setDetectorMode(SelfieSegmenterOptions.STREAM_MODE)
            .enableRawSizeMask()
            .build();

أنشئ مثيلاً من Segmenter. مرِّر الخيارات التي حدّدتها:

Kotlin

val segmenter = Segmentation.getClient(options)

جافا

Segmenter segmenter = Segmentation.getClient(options);

2. تجهيز الصورة المصدر

لتنفيذ تقسيم على صورة، أنشئ عنصر InputImage من Bitmap أو media.Image أو ByteBuffer أو مصفوفة بايت أو ملف على الجهاز.

يمكنك إنشاء عنصر InputImage من مصادر مختلفة، ويتم توضيح كل مصدر أدناه.

استخدام `media.Image`

لإنشاء عنصر InputImage من عنصر media.Image، مثلاً عند التقاط صورة من كاميرا جهاز، مرِّر العنصر media.Image وزاوية دوران الصورة إلى InputImage.fromMediaImage().

إذا كنت تستخدم مكتبة CameraX، سيحسب لك الفئتان OnImageCapturedListener وImageAnalysis.Analyzer قيمة الدوران.

Kotlin

private class YourImageAnalyzer : ImageAnalysis.Analyzer {

    override fun analyze(imageProxy: ImageProxy) {
        val mediaImage = imageProxy.image
        if (mediaImage != null) {
            val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees)
            // Pass image to an ML Kit Vision API
            // ...
        }
    }
}

جافا

private class YourAnalyzer implements ImageAnalysis.Analyzer {

    @Override
    public void analyze(ImageProxy imageProxy) {
        Image mediaImage = imageProxy.getImage();
        if (mediaImage != null) {
          InputImage image =
                InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
          // Pass image to an ML Kit Vision API
          // ...
        }
    }
}

إذا لم تستخدم مكتبة كاميرا تمنحك درجة دوران الصورة، يمكنك احتسابها من درجة دوران الجهاز واتجاه مستشعر الكاميرا في الجهاز:

Kotlin

private val ORIENTATIONS = SparseIntArray()

init {
    ORIENTATIONS.append(Surface.ROTATION_0, 0)
    ORIENTATIONS.append(Surface.ROTATION_90, 90)
    ORIENTATIONS.append(Surface.ROTATION_180, 180)
    ORIENTATIONS.append(Surface.ROTATION_270, 270)
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
@Throws(CameraAccessException::class)
private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    val deviceRotation = activity.windowManager.defaultDisplay.rotation
    var rotationCompensation = ORIENTATIONS.get(deviceRotation)

    // Get the device's sensor orientation.
    val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager
    val sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION)!!

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360
    }
    return rotationCompensation
}MLKitVisionImage.kt

جافا

private static final SparseIntArray ORIENTATIONS = new SparseIntArray();
static {
    ORIENTATIONS.append(Surface.ROTATION_0, 0);
    ORIENTATIONS.append(Surface.ROTATION_90, 90);
    ORIENTATIONS.append(Surface.ROTATION_180, 180);
    ORIENTATIONS.append(Surface.ROTATION_270, 270);
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing)
        throws CameraAccessException {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation();
    int rotationCompensation = ORIENTATIONS.get(deviceRotation);

    // Get the device's sensor orientation.
    CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE);
    int sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION);

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360;
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360;
    }
    return rotationCompensation;
}

بعد ذلك، مرِّر العنصر media.Image وقيمة درجة التدوير إلى InputImage.fromMediaImage():

Kotlin

val image = InputImage.fromMediaImage(mediaImage, rotation)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromMediaImage(mediaImage, rotation);

استخدام عنوان URI للملف

لإنشاء عنصر InputImage من معرّف URI لملف، مرِّر سياق التطبيق ومعرّف URI للملف إلى InputImage.fromFilePath(). ويكون ذلك مفيدًا عند استخدام ACTION_GET_CONTENT intent لطلب أن يختار المستخدم صورة من تطبيق المعرض.

Kotlin

val image: InputImage
try {
    image = InputImage.fromFilePath(context, uri)
} catch (e: IOException) {
    e.printStackTrace()
}MLKitVisionImage.kt

Java

InputImage image;
try {
    image = InputImage.fromFilePath(context, uri);
} catch (IOException e) {
    e.printStackTrace();
}

استخدام `ByteBuffer` أو `ByteArray`

لإنشاء عنصر InputImage من ByteBuffer أو ByteArray، عليك أولاً حساب درجة دوران الصورة كما سبق وصفها لإدخال media.Image. بعد ذلك، أنشئ الكائن InputImage باستخدام المخزن المؤقت أو المصفوفة، بالإضافة إلى ارتفاع الصورة وعرضها وتنسيق ترميز الألوان ودرجة التدوير:

Kotlin

val image = InputImage.fromByteBuffer(
        byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)MLKitVisionImage.kt
// Or:
val image = InputImage.fromByteArray(
        byteArray,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)
MLKitVisionImage.kt

جافا

InputImage image = InputImage.fromByteBuffer(byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java
// Or:
InputImage image = InputImage.fromByteArray(
        byteArray,
        /* image width */480,
        /* image height */360,
        rotation,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java

استخدام `Bitmap`

لإنشاء عنصر InputImage من عنصر Bitmap، عليك إجراء التصريح التالي:

Kotlin

val image = InputImage.fromBitmap(bitmap, 0)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);MLKitVisionImage.java

يتم تمثيل الصورة باستخدام عنصر Bitmap مع درجات التدوير.

3- معالجة الصورة

مرِّر عنصر InputImage المُعدّ إلى طريقة process في Segmenter.

Kotlin

Task<SegmentationMask> result = segmenter.process(image)
       .addOnSuccessListener { results ->
           // Task completed successfully
           // ...
       }
       .addOnFailureListener { e ->
           // Task failed with an exception
           // ...
       }

جافا

Task<SegmentationMask> result =
        segmenter.process(image)
                .addOnSuccessListener(
                        new OnSuccessListener<SegmentationMask>() {
                            @Override
                            public void onSuccess(SegmentationMask mask) {
                                // Task completed successfully
                                // ...
                            }
                        })
                .addOnFailureListener(
                        new OnFailureListener() {
                            @Override
                            public void onFailure(@NonNull Exception e) {
                                // Task failed with an exception
                                // ...
                            }
                        });

ملاحظة: إذا كنت تستخدم واجهة برمجة التطبيقات CameraX، احرص على إغلاق ImageProxy عند الانتهاء من استخدامها، على سبيل المثال، من خلال إضافة OnCompleteListener إلى Task الذي تم عرضه من خلال الطريقة process. يمكنك الاطّلاع على فئة VisionProcessorBase في نموذج تطبيق البدء السريع للحصول على مثال.

4. الحصول على نتيجة التقسيم

يمكنك الحصول على نتيجة التقسيم على النحو التالي:

Kotlin

val mask = segmentationMask.getBuffer()
val maskWidth = segmentationMask.getWidth()
val maskHeight = segmentationMask.getHeight()

for (val y = 0; y < maskHeight; y++) {
  for (val x = 0; x < maskWidth; x++) {
    // Gets the confidence of the (x,y) pixel in the mask being in the foreground.
    val foregroundConfidence = mask.getFloat()
  }
}

جافا

ByteBuffer mask = segmentationMask.getBuffer();
int maskWidth = segmentationMask.getWidth();
int maskHeight = segmentationMask.getHeight();

for (int y = 0; y < maskHeight; y++) {
  for (int x = 0; x < maskWidth; x++) {
    // Gets the confidence of the (x,y) pixel in the mask being in the foreground.
    float foregroundConfidence = mask.getFloat();
  }
}

للاطّلاع على مثال كامل حول كيفية استخدام نتائج التقسيم، يُرجى الاطّلاع على نموذج التشغيل السريع في ML Kit.

نصائح لتحسين الأداء

تعتمد جودة النتائج على جودة الصورة المُدخَلة:

لكي يحصل ML Kit على نتيجة تقسيم دقيقة، يجب أن يكون حجم الصورة 256x256 بكسل على الأقل.
يمكن أن يؤثّر عدم وضوح الصورة أيضًا في الدقة. إذا لم تحصل على نتائج مقبولة، اطلب من المستخدم إعادة التقاط الصورة.

إذا كنت تريد استخدام تقسيم الصور في تطبيق يعمل في الوقت الفعلي، اتّبِع الإرشادات التالية لتحقيق أفضل معدّلات عرض اللقطات:

استخدم STREAM_MODE.
ننصحك بالتقاط الصور بدقة أقل. ومع ذلك، يجب أيضًا مراعاة متطلبات أبعاد الصورة في واجهة برمجة التطبيقات هذه.
ننصحك بتفعيل خيار قناع الحجم الأولي ودمج جميع منطق إعادة التحجيم معًا. على سبيل المثال، بدلاً من السماح لواجهة برمجة التطبيقات بإعادة ضبط حجم القناع ليتطابق مع حجم الصورة المُدخَلة أولاً، ثم إعادة ضبط حجمه مرة أخرى ليتطابق مع حجم "طريقة العرض"، ما عليك سوى طلب قناع الحجم الأولي، والجمع بين هاتين الخطوتين في خطوة واحدة.
إذا كنت تستخدم واجهة برمجة التطبيقات Camera أو camera2، عليك تقييد عدد طلبات البيانات إلى أداة الرصد. إذا توفّر إطار فيديو جديد أثناء تشغيل أداة رصد الوجوه، تجاهِل الإطار. يمكنك الاطّلاع على فئة VisionProcessorBase في نموذج تطبيق البدء السريع للحصول على مثال.
إذا كنت تستخدم واجهة برمجة التطبيقات CameraX، احرص على ضبط استراتيجية الضغط الخلفي على القيمة التلقائية ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST. يضمن ذلك عرض صورة واحدة فقط لتحليلها في كل مرة. إذا تم إنتاج المزيد من الصور عندما يكون المحلّل مشغولاً، سيتم إسقاطها تلقائيًا ولن يتم وضعها في قائمة انتظار التسليم. بعد إغلاق الصورة التي يتم تحليلها من خلال استدعاء ImageProxy.close()، سيتم عرض أحدث صورة تالية.
إذا كنت تستخدم ناتج أداة رصد الوجوه لتراكب الرسومات على صورة الإدخال، احصل أولاً على النتيجة من ML Kit، ثم اعرض الصورة وتراكبها في خطوة واحدة. ويتم عرض هذا المحتوى على مساحة العرض مرة واحدة فقط لكل إطار إدخال. يمكنك الاطّلاع على الفئتين CameraSourcePreview و GraphicOverlay في تطبيق العيّنة للبدء السريع للحصول على مثال.
إذا كنت تستخدم Camera2 API، التقط الصور بتنسيق ImageFormat.YUV_420_888. إذا كنت تستخدم Camera API القديم، التقط الصور بتنسيق ImageFormat.NV21.

تصنيف الصورة الذاتية باستخدام "حزمة تعلّم الآلة" على نظام التشغيل Android تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

جرِّبه الآن

قبل البدء

1. إنشاء مثيل من Segmenter

خيارات أداة التقسيم

وضع أداة الرصد

تفعيل قناع الحجم الأولي

Kotlin

جافا

Kotlin

جافا

2. تجهيز الصورة المصدر

استخدام media.Image

Kotlin

جافا

Kotlin

جافا

Kotlin

Java

استخدام عنوان URI للملف

Kotlin

Java

استخدام ByteBuffer أو ByteArray

Kotlin

جافا

استخدام Bitmap

Kotlin

Java

3- معالجة الصورة

Kotlin

جافا

4. الحصول على نتيجة التقسيم

Kotlin

جافا

نصائح لتحسين الأداء

تصنيف الصورة الذاتية باستخدام "حزمة تعلّم الآلة" على نظام التشغيل Android

استخدام `media.Image`

استخدام `ByteBuffer` أو `ByteArray`

استخدام `Bitmap`