ตรวจจับท่าทางด้วย ML Kit บน Android

ML Kit มี SDK 2 รายการที่ได้รับการเพิ่มประสิทธิภาพสำหรับการตรวจหาท่าทาง

ชื่อ SDK	การตรวจจับท่าทาง	pose-detection-accurate
การใช้งาน	โค้ดและชิ้นงานจะลิงก์กับแอปแบบคงที่ในเวลาที่สร้าง	ระบบจะลิงก์โค้ดและชิ้นงานกับแอปแบบคงที่ในเวลาที่สร้าง
ผลกระทบต่อขนาดแอป (รวมถึงโค้ดและชิ้นงาน)	~10.1MB	~13.3MB
ประสิทธิภาพ	Pixel 3XL: ~30FPS	Pixel 3XL: ~23 FPS ด้วย CPU, ~30 FPS ด้วย GPU

ลองเลย

ลองใช้แอปตัวอย่างเพื่อดูตัวอย่างการใช้งาน API นี้

ก่อนเริ่มต้น

API นี้ต้องใช้ Android API ระดับ 23 ขึ้นไป ตรวจสอบว่าไฟล์บิลด์ของแอป ใช้ค่า minSdkVersion ตั้งแต่ 23 ขึ้นไป

ในไฟล์ build.gradle ระดับโปรเจ็กต์ ให้ตรวจสอบว่าได้รวมที่เก็บ Maven ของ Google ไว้ในทั้งส่วน buildscript และ allprojects
เพิ่มทรัพยากร Dependency สำหรับไลบรารี ML Kit สำหรับ Android ลงในไฟล์ Gradle ระดับแอปของโมดูล ซึ่งโดยปกติคือ app/build.gradle
```
dependencies {
  // If you want to use the base sdk
  implementation 'com.google.mlkit:pose-detection:18.0.0-beta5'
  // If you want to use the accurate sdk
  implementation 'com.google.mlkit:pose-detection-accurate:18.0.0-beta5'
}
```

1. สร้างอินสแตนซ์ของ `PoseDetector`

`PoseDetector` ตัวเลือก

หากต้องการตรวจจับท่าทางในรูปภาพ ให้สร้างอินสแตนซ์ของ PoseDetector ก่อน แล้วระบุการตั้งค่าเครื่องตรวจจับ (ไม่บังคับ)

โหมดการตรวจหา

PoseDetector ทำงานในโหมดการตรวจจับ 2 โหมด โปรดเลือกตัวเลือกที่ตรงกับ กรณีการใช้งานของคุณ

STREAM_MODE (ค่าเริ่มต้น): เครื่องตรวจจับท่าทางจะตรวจจับบุคคลที่โดดเด่นที่สุดในรูปภาพก่อน แล้วจึงเรียกใช้การตรวจจับท่าทาง ในเฟรมต่อๆ ไป ระบบจะไม่ดำเนินการขั้นตอนการตรวจหาบุคคล เว้นแต่บุคคลนั้นจะถูกบดบัง หรือตรวจไม่พบอีกต่อไปด้วยความเชื่อมั่นสูง เครื่องตรวจจับท่าทางจะ พยายามติดตามบุคคลที่โดดเด่นที่สุดและแสดงท่าทางของบุคคลนั้นในแต่ละ การอนุมาน ซึ่งจะช่วยลดเวลาในการตอบสนองและทำให้การตรวจจับราบรื่นขึ้น ใช้โหมดนี้เมื่อคุณ ต้องการตรวจจับท่าทางในสตรีมวิดีโอ
SINGLE_IMAGE_MODE: เครื่องตรวจจับท่าทางจะตรวจจับบุคคล แล้วจึงเรียกใช้การตรวจจับท่าทาง ขั้นตอนการตรวจหาบุคคลจะทำงานกับทุกรูปภาพ ดังนั้นเวลาในการตอบสนองจะสูงขึ้น และจะไม่มีการติดตามบุคคล ใช้โหมดนี้เมื่อใช้การตรวจจับท่าทาง ในรูปภาพแบบคงที่หรือไม่ต้องการติดตาม

การกำหนดค่าฮาร์ดแวร์

PoseDetector รองรับการกำหนดค่าฮาร์ดแวร์หลายแบบเพื่อเพิ่มประสิทธิภาพ ดังนี้

CPU: เรียกใช้เครื่องตรวจจับโดยใช้ CPU เท่านั้น
CPU_GPU: เรียกใช้เครื่องตรวจจับโดยใช้ทั้ง CPU และ GPU

เมื่อสร้างตัวเลือกเครื่องตรวจจับ คุณสามารถใช้ API setPreferredHardwareConfigs เพื่อควบคุมการเลือกฮาร์ดแวร์ได้ โดยค่าเริ่มต้น ระบบจะตั้งค่าฮาร์ดแวร์ทั้งหมดเป็นค่าที่ต้องการ

ML Kit จะพิจารณาความพร้อมใช้งาน ความเสถียร ความถูกต้อง และเวลาในการตอบสนองของแต่ละการกำหนดค่า และเลือกการกำหนดค่าที่ดีที่สุดจากการกำหนดค่าที่ต้องการ หากไม่มีการกำหนดค่าที่ต้องการ ระบบจะใช้การกำหนดค่า CPU โดยอัตโนมัติ เป็นค่าสำรอง ML Kit จะทำการตรวจสอบและการเตรียมการที่เกี่ยวข้องเหล่านี้ในลักษณะ ที่ไม่บล็อกก่อนที่จะเปิดใช้การเร่งความเร็วใดๆ ดังนั้นจึงเป็นไปได้มากที่ ครั้งแรกที่ผู้ใช้เรียกใช้เครื่องตรวจจับ ระบบจะใช้ CPU หลังจากเตรียมการทั้งหมดเสร็จสิ้น ระบบจะใช้การกำหนดค่าที่ดีที่สุดในการเรียกใช้ครั้งต่อไป

ตัวอย่างการใช้งาน setPreferredHardwareConfigs

หากต้องการให้ ML Kit เลือกการกำหนดค่าที่ดีที่สุด โปรดอย่าเรียกใช้ API นี้
หากไม่ต้องการเปิดใช้การเร่งความเร็วใดๆ ให้ส่งเฉพาะ CPU
หากต้องการใช้ GPU เพื่อลดภาระงานของ CPU แม้ว่า GPU อาจช้ากว่า ให้ส่งเฉพาะ CPU_GPU

ระบุตัวเลือกเครื่องตรวจจับท่าทางดังนี้

Kotlin

// Base pose detector with streaming frames, when depending on the pose-detection sdk
val options = PoseDetectorOptions.Builder()
    .setDetectorMode(PoseDetectorOptions.STREAM_MODE)
    .build()

// Accurate pose detector on static images, when depending on the pose-detection-accurate sdk
val options = AccuratePoseDetectorOptions.Builder()
    .setDetectorMode(AccuratePoseDetectorOptions.SINGLE_IMAGE_MODE)
    .build()

Java

// Base pose detector with streaming frames, when depending on the pose-detection sdk
PoseDetectorOptions options =
   new PoseDetectorOptions.Builder()
       .setDetectorMode(PoseDetectorOptions.STREAM_MODE)
       .build();

// Accurate pose detector on static images, when depending on the pose-detection-accurate sdk
AccuratePoseDetectorOptions options =
   new AccuratePoseDetectorOptions.Builder()
       .setDetectorMode(AccuratePoseDetectorOptions.SINGLE_IMAGE_MODE)
       .build();

สุดท้าย ให้สร้างอินสแตนซ์ของ PoseDetector ส่งตัวเลือกที่คุณระบุ

Kotlin

val poseDetector = PoseDetection.getClient(options)

Java

PoseDetector poseDetector = PoseDetection.getClient(options);

2. เตรียมรูปภาพอินพุต

หากต้องการตรวจหาท่าทางในรูปภาพ ให้สร้างออบเจ็กต์ InputImage จาก Bitmap, media.Image, ByteBuffer, อาร์เรย์ไบต์ หรือไฟล์ใน อุปกรณ์ จากนั้นส่งออบเจ็กต์ InputImage ไปยัง PoseDetector

สำหรับการตรวจหาท่าทาง คุณควรใช้รูปภาพที่มีขนาดอย่างน้อย 480x360 พิกเซล หากตรวจจับท่าทางแบบเรียลไทม์ การจับภาพเฟรมที่ความละเอียดขั้นต่ำนี้จะช่วยลดเวลาในการตอบสนองได้

คุณสร้างInputImage ออบเจ็กต์จากแหล่งที่มาต่างๆ ได้ โดยแต่ละแหล่งที่มามีคำอธิบายอยู่ด้านล่าง

การใช้ `media.Image`

หากต้องการสร้างออบเจ็กต์ InputImage จากออบเจ็กต์ media.Image เช่น เมื่อคุณจับภาพจากกล้องของอุปกรณ์ ให้ส่งออบเจ็กต์ media.Image และการหมุนของรูปภาพไปยัง InputImage.fromMediaImage()

หากใช้ไลบรารี CameraX คลาส OnImageCapturedListener และ ImageAnalysis.Analyzer จะคํานวณค่าการหมุน ให้คุณ

Kotlin

private class YourImageAnalyzer : ImageAnalysis.Analyzer {

    override fun analyze(imageProxy: ImageProxy) {
        val mediaImage = imageProxy.image
        if (mediaImage != null) {
            val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees)
            // Pass image to an ML Kit Vision API
            // ...
        }
    }
}

Java

private class YourAnalyzer implements ImageAnalysis.Analyzer {

    @Override
    public void analyze(ImageProxy imageProxy) {
        Image mediaImage = imageProxy.getImage();
        if (mediaImage != null) {
          InputImage image =
                InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
          // Pass image to an ML Kit Vision API
          // ...
        }
    }
}

หากไม่ได้ใช้คลังกล้องที่ให้องศาการหมุนของรูปภาพ คุณ สามารถคำนวณได้จากองศาการหมุนของอุปกรณ์และเซ็นเซอร์กล้อง ในอุปกรณ์

Kotlin

private val ORIENTATIONS = SparseIntArray()

init {
    ORIENTATIONS.append(Surface.ROTATION_0, 0)
    ORIENTATIONS.append(Surface.ROTATION_90, 90)
    ORIENTATIONS.append(Surface.ROTATION_180, 180)
    ORIENTATIONS.append(Surface.ROTATION_270, 270)
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
@Throws(CameraAccessException::class)
private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    val deviceRotation = activity.windowManager.defaultDisplay.rotation
    var rotationCompensation = ORIENTATIONS.get(deviceRotation)

    // Get the device's sensor orientation.
    val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager
    val sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION)!!

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360
    }
    return rotationCompensation
}MLKitVisionImage.kt

Java

private static final SparseIntArray ORIENTATIONS = new SparseIntArray();
static {
    ORIENTATIONS.append(Surface.ROTATION_0, 0);
    ORIENTATIONS.append(Surface.ROTATION_90, 90);
    ORIENTATIONS.append(Surface.ROTATION_180, 180);
    ORIENTATIONS.append(Surface.ROTATION_270, 270);
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing)
        throws CameraAccessException {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation();
    int rotationCompensation = ORIENTATIONS.get(deviceRotation);

    // Get the device's sensor orientation.
    CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE);
    int sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION);

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360;
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360;
    }
    return rotationCompensation;
}

จากนั้นส่งออบเจ็กต์ media.Image และค่าองศาการหมุนไปยัง InputImage.fromMediaImage():

Kotlin

val image = InputImage.fromMediaImage(mediaImage, rotation)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromMediaImage(mediaImage, rotation);

การใช้ URI ของไฟล์

หากต้องการสร้างออบเจ็กต์ InputImage จาก URI ของไฟล์ ให้ส่งบริบทของแอปและ URI ของไฟล์ไปยัง InputImage.fromFilePath() ซึ่งจะมีประโยชน์เมื่อคุณ ใช้ACTION_GET_CONTENT Intent เพื่อแจ้งให้ผู้ใช้เลือก รูปภาพจากแอปแกลเลอรี

Kotlin

val image: InputImage
try {
    image = InputImage.fromFilePath(context, uri)
} catch (e: IOException) {
    e.printStackTrace()
}MLKitVisionImage.kt

Java

InputImage image;
try {
    image = InputImage.fromFilePath(context, uri);
} catch (IOException e) {
    e.printStackTrace();
}

การใช้ `ByteBuffer` หรือ `ByteArray`

หากต้องการสร้างออบเจ็กต์ InputImage จาก ByteBuffer หรือ ByteArray ให้คำนวณองศาการหมุนของรูปภาพก่อน ตามที่อธิบายไว้ก่อนหน้านี้สำหรับอินพุต media.Image จากนั้นสร้างออบเจ็กต์ InputImage ด้วยบัฟเฟอร์หรืออาร์เรย์ พร้อมกับความสูง ความกว้าง รูปแบบการเข้ารหัสสี และองศาการหมุนของรูปภาพ

Kotlin

val image = InputImage.fromByteBuffer(
        byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)MLKitVisionImage.kt
// Or:
val image = InputImage.fromByteArray(
        byteArray,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)
MLKitVisionImage.kt

Java

InputImage image = InputImage.fromByteBuffer(byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java
// Or:
InputImage image = InputImage.fromByteArray(
        byteArray,
        /* image width */480,
        /* image height */360,
        rotation,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java

การใช้ `Bitmap`

หากต้องการสร้างออบเจ็กต์ InputImage จากออบเจ็กต์ Bitmap ให้ประกาศดังนี้

Kotlin

val image = InputImage.fromBitmap(bitmap, 0)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);MLKitVisionImage.java

รูปภาพแสดงด้วยออบเจ็กต์ Bitmap พร้อมกับองศาการหมุน

3. ประมวลผลรูปภาพ

ส่งออบเจ็กต์ InputImage ที่เตรียมไว้ไปยังเมธอด process ของ PoseDetector

Kotlin

Task<Pose> result = poseDetector.process(image)
       .addOnSuccessListener { results ->
           // Task completed successfully
           // ...
       }
       .addOnFailureListener { e ->
           // Task failed with an exception
           // ...
       }

Java

Task<Pose> result =
        poseDetector.process(image)
                .addOnSuccessListener(
                        new OnSuccessListener<Pose>() {
                            @Override
                            public void onSuccess(Pose pose) {
                                // Task completed successfully
                                // ...
                            }
                        })
                .addOnFailureListener(
                        new OnFailureListener() {
                            @Override
                            public void onFailure(@NonNull Exception e) {
                                // Task failed with an exception
                                // ...
                            }
                        });

หมายเหตุ: หากคุณใช้ CameraX API อย่าลืมปิด ImageProxy เมื่อใช้งานเสร็จแล้ว เช่น โดยการเพิ่ม OnCompleteListener ลงใน Task ที่ส่งคืนจาก เมธอด process ดูตัวอย่างได้ที่คลาส VisionProcessorBase ในแอปตัวอย่างฉบับเริ่มต้น

4. ดูข้อมูลเกี่ยวกับท่าทางที่ตรวจพบ

หากตรวจพบบุคคลในรูปภาพ API การตรวจหาท่าทางจะแสดงออบเจ็กต์ Pose ที่มี PoseLandmark จำนวน 33 รายการ

หากบุคคลนั้นไม่ได้อยู่ภายในรูปภาพทั้งหมด โมเดลจะกำหนด พิกัดจุดสังเกตที่ขาดหายไปนอกเฟรมและให้ค่า InFrameConfidence ต่ำ

หากไม่พบบุคคลในเฟรม Pose ออบเจ็กต์จะไม่มี PoseLandmark

Kotlin

// Get all PoseLandmarks. If no person was detected, the list will be empty
val allPoseLandmarks = pose.getAllPoseLandmarks()

// Or get specific PoseLandmarks individually. These will all be null if no person
// was detected
val leftShoulder = pose.getPoseLandmark(PoseLandmark.LEFT_SHOULDER)
val rightShoulder = pose.getPoseLandmark(PoseLandmark.RIGHT_SHOULDER)
val leftElbow = pose.getPoseLandmark(PoseLandmark.LEFT_ELBOW)
val rightElbow = pose.getPoseLandmark(PoseLandmark.RIGHT_ELBOW)
val leftWrist = pose.getPoseLandmark(PoseLandmark.LEFT_WRIST)
val rightWrist = pose.getPoseLandmark(PoseLandmark.RIGHT_WRIST)
val leftHip = pose.getPoseLandmark(PoseLandmark.LEFT_HIP)
val rightHip = pose.getPoseLandmark(PoseLandmark.RIGHT_HIP)
val leftKnee = pose.getPoseLandmark(PoseLandmark.LEFT_KNEE)
val rightKnee = pose.getPoseLandmark(PoseLandmark.RIGHT_KNEE)
val leftAnkle = pose.getPoseLandmark(PoseLandmark.LEFT_ANKLE)
val rightAnkle = pose.getPoseLandmark(PoseLandmark.RIGHT_ANKLE)
val leftPinky = pose.getPoseLandmark(PoseLandmark.LEFT_PINKY)
val rightPinky = pose.getPoseLandmark(PoseLandmark.RIGHT_PINKY)
val leftIndex = pose.getPoseLandmark(PoseLandmark.LEFT_INDEX)
val rightIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_INDEX)
val leftThumb = pose.getPoseLandmark(PoseLandmark.LEFT_THUMB)
val rightThumb = pose.getPoseLandmark(PoseLandmark.RIGHT_THUMB)
val leftHeel = pose.getPoseLandmark(PoseLandmark.LEFT_HEEL)
val rightHeel = pose.getPoseLandmark(PoseLandmark.RIGHT_HEEL)
val leftFootIndex = pose.getPoseLandmark(PoseLandmark.LEFT_FOOT_INDEX)
val rightFootIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_FOOT_INDEX)
val nose = pose.getPoseLandmark(PoseLandmark.NOSE)
val leftEyeInner = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_INNER)
val leftEye = pose.getPoseLandmark(PoseLandmark.LEFT_EYE)
val leftEyeOuter = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_OUTER)
val rightEyeInner = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_INNER)
val rightEye = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE)
val rightEyeOuter = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_OUTER)
val leftEar = pose.getPoseLandmark(PoseLandmark.LEFT_EAR)
val rightEar = pose.getPoseLandmark(PoseLandmark.RIGHT_EAR)
val leftMouth = pose.getPoseLandmark(PoseLandmark.LEFT_MOUTH)
val rightMouth = pose.getPoseLandmark(PoseLandmark.RIGHT_MOUTH)

Java

// Get all PoseLandmarks. If no person was detected, the list will be empty
List<PoseLandmark> allPoseLandmarks = pose.getAllPoseLandmarks();

// Or get specific PoseLandmarks individually. These will all be null if no person
// was detected
PoseLandmark leftShoulder = pose.getPoseLandmark(PoseLandmark.LEFT_SHOULDER);
PoseLandmark rightShoulder = pose.getPoseLandmark(PoseLandmark.RIGHT_SHOULDER);
PoseLandmark leftElbow = pose.getPoseLandmark(PoseLandmark.LEFT_ELBOW);
PoseLandmark rightElbow = pose.getPoseLandmark(PoseLandmark.RIGHT_ELBOW);
PoseLandmark leftWrist = pose.getPoseLandmark(PoseLandmark.LEFT_WRIST);
PoseLandmark rightWrist = pose.getPoseLandmark(PoseLandmark.RIGHT_WRIST);
PoseLandmark leftHip = pose.getPoseLandmark(PoseLandmark.LEFT_HIP);
PoseLandmark rightHip = pose.getPoseLandmark(PoseLandmark.RIGHT_HIP);
PoseLandmark leftKnee = pose.getPoseLandmark(PoseLandmark.LEFT_KNEE);
PoseLandmark rightKnee = pose.getPoseLandmark(PoseLandmark.RIGHT_KNEE);
PoseLandmark leftAnkle = pose.getPoseLandmark(PoseLandmark.LEFT_ANKLE);
PoseLandmark rightAnkle = pose.getPoseLandmark(PoseLandmark.RIGHT_ANKLE);
PoseLandmark leftPinky = pose.getPoseLandmark(PoseLandmark.LEFT_PINKY);
PoseLandmark rightPinky = pose.getPoseLandmark(PoseLandmark.RIGHT_PINKY);
PoseLandmark leftIndex = pose.getPoseLandmark(PoseLandmark.LEFT_INDEX);
PoseLandmark rightIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_INDEX);
PoseLandmark leftThumb = pose.getPoseLandmark(PoseLandmark.LEFT_THUMB);
PoseLandmark rightThumb = pose.getPoseLandmark(PoseLandmark.RIGHT_THUMB);
PoseLandmark leftHeel = pose.getPoseLandmark(PoseLandmark.LEFT_HEEL);
PoseLandmark rightHeel = pose.getPoseLandmark(PoseLandmark.RIGHT_HEEL);
PoseLandmark leftFootIndex = pose.getPoseLandmark(PoseLandmark.LEFT_FOOT_INDEX);
PoseLandmark rightFootIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_FOOT_INDEX);
PoseLandmark nose = pose.getPoseLandmark(PoseLandmark.NOSE);
PoseLandmark leftEyeInner = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_INNER);
PoseLandmark leftEye = pose.getPoseLandmark(PoseLandmark.LEFT_EYE);
PoseLandmark leftEyeOuter = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_OUTER);
PoseLandmark rightEyeInner = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_INNER);
PoseLandmark rightEye = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE);
PoseLandmark rightEyeOuter = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_OUTER);
PoseLandmark leftEar = pose.getPoseLandmark(PoseLandmark.LEFT_EAR);
PoseLandmark rightEar = pose.getPoseLandmark(PoseLandmark.RIGHT_EAR);
PoseLandmark leftMouth = pose.getPoseLandmark(PoseLandmark.LEFT_MOUTH);
PoseLandmark rightMouth = pose.getPoseLandmark(PoseLandmark.RIGHT_MOUTH);

เคล็ดลับในการปรับปรุงประสิทธิภาพ

คุณภาพของผลลัพธ์ขึ้นอยู่กับคุณภาพของรูปภาพอินพุต

ML Kit จะตรวจจับท่าทางได้อย่างแม่นยำเมื่อบุคคลในรูปภาพแสดงด้วยข้อมูลพิกเซลที่เพียงพอ และเพื่อให้ได้ประสิทธิภาพสูงสุด วัตถุควรมีขนาดอย่างน้อย 256x256 พิกเซล
หากตรวจพบท่าทางในแอปพลิเคชันแบบเรียลไทม์ คุณอาจต้องพิจารณา ขนาดโดยรวมของรูปภาพอินพุตด้วย ระบบจะประมวลผลรูปภาพขนาดเล็กได้เร็วขึ้น ดังนั้นหากต้องการลดเวลาในการตอบสนอง ให้ถ่ายภาพที่ความละเอียดต่ำกว่า แต่โปรดคำนึงถึงข้อกำหนดด้านความละเอียดข้างต้นและตรวจสอบว่าวัตถุในภาพมีขนาดใหญ่ที่สุดเท่าที่จะเป็นไปได้
โฟกัสของรูปภาพที่ไม่ดีอาจส่งผลต่อความถูกต้องได้เช่นกัน หากไม่ได้รับผลลัพธ์ที่ยอมรับได้ ให้ขอให้ผู้ใช้ถ่ายภาพอีกครั้ง

หากต้องการใช้การตรวจหาท่าทางในแอปพลิเคชันแบบเรียลไทม์ ให้ทำตามหลักเกณฑ์ต่อไปนี้เพื่อให้ได้อัตราเฟรมที่ดีที่สุด

ใช้ SDK การตรวจหาท่าทางพื้นฐานและ STREAM_MODE
ลองถ่ายภาพที่ความละเอียดต่ำลง อย่างไรก็ตาม โปรดคำนึงถึงข้อกำหนดด้านขนาดรูปภาพของ API นี้ด้วย
หากคุณใช้ API ของ Camera หรือ camera2 ให้จำกัดการเรียกไปยังเครื่องตรวจจับ หากมีเฟรมวิดีโอใหม่ ขณะที่เครื่องตรวจจับทำงาน ให้ทิ้งเฟรม ดูตัวอย่างได้ที่คลาส VisionProcessorBase ในแอปตัวอย่างการเริ่มต้นอย่างรวดเร็ว
หากคุณใช้ CameraX API โปรดตรวจสอบว่าได้ตั้งค่ากลยุทธ์การควบคุมปริมาณการรับส่งเป็นค่าเริ่มต้น ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST ซึ่งจะรับประกันว่าระบบจะส่งรูปภาพเพียงรูปเดียวเพื่อวิเคราะห์ในแต่ละครั้ง หากมีการสร้างรูปภาพเพิ่มเติมในขณะที่เครื่องมือวิเคราะห์ทำงานอยู่ ระบบจะทิ้งรูปภาพเหล่านั้นโดยอัตโนมัติและจะไม่จัดคิวเพื่อส่ง เมื่อปิดรูปภาพที่กำลังวิเคราะห์โดยเรียกใช้ ImageProxy.close() ระบบจะส่งรูปภาพล่าสุดถัดไป
หากใช้เอาต์พุตของเครื่องตรวจจับเพื่อซ้อนทับกราฟิกบน รูปภาพอินพุต ให้รับผลลัพธ์จาก ML Kit ก่อน จากนั้นจึงแสดงรูปภาพ และซ้อนทับในขั้นตอนเดียว ซึ่งจะแสดงผลในพื้นผิวการแสดงผล เพียงครั้งเดียวสำหรับแต่ละเฟรมอินพุต ดูคลาส CameraSourcePreview และ GraphicOverlay ในแอปตัวอย่างการเริ่มต้นอย่างรวดเร็วเพื่อดูตัวอย่าง
หากใช้ Camera2 API ให้ถ่ายภาพในรูปแบบ ImageFormat.YUV_420_888 หากใช้ Camera API เวอร์ชันเก่า ให้จับภาพในรูปแบบ ImageFormat.NV21

ขั้นตอนถัดไป

ดูวิธีใช้จุดสังเกตของท่าทางเพื่อจัดประเภทท่าทางได้ที่เคล็ดลับการจัดประเภทท่าทาง

ลองเลย

ก่อนเริ่มต้น

1. สร้างอินสแตนซ์ของ PoseDetector

PoseDetector ตัวเลือก

โหมดการตรวจหา

การกำหนดค่าฮาร์ดแวร์

Kotlin

Java

Kotlin

Java

2. เตรียมรูปภาพอินพุต

การใช้ media.Image

Kotlin

Java

Kotlin

Java

Kotlin

Java

การใช้ URI ของไฟล์

Kotlin

Java

การใช้ ByteBuffer หรือ ByteArray

Kotlin

Java

การใช้ Bitmap

Kotlin

Java

3. ประมวลผลรูปภาพ

Kotlin

Java

4. ดูข้อมูลเกี่ยวกับท่าทางที่ตรวจพบ

Kotlin

Java

เคล็ดลับในการปรับปรุงประสิทธิภาพ

ขั้นตอนถัดไป

1. สร้างอินสแตนซ์ของ `PoseDetector`

`PoseDetector` ตัวเลือก

การใช้ `media.Image`

การใช้ `ByteBuffer` หรือ `ByteArray`

การใช้ `Bitmap`