Các khái niệm về tính năng phát hiện khuôn mặt

Tính năng phát hiện khuôn mặt định vị khuôn mặt người trong nội dung nghe nhìn trực quan, chẳng hạn như hình ảnh hoặc video kỹ thuật số. Khi phát hiện một khuôn mặt, khuôn mặt đó sẽ có vị trí, kích thước và hướng liên quan. Đồng thời, khuôn mặt có thể được tìm kiếm các điểm mốc như mắt và mũi.

Sau đây là một số thuật ngữ mà chúng tôi sử dụng liên quan đến tính năng phát hiện khuôn mặt của Bộ công cụ học máy:

  • Tính năng Theo dõi khuôn mặt mở rộng tính năng phát hiện khuôn mặt cho các trình tự video. Bất kỳ khuôn mặt nào xuất hiện trong video trong một khoảng thời gian bất kỳ đều có thể được theo dõi giữa các khung hình. Như vậy, hệ thống có thể xác định một khuôn mặt được phát hiện trong các khung hình video liên tiếp là cùng một người. Xin lưu ý rằng đây không phải là một hình thức nhận dạng khuôn mặt; tính năng theo dõi khuôn mặt chỉ đưa ra suy luận dựa trên vị trí và chuyển động của các khuôn mặt trong trình tự video.

  • Mốc là địa điểm yêu thích trong khuôn mặt. Mắt trái, mắt phải và đáy mũi đều là ví dụ về địa danh. Bộ công cụ học máy cung cấp khả năng tìm thấy các điểm mốc trên một khuôn mặt đã phát hiện.

  • Đường viền là tập hợp các điểm theo hình dạng của một đặc điểm trên khuôn mặt. Bộ công cụ học máy cung cấp khả năng tìm các đường viền của khuôn mặt.

  • Phân loại xác định xem có đặc điểm khuôn mặt nào đó hay không. Ví dụ: một khuôn mặt có thể được phân loại theo liệu bạn đang mở hay nhắm mắt hoặc khuôn mặt đang cười hay không.

Hướng khuôn mặt

Các thuật ngữ sau đây mô tả góc mà một khuôn mặt hướng so với máy ảnh:

  • Euler X: Mặt có góc Euler X dương đang hướng lên trên.
  • Euler Y: Khuôn mặt có góc Euler Y dương đang nhìn sang bên phải máy ảnh hoặc nhìn sang trái nếu là góc âm.
  • Euler Z: Mặt có góc Euler Z dương được xoay ngược chiều kim đồng hồ so với máy ảnh.

Bộ công cụ học máy không báo cáo góc Euler X, Euler Y hoặc Euler Z của khuôn mặt được phát hiện khi LANDMARK_MODE_NONE, CONTOUR_MODE_ALL, CLASSIFICATION_MODE_NONEPERFORMANCE_MODE_FAST được đặt cùng nhau.

Địa danh

Mốc là điểm yêu thích trong khuôn mặt. Mắt trái, mắt phải và đế mũi đều là ví dụ về địa danh.

Bộ công cụ học máy phát hiện khuôn mặt mà không cần tìm địa danh. Phát hiện địa danh là một bước không bắt buộc nhưng bị tắt theo mặc định.

Bảng sau đây tóm tắt tất cả điểm mốc có thể được phát hiện dựa vào góc Euler Y của một mặt được liên kết:

Góc Euler Y Địa danh có thể phát hiện
< -36 độ mắt trái, miệng trái, tai trái, căn mũi, má trái
-36 độ đến -12 độ miệng trái, căn mũi, miệng dưới, mắt phải, mắt trái, má trái, đầu tai trái
-12 độ đến 12 độ mắt phải, mắt trái, căn mũi, má trái, má phải, miệng trái, miệng phải, miệng dưới
12 độ đến 36 độ miệng phải, căn mũi, miệng dưới, mắt trái, mắt phải, má phải, đầu tai phải
> 36 độ mắt phải, miệng phải, tai phải, căn mũi, má phải

Mỗi điểm mốc được phát hiện đều có vị trí liên quan trong hình ảnh.

Đường viền

Đường viền là tập hợp các điểm thể hiện hình dạng của một đặc điểm trên khuôn mặt. Hình ảnh sau đây minh hoạ cách những điểm này ánh xạ với một khuôn mặt. Nhấp vào hình ảnh để phóng to:

Mỗi đường viền tính năng mà Bộ công cụ học máy phát hiện được biểu thị bằng một số điểm cố định:

Mặt hình bầu dục 36 điểm Môi trên (trên cùng) 11 điểm
Lông mày trái (trên cùng) 5 điểm Môi trên (dưới) 9 điểm
Lông mày trái (dưới cùng) 5 điểm Môi dưới (trên cùng) 9 điểm
Lông mày phải (trên cùng) 5 điểm Môi dưới (dưới cùng) 9 điểm
Lông mày phải (dưới cùng) 5 điểm Cầu mũi 2 điểm
Mắt trái 16 điểm Mũi dưới cùng 3 điểm
Mắt phải 16 điểm
Má trái (chính giữa) 1 điểm
Má phải (chính giữa) 1 điểm

Khi lấy tất cả các đường viền của một khuôn mặt cùng một lúc, bạn sẽ nhận được một mảng gồm 133 điểm. Các điểm này liên kết với các đường viền như sau:

Chỉ mục của đường viền đối tượng
0-35 Mặt hình bầu dục
36-40 Lông mày trái (trên cùng)
41-45 Lông mày trái (dưới cùng)
46-50 Lông mày phải (trên cùng)
51-55 Lông mày phải (dưới cùng)
56-71 Mắt trái
72-87 Mắt phải
88-96 Môi trên (dưới)
97-105 Môi dưới (trên cùng)
106-116 Môi trên (trên cùng)
117-125 Môi dưới (dưới cùng)
126, 127 Cầu mũi
128-130 Phần dưới cùng của mũi (lưu ý rằng điểm giữa nằm tại chỉ mục 128)
131 Má trái (chính giữa)
132 Má phải (chính giữa)

Phân loại

Việc phân loại giúp xác định xem có một đặc điểm nhất định trên khuôn mặt hay không. Bộ công cụ học máy hiện hỗ trợ hai phân loại: mở mắtcười.

Phân loại là một giá trị nhất định. Chỉ số này cho biết mức độ tự tin của một đặc điểm khuôn mặt. Ví dụ: giá trị từ 0, 7 trở lên cho phân loại tươi cười cho biết có khả năng một người đang cười.

Cả hai phân loại này đều dựa trên tính năng phát hiện mốc.

Ngoài ra, xin lưu ý rằng cách phân loại "mắt mở" và "cười" chỉ áp dụng cho mặt phía trước, tức là mặt có góc Euler Y nhỏ (từ -18 đến 18 độ).

Kích thước mặt tối thiểu

Kích thước khuôn mặt tối thiểu là kích thước khuôn mặt mong muốn, được biểu thị bằng tỷ lệ chiều rộng của đầu so với chiều rộng của hình ảnh. Ví dụ: giá trị 0, 1 có nghĩa là khuôn mặt nhỏ nhất cần tìm kiếm chiếm khoảng 10% chiều rộng của hình ảnh đang được tìm kiếm.

Kích thước khuôn mặt tối thiểu là sự đánh đổi hiệu suất so với độ chính xác: việc đặt kích thước tối thiểu nhỏ hơn sẽ cho phép trình phát hiện tìm các khuôn mặt nhỏ hơn nhưng quá trình phát hiện sẽ mất nhiều thời gian hơn; việc đặt kích thước lớn hơn có thể loại trừ các khuôn mặt nhỏ hơn nhưng sẽ chạy nhanh hơn.

Kích thước khuôn mặt tối thiểu không phải là giới hạn cố định; trình phát hiện có thể tìm thấy các khuôn mặt nhỏ hơn một chút so với mức đã chỉ định.

Các bước tiếp theo

Cách dùng tính năng phát hiện khuôn mặt trong ứng dụng iOS hoặc Android: