Các khái niệm về tính năng phát hiện khuôn mặt

Tính năng phát hiện khuôn mặt định vị khuôn mặt người trong các phương tiện hình ảnh như hình ảnh kỹ thuật số hoặc video. Khi phát hiện được một khuôn mặt, khuôn mặt sẽ có kích thước, hướng và vị trí tương ứng. Bạn có thể tìm kiếm các địa danh như mắt và mũi.

Dưới đây là một số thuật ngữ chúng tôi sử dụng liên quan đến tính năng phát hiện khuôn mặt của Bộ công cụ máy học:

  • Tính năng theo dõi khuôn mặt mở rộng tính năng phát hiện khuôn mặt theo trình tự video. Bạn có thể theo dõi mọi khuôn mặt xuất hiện trong video trong một khoảng thời gian bất kỳ. Điều này có nghĩa là có thể xác định một khuôn mặt được phát hiện trong các khung hình video liên tiếp là cùng một người. Xin lưu ý rằng đây không phải là một dạng nhận dạng khuôn mặt. Tính năng theo dõi khuôn mặt chỉ đưa ra dự đoán dựa trên vị trí và chuyển động của các khuôn mặt trong trình tự video.

  • Mốc là một địa điểm yêu thích. Mắt trái, mắt phải và đáy của mũi đều là các ví dụ về địa danh. Bộ công cụ máy học cho phép bạn tìm các mốc trên khuôn mặt được phát hiện.

  • Đường viền là một tập hợp các điểm tuân theo hình dạng của một đặc điểm trên khuôn mặt. Bộ công cụ máy học cho phép bạn tìm đường nét của một khuôn mặt.

  • Phân loại xác định xem có một đặc điểm khuôn mặt nào đó hay không. Ví dụ: có thể phân loại một khuôn mặt bằng cách mở hoặc đóng mắt hoặc khuôn mặt cười hay không.

Hướng khuôn mặt

Các thuật ngữ sau đây mô tả góc mà hướng mà khuôn mặt hướng tới máy ảnh:

  • Euler X: Khuôn mặt có góc Euler X dương hướng về phía trên.
  • Euler Y: Khuôn mặt có góc Y dương Y nhìn về bên phải máy ảnh hoặc nhìn sang trái nếu âm.
  • Euler Z: Khuôn mặt có góc Euler Z dương được xoay ngược chiều kim đồng hồ so với máy ảnh.

Bộ công cụ máy học' không báo cáo góc Euler X, Euler Y hoặc Euler Z của khuôn mặt được phát hiện khi LANDMARK_MODE_NONE, CONTOUR_MODE_ALL, CLASSIFICATION_MODE_NONEPERFORMANCE_MODE_FASTđược đặt cùng nhau.

Địa danh

Mốc là một địa điểm yêu thích trong một khuôn mặt. Mắt trái, mắt phải và nền mũi đều là các ví dụ về địa danh.

Bộ công cụ máy học phát hiện khuôn mặt mà không cần tìm các địa danh. Phát hiện mốc là một bước không bắt buộc và bị tắt theo mặc định.

Bảng sau đây tóm tắt tất cả các mốc có thể phát hiện được theo góc Euler Y của một khuôn mặt được liên kết:

Góc Euler Y Các địa danh có thể phát hiện
< -36 độ mắt trái, miệng trái, tai trái, mũi mũi, má trái
-36 độ đến -12 độ miệng trái, chân mũi, miệng dưới, mắt phải, mắt trái, má trái, đầu tai trái
-12 độ đến 12 độ mắt phải, mắt trái, cánh mũi, má trái, má phải, miệng trái, miệng phải, miệng dưới
12 độ đến 36 độ miệng phải, chân mũi, miệng dưới, mắt trái, mắt phải, má phải, đầu tai phải
> 36 độ mắt phải, miệng phải, tai phải, đế mũi, má phải

Mỗi địa danh được phát hiện đều có vị trí tương ứng trong hình ảnh.

Đường viền

Đường viền là một tập hợp các điểm đại diện cho hình dạng của một đặc điểm trên khuôn mặt. Hình ảnh sau đây minh hoạ cách các điểm này ánh xạ với một khuôn mặt. Nhấp vào hình ảnh để phóng to:

Mỗi đường viền tính năng mà Bộ công cụ máy học phát hiện được biểu thị bằng một số điểm cố định:

Hình bầu dục mặt 36 điểm Môi trên (trên cùng) 11 điểm
Lông mày trái (trên cùng) 5 điểm Môi trên (dưới cùng) 9 điểm
Lông mày trái (dưới cùng) 5 điểm Môi dưới (trên cùng) 9 điểm
Lông mày phải (trên cùng) 5 điểm Môi dưới (dưới cùng) 9 điểm
Lông mày phải (dưới cùng) 5 điểm Cầu mũi 2 điểm
Mắt trái 16 điểm Hình dạng mũi 3 điểm
Mắt phải 16 điểm
Bên trái má (giữa) 1 điểm
Bên phải má (giữa) 1 điểm

Khi cùng lúc có tất cả đường viền trên khuôn mặt, bạn sẽ nhận được một mảng gồm 133 điểm, ánh xạ để bao gồm các đường viền như được hiển thị bên dưới:

Chỉ số đường viền tính năng
0-35 Hình bầu dục mặt
36-40 Lông mày trái (trên cùng)
41-45 Lông mày trái (dưới cùng)
46-50 Lông mày phải (trên cùng)
51-55 Lông mày phải (dưới cùng)
56-71 Mắt trái
72-87 Mắt phải
88-96 Môi trên (dưới cùng)
97-105 Môi dưới (trên cùng)
106-116 Môi trên (trên cùng)
117-125 Môi dưới (dưới cùng)
126, 127 Cầu mũi
128-130 Mũi dưới cùng (lưu ý rằng điểm giữa nằm ở chỉ mục 128)
131 Bên trái má (giữa)
132 Bên phải má (giữa)

Phân loại

Việc phân loại sẽ xác định xem có một đặc điểm khuôn mặt nào đó hay không. Bộ công cụ máy học hiện hỗ trợ hai cách phân loại: mở mắtmỉm cười.

Phân loại là một giá trị chắc chắn. Nó cho biết độ tin cậy rằng có một đặc điểm trên khuôn mặt. Ví dụ: Giá trị từ 0, 7 trở lên cho phân loại cười cho biết rằng một người có khả năng là đang cười.

Cả hai loại phân loại này đều dựa trên tính năng phát hiện mốc.

Ngoài ra, xin lưu ý rằng cách phân loại "eyes open" và "smiling" chỉ hoạt động với các khuôn mặt phía trước, tức là các khuôn mặt có góc Euler Y nhỏ (từ -18 đến 18 độ).

Kích thước khuôn mặt tối thiểu

Kích thước khuôn mặt tối thiểu là kích thước khuôn mặt mong muốn, được biểu thị bằng tỷ lệ giữa chiều rộng của phần đầu và chiều rộng của hình ảnh. Ví dụ: Giá trị 0, 1 có nghĩa là khuôn mặt nhỏ nhất cần tìm kiếm có khoảng 10% chiều rộng của hình ảnh được tìm kiếm.

Kích thước khuôn mặt tối thiểu là hiệu suất so với sự đánh đổi chính xác: việc đặt kích thước tối thiểu nhỏ hơn cho phép trình phát hiện tìm các khuôn mặt nhỏ hơn nhưng việc phát hiện sẽ mất nhiều thời gian hơn; việc đặt kích thước lớn hơn có thể loại trừ các khuôn mặt nhỏ hơn nhưng sẽ chạy nhanh hơn.

Kích thước khuôn mặt tối thiểu không phải là giới hạn cố định; trình phát hiện có thể tìm thấy các khuôn mặt nhỏ hơn một chút so với mức độ chỉ định.

Bước tiếp theo

Sử dụng tính năng phát hiện khuôn mặt trong ứng dụng iOS hoặc Android: