Công nghệ học máy có thể thay đổi xã hội theo nhiều cách, theo cách tích cực hoặc tiêu cực. Điều quan trọng là bạn phải xem xét ý nghĩa đạo đức của các mô hình và hệ thống chứa các mô hình đó.
Giống như mọi công nghệ được phát triển tại Google, các dự án học máy của bạn phải mang lại lợi ích cho xã hội. Chúng không được gây hại hoặc dễ bị sử dụng sai mục đích. Nội dung không được duy trì, củng cố hoặc làm trầm trọng thêm các thành kiến hay định kiến. Trẻ không được thu thập hoặc sử dụng dữ liệu cá nhân một cách vô trách nhiệm.
Nguyên tắc của Google về trí tuệ nhân tạo (AI)
Các dự án học máy phải tuân thủ Nguyên tắc về trí tuệ nhân tạo của Google. Trang web Các phương pháp thông minh về AI (RAI) có trách nhiệm giúp nhân viên của Google phát triển các giải pháp học máy hợp lý về mặt đạo đức, phù hợp với các nguyên tắc về AI của Google.
Các phương pháp RAI thông minh là những nguyên tắc thiết thực mà các nhóm nên triển khai, nhằm phát triển trí tuệ nhân tạo (AI) và học máy một cách có trách nhiệm. Giải pháp học máy phải tuân thủ hướng dẫn của Google về các miền sau:
- Tính công bằng
- Quyền riêng tư
- Sự minh bạch
- An toàn
Nếu bạn có câu hỏi hoặc thắc mắc liên quan đến công nghệ học máy và đạo đức, hãy tham khảo ý kiến của PCounsel và Nhóm hoạt động về quyền riêng tư của sản phẩm.
Tính công bằng
Tránh tạo hoặc củng cố thiên vị không công bằng. Các mô hình thể hiện độ sai lệch khi dữ liệu đào tạo của các mô hình đó có một số đặc điểm sau:
Không phản ánh dân số người dùng thực tế.
Giữ nguyên các quyết định hoặc kết quả thiên lệch, ví dụ: phán quyết của công lý hình sự như thời gian giam giữ.
Sử dụng các tính năng có khả năng dự đoán cao hơn cho một số nhóm người dùng nhất định.
Các ví dụ trước chỉ là một số cách mà các mô hình trở nên thiên vị. Việc hiểu rõ dữ liệu là điều rất quan trọng để phát hiện và giải quyết mọi sai lệch có thể xảy ra trong dữ liệu đó. Bước đầu tiên để phát triển các mô hình công bằng là xác minh dữ liệu đào tạo phản ánh chính xác việc phân phối người dùng. Dưới đây là các phương pháp khác để giúp tạo ra mô hình công bằng:
Xác định các nhóm ít được thể hiện trong tập dữ liệu đánh giá hoặc các nhóm có thể có chất lượng mô hình kém hơn so với các nhóm khác. Bạn có thể cần phải lấy mẫu nhiều lần một nhóm con người dùng để tăng sự hiện diện của họ trong dữ liệu đào tạo.
Hãy sử dụng tập dữ liệu màu vàng (còn gọi là tập dữ liệu điểm chuẩn) để xác thực mô hình theo các vấn đề về tính công bằng và phát hiện độ sai lệch ngầm.
Tránh đưa các đối tượng nhạy cảm vào tập dữ liệu, chẳng hạn như giới tính hoặc sắc tộc.
Tránh dùng các tính năng có ít sức mạnh thực nghiệm hoặc dễ giải thích, nhưng đặc biệt là trong các bối cảnh nhạy cảm nơi mô hình đã qua đào tạo được dùng để thực hiện các tác vụ có tác động lớn trong các lĩnh vực như y tế, tài chính, giáo dục, việc làm, v.v. Ví dụ: trong mô hình phê duyệt các khoản vay mua nhà, đừng đưa tên vào dữ liệu huấn luyện. Tên của người đăng ký không chỉ liên quan đến nhiệm vụ dự đoán mà còn nếu để một tính năng không liên quan như vậy trong tập dữ liệu thì còn có nguy cơ tạo ra thiên kiến ngầm hoặc thiệt hại phân bổ. Ví dụ: mô hình này có thể tương quan các tên nam với xác suất trả nợ cao hơn hoặc ngược lại.
Đo lường tác động bất lợi tiềm ẩn mà các dự đoán của mô hình có thể gây ra đối với các nhóm cụ thể, và cân nhắc các kỹ thuật chỉnh sửa độ lệch có chủ ý nếu bạn nhận thấy tác động bất lợi trong một ngữ cảnh nhạy cảm.
Để biết thêm thông tin về tính công bằng của AI và công nghệ học máy, hãy xem trang Tính công bằng của các phương pháp thông minh và mô-đun về Tính công bằng của khoá học máy học nhanh.
Quyền riêng tư
Kết hợp các nguyên tắc thiết kế về quyền riêng tư ngay từ đầu. Giống như mọi tính năng hoặc sản phẩm mới tại Google, mô hình của bạn cần phải được Nhóm hoạt động về quyền riêng tư thuộc lĩnh vực sản phẩm xem xét. Do đó, hãy tạo Tài liệu thiết kế về quyền riêng tư sớm để nhận ý kiến phản hồi ban đầu.
Sau đây là các luật và chính sách liên quan đến quyền riêng tư bạn cần lưu ý và tuân thủ:
Đạo luật thị trường kỹ thuật số (DMA) của Liên minh Châu Âu để yêu cầu sự đồng ý chia sẻ hoặc sử dụng dữ liệu cá nhân.
Sau đây là các phương thức bảo vệ quyền riêng tư mà Google cần tuân thủ:
Quy định về việc xoá sạch dữ liệu.
Mã nhận dạng tệp nhị phân và cấu hình (BCID) cấp 4 để ngăn mã độc hại hoặc mã bị xâm phạm truy cập vào hệ thống của bạn.
Xoá tất cả thông tin nhận dạng cá nhân khỏi các tập dữ liệu, đồng thời xác nhận rằng mô hình và kho lưu trữ dữ liệu của bạn được thiết lập với các quyền phù hợp, ví dụ: không thể đọc được.
Video sau đây cung cấp thông tin tổng quan về các vấn đề liên quan đến quyền riêng tư:
Để biết thêm thông tin về quyền riêng tư của công nghệ AI và công nghệ học máy, hãy xem trang Quyền riêng tư của các phương pháp thông minh.
Sự minh bạch
Có trách nhiệm với mọi người. Ví dụ: giúp người khác dễ dàng hiểu mô hình của bạn hoạt động như thế nào, cách thực hiện và lý do mô hình của bạn thực hiện. Thẻ mô hình cung cấp một mẫu để ghi chép mô hình của bạn và tạo các cấu phần phần mềm trong suốt.
Để biết thêm thông tin về tính minh bạch của công nghệ trí tuệ nhân tạo và học máy, hãy xem trang Tính minh bạch của các phương pháp thông minh.
An toàn
Thiết kế các mô hình để hoạt động an toàn trong các điều kiện đối nghịch. Ví dụ: kiểm thử mô hình với các dữ liệu đầu vào có thể gây hại để xác nhận rằng mô hình của bạn đã an toàn. Ngoài ra, hãy kiểm tra các tình trạng có thể xảy ra lỗi. Các nhóm thường sử dụng các tập dữ liệu được thiết kế đặc biệt để kiểm thử mô hình bằng thông tin đầu vào hoặc điều kiện khiến mô hình này bị lỗi trước đây.
Để biết thêm thông tin về mức độ an toàn, hãy xem trang AI có trách nhiệm.
Hãy luôn xem xét bối cảnh xã hội rộng hơn mà mô hình hoạt động trong đó. Nỗ lực để đảm bảo việc xử lý dữ liệu nhạy cảm của bạn không vi phạm các vấn đề về quyền riêng tư, duy trì thiên kiến hoặc vi phạm tài sản trí tuệ của người khác.
Để biết thông tin liên quan đến đạo đức liên quan đến AI tạo sinh, hãy xem Các phương pháp thông minh về hệ thống RaI (RAI) dành cho AI tạo sinh.