Công nghệ học máy có tiềm năng biến đổi xã hội theo nhiều cách có ý nghĩa, tích cực hoặc tiêu cực. Bạn cần cân nhắc đến những tác động về mặt đạo đức của các mô hình và hệ thống mà chúng thuộc về.
Dự án học máy của bạn phải mang lại lợi ích cho xã hội. Không được gây hại hoặc dễ bị sử dụng sai mục đích. Nội dung không được duy trì, củng cố hoặc làm trầm trọng thêm thành kiến hoặc định kiến. Họ không được thu thập hoặc sử dụng dữ liệu cá nhân một cách vô trách nhiệm.Nguyên tắc của Google về trí tuệ nhân tạo
Google ủng hộ việc phát triển các ứng dụng học máy và AI tuân thủ các nguyên tắc về AI. Nguyên tắc của Google tập trung vào các khái niệm sau:
- Tính công bằng
- Quyền riêng tư
- Sự minh bạch
- An toàn
Tính công bằng
Tránh tạo ra hoặc củng cố thiên kiến bất công. Mô hình thể hiện sự thiên vị khi dữ liệu huấn luyện của mô hình có một số đặc điểm sau:
Không phản ánh số lượng người dùng thực tế.
Giữ lại các quyết định hoặc kết quả thiên vị, chẳng hạn như các quyết định tư pháp hình sự như thời gian giam giữ.
Sử dụng các tính năng có khả năng dự đoán cao hơn cho một số nhóm người dùng nhất định.
Các ví dụ trước chỉ là một số cách khiến mô hình bị thiên vị. Việc hiểu rõ dữ liệu là rất quan trọng để phát hiện và giải quyết mọi thành phần thiên vị tiềm ẩn có trong dữ liệu. Bước đầu tiên để phát triển mô hình công bằng là xác minh rằng dữ liệu huấn luyện phản ánh chính xác mức phân phối người dùng. Sau đây là các phương pháp khác để giúp tạo mô hình công bằng:
Xác định các nhóm ít được đại diện trong tập dữ liệu đánh giá hoặc các nhóm có thể có chất lượng mô hình kém hơn so với các nhóm khác. Bạn có thể cần lấy mẫu nhiều lần một nhóm nhỏ người dùng để tăng mức độ hiện diện của họ trong dữ liệu huấn luyện.
Sử dụng tập dữ liệu vàng (còn gọi là tập dữ liệu chuẩn) để xác thực mô hình đối với các vấn đề về tính công bằng và phát hiện thiên kiến ngầm ẩn.
Tránh đưa các đặc điểm nhạy cảm vào tập dữ liệu, chẳng hạn như giới tính hoặc sắc tộc.
Tránh đưa vào các tính năng có ít sức mạnh thực nghiệm hoặc giải thích, đặc biệt là trong các ngữ cảnh nhạy cảm, trong đó mô hình đã huấn luyện được dùng để thực hiện các nhiệm vụ có tác động cao trong các lĩnh vực như chăm sóc sức khoẻ, tài chính, giáo dục, việc làm, v.v. Ví dụ: trong mô hình phê duyệt khoản vay mua nhà, đừng đưa tên vào dữ liệu huấn luyện. Tên của người nộp đơn không chỉ không liên quan đến nhiệm vụ dự đoán, mà việc để lại một đặc điểm không liên quan như vậy trong tập dữ liệu cũng có khả năng tạo ra sự thiên vị ngầm hoặc gây hại cho việc phân bổ. Ví dụ: mô hình có thể liên kết tên nam giới với khả năng trả nợ cao hơn hoặc ngược lại.
Đo lường tác động bất lợi tiềm ẩn mà dự đoán của mô hình có thể gây ra đối với các nhóm cụ thể và cân nhắc các kỹ thuật sửa lỗi cố ý nếu bạn phát hiện thấy tác động bất lợi trong một bối cảnh nhạy cảm.
Quyền riêng tư
Kết hợp các nguyên tắc thiết kế liên quan đến quyền riêng tư ngay từ đầu.
Sau đây là các luật và chính sách liên quan đến quyền riêng tư mà bạn cần biết và tuân thủ:
Đạo luật thị trường kỹ thuật số (DMA) của Liên minh Châu Âu về sự đồng ý chia sẻ hoặc sử dụng dữ liệu cá nhân.
Luật Quy định chung về việc bảo vệ dữ liệu (GDPR) của Liên minh Châu Âu.
Ngoài ra, hãy nhớ xoá tất cả thông tin nhận dạng cá nhân (PII) khỏi tập dữ liệu và xác nhận rằng mô hình và kho lưu trữ dữ liệu của bạn được thiết lập với các quyền phù hợp, chẳng hạn như không thể đọc được trên toàn cầu.
Sự minh bạch
Chịu trách nhiệm trước mọi người. Ví dụ: giúp người khác dễ dàng hiểu được mô hình của bạn làm gì, cách mô hình đó hoạt động và lý do mô hình đó hoạt động như vậy. Thẻ mô hình cung cấp một mẫu để ghi lại mô hình và tạo các cấu phần minh bạch.
An toàn
Thiết kế mô hình để hoạt động an toàn trong các điều kiện đối kháng. Ví dụ: kiểm thử mô hình bằng dữ liệu đầu vào có thể gây hại để xác nhận mô hình của bạn an toàn. Ngoài ra, hãy kiểm tra các điều kiện có thể dẫn đến lỗi. Các nhóm thường sử dụng các tập dữ liệu được thiết kế đặc biệt để kiểm thử mô hình bằng các dữ liệu đầu vào hoặc điều kiện từng khiến mô hình không hoạt động trong quá khứ.
Kiểm tra mức độ hiểu biết
Luôn cân nhắc bối cảnh xã hội rộng lớn hơn mà mô hình của bạn hoạt động trong đó. Hãy nỗ lực để đảm bảo rằng cách bạn xử lý dữ liệu nhạy cảm không vi phạm các vấn đề về quyền riêng tư, tiếp tục tạo ra sự thiên vị hoặc vi phạm tài sản trí tuệ của người khác.