Keadilan: Jenis bias

Model machine learning (ML) tidak memiliki tujuan inheren. Praktisi ML melatih model dengan memberinya set data yang berisi contoh pelatihan, dan Keterlibatan dalam penyediaan dan kurasi data ini dapat membuat dan prediksi yang rentan terhadap bias.

Saat membangun model, penting untuk menyadari bias-bias manusia yang umum terjadi yang dapat muncul dalam data Anda, sehingga Anda dapat mengambil langkah proaktif untuk yang dihasilkan.

Bias pelaporan

Bias historis

Bias otomatisasi

Bias seleksi

Bias seleksi terjadi jika contoh set data dipilih dengan cara yang tidak mencerminkan distribusi di dunia nyata. Bias seleksi memiliki berbagai bentuk, termasuk bias cakupan, bias non-respons, dan bias pengambilan sampel.

Bias cakupan

Bias Non-Respons

Bias sampling

Bias atribusi golongan

Bias atribusi golongan adalah kecenderungan untuk menggeneralisasi bahwa apa yang benar tentang individu itu berlaku untuk seluruh kelompok mereka memilikinya. Bias atribusi golongan sering kali muncul dalam dua hal formulir.

Bias dalam golongan

Bias kehomogenan luar golongan

Bias Implisit

Bias konfirmasi

Bias pelaku eksperimen

Latihan: Memeriksa pemahaman Anda

Manakah dari jenis bias berikut yang dapat berkontribusi prediksi yang condong pada model penerimaan perguruan tinggi yang dijelaskan in pendahuluan?
Bias historis
Model penerimaan dilatih berdasarkan data siswa dari masa lalu 20 tahun. Jika siswa minoritas kurang terwakili dalam data ini, model bisa mereproduksi ketidaksetaraan historis yang sama saat membuat prediksi pada data baru siswa.
Bias dalam golongan
Model penerimaan dilatih oleh mahasiswa saat ini, yang bisa saja memiliki preferensi tidak sadar untuk menerima siswa yang berasal dari latar belakang yang mirip dengan mereka sendiri, yang dapat memengaruhi cara mereka menyeleksi atau merekayasa fitur data yang digunakan untuk melatih model.
Bias konfirmasi
Model penerimaan dilatih oleh mahasiswa saat ini, yang kemungkinan memiliki keyakinan yang sudah ada tentang jenis kualifikasi apa berkorelasi dengan kesuksesan dalam program ilmu komputer. Mereka dapat telah secara tidak sengaja menyeleksi atau merekayasa fitur data sehingga model menegaskan keyakinan yang ada tersebut.
Bias otomatisasi
Bias otomatisasi dapat menjelaskan mengapa komite penerimaan memilih untuk menggunakan model ML dalam membuat keputusan penerimaan; mereka mungkin memiliki percaya bahwa sistem otomatis akan memberikan hasil yang lebih baik daripada keputusan yang dibuat oleh manusia. Namun, bias otomatisasi tidak memberikan data yang menyebabkan prediksi model menjadi menyimpang.