Halaman ini diterjemahkan oleh Cloud Translation API.

Keadilan: Jenis bias

Objektivitas bukan merupakan sifat dasar model machine learning (ML). Praktisi ML melatih model dengan memberinya set data yang berisi contoh pelatihan, dan Keterlibatan dalam penyediaan dan kurasi data ini dapat membuat dan prediksi yang rentan terhadap bias.

Saat membuat model, penting untuk menyadari bias umum manusia yang dapat muncul di data, sehingga Anda dapat mengambil langkah proaktif untuk mengurangi efeknya.

Bias pelaporan

Definisi

Bias pelaporan terjadi saat frekuensi peristiwa, properti, dan/atau hasil yang ditangkap dalam set data tidak mencerminkan frekuensi yang ada di dunia nyata secara akurat. Bias ini dapat muncul karena orang cenderung berfokus pada pendokumentasian keadaan yang tidak biasa atau sangat berkesan, dengan asumsi bahwa kejadian biasa tidak perlu dicatat.

Klik chevron_right untuk melihat contohnya.
Contoh

Model analisis sentimen dilatih untuk memprediksi apakah ulasan bersifat positif atau negatif berdasarkan korpus pengguna pengiriman ke situs web populer. Sebagian besar ulasan di yang berbeda mencerminkan pendapat yang ekstrem (pengulas yang menyukai atau benci buku), karena orang cenderung tidak mengirimkan ulasan buku jika mereka tidak menanggapinya dengan kuat. Sebagai seorang model tersebut kurang mampu memprediksi sentimen dengan benar ulasan yang menggunakan bahasa yang lebih halus untuk mendeskripsikan sebuah buku.

Klik chevron_left untuk definisi.

Bias historis

Definisi

Bias historis terjadi saat data historis menunjukkan ketidaksetaraan yang ada di dunia pada saat itu.

Klik chevron_right untuk contohnya
Contoh

{i>Dataset<i} perumahan kota dari tahun 1960-an berisi data harga rumah yang mencerminkan praktik pinjaman diskriminatif yang berlaku selama periode tersebut satu dekade.

Klik chevron_left untuk definisinya.

Bias otomatisasi

Definisi

Bias otomatisasi adalah kecenderungan untuk mengutamakan hasil dibuat oleh sistem otomatis daripada yang dibuat oleh sistem sistem, terlepas dari tingkat kesalahan masing-masing.

Klik chevron_right untuk contohnya
Contoh

Praktisi ML yang bekerja untuk produsen sprocket ingin men-deploy model "pendobrak" baru yang mereka latih untuk mengidentifikasi kerusakan gigi, hingga supervisor pabrik menunjukkan bahwa tingkat presisi dan recall model tersebut 15% lebih rendah daripada pemeriksa manusia.

Klik chevron_left untuk definisinya.

Bias seleksi

Bias seleksi terjadi jika contoh set data dipilih dengan cara yang tidak mencerminkan distribusi di dunia nyata. Bias seleksi memiliki berbagai bentuk, termasuk bias cakupan, bias non-respons, dan bias pengambilan sampel.

Bias cakupan

Definisi

Bias cakupan terjadi jika data tidak dipilih dalam mode yang representatif.

Klik chevron_right untuk contohnya
Contoh

Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk. Konsumen yang memilih untuk membeli produk pesaing tidak disurvei, dan sebagai hasilnya, kelompok orang ini tidak yang direpresentasikan dalam data pelatihan.

Klik chevron_left untuk definisinya.

Bias Non-Respons

Definisi

Bias abstain (juga dikenal sebagai bias partisipasi) terjadi jika data tidak representatif karena kesenjangan partisipasi dalam proses pengumpulan data.

Klik chevron_right untuk contohnya
Contoh

Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk dan dengan sampel konsumen yang membeli produk pesaing Google. Konsumen yang membeli produk pesaing 80% lebih banyak cenderung menolak untuk menyelesaikan survei, dan data mereka kurang terwakili dalam sampel.

Klik chevron_left untuk definisinya.

Bias sampling

Definisi

Bias pengambilan sampel terjadi jika pengacakan yang tepat tidak digunakan selama pengumpulan data.

Klik chevron_right untuk contohnya
Contoh

Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk dan dengan sampel konsumen yang membeli produk pesaing Google. Petugas survei tidak menargetkan konsumen secara acak, tetapi memilih 200 konsumen pertama yang merespons email. Konsumen tersebut mungkin lebih antusias terhadap produk tersebut daripada pembeli pada umumnya.

Klik chevron_left untuk definisinya.

Bias atribusi golongan

Bias atribusi golongan adalah kecenderungan untuk menggeneralisasi bahwa apa yang benar tentang individu itu berlaku untuk seluruh kelompok tempat mereka berasal. Bias atribusi golongan sering kali muncul dalam dua hal formulir.

Bias dalam golongan

Definisi

Bias dalam golongan adalah preferensi bagi anggota kelompok Anda sendiri yang juga Anda ikuti, atau untuk karakteristik yang juga Anda bagikan.

Klik chevron_right untuk contohnya
Contoh

Dua praktisi ML melatih model penyaringan resume untuk pengembang perangkat lunak cenderung meyakini bahwa pelamar yang belajar di akademi ilmu komputer yang sama dengan mereka lebih memenuhi syarat untuk peran tersebut.

Klik chevron_left untuk definisi.

Bias kehomogenan luar golongan

Definisi

Bias kehomogenan luar golongan adalah kecenderungan untuk stereotip anggota individu suatu kelompok yang tidak Anda , atau untuk melihat karakteristiknya secara lebih seragam.

Klik chevron_right untuk melihat contoh
Contoh

Dua praktisi ML melatih model penyaringan resume untuk pengembang perangkat lunak cenderung meyakini bahwa semua pelamar yang sebelumnya tidak belajar di akademi ilmu komputer tidak memiliki keahlian yang memadai untuk posisi tersebut.

Klik chevron_left untuk definisinya.

Bias Implisit

Definisi

Bias implisit terjadi saat asumsi dibuat berdasarkan model pemikiran dan pengalaman pribadi seseorang yang belum tentu berlaku secara lebih umum.

Klik chevron_right untuk melihat contoh
Contoh

Praktisi ML yang melatih model pengenalan gestur menggunakan gelengan kepala sebagai fitur untuk menunjukkan bahwa seseorang menyampaikan kata "tidak". Namun, di beberapa wilayah di dunia, menggelengkan kepala berarti “ya”.

Klik chevron_left untuk definisinya.

Bias konfirmasi

Definisi

Bias konfirmasi terjadi saat builder model memproses data secara tidak sadar dengan cara menegaskan keyakinan yang sudah ada sebelumnya dan hipotesis.

Klik chevron_right untuk contohnya
Contoh

Seorang praktisi ML sedang membangun model yang memprediksi agresivitas pada berdasarkan berbagai fitur (tinggi, berat, jenis, tertentu). Praktisi ini memiliki pengalaman yang tidak menyenangkan dengan seorang pudel mainan hiperaktif ketika kecil, dan sejak itu telah mengaitkan berkembang biak dengan agresif. Saat mengkurasi data pelatihan model, praktisi secara tidak sadar membuang fitur-fitur yang memberikan bukti kepatuhan pada yang lebih kecil.

Klik chevron_left untuk definisinya.

Bias pelaku eksperimen

Definisi

Bias pelaku eksperimen terjadi saat pembuat model terus melatih model hingga model tersebut memberikan hasil yang selaras dengan hipotesis awal mereka.

Klik chevron_right untuk contohnya
Contoh

Seorang praktisi ML sedang membangun model yang memprediksi agresivitas pada berdasarkan berbagai fitur (tinggi, berat, jenis, tertentu). Praktisi tersebut memiliki pengalaman yang tidak menyenangkan dengan pudel mainan yang hiperaktif saat masih kecil, dan sejak saat itu mengaitkan ras anjing pudel dengan agresi. Ketika model yang sudah dilatih memprediksi sebagian besar pudel mainan sebagai relatif jinak, praktisi melatih ulang model beberapa kali hingga model tersebut memberikan hasil yang menunjukkan bahwa pudel yang lebih kecil sebagai lebih ganas.

Klik chevron_left untuk definisinya.

Latihan: Memeriksa pemahaman Anda

Manakah dari jenis bias berikut yang dapat berkontribusi prediksi yang condong pada model penerimaan perguruan tinggi yang dijelaskan in pendahuluan?

Bias historis

Model penerimaan dilatih berdasarkan data siswa dari masa lalu 20 tahun. Jika siswa minoritas kurang terwakili dalam data ini, model bisa mereproduksi ketidaksetaraan historis yang sama saat membuat prediksi pada data baru siswa.

Bias dalam golongan

Model penerimaan dilatih oleh mahasiswa universitas saat ini, yang mungkin memiliki preferensi tidak sadar untuk menerima siswa yang berasal dari latar belakang yang mirip dengan mereka, yang dapat memengaruhi cara mereka menyeleksi atau membuat fitur data yang digunakan untuk melatih model.

Bias konfirmasi

Model penerimaan dilatih oleh mahasiswa saat ini, yang kemungkinan memiliki keyakinan yang sudah ada tentang jenis kualifikasi apa berkorelasi dengan kesuksesan dalam program ilmu komputer. Mereka mungkin tidak sengaja menyeleksi atau membuat fitur data sehingga model tersebut mengonfirmasi keyakinan yang sudah ada ini.

Bias otomatisasi

Bias otomatisasi dapat menjelaskan mengapa komite penerimaan memilih untuk menggunakan model ML dalam membuat keputusan penerimaan; mereka mungkin memiliki percaya bahwa sistem otomatis akan memberikan hasil yang lebih baik daripada keputusan yang dibuat oleh manusia. Namun, bias otomatisasi tidak memberikan data yang menyebabkan prediksi model menjadi menyimpang.

Sebelumnya

Pengantar (5 mnt)

Berikutnya

Mengidentifikasi bias (10 mnt)

Keadilan: Jenis bias

Bias pelaporan

Definisi

Contoh

Bias historis

Definisi

Contoh

Bias otomatisasi

Definisi

Contoh

Bias seleksi

Bias cakupan

Definisi

Contoh

Bias Non-Respons

Definisi

Contoh

Bias sampling

Definisi

Contoh

Bias atribusi golongan

Bias dalam golongan

Definisi

Contoh

Bias kehomogenan luar golongan

Definisi

Contoh

Bias Implisit

Definisi

Contoh

Bias konfirmasi

Definisi

Contoh

Bias pelaku eksperimen

Definisi

Contoh

Latihan: Memeriksa pemahaman Anda