Objektivitas bukan merupakan sifat dasar model machine learning (ML). Praktisi ML melatih model dengan memberinya set data yang berisi contoh pelatihan, dan Keterlibatan dalam penyediaan dan kurasi data ini dapat membuat dan prediksi yang rentan terhadap bias.
Saat membuat model, penting untuk menyadari bias umum manusia yang dapat muncul di data, sehingga Anda dapat mengambil langkah proaktif untuk mengurangi efeknya.
Bias pelaporan
-
Definisi
Bias pelaporan terjadi saat frekuensi peristiwa, properti, dan/atau hasil yang ditangkap dalam set data tidak mencerminkan frekuensi yang ada di dunia nyata secara akurat. Bias ini dapat muncul karena orang cenderung berfokus pada pendokumentasian keadaan yang tidak biasa atau sangat berkesan, dengan asumsi bahwa kejadian biasa tidak perlu dicatat.
-
Contoh
Model analisis sentimen dilatih untuk memprediksi apakah ulasan bersifat positif atau negatif berdasarkan korpus pengguna pengiriman ke situs web populer. Sebagian besar ulasan di yang berbeda mencerminkan pendapat yang ekstrem (pengulas yang menyukai atau benci buku), karena orang cenderung tidak mengirimkan ulasan buku jika mereka tidak menanggapinya dengan kuat. Sebagai seorang model tersebut kurang mampu memprediksi sentimen dengan benar ulasan yang menggunakan bahasa yang lebih halus untuk mendeskripsikan sebuah buku.
Klik chevron_left untuk definisi.
Bias historis
-
Definisi
Bias historis terjadi saat data historis menunjukkan ketidaksetaraan yang ada di dunia pada saat itu.
-
Contoh
{i>Dataset<i} perumahan kota dari tahun 1960-an berisi data harga rumah yang mencerminkan praktik pinjaman diskriminatif yang berlaku selama periode tersebut satu dekade.
Klik chevron_left untuk definisinya.
Bias otomatisasi
-
Definisi
Bias otomatisasi adalah kecenderungan untuk mengutamakan hasil dibuat oleh sistem otomatis daripada yang dibuat oleh sistem sistem, terlepas dari tingkat kesalahan masing-masing.
-
Contoh
Praktisi ML yang bekerja untuk produsen sprocket ingin men-deploy model "pendobrak" baru yang mereka latih untuk mengidentifikasi kerusakan gigi, hingga supervisor pabrik menunjukkan bahwa tingkat presisi dan recall model tersebut 15% lebih rendah daripada pemeriksa manusia.
Klik chevron_left untuk definisinya.
Bias seleksi
Bias seleksi terjadi jika contoh set data dipilih dengan cara yang tidak mencerminkan distribusi di dunia nyata. Bias seleksi memiliki berbagai bentuk, termasuk bias cakupan, bias non-respons, dan bias pengambilan sampel.
Bias cakupan
-
Definisi
Bias cakupan terjadi jika data tidak dipilih dalam mode yang representatif.
-
Contoh
Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk. Konsumen yang memilih untuk membeli produk pesaing tidak disurvei, dan sebagai hasilnya, kelompok orang ini tidak yang direpresentasikan dalam data pelatihan.
Klik chevron_left untuk definisinya.
Bias Non-Respons
-
Definisi
Bias abstain (juga dikenal sebagai bias partisipasi) terjadi jika data tidak representatif karena kesenjangan partisipasi dalam proses pengumpulan data.
-
Contoh
Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk dan dengan sampel konsumen yang membeli produk pesaing Google. Konsumen yang membeli produk pesaing 80% lebih banyak cenderung menolak untuk menyelesaikan survei, dan data mereka kurang terwakili dalam sampel.
Klik chevron_left untuk definisinya.
Bias sampling
-
Definisi
Bias pengambilan sampel terjadi jika pengacakan yang tepat tidak digunakan selama pengumpulan data.
-
Contoh
Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk dan dengan sampel konsumen yang membeli produk pesaing Google. Petugas survei tidak menargetkan konsumen secara acak, tetapi memilih 200 konsumen pertama yang merespons email. Konsumen tersebut mungkin lebih antusias terhadap produk tersebut daripada pembeli pada umumnya.
Klik chevron_left untuk definisinya.
Bias atribusi golongan
Bias atribusi golongan adalah kecenderungan untuk menggeneralisasi bahwa apa yang benar tentang individu itu berlaku untuk seluruh kelompok tempat mereka berasal. Bias atribusi golongan sering kali muncul dalam dua hal formulir.
Bias dalam golongan
-
Definisi
Bias dalam golongan adalah preferensi bagi anggota kelompok Anda sendiri yang juga Anda ikuti, atau untuk karakteristik yang juga Anda bagikan.
-
Contoh
Dua praktisi ML melatih model penyaringan resume untuk pengembang perangkat lunak cenderung meyakini bahwa pelamar yang belajar di akademi ilmu komputer yang sama dengan mereka lebih memenuhi syarat untuk peran tersebut.
Klik chevron_left untuk definisi.
Bias kehomogenan luar golongan
-
Definisi
Bias kehomogenan luar golongan adalah kecenderungan untuk stereotip anggota individu suatu kelompok yang tidak Anda , atau untuk melihat karakteristiknya secara lebih seragam.
-
Contoh
Dua praktisi ML melatih model penyaringan resume untuk pengembang perangkat lunak cenderung meyakini bahwa semua pelamar yang sebelumnya tidak belajar di akademi ilmu komputer tidak memiliki keahlian yang memadai untuk posisi tersebut.
Klik chevron_left untuk definisinya.
Bias Implisit
-
Definisi
Bias implisit terjadi saat asumsi dibuat berdasarkan model pemikiran dan pengalaman pribadi seseorang yang belum tentu berlaku secara lebih umum.
-
Contoh
Praktisi ML yang melatih model pengenalan gestur menggunakan gelengan kepala sebagai fitur untuk menunjukkan bahwa seseorang menyampaikan kata "tidak". Namun, di beberapa wilayah di dunia, menggelengkan kepala berarti “ya”.
Klik chevron_left untuk definisinya.
Bias konfirmasi
-
Definisi
Bias konfirmasi terjadi saat builder model memproses data secara tidak sadar dengan cara menegaskan keyakinan yang sudah ada sebelumnya dan hipotesis.
-
Contoh
Seorang praktisi ML sedang membangun model yang memprediksi agresivitas pada berdasarkan berbagai fitur (tinggi, berat, jenis, tertentu). Praktisi ini memiliki pengalaman yang tidak menyenangkan dengan seorang pudel mainan hiperaktif ketika kecil, dan sejak itu telah mengaitkan berkembang biak dengan agresif. Saat mengkurasi data pelatihan model, praktisi secara tidak sadar membuang fitur-fitur yang memberikan bukti kepatuhan pada yang lebih kecil.
Klik chevron_left untuk definisinya.
Bias pelaku eksperimen
-
Definisi
Bias pelaku eksperimen terjadi saat pembuat model terus melatih model hingga model tersebut memberikan hasil yang selaras dengan hipotesis awal mereka.
-
Contoh
Seorang praktisi ML sedang membangun model yang memprediksi agresivitas pada berdasarkan berbagai fitur (tinggi, berat, jenis, tertentu). Praktisi tersebut memiliki pengalaman yang tidak menyenangkan dengan pudel mainan yang hiperaktif saat masih kecil, dan sejak saat itu mengaitkan ras anjing pudel dengan agresi. Ketika model yang sudah dilatih memprediksi sebagian besar pudel mainan sebagai relatif jinak, praktisi melatih ulang model beberapa kali hingga model tersebut memberikan hasil yang menunjukkan bahwa pudel yang lebih kecil sebagai lebih ganas.
Klik chevron_left untuk definisinya.