Глоссарий машинного обучения: справедливость

На этой странице содержатся термины глоссария Fairness. Чтобы просмотреть все термины глоссария, нажмите здесь .

А

атрибут

#справедливость

Синоним функции .

В рамках справедливости машинного обучения атрибуты часто относятся к характеристикам, относящимся к отдельным людям.

предвзятость автоматизации

#справедливость

Когда человек, принимающий решения, предпочитает рекомендации автоматизированной системы принятия решений информации, полученной без автоматизации, даже если автоматизированная система принятия решений допускает ошибки.

Б

предвзятость (этика/справедливость)

#справедливость
#основы

1. Стереотипы, предрассудки или фаворитизм в отношении одних вещей, людей или групп по сравнению с другими. Эти предубеждения могут повлиять на сбор и интерпретацию данных, дизайн системы и то, как пользователи взаимодействуют с системой. К формам этого типа предвзятости относятся:

2. Систематическая ошибка, вызванная процедурой выборки или отчетности. К формам этого типа предвзятости относятся:

Не путать с термином «предвзятость» в моделях машинного обучения или «предвзятость прогнозирования» .

С

Подтверждение смещения

#справедливость

Тенденция искать, интерпретировать, отдавать предпочтение и вспоминать информацию таким образом, чтобы подтвердить ранее существовавшие убеждения или гипотезы. Разработчики машинного обучения могут непреднамеренно собирать или маркировать данные таким образом, что это повлияет на результат, подтверждающий их существующие убеждения. Предвзятость подтверждения — это форма неявной предвзятости .

Предвзятость экспериментатора — это форма предвзятости подтверждения, при которой экспериментатор продолжает обучение моделей до тех пор, пока не подтвердится ранее существовавшая гипотеза.

контрфактическая справедливость

#справедливость

Метрика справедливости , которая проверяет, дает ли классификатор тот же результат для одного человека, что и для другого человека, идентичного первому, за исключением одного или нескольких чувствительных атрибутов . Оценка классификатора на предмет контрфактической справедливости — это один из методов выявления потенциальных источников систематической ошибки в модели.

См. «Когда миры сталкиваются: интеграция различных контрфактических предположений в справедливость» для более подробного обсуждения контрфактической справедливости.

смещение охвата

#справедливость

См. смещение выбора .

Д

демографический паритет

#справедливость

Метрика справедливости , которая удовлетворяется, если результаты классификации модели не зависят от заданного конфиденциального атрибута .

Например, если и лилипуты, и бробдингнаги подают заявку в университет Глуббдубдриб, демографический паритет достигается, если процент принятых лилипутов такой же, как процент принятых бробдингнагов, независимо от того, является ли одна группа в среднем более квалифицированной, чем другая.

Сравните с уравненными шансами и равенством возможностей , которые позволяют результатам классификации в совокупности зависеть от конфиденциальных атрибутов, но не позволяют результатам классификации для определенных указанных основных меток истинности зависеть от конфиденциальных атрибутов. См. «Борьба с дискриминацией с помощью более разумного машинного обучения», где представлена ​​визуализация компромиссов при оптимизации для достижения демографического паритета.

несопоставимое воздействие

#справедливость

Принятие решений о людях, которые непропорционально влияют на разные подгруппы населения. Обычно это относится к ситуациям, когда алгоритмический процесс принятия решений вредит или приносит пользу одним подгруппам больше, чем другим.

Например, предположим, что алгоритм, определяющий право лилипутов на получение кредита на покупку миниатюрного дома, с большей вероятностью классифицирует их как «неправомочных», если их почтовый адрес содержит определенный почтовый индекс. Если лилипуты с прямым порядком байтов с большей вероятностью будут иметь почтовые адреса с этим почтовым индексом, чем лилипуты с прямым порядком байтов, то этот алгоритм может привести к несопоставимому воздействию.

В отличие от несопоставимого подхода , который фокусируется на различиях, возникающих в результате того, что характеристики подгруппы являются явными входными данными для алгоритмического процесса принятия решений.

несопоставимое обращение

#справедливость

Включение чувствительных качеств субъектов в алгоритмический процесс принятия решений, при котором к различным подгруппам людей относятся по-разному.

Например, рассмотрим алгоритм, который определяет право лилипутов на получение кредита на строительство миниатюрного дома на основе данных, которые они предоставляют в своей заявке на кредит. Если алгоритм использует в качестве входных данных принадлежность лилипутов к Big-Endian или Little-Endian, он применяет несопоставимую обработку по этому измерению.

Сравните с несопоставимым воздействием , которое фокусируется на различиях в социальном воздействии алгоритмических решений на подгруппы, независимо от того, являются ли эти подгруппы входными данными для модели.

Э

равенство возможностей

#справедливость

Метрика справедливости, позволяющая оценить, одинаково ли хорошо модель предсказывает желаемый результат для всех значений чувствительного атрибута . Другими словами, если желаемым результатом модели является положительный класс , цель состоит в том, чтобы истинный положительный уровень был одинаковым для всех групп.

Равенство возможностей связано с уравниванием шансов , которое требует, чтобы как истинно положительные, так и ложноположительные показатели были одинаковыми для всех групп.

Предположим, что университет Глаббдубдриб принимает как лилипутов, так и бробдингнегов на строгую математическую программу. Средние школы лилипутов предлагают обширную программу занятий по математике, и подавляющее большинство учащихся имеют право на университетскую программу. В средних школах Бробдингнеджана вообще не проводятся занятия по математике, и в результате гораздо меньше учеников имеют соответствующую квалификацию. Равенство возможностей соблюдается для предпочтительного ярлыка «допущенный» в отношении национальности (лилипут или бробдингнаг), если квалифицированные студенты имеют одинаковую вероятность быть принятыми независимо от того, являются ли они лилипутами или бробдингнегами.

Например, предположим, что 100 лилипутов и 100 бробдингнагцев подают заявки в университет Глаббдубдриб, и решения о приеме принимаются следующим образом:

Таблица 1. Кандидаты-лилипуты (90% соответствуют требованиям)

Квалифицированный Неквалифицированный
Допущенный 45 3
Отклоненный 45 7
Общий 90 10
Процент зачисленных квалифицированных студентов: 45/90 = 50%.
Процент отклоненных неквалифицированных студентов: 7/10 = 70%
Общий процент зачисленных студентов-лилипутов: (45+3)/100 = 48%.

Таблица 2. Кандидаты из Бробдингнага (10% соответствуют требованиям):

Квалифицированный Неквалифицированный
Допущенный 5 9
Отклоненный 5 81
Общий 10 90
Процент зачисленных квалифицированных студентов: 5/10 = 50%
Процент отклоненных неквалифицированных студентов: 81/90 = 90%.
Общий процент зачисленных студентов Бробдингнега: (5+9)/100 = 14%.

Предыдущие примеры удовлетворяют равенству возможностей для приема квалифицированных студентов, поскольку квалифицированные лилипуты и бробдингнаги имеют 50% шансов на поступление.

Хотя равенство возможностей соблюдается, следующие два показателя справедливости не выполняются:

  • демографический паритет : лилипуты и бробдингнаги принимаются в университет с разной скоростью; Принимаются 48% студентов-лилипутов, но только 14% студентов-бробдингнегов.
  • уравненные шансы : хотя квалифицированные студенты-лилипуты и бробдингнаги имеют одинаковые шансы на поступление, дополнительное ограничение, заключающееся в том, что неквалифицированные лилипуты и бробдингнаги имеют одинаковые шансы быть отклоненными, не удовлетворяется. У неквалифицированных лилипутов процент отказов составляет 70%, тогда как у неквалифицированных бробдингнегов — 90%.

См. «Равенство возможностей в контролируемом обучении» для более подробного обсуждения равенства возможностей. Также см. «Борьба с дискриминацией с помощью более разумного машинного обучения», где представлена ​​визуализация компромиссов при оптимизации для обеспечения равенства возможностей.

уравненные шансы

#справедливость

Метрика справедливости, позволяющая оценить, одинаково ли хорошо модель прогнозирует результаты для всех значений чувствительного атрибута как в отношении положительного , так и в отношении отрицательного класса , а не только одного или другого класса. Другими словами, как истинно положительный, так и ложноотрицательный уровень должен быть одинаковым для всех групп.

Уравненные шансы связаны с равенством возможностей , которое фокусируется только на частоте ошибок для одного класса (положительных или отрицательных).

Например, предположим, что университет Глаббдубдриб принимает как лилипутов, так и бробдингнегов на строгую математическую программу. Средние школы лилипутов предлагают обширную программу занятий по математике, и подавляющее большинство учащихся имеют право на университетскую программу. В средних школах Бробдингнеджана вообще не проводятся занятия по математике, и в результате гораздо меньше учеников имеют соответствующую квалификацию. Уравненные шансы удовлетворяются при условии, что независимо от того, является ли заявитель лилипутом или бробдингнежцем, если он соответствует требованиям, он имеет одинаковую вероятность быть допущенным к программе, а если он не соответствует требованиям, он с одинаковой вероятностью будет отклонен. .

Предположим, 100 лилипутов и 100 бробдингнегцев подают заявки в университет Глаббдубдриб, и решения о приеме принимаются следующим образом:

Таблица 3. Кандидаты-лилипуты (90% соответствуют требованиям)

Квалифицированный Неквалифицированный
Допущенный 45 2
Отклоненный 45 8
Общий 90 10
Процент зачисленных квалифицированных студентов: 45/90 = 50%.
Процент отклоненных неквалифицированных студентов: 8/10 = 80%
Общий процент зачисленных студентов-лилипутов: (45+2)/100 = 47%.

Таблица 4. Кандидаты из Бробдингнага (10% соответствуют требованиям):

Квалифицированный Неквалифицированный
Допущенный 5 18
Отклоненный 5 72
Общий 10 90
Процент зачисленных квалифицированных студентов: 5/10 = 50%
Процент отклоненных неквалифицированных студентов: 72/90 = 80%.
Общий процент зачисленных студентов Бробдингнега: (5+18)/100 = 23%.

Уравненные шансы удовлетворяются, потому что квалифицированные студенты-лилипуты и бробдингнаги имеют 50% шанс быть зачисленными, а неквалифицированные лилипуты и бробдингнаги имеют 80% шанс быть отклоненными.

Уравненные шансы формально определены в «Равенстве возможностей в контролируемом обучении» следующим образом: «предиктор Ŷ удовлетворяет уравненным шансам в отношении защищенного атрибута A и результата Y, если Ŷ и A независимы, при условии, что Y».

предвзятость экспериментатора

#справедливость

См. предвзятость подтверждения .

Ф

ограничение справедливости

#справедливость
Применение ограничения к алгоритму для обеспечения соблюдения одного или нескольких определений справедливости. Примеры ограничений справедливости включают в себя:

показатель справедливости

#справедливость

Математическое определение «справедливости», поддающееся измерению. Некоторые часто используемые показатели справедливости включают в себя:

Многие показатели справедливости являются взаимоисключающими; см. несовместимость показателей справедливости .

г

предвзятость групповой атрибуции

#справедливость

Предполагается, что то, что верно для отдельного человека, верно и для всех членов этой группы. Последствия предвзятости групповой атрибуции могут усугубиться, если для сбора данных используется удобная выборка . В нерепрезентативной выборке могут быть сделаны атрибуции, не отражающие реальность.

См. также смещение из-за однородности чужой группы и смещение внутри группы .

ЧАС

исторический уклон

#справедливость

Тип предвзятости , который уже существует в мире и проник в набор данных. Эти предубеждения имеют тенденцию отражать существующие культурные стереотипы, демографическое неравенство и предубеждения против определенных социальных групп.

Например, рассмотрим классификационную модель , которая предсказывает, не выполнит ли заявитель на получение кредита дефолт по своему кредиту, которая была обучена на исторических данных о невыплатах по кредитам за 1980-е годы от местных банков в двух разных сообществах. Если бы прошлые заявители из Сообщества А имели в шесть раз больше шансов не выполнить свои обязательства по своим кредитам, чем заявители из Сообщества Б, модель могла бы усвоить историческую предвзятость, в результате чего модель с меньшей вероятностью одобрит кредиты в Сообществе А, даже если исторические условия, которые привели к этому, в этом сообществе более высокие показатели дефолта больше не актуальны.

я

неявная предвзятость

#справедливость

Автоматическое создание ассоциации или предположения на основе моделей ума и воспоминаний. Неявная предвзятость может повлиять на следующее:

  • Как данные собираются и классифицируются.
  • Как проектируются и разрабатываются системы машинного обучения.

Например, при построении классификатора для идентификации свадебных фотографий инженер может использовать в качестве признака наличие на фотографии белого платья. Однако белые платья были обычным явлением только в определенные эпохи и в определенных культурах.

См. также предвзятость подтверждения .

несовместимость показателей справедливости

#справедливость

Идея о том, что некоторые понятия справедливости несовместимы друг с другом и не могут быть удовлетворены одновременно. В результате не существует единого универсального показателя для количественной оценки справедливости, который можно было бы применить ко всем проблемам ОД.

Хотя это может показаться обескураживающим, несовместимость показателей справедливости не означает, что усилия по обеспечению справедливости бесплодны. Вместо этого предполагается, что справедливость должна определяться контекстуально для конкретной проблемы ОД с целью предотвращения вреда, специфичного для случаев ее использования.

См . «О (не)возможности справедливости» для более подробного обсуждения этой темы.

индивидуальная справедливость

#справедливость

Метрика справедливости, которая проверяет, классифицируются ли похожие люди одинаково. Например, Академия Бробдингнагяна может захотеть обеспечить индивидуальную справедливость, гарантируя, что два студента с одинаковыми оценками и результатами стандартизированных тестов имеют равную вероятность поступления.

Обратите внимание, что индивидуальная справедливость полностью зависит от того, как вы определяете «сходство» (в данном случае оценки и результаты тестов), и вы можете рискнуть создать новые проблемы со справедливостью, если ваш показатель сходства упускает важную информацию (например, строгость оценки учащегося). учебный план).

См. «Справедливость через осведомленность» для более подробного обсуждения индивидуальной справедливости.

внутригрупповая предвзятость

#справедливость

Проявление пристрастия к своей группе или собственным характеристикам. Если в число тестировщиков или оценщиков входят друзья, родственники или коллеги разработчика машинного обучения, то групповая предвзятость может сделать тестирование продукта или набора данных недействительным.

Внутригрупповая предвзятость — это форма предвзятости групповой атрибуции . См. также предвзятость однородности аут-группы .

Н

предвзятость в связи с отсутствием ответов

#справедливость

См. смещение выбора .

О

предвзятость в отношении однородности чужой группы

#справедливость

Тенденция рассматривать членов чужой группы более похожими, чем членов своей группы, при сравнении взглядов, ценностей, личностных качеств и других характеристик. Под группой подразумеваются люди, с которыми вы регулярно общаетесь; К аут-группе относятся люди, с которыми вы не общаетесь регулярно. Если вы создаете набор данных, попросив людей предоставить атрибуты чужих групп, эти атрибуты могут быть менее детальными и более стереотипными, чем атрибуты, которые участники перечисляют для людей из своей группы.

Например, лилипуты могут очень подробно описывать дома других лилипутов, ссылаясь на небольшие различия в архитектурных стилях, окнах, дверях и размерах. Однако те же лилипуты могли бы просто заявить, что все бробдингнегцы живут в одинаковых домах.

Предвзятость однородности аутгруппы — это форма предвзятости групповой атрибуции .

См. также внутригрупповую предвзятость .

п

предвзятость участия

#справедливость

Синоним систематической ошибки в связи с отсутствием ответов. См. смещение выбора .

Постобработка

#справедливость
#основы

Корректировка вывода модели после ее запуска. Постобработка может использоваться для обеспечения соблюдения ограничений справедливости без изменения самих моделей.

Например, можно применить постобработку к двоичному классификатору, установив порог классификации таким образом, чтобы для некоторого атрибута сохранялось равенство возможностей , проверяя, что истинный положительный уровень одинаков для всех значений этого атрибута.

прогнозируемая четность

#справедливость

Метрика справедливости , которая проверяет, эквивалентны ли для данного классификатора показатели точности для рассматриваемых подгрупп.

Например, модель, предсказывающая поступление в колледж, будет удовлетворять прогнозному паритету национальности, если ее уровень точности одинаков для лилипутов и бробдингнегов.

Прогнозируемый паритет иногда также называют прогнозирующим паритетом ставок .

См. «Объяснение определений справедливости» (раздел 3.2.1) для более подробного обсуждения прогнозируемой четности.

прогнозируемый паритет ставок

#справедливость

Другое название прогнозирующей четности .

предварительная обработка

#справедливость
Обработка данных перед их использованием для обучения модели. Предварительная обработка может быть такой же простой, как удаление слов из корпуса английского текста, которых нет в английском словаре, или может быть такой же сложной, как повторное выражение точек данных таким образом, чтобы исключить как можно больше атрибутов, которые коррелируют с конфиденциальными атрибутами. . Предварительная обработка может помочь удовлетворить ограничения справедливости .

прокси (чувствительные атрибуты)

#справедливость
Атрибут, используемый в качестве замены конфиденциального атрибута . Например, почтовый индекс человека может использоваться в качестве показателя его дохода, расовой или этнической принадлежности.

р

предвзятость в отчетности

#справедливость

Тот факт, что частота, с которой люди пишут о действиях, результатах или свойствах, не является отражением их реальных частот или степени, в которой свойство характерно для класса людей. Предвзятость отчетности может повлиять на состав данных, на которых учатся системы машинного обучения.

Например, в книгах слово «смеяться» встречается чаще, чем «дышать» . Модель машинного обучения, которая оценивает относительную частоту смеха и дыхания по корпусу книг, вероятно, определит, что смех встречается чаще, чем дыхание.

С

смещение выборки

#справедливость

См. смещение выбора .

критерий отбора

#справедливость

Ошибки в выводах, сделанных на основе выборочных данных, из-за процесса отбора, который приводит к систематическим различиям между образцами, наблюдаемыми в данных, и теми, которые не наблюдались. Существуют следующие формы предвзятости отбора:

  • смещение охвата : популяция, представленная в наборе данных, не соответствует популяции, о которой прогнозирует модель машинного обучения.
  • систематическая ошибка выборки : данные из целевой группы собираются не случайным образом.
  • предвзятость отсутствия ответов (также называемая предвзятостью участия ): пользователи из определенных групп отказываются от участия в опросах с разной частотой, чем пользователи из других групп.

Например, предположим, что вы создаете модель машинного обучения, которая предсказывает удовольствие людей от фильма. Чтобы собрать данные для обучения, вы раздаете опросник всем, кто находится в первом ряду кинотеатра, где показывают фильм. На первый взгляд это может показаться разумным способом сбора набора данных; однако эта форма сбора данных может привести к следующим формам систематической ошибки отбора:

  • предвзятость охвата. При выборке из группы населения, которая решила посмотреть фильм, прогнозы вашей модели могут не распространяться на людей, которые еще не проявили такой уровень интереса к фильму.
  • смещение выборки: вместо случайной выборки из предполагаемой совокупности (всех людей в фильме) вы выбрали только людей в первом ряду. Возможно, люди, сидевшие в первом ряду, заинтересовались фильмом больше, чем те, кто сидел в других рядах.
  • предвзятость в связи с отсутствием ответов. В целом, люди с сильным мнением склонны отвечать на дополнительные опросы чаще, чем люди с умеренным мнением. Поскольку опрос по фильму не является обязательным, ответы с большей вероятностью образуют бимодальное распределение , чем нормальное (колокольчатое) распределение.

чувствительный атрибут

#справедливость
Человеческий атрибут, которому можно уделять особое внимание по юридическим, этическим, социальным или личным причинам.

ты

неосведомленность (к чувствительному атрибуту)

#справедливость

Ситуация, в которой конфиденциальные атрибуты присутствуют, но не включены в обучающие данные. Поскольку конфиденциальные атрибуты часто коррелируют с другими атрибутами данных, модель, обученная без знания конфиденциального атрибута, все равно может оказывать несопоставимое влияние на этот атрибут или нарушать другие ограничения справедливости .