Справочная информация: Что такое генеративная модель?

Что означает «генеративный» в названии «Генераторно-состязательная сеть»? « Генеративный » описывает класс статистических моделей, которые контрастируют с дискриминативными моделями.

Неофициально:

  • Генеративные модели могут генерировать новые экземпляры данных.
  • Дискриминационные модели различают разные типы экземпляров данных.

Генеративная модель может генерировать новые фотографии животных, похожих на настоящих животных, а дискриминационная модель может отличить собаку от кошки. GAN — это всего лишь один из видов генеративной модели.

Более формально, учитывая набор экземпляров данных X и набор меток Y:

  • Генеративные модели фиксируют совместную вероятность p(X, Y) или просто p(X), если меток нет.
  • Дискриминационные модели фиксируют условную вероятность p(Y | X).

Генеративная модель включает в себя распределение самих данных и сообщает вам, насколько вероятен данный пример. Например, модели, которые предсказывают следующее слово в последовательности, обычно являются генеративными моделями (обычно намного проще, чем GAN), поскольку они могут присваивать вероятность последовательности слов.

Дискриминационная модель игнорирует вопрос о том, вероятен ли данный экземпляр, и просто сообщает вам, насколько вероятно, что ярлык будет применен к этому экземпляру.

Обратите внимание, что это очень общее определение. Существует много видов генеративных моделей. GAN — это всего лишь один из видов генеративной модели.

Моделирование вероятностей

Ни одна из моделей не должна возвращать число, представляющее вероятность. Вы можете смоделировать распределение данных, имитируя это распределение.

Например, дискриминационный классификатор, такой как дерево решений, может маркировать экземпляр, не присваивая этой метке вероятность. Такой классификатор по-прежнему будет моделью, поскольку распределение всех предсказанных меток будет моделировать реальное распределение меток в данных.

Точно так же генеративная модель может моделировать распределение, создавая убедительные «фальшивые» данные, которые выглядят так, как будто они взяты из этого распределения.

Генеративные модели сложны

Генеративные модели решают более сложную задачу, чем аналогичные дискриминационные модели. Генеративным моделям приходится моделировать больше .

Генеративная модель изображений может фиксировать такие корреляции, как «предметы, похожие на лодки, вероятно, будут появляться рядом с предметами, похожими на воду» и «глаза вряд ли появятся на лбу». Это очень сложные дистрибутивы.

Напротив, дискриминационная модель может определить разницу между «парусником» и «не парусником», просто найдя несколько контрольных закономерностей. Он может игнорировать многие корреляции, которые должна получить правильная генеративная модель.

Дискриминационные модели пытаются провести границы в пространстве данных, тогда как генеративные модели пытаются смоделировать размещение данных в пространстве. Например, на следующей диаграмме показаны дискриминационная и генеративная модели рукописных цифр:

Два графика, один из которых называется «Дискриминационная модель».           а другой с надписью «Генеративная модель». Оба графика показывают           те же четыре точки данных. Каждая точка отмечена изображением           рукописной цифры, которую она представляет. В дискриминационном           На графике есть пунктирная линия, отделяющая две точки данных от           осталось два. Область над пунктирной линией помечена как «y=0» и           область под линией помечена как «y=1». В генеративном графе           Вокруг двух пар точек нарисованы два пунктирных круга.           верхний круг помечен как «y=0», а нижний круг помечен как «y=1».

Рисунок 1: Дискриминационная и генеративная модели рукописных цифр.

Дискриминативная модель пытается отличить рукописные 0 от 1, рисуя линию в пространстве данных. Если он правильно поймет строку, он сможет отличить 0 от 1 без необходимости точного моделирования того, где экземпляры размещаются в пространстве данных по обе стороны от линии.

Напротив, генеративная модель пытается создать убедительные 1 и 0, генерируя цифры, которые близки к их реальным аналогам в пространстве данных. Он должен моделировать распределение по пространству данных.

GAN предлагают эффективный способ обучения таких богатых моделей, чтобы они напоминали реальное распределение. Чтобы понять, как они работают, нам нужно понять базовую структуру GAN.

Проверьте свое понимание: генеративные и дискриминативные модели

У вас есть показатели IQ для 1000 человек. Вы моделируете распределение показателей IQ с помощью следующей процедуры:
  1. Бросьте три шестигранных игральных кубика.
  2. Умножьте бросок на константу w.
  3. Повторите 100 раз и возьмите среднее значение всех результатов.
Вы пробуете разные значения w до тех пор, пока результат вашей процедуры не станет равным среднему значению реальных показателей IQ. Является ли ваша модель генеративной или дискриминативной моделью?
Недостаточно информации, чтобы рассказать.
Генеративная модель
Дискриминационная модель
Модель возвращает вероятность, когда вы передаете ей экземпляр данных. Является ли эта модель генеративной моделью или дискриминативной моделью?
Недостаточно информации, чтобы рассказать.
Дискриминационная модель
Генеративная модель