Машинное обучение (МО) лежит в основе некоторых важнейших технологий, которые мы используем, от приложений для перевода до беспилотных автомобилей. В этом курсе объясняются основные концепции МО.
Машинное обучение предлагает новый способ решения задач, поиска ответов на сложные вопросы и создания нового контента. Машинное обучение может предсказывать погоду, рассчитывать время в пути, рекомендовать песни, автоматически дополнять предложения, составлять краткие обзоры статей и генерировать ранее невиданные изображения.
Проще говоря, МО — это процесс обучения программного обеспечения, называемого моделью , для составления полезных прогнозов или создания контента (например, текста, изображений, аудио или видео) на основе данных.
Например, предположим, что мы хотим создать приложение для прогнозирования осадков. Мы можем использовать как традиционный подход, так и подход с использованием машинного обучения. При традиционном подходе мы создаём основанное на физике представление атмосферы и поверхности Земли, вычисляя огромное количество уравнений гидродинамики. Это невероятно сложно.
Используя подход МО, мы бы предоставили модели МО огромный объём данных о погоде, пока она в конечном итоге не выучила бы математическую взаимосвязь между погодными условиями, приводящими к разному количеству осадков. Затем мы бы предоставили модели текущие данные о погоде, и она бы спрогнозировала количество осадков.
Проверьте свое понимание
Типы систем МО
Системы МО попадают в одну или несколько из следующих категорий в зависимости от того, как они учатся делать прогнозы или генерировать контент:
- Контролируемое обучение
- Неконтролируемое обучение
- Обучение с подкреплением
- Генеративный ИИ
Контролируемое обучение
Модели контролируемого обучения могут делать прогнозы, рассматривая большой объём данных с правильными ответами и затем выявляя связи между элементами данных, которые приводят к правильным ответам. Это похоже на то, как студент изучает новый материал, изучая старые экзаменационные задания, содержащие как вопросы, так и ответы. Как только студент натренируется на достаточном количестве старых экзаменов, он будет хорошо подготовлен к сдаче нового. Такие системы машинного обучения являются «контролируемыми» в том смысле, что человек предоставляет системе машинного обучения данные с заведомо правильными результатами.
Двумя наиболее распространенными вариантами использования контролируемого обучения являются регрессия и классификация.
Регрессия
Регрессионная модель предсказывает числовое значение. Например, метеорологическая модель, предсказывающая количество осадков в дюймах или миллиметрах, является регрессионной моделью.
Дополнительные примеры регрессионных моделей см. в таблице ниже:
Сценарий | Возможные входные данные | Числовое предсказание |
---|---|---|
Будущая цена дома | Площадь, почтовый индекс, количество спален и ванных комнат, размер участка, процентная ставка по ипотеке, ставка налога на имущество, стоимость строительства и количество домов на продажу в этом районе. | Стоимость дома. |
Будущее время поездки | История дорожной обстановки (собранная со смартфонов, датчиков дорожного движения, сервисов заказа поездок и других навигационных приложений), расстояние до пункта назначения и погодные условия. | Время в минутах и секундах до прибытия в пункт назначения. |
Классификация
Модели классификации предсказывают вероятность принадлежности объекта к определённой категории. В отличие от регрессионных моделей, которые выдают числовое значение, модели классификации выдают значение, указывающее на принадлежность объекта к определённой категории. Например, модели классификации используются для прогнозирования того, является ли электронное письмо спамом или есть ли на фотографии кот.
Модели классификации делятся на две группы: бинарную классификацию и многоклассовую классификацию. Бинарные модели классификации выводят значение из класса, содержащего только два значения, например, модель, которая выводит либо rain
, либо no rain
. Многоклассовые модели классификации выводят значение из класса, содержащего более двух значений, например, модель, которая может выводить либо rain
, hail
, snow
снег», либо sleet
.
Проверьте свое понимание
Неконтролируемое обучение
Модели обучения без учителя делают прогнозы, получая данные, не содержащие правильных ответов. Цель модели обучения без учителя — выявить значимые закономерности в данных. Другими словами, у модели нет подсказок о том, как классифицировать каждый фрагмент данных, вместо этого она должна выводить собственные правила.
Широко используемая модель обучения без учителя использует метод кластеризации . Модель находит точки данных, разграничивающие естественные группы.

Рисунок 1. Модель МО, кластеризующая схожие точки данных.

Рисунок 2. Группы кластеров с естественными разграничениями.
Кластеризация отличается от классификации тем, что категории определяются не вами. Например, неконтролируемая модель может кластеризовать набор данных о погоде по температуре, выявляя сегментации, определяющие времена года. Затем вы можете попытаться дать этим кластерам названия, основываясь на вашем понимании набора данных.

Рисунок 3. Модель МО, кластеризующая схожие погодные модели.

Рисунок 4. Группы погодных условий, обозначенные как снег, мокрый снег, дождь и отсутствие дождя.
Проверьте свое понимание
Обучение с подкреплением
Модели обучения с подкреплением делают прогнозы, получая вознаграждения или штрафы в зависимости от действий, выполняемых в данной среде. Система обучения с подкреплением формирует политику , определяющую наилучшую стратегию для получения максимального вознаграждения.
Обучение с подкреплением используется для обучения роботов выполнению задач, например, хождению по комнате, а также для обучения программ, таких как AlphaGo , игре в го.
Генеративный ИИ
Генеративный ИИ — это класс моделей, создающих контент на основе пользовательского ввода. Например, генеративный ИИ может создавать уникальные изображения, музыкальные композиции и шутки; он может составлять краткие содержания статей, объяснять, как выполнить задачу, или редактировать фотографии.
Генеративный ИИ может принимать различные входные данные и создавать различные выходные данные, такие как текст, изображения, аудио и видео. Он также может принимать и создавать их комбинации. Например, модель может принять изображение в качестве входных данных и создать изображение и текст в качестве выходных данных, или принять изображение и текст в качестве входных данных и создать видео в качестве выходных данных.
Генеративные модели можно рассматривать по их входным и выходным данным, обычно записываемым как «тип входных данных» — «тип выходных данных». Например, ниже приведён частичный список некоторых входных и выходных данных для генеративных моделей:
- Текст в текст
- Текст в изображение
- Текст в видео
- Текст в код
- Преобразование текста в речь
- Изображение и преобразование текста в изображение
В следующей таблице приведены примеры генеративных моделей, их входные данные и возможные выходные данные:
Модель | Вход | Пример вывода |
---|---|---|
Текст в текст | Кто придумал гонку Ле-Ман? | Гонка «24 часа Ле-Мана» была основана Автомобильным клубом Запада (ACO), автомобильной организацией, основанной в 1906 году. Первая гонка прошла 26 и 27 мая 1923 года на трассе Сарта — 13,426-километровой (8,345 миль) трассе, расположенной недалеко от города Ле-Ман во Франции. Изначально гонка была задумана как способ популяризации ACO и региона Сарта. Источник: Бард |
Текст в изображение | Инопланетный осьминог проплывает через портал, читая газету. | ![]() Источник: Imagen |
Текст в видео | Фотореалистичный плюшевый мишка плавает в океане Сан-Франциско. Плюшевый мишка уходит под воду. Плюшевый мишка продолжает плавать под водой вместе с разноцветными рыбками. Панда плавает под водой. | ![]() Источник: Фенаки |
Текст в код | Напишите цикл Python, который проходит по списку чисел и выводит простые числа. | for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) Источник: Бард |
Изображение в текст | ![]() | Это фламинго. Они обитают в Карибском море. Источник: Google DeepMind |
Как работает генеративный ИИ? На высоком уровне генеративные модели изучают закономерности в данных с целью создания новых, но схожих данных. Генеративные модели работают следующим образом:
- Комики, которые учатся подражать другим, наблюдая за поведением и стилем речи людей
- Художники, которые учатся рисовать в определенном стиле, изучая множество картин в этом стиле.
- Кавер-группы, которые учатся звучать как определенная музыкальная группа, слушая много музыки этой группы
Для создания уникальных и креативных результатов генеративные модели изначально обучаются без учителя, то есть модель учится имитировать данные, на которых она была обучена. Иногда модель дополнительно обучается с учителем или с подкреплением на конкретных данных, связанных с задачами, которые может выполнить модель, например, составить резюме статьи или отредактировать фотографию.
Генеративный ИИ — быстро развивающаяся технология, постоянно открывающая новые возможности для применения. Например, генеративные модели помогают компаниям улучшать изображения товаров для электронной коммерции, автоматически удаляя отвлекающий фон или улучшая качество изображений с низким разрешением.