Машинное обучение (МО) лежит в основе некоторых наиболее важных технологий, которые мы используем, от приложений для перевода до автономных транспортных средств. В этом курсе объясняются основные концепции машинного обучения.
Машинное обучение предлагает новый способ решения проблем, ответа на сложные вопросы и создания нового контента. ML может предсказывать погоду, оценивать время в пути, рекомендовать песни, автоматически заполнять предложения, резюмировать статьи и создавать ранее невиданные изображения.
По сути, машинное обучение — это процесс обучения части программного обеспечения, называемой моделью , позволяющей делать полезные прогнозы или генерировать контент на основе данных.
Например, предположим, что мы хотим создать приложение для прогнозирования осадков. Мы могли бы использовать либо традиционный подход, либо подход ML. Используя традиционный подход, мы создадим физическое представление атмосферы и поверхности Земли, вычислив огромное количество уравнений гидродинамики. Это невероятно сложно.
Используя подход ML, мы передавали модели ML огромные объемы данных о погоде, пока модель ML в конечном итоге не узнала математическую взаимосвязь между погодными условиями, которые вызывают различное количество дождя. Затем мы передавали модели текущие данные о погоде, и она прогнозировала количество дождя.
Проверьте свое понимание
Типы систем машинного обучения
Системы МО попадают в одну или несколько следующих категорий в зависимости от того, как они учатся делать прогнозы или генерировать контент:
- Обучение под присмотром
- Обучение без присмотра
- Обучение с подкреплением
- Генеративный ИИ
Обучение под присмотром
Модели обучения с учителем могут делать прогнозы после просмотра большого количества данных с правильными ответами, а затем обнаружения связей между элементами данных, которые дают правильные ответы. Это похоже на то, как студент изучает новый материал, изучая старые экзамены, содержащие как вопросы, так и ответы. Как только студент натренируется на достаточном количестве старых экзаменов, он будет хорошо подготовлен к сдаче нового экзамена. Эти системы МО «контролируются» в том смысле, что человек предоставляет системе МО данные с известными правильными результатами.
Двумя наиболее распространенными вариантами использования контролируемого обучения являются регрессия и классификация.
Регрессия
Модель регрессии предсказывает числовое значение. Например, модель погоды, которая прогнозирует количество дождя в дюймах или миллиметрах, является регрессионной моделью.
В таблице ниже приведены дополнительные примеры регрессионных моделей:
Сценарий | Возможные входные данные | Числовой прогноз |
---|---|---|
Будущая цена дома | Площадь участка, почтовый индекс, количество спален и ванных комнат, размер участка, процентная ставка по ипотеке, ставка налога на недвижимость, затраты на строительство и количество домов, выставленных на продажу в этом районе. | Цена дома. |
Будущее время поездки | Исторические условия дорожного движения (собранные со смартфонов, датчиков дорожного движения, служб такси и других навигационных приложений), расстояние до пункта назначения и погодные условия. | Время в минутах и секундах до прибытия в пункт назначения. |
Классификация
Модели классификации предсказывают вероятность того, что что-то принадлежит к категории. В отличие от регрессионных моделей, выходные данные которых представляют собой число, модели классификации выводят значение, указывающее, принадлежит ли что-либо к определенной категории. Например, модели классификации используются, чтобы предсказать, является ли электронное письмо спамом или на фотографии изображен кот.
Модели классификации делятся на две группы: бинарная классификация и мультиклассовая классификация. Модели двоичной классификации выводят значение из класса, который содержит только два значения, например модель, которая выводит либо rain
, либо no rain
. Модели многоклассовой классификации выводят значение из класса, который содержит более двух значений, например модель, которая может выводить rain
, hail
, snow
или sleet
.
Проверьте свое понимание
Обучение без присмотра
Модели обучения без учителя делают прогнозы, получая данные, которые не содержат правильных ответов. Цель модели обучения без учителя — выявить значимые закономерности среди данных. Другими словами, в модели нет подсказок о том, как классифицировать каждый фрагмент данных, вместо этого она должна выводить свои собственные правила.
Широко используемая модель обучения без учителя использует метод, называемый кластеризацией . Модель находит точки данных, которые разграничивают естественные группы.
Рисунок 1 . Модель машинного обучения, объединяющая схожие точки данных.
Рисунок 2 . Группы кластеров с естественными границами.
Кластеризация отличается от классификации, поскольку категории не определяются вами. Например, неконтролируемая модель может группировать набор погодных данных на основе температуры, выявляя сегментации, определяющие времена года. Затем вы можете попытаться назвать эти кластеры на основе вашего понимания набора данных.
Рисунок 3 . Модель ML, объединяющая схожие погодные условия.
Рисунок 4 . Кластеры погодных условий, помеченные как снег, мокрый снег, дождь и отсутствие дождя.
Проверьте свое понимание
Обучение с подкреплением
Модели обучения с подкреплением делают прогнозы, получая вознаграждения или штрафы в зависимости от действий, выполняемых в среде. Система обучения с подкреплением генерирует политику , которая определяет лучшую стратегию для получения максимального вознаграждения.
Обучение с подкреплением используется для обучения роботов выполнению задач, например, хождению по комнате, а также таких программ, как AlphaGo, для игры в го.
Генеративный ИИ
Генеративный ИИ — это класс моделей, которые создают контент на основе пользовательского ввода. Например, генеративный ИИ может создавать уникальные изображения, музыкальные композиции и шутки; он может суммировать статьи, объяснять, как выполнить задачу или редактировать фотографию.
Генеративный ИИ может принимать различные входные данные и создавать различные выходные данные, такие как текст, изображения, аудио и видео. Он также может брать и создавать их комбинации. Например, модель может использовать изображение в качестве входных данных и создать изображение и текст в качестве выходных данных или использовать изображение и текст в качестве входных данных и создать видео в качестве выходных данных.
Мы можем обсуждать генеративные модели по их входным и выходным данным, обычно записываемым как «тип входных данных» к «типу выходных данных». Например, ниже приведен неполный список некоторых входных и выходных данных для генеративных моделей:
- Текст в текст
- Преобразование текста в изображение
- Преобразование текста в видео
- Преобразование текста в код
- Преобразование текста в речь
- Изображение и преобразование текста в изображение
В следующей таблице приведены примеры генеративных моделей, их входные данные и пример их возможных выходных данных:
Модель | Вход | Пример вывода |
---|---|---|
Текст в текст | Кто придумал гонку Ле-Ман? | Гонка «24 часа Ле-Мана» была основана Автомобильным клубом Запада (ACO), автомобильной организацией, основанной в 1906 году. Первая гонка состоялась 26 и 27 мая 1923 года на трассе Сарт длиной 13,426 км (8,345-13,426 км). миля) дорожная цепь, расположенная недалеко от города Ле-Ман во Франции. Изначально гонка была задумана как способ популяризации ACO и региона Сарт. Источник: Бард |
Преобразование текста в изображение | Инопланетный осьминог проплывает через портал и читает газету. | Источник: Изображение |
Преобразование текста в видео | Фотореалистичный плюшевый мишка плавает в океане в Сан-Франциско. Медвежонок уходит под воду. Медвежонок продолжает плавать под водой с разноцветными рыбками. Панда плавает под водой. | Источник: Фенаки |
Преобразование текста в код | Напишите цикл Python, который перебирает список чисел и печатает простые числа. | for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) Источник: Бард |
Преобразование изображения в текст | Это фламинго. Они обитают в Карибском море. Источник: Google DeepMind. |
Как работает генеративный ИИ? На высоком уровне генеративные модели изучают закономерности в данных с целью создания новых, но похожих данных. Генеративные модели выглядят следующим образом:
- Юмористы, которые учатся подражать другим, наблюдая за поведением и стилем речи людей.
- Художники, которые учатся рисовать в определенном стиле, изучая множество картин в этом стиле.
- Кавер-группы, которые учатся звучать как определенная музыкальная группа, слушая много музыки этой группы.
Для получения уникальных и творческих результатов генеративные модели изначально обучаются с использованием неконтролируемого подхода, при котором модель учится имитировать данные, на которых она обучена. Иногда модель дополнительно обучается с использованием контролируемого обучения или обучения с подкреплением на конкретных данных, связанных с задачами, которые модель может быть предложена выполнить, например, подвести итог статьи или отредактировать фотографию.
Генеративный искусственный интеллект — это быстро развивающаяся технология, в которой постоянно открываются новые варианты использования. Например, генеративные модели помогают компаниям совершенствовать изображения продуктов электронной коммерции, автоматически удаляя отвлекающий фон или улучшая качество изображений с низким разрешением.