Se usó la API de Cloud Translation para traducir esta página.

¿Qué es el aprendizaje automático?

El aprendizaje automático (AA) impulsa algunas de las tecnologías más importantes que usamos, desde apps de traducción hasta vehículos autónomos. En este curso, se explican los conceptos básicos del AA.

El AA ofrece una nueva forma de resolver problemas, responder preguntas complejas y crear contenido nuevo. El AA puede predecir el clima, estimar los tiempos de viaje, recomendar canciones, autocompletar oraciones, resumir artículos y generar imágenes nunca antes vistas.

En términos básicos, el AA es el proceso de entrenar un software, llamado modelo, para que realice predicciones útiles o genere contenido (como texto, imágenes, audio o video) a partir de datos.

Por ejemplo, supongamos que queremos crear una app para predecir la lluvia. Podríamos usar un enfoque tradicional o uno basado en AA. Con un enfoque tradicional, crearíamos una representación basada en la física de la atmósfera y la superficie de la Tierra, y calcularíamos grandes cantidades de ecuaciones de dinámica de fluidos. Esto es increíblemente difícil.

Con un enfoque de AA, le proporcionaríamos a un modelo de AA enormes cantidades de datos meteorológicos hasta que el modelo de AA finalmente aprendiera la relación matemática entre los patrones climáticos que producen diferentes cantidades de lluvia. Luego, le daríamos al modelo los datos meteorológicos actuales y este predeciría la cantidad de lluvia.

Comprueba tu comprensión

¿Qué es un "modelo" en el aprendizaje automático?

Un modelo es una relación matemática derivada de los datos que un sistema de AA usa para hacer predicciones.

Un modelo es una pieza de hardware de computadora

Un modelo es una representación más pequeña de lo que estás estudiando.

Tipos de sistemas de AA

Los sistemas de AA se clasifican en una o más de las siguientes categorías según cómo aprenden a generar predicciones o contenido:

Aprendizaje supervisado
Aprendizaje no supervisado
Aprendizaje por refuerzo
IA generativa

Aprendizaje supervisado

Los modelos de aprendizaje supervisado pueden realizar predicciones después de ver muchos datos con las respuestas correctas y, luego, descubrir las conexiones entre los elementos de los datos que producen las respuestas correctas. Esto es como un estudiante que aprende material nuevo estudiando exámenes anteriores que contienen preguntas y respuestas. Una vez que el estudiante se haya preparado con suficientes exámenes anteriores, estará listo para realizar un examen nuevo. Estos sistemas de AA son "supervisados" en el sentido de que un humano le proporciona al sistema de AA datos con los resultados correctos conocidos.

Dos de los casos de uso más comunes del aprendizaje supervisado son la regresión y la clasificación.

Regresión

Un modelo de regresión predice un valor numérico. Por ejemplo, un modelo meteorológico que predice la cantidad de lluvia, en pulgadas o milímetros, es un modelo de regresión.

Consulta la siguiente tabla para ver más ejemplos de modelos de regresión:

Situación	Posibles datos de entrada	Predicción numérica
Precio futuro de la vivienda	Metraje cuadrado, código postal, cantidad de habitaciones y baños, tamaño del lote, tasa de interés hipotecaria, tasa de impuestos a la propiedad, costos de construcción y cantidad de casas en venta en el área.	Es el precio de la casa.
Hora de viaje futura	Condiciones de tráfico históricas (recopiladas de smartphones, sensores de tráfico, aplicaciones de transporte compartido y otras aplicaciones de navegación), distancia al destino y condiciones climáticas	Es el tiempo en minutos y segundos para llegar a un destino.

Clasificación

Los modelos de clasificación predicen la probabilidad de que algo pertenezca a una categoría. A diferencia de los modelos de regresión, cuyo resultado es un número, los modelos de clasificación generan un valor que indica si algo pertenece o no a una categoría en particular. Por ejemplo, los modelos de clasificación se usan para predecir si un correo electrónico es spam o si una foto contiene un gato.

Los modelos de clasificación se dividen en dos grupos: clasificación binaria y clasificación multiclase. Los modelos de clasificación binaria generan un valor a partir de una clase que contiene solo dos valores, por ejemplo, un modelo que genera rain o no rain. Los modelos de clasificación multiclase generan un valor a partir de una clase que contiene más de dos valores, por ejemplo, un modelo que puede generar rain, hail, snow o sleet.

Comprueba tu comprensión

Si quisieras usar un modelo de AA para predecir el consumo de energía de edificios comerciales, ¿qué tipo de modelo usarías?

Regresión

El uso de energía se mide en kilovatios-hora (kWh), que es un número, por lo que te convendría usar un modelo de regresión.

Clasificación

Los modelos de clasificación predicen si algo pertenece o no a una categoría, mientras que los modelos de regresión predicen un número. Dado que el uso de energía se mide en kilovatios-hora (kWh), que es un número, te convendría usar un modelo de regresión.

Aprendizaje no supervisado

Los modelos de aprendizaje no supervisado realizan predicciones a partir de datos que no contienen respuestas correctas. El objetivo de un modelo de aprendizaje no supervisado es identificar patrones significativos entre los datos. En otras palabras, el modelo no tiene pistas sobre cómo categorizar cada dato, sino que debe inferir sus propias reglas.

Un modelo de aprendizaje no supervisado que se usa con frecuencia emplea una técnica llamada agrupamiento. El modelo encuentra los puntos de datos que demarcan las agrupaciones naturales.

Una imagen que muestra puntos de colores en clústeres.

Figura 1. Un modelo de AA que agrupa en clústeres los puntos de datos similares.

Una imagen que muestra puntos de colores en clústeres encerrados en una forma y que se bordean entre sí.

Figura 2. Son grupos de clústeres con demarcaciones naturales.

El agrupamiento en clústeres difiere de la clasificación porque las categorías no las defines tú. Por ejemplo, un modelo no supervisado podría agrupar un conjunto de datos meteorológicos según la temperatura, lo que revelaría segmentaciones que definen las estaciones. Luego, puedes intentar nombrar esos clústeres según tu comprensión del conjunto de datos.

Una imagen que muestra puntos de colores en clústeres etiquetados como nieve, lluvia, granizo y sin lluvia.

Figura 3. Un modelo de AA que agrupa patrones climáticos similares.

Una imagen que muestra puntos de colores en clústeres etiquetados como nieve, lluvia, granizo y sin lluvia, que están encerrados en una forma y se bordean entre sí.

Figura 4. Agrupaciones de patrones climáticos etiquetados como nieve, aguanieve, lluvia y sin lluvia.

Comprueba tu comprensión

¿Qué distingue un enfoque supervisado de uno no supervisado?

Un enfoque supervisado recibe datos que contienen la respuesta correcta.

Un enfoque supervisado recibe datos que contienen la respuesta correcta. El trabajo del modelo es encontrar conexiones en los datos que produzcan la respuesta correcta. En un enfoque no supervisado, se proporcionan datos sin la respuesta correcta. Su trabajo es encontrar agrupaciones en los datos.

Por lo general, un enfoque supervisado usa el agrupamiento.

Un enfoque no supervisado usa el agrupamiento en clústeres.

Un enfoque no supervisado sabe cómo etiquetar clústeres de datos.

Un enfoque no supervisado no sabe qué significan los clústeres de datos. Según tu comprensión de los datos, depende de ti definirlos.

Aprendizaje por refuerzo

Los modelos de aprendizaje por refuerzo realizan predicciones obteniendo recompensas o penalizaciones según las acciones que se realizan en un entorno. Un sistema de aprendizaje por refuerzo genera una política que define la mejor estrategia para obtener la mayor cantidad de recompensas.

El aprendizaje por refuerzo se usa para entrenar robots para que realicen tareas, como caminar por una habitación, y programas de software, como AlphaGo, para jugar al juego de Go.

IA generativa

La IA generativa es una clase de modelos que crea contenido a partir de la entrada del usuario. Por ejemplo, la IA generativa puede crear imágenes, composiciones musicales y chistes únicos, resumir artículos, explicar cómo realizar una tarea o editar una foto.

La IA generativa puede tomar una variedad de entradas y crear una variedad de salidas, como texto, imágenes, audio y video. También puede tomar y crear combinaciones de estos. Por ejemplo, un modelo puede tomar una imagen como entrada y crear una imagen y texto como salida, o tomar una imagen y texto como entrada y crear un video como salida.

Podemos analizar los modelos generativos según sus entradas y salidas, que suelen escribirse como "tipo de entrada" a "tipo de salida". Por ejemplo, a continuación, se muestra una lista parcial de algunas entradas y salidas para los modelos generativos:

Texto a texto
Texto a imagen
Texto a video
De texto a código
Texto a voz
Imagen y texto a imagen

En la siguiente tabla, se incluyen ejemplos de modelos generativos, sus entradas y sus posibles resultados:

Modelo	Entrada	Ejemplo de resultado:
Texto a texto	¿Quién inventó la carrera de Le Mans?	Las 24 Horas de Le Mans fueron fundadas por el Automobile Club de l'Ouest (ACO), una organización automovilística fundada en 1906. La primera carrera se llevó a cabo el 26 y 27 de mayo de 1923 en el circuito de Sarthe, un circuito vial de 13.426 kilómetros (8.345 millas) ubicado cerca de la ciudad de Le Mans en Francia. La carrera se concibió originalmente como una forma de promover el ACO y la región de Sarthe. Fuente: Bard
Texto a imagen	Un pulpo alienígena flota a través de un portal mientras lee un periódico.	Fuente: Imagen
Texto a video	Un oso de peluche fotorrealista nada en el océano en San Francisco. El oso de peluche se sumerge en el agua. El oso de peluche sigue nadando bajo el agua con peces coloridos. Un oso panda nada bajo el agua.	Fuente: Phenaki
De texto a código	Escribe un bucle de Python que itere sobre una lista de números y muestre los números primos.	for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) Fuente: Bard
Imagen a texto		Este es un flamenco. Se encuentran en el Caribe. Fuente: Google DeepMind

¿Cómo funciona la IA generativa? En términos generales, los modelos generativos aprenden patrones en los datos con el objetivo de producir datos nuevos, pero similares. Los modelos generativos son como los siguientes:

Comediantes que aprenden a imitar a otras personas observando sus comportamientos y su forma de hablar
Artistas que aprenden a pintar en un estilo particular estudiando muchas pinturas en ese estilo
Bandas de versiones que aprenden a sonar como un grupo musical específico escuchando mucha música de ese grupo

Para producir resultados únicos y creativos, los modelos generativos se entrenan inicialmente con un enfoque no supervisado, en el que el modelo aprende a imitar los datos con los que se entrena. A veces, el modelo se entrena más con aprendizaje supervisado o por refuerzo sobre datos específicos relacionados con las tareas que se le pueden pedir que realice, por ejemplo, resumir un artículo o editar una foto.

La IA generativa es una tecnología que evoluciona rápidamente y se descubren nuevos casos de uso constantemente. Por ejemplo, los modelos generativos ayudan a las empresas a definir mejor las imágenes de sus productos de comercio electrónico quitando automáticamente los fondos que distraen o mejorando la calidad de las imágenes de baja resolución.

Introducción al aprendizaje automático

Aprendizaje supervisado

¿Qué es el aprendizaje automático? Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Comprueba tu comprensión

Tipos de sistemas de AA

Aprendizaje supervisado

Regresión

Clasificación

Comprueba tu comprensión

Aprendizaje no supervisado

Comprueba tu comprensión

Aprendizaje por refuerzo

IA generativa

¿Qué es el aprendizaje automático?