¿Qué es el aprendizaje automático?

El aprendizaje automático (AA) potencia algunas de las tecnologías más importantes que usamos, desde las apps de traducción hasta los vehículos autónomos. En este curso, se explican los conceptos básicos de la AA.

El AA ofrece una nueva forma de resolver problemas, responder preguntas complejas y crear contenido nuevo. El AA puede predecir el clima, estimar los tiempos de viaje, recomendar canciones, autocompletar oraciones, resumir artículos y generar imágenes nunca antes vistas.

En términos básicos, el AA es el proceso de entrenar un software, llamado modelo, para hacer predicciones útiles o generar contenido a partir de datos.

Por ejemplo, supongamos que queremos crear una app para predecir la lluvia. Podríamos usar un enfoque tradicional o uno de AA. Con un enfoque tradicional, crearemos una representación basada en la física de la atmósfera y la superficie de la Tierra, y calcularemos grandes cantidades de ecuaciones de dinámica de fluidos. Esto es increíblemente difícil.

Con un enfoque de AA, le daríamos a un modelo de AA enormes cantidades de datos climáticos hasta que, finalmente, el modelo de AA aprendiera la relación matemática entre los patrones climáticos que producen diferentes cantidades de lluvia. Luego, le daríamos al modelo los datos del clima actuales, y este predeciría la cantidad de lluvia.

Comprueba tu comprensión

¿Qué es un "modelo" en el aprendizaje automático?
Un modelo es una relación matemática derivada de los datos que un sistema de AA usa para realizar predicciones.
Un modelo es un componente de hardware de computadora.
Un modelo es una representación más pequeña de lo que estudias.

Tipos de sistemas de AA

Los sistemas de AA se dividen en una o más de las siguientes categorías según cómo aprenden a realizar predicciones o generar contenido:

  • Aprendizaje supervisado
  • Aprendizaje no supervisado
  • Aprendizaje por refuerzo
  • IA generativa

Aprendizaje supervisado

Los modelos de aprendizaje supervisado pueden realizar predicciones después de ver muchos datos con las respuestas correctas y, luego, descubrir las conexiones entre los elementos de los datos que producen las respuestas correctas. Esto es como un estudiante que aprende material nuevo estudiando exámenes anteriores que contienen preguntas y respuestas. Una vez que el estudiante se entrenó en suficientes exámenes anteriores, estará bien preparado para realizar un examen nuevo. Estos sistemas de AA están "supervisados" en el sentido de que una persona le proporciona al sistema de AA datos con los resultados correctos conocidos.

Dos de los casos de uso más comunes del aprendizaje supervisado son la regresión y la clasificación.

Regresión

Un modelo de regresión predice un valor numérico. Por ejemplo, un modelo meteorológico que predice la cantidad de lluvia, en pulgadas o milímetros, es un modelo de regresión.

Consulta la siguiente tabla para ver más ejemplos de modelos de regresión:

Situación Posibles datos de entrada Predicción numérica
Precio futuro de la casa Metros cuadrados, código postal, cantidad de habitaciones y baños, tamaño del lote, tasa de interés hipotecario, tasa de impuestos a la propiedad, costos de construcción y cantidad de casas en venta en el área Es el precio de la casa.
Hora del viaje futuro Condiciones de tráfico históricas (recopiladas de smartphones, sensores de tráfico, aplicaciones de transporte privado con conductor y otras aplicaciones de navegación), distancia del destino y condiciones climáticas Es el tiempo en minutos y segundos que tardarás en llegar a un destino.

Clasificación

Los modelos de clasificación predicen la probabilidad de que algo pertenezca a una categoría. A diferencia de los modelos de regresión, cuyo resultado es un número, los modelos de clasificación generan un valor que indica si algo pertenece o no a una categoría en particular. Por ejemplo, los modelos de clasificación se usan para predecir si un correo electrónico es spam o si una foto contiene un gato.

Los modelos de clasificación se dividen en dos grupos: clasificación binaria y clasificación multiclase. Los modelos de clasificación binaria generan un valor de una clase que solo contiene dos valores, por ejemplo, un modelo que genera rain o no rain. Los modelos de clasificación multiclase muestran un valor de una clase que contiene más de dos valores, por ejemplo, un modelo que puede mostrar rain, hail, snow o sleet.

Comprueba tu comprensión

Si quisieras usar un modelo de AA para predecir el uso de energía de los edificios comerciales, ¿qué tipo de modelo usarías?
Regresión
El consumo de energía se mide en kilovatios-hora (kWh), que es un número, por lo que te recomendamos usar un modelo de regresión.
Clasificación
Los modelos de clasificación predicen si algo pertenece o no a una categoría, mientras que los modelos de regresión predicen un número. Dado que el uso de energía se mide en kilovatios-hora (kWh), que es un número, te recomendamos que uses un modelo de regresión.

Aprendizaje no supervisado

Los modelos de aprendizaje no supervisado realizan predicciones a partir de datos que no contienen respuestas correctas. El objetivo de un modelo de aprendizaje no supervisado es identificar patrones significativos entre los datos. En otras palabras, el modelo no tiene sugerencias sobre cómo categorizar cada dato, sino que debe inferir sus propias reglas.

Un modelo de aprendizaje no supervisado de uso general emplea una técnica llamada agrupación. El modelo encuentra datos que marcan agrupaciones naturales.

Una imagen que muestra puntos de colores en grupos.

Figura 1. Un modelo de AA que agrupa puntos de datos similares

Una imagen que muestra puntos de colores en grupos que están encerrados en una forma y se bordean entre sí.

Figura 2. Grupos de clústeres con demarcaciones naturales.

El agrupamiento en clústeres difiere de la clasificación porque tú no defines las categorías. Por ejemplo, un modelo no supervisado podría agrupar un conjunto de datos meteorológicos en función de la temperatura, lo que revelaría segmentaciones que definen las estaciones. Luego, puedes intentar asignarles un nombre a esos clústeres en función de tu comprensión del conjunto de datos.

Una imagen que muestra puntos de colores en grupos etiquetados como nieve, lluvia, granizo y sin lluvia.

Figura 3. Un modelo de AA que agrupa patrones climáticos similares

Una imagen que muestra puntos de colores en grupos etiquetados como nieve, lluvia, granizo y sin lluvia que están encerrados en una forma y se bordean entre sí.

Figura 4. Agrupaciones de patrones climáticos etiquetados como nieve, aguanieve, lluvia y sin lluvia

Comprueba tu comprensión

¿Qué distingue un enfoque supervisado de uno no supervisado?
A un enfoque supervisado se le proporcionan datos que contienen la respuesta correcta.
A un enfoque supervisado se le proporcionan datos que contienen la respuesta correcta. La tarea del modelo es encontrar conexiones en los datos que produzcan la respuesta correcta. En un enfoque no supervisado, se proporcionan datos sin la respuesta correcta. Su trabajo es encontrar agrupaciones en los datos.
Por lo general, un enfoque supervisado usa el agrupamiento.
Un enfoque no supervisado usa el agrupamiento.
Un enfoque no supervisado sabe cómo etiquetar clústeres de datos.
Un enfoque no supervisado no sabe qué significan los grupos de datos. Según tu comprensión de los datos, depende de ti definirlos.

Aprendizaje por refuerzo

Los modelos de aprendizaje por refuerzo hacen predicciones a partir de recompensas o penalizaciones según las acciones que se realizan en un entorno. Un sistema de aprendizaje por refuerzo genera una política que define la mejor estrategia para obtener la mayor cantidad de recompensas.

El aprendizaje por refuerzo se usa para entrenar a los robots para que realicen tareas, como caminar por una habitación, y a programas de software, como AlphaGo, para jugar al Go.

IA generativa

La IA generativa es una clase de modelos que crean contenido a partir de las entradas del usuario. Por ejemplo, la IA generativa puede crear imágenes, composiciones musicales y chistes únicos; puede resumir artículos, explicar cómo realizar una tarea o editar una foto.

La IA generativa puede tomar una variedad de entradas y crear una variedad de salidas, como texto, imágenes, audio y video. También puede tomar y crear combinaciones de estos. Por ejemplo, un modelo puede tomar una imagen como entrada y crear una imagen y texto como resultado, o tomar una imagen y texto como entrada y crear un video como resultado.

Podemos analizar los modelos generativos por sus entradas y salidas, que suelen escribirse como "tipo de entrada" a "tipo de salida". Por ejemplo, la siguiente es una lista parcial de algunas entradas y salidas de los modelos generativos:

  • Texto a texto
  • Texto a imagen
  • Texto a video
  • Texto a código
  • Texto a voz
  • Imagen y texto a imagen

En la siguiente tabla, se muestran ejemplos de modelos generativos, su entrada y un ejemplo de su posible salida:

Modelo Entrada Ejemplo de resultado:
Texto a texto ¿Quién inventó la carrera de Le Mans? El Automobile Club de l'Ouest (ACO), una organización automovilística fundada en 1906, fue el creador de las 24 Horas de Le Mans. La primera carrera se llevó a cabo el 26 y 27 de mayo de 1923 en el circuito de Sarthe, un circuito de ruta de 13.426 kilómetros (8.345 millas) ubicado cerca de la ciudad de Le Mans, en Francia. Originalmente, la carrera se concibió como una forma de promocionar el ACO y la región de Sarthe.
Fuente: Bard
Texto a imagen Un pulpo alienígena flota a través de un portal mientras lee un periódico. Imagen de un pulpo de caricatura.
Fuente: Imagen
Texto a video Un oso de peluche fotorrealista está nadando en el océano en San Francisco. El oso de peluche se mete debajo del agua. El oso de peluche sigue nadando bajo el agua con peces coloridos. Un oso panda está nadando bajo el agua. Video de un oso de peluche que nada bajo el agua.
Fuente: Phenaki
Texto a código Escribe un bucle de Python que itere por una lista de números y, luego, imprima los números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fuente: Bard
Imagen a texto Imagen de un flamenco. Este es un flamenco. Se encuentran en el Caribe.
Fuente: Google DeepMind

¿Cómo funciona la IA generativa? En un nivel alto, los modelos generativos aprenden patrones en los datos con el objetivo de producir datos nuevos, pero similares. Los modelos generativos son los siguientes:

  • Los comediantes que aprenden a imitar a otras personas observando su comportamiento y estilo de hablar
  • Artistas que aprenden a pintar en un estilo particular estudiando muchas pinturas de ese estilo
  • Bandas tributo que aprenden a sonar como un grupo musical específico escuchando mucho de su música

Para producir resultados únicos y creativos, los modelos generativos se entrenan inicialmente con un enfoque no supervisado, en el que el modelo aprende a imitar los datos en los que se entrena. A veces, el modelo se entrena más con el aprendizaje supervisado o de refuerzo en datos específicos relacionados con las tareas que se le podrían pedir, por ejemplo, resumir un artículo o editar una foto.

La IA generativa es una tecnología que evoluciona rápidamente y se descubren nuevos casos de uso constantemente. Por ejemplo, los modelos generativos ayudan a las empresas a definir mejor sus imágenes de productos de comercio electrónico, ya que quitan automáticamente los fondos que distraen o mejoran la calidad de las imágenes de baja resolución.