¿Qué es el aprendizaje automático?

El aprendizaje automático (AA) impulsa algunas de las tecnologías más importantes que usamos, desde apps de traducción hasta vehículos autónomos. En este curso, se explican los conceptos básicos del AA.

El AA ofrece una nueva forma de resolver problemas, responder preguntas complejas y crear contenido nuevo. El AA puede predecir el clima, estimar los tiempos de viaje, recomendar canciones, autocompletar oraciones, resumir artículos y generar imágenes nunca antes vistas.

En términos básicos, el AA es el proceso de entrenamiento de un software, llamado model, para realizar predicciones útiles o generar contenido a partir de datos.

Por ejemplo, supongamos que queremos crear una aplicación para predecir la lluvia. Podríamos usar un enfoque tradicional o uno de AA. Con un enfoque tradicional, crearíamos una representación basada en la física de la atmósfera y la superficie de la Tierra, mediante el cálculo de cantidades masivas de ecuaciones de dinámica de fluidos. Esto es increíblemente difícil.

Con un enfoque de AA, le daríamos a un modelo de AA enormes cantidades de datos meteorológicos hasta que este aprendió la relación matemática entre los patrones climáticos que producen cantidades diferentes de lluvia. Entonces, le daríamos al modelo los datos meteorológicos actuales y predeciría la cantidad de lluvia.

Comprueba tu comprensión

¿Qué es un “modelo” en el aprendizaje automático?
Un modelo es una relación matemática derivada de los datos que usa un sistema de AA para hacer predicciones
Un modelo es una pieza de hardware informático
Un modelo es una representación más pequeña de lo que se está estudiando.

Tipos de sistemas de AA

Los sistemas de AA se dividen en una o más de las siguientes categorías según cómo aprenden a hacer predicciones o generar contenido:

  • Aprendizaje supervisado
  • Aprendizaje no supervisado
  • Aprendizaje por refuerzo
  • IA generativa

Aprendizaje supervisado

Los modelos de aprendizaje supervisado pueden hacer predicciones después de ver muchos datos con las respuestas correctas y, luego, descubrir las conexiones entre los elementos de los datos que producen las respuestas correctas. Es como un estudiante que aprende material nuevo al estudiar exámenes antiguos que contienen tanto preguntas como respuestas. Una vez que el estudiante se entrenó con suficientes exámenes antiguos, está bien preparado para realizar un examen nuevo. Estos sistemas de AA están “supervisados” en el sentido de que una persona proporciona los datos del sistema de AA con los resultados correctos conocidos.

Dos de los casos de uso más comunes para el aprendizaje supervisado son la regresión y la clasificación.

Regresión

Un modelo de regresión predice un valor numérico. Por ejemplo, un modelo meteorológico que predice la cantidad de lluvia, en pulgadas o milímetros, es un modelo de regresión.

Consulta la siguiente tabla para ver más ejemplos de modelos de regresión:

Situación Datos de entrada posibles Predicción numérica
Precio futuro de la casa metros cuadrados, código postal, cantidad de habitaciones y baños, tamaño del terreno, tasa de interés hipotecaria, tasa de impuestos a la propiedad, costos de construcción y cantidad de viviendas a la venta en el área. Es el precio de la casa.
Tiempo de viaje futuro Historial de condiciones de tráfico (recopiladas de smartphones, sensores de tráfico, transporte privado a pedido y otras aplicaciones de navegación), la distancia desde el destino y las condiciones climáticas El tiempo en minutos y segundos que tarda en llegar a un destino.

Clasificación

Los modelos de clasificación predicen la probabilidad de que algo pertenezca a una categoría. A diferencia de los modelos de regresión, cuyo resultado es un número, los modelos de clasificación generan un valor que indica si algo pertenece o no a una categoría en particular. Por ejemplo, los modelos de clasificación se usan para predecir si un correo electrónico es spam o si una foto contiene un gato.

Los modelos de clasificación se dividen en dos grupos: clasificación binaria y clasificación multiclase. Los modelos de clasificación binaria generan un valor de una clase que contiene solo dos valores, por ejemplo, un modelo que genera rain o no rain. Los modelos de clasificación de clases múltiples generan un valor de una clase que contiene más de dos valores, por ejemplo, un modelo que puede generar rain, hail, snow o sleet.

Comprueba tu comprensión

Si quisieras usar un modelo de AA para predecir el uso de energía de los edificios comerciales, ¿qué tipo de modelo usarías?
Regresión
El uso de energía se mide en kilovatios-hora (kWh), que es un número, por lo que te recomendamos usar un modelo de regresión.
Clasificación
Los modelos de clasificación predicen si un elemento pertenece a una categoría o no, mientras que los modelos de regresión predicen un número. Debido a que el uso de energía se mide en kilovatios-hora (kWh), que es un número, debes usar un modelo de regresión.

Aprendizaje no supervisado

Los modelos de aprendizaje no supervisado realizan predicciones cuando reciben datos que no contienen respuestas correctas. El objetivo de un modelo de aprendizaje no supervisado es identificar patrones significativos entre los datos. En otras palabras, el modelo no tiene sugerencias sobre cómo categorizar cada dato, sino que debe inferir sus propias reglas.

Un modelo de aprendizaje no supervisado de uso general emplea una técnica llamada agrupamiento en clústeres. El modelo encuentra datos que demarcan agrupaciones naturales.

Imagen que muestra puntos de colores en clústeres.

Figura 1: Un modelo de AA que agrupa datos similares en clústeres

Una imagen que muestra puntos de colores en clústeres delimitados con una forma que tienen un borde entre sí.

Figura 2. Grupos de clústeres con demarcaciones naturales.

El agrupamiento en clústeres difiere de la clasificación porque tú no defines las categorías. Por ejemplo, un modelo no supervisado podría agrupar un conjunto de datos meteorológicos en función de la temperatura, lo que revelará segmentaciones que definen las estaciones. Luego, podrías intentar nombrar esos clústeres en función de tu comprensión del conjunto de datos.

Una imagen que muestra puntos de colores en grupos etiquetados como nieve, lluvia, granizo y sin lluvia.

Figura 3. Un modelo de AA que agrupa en clústeres patrones climáticos similares.

Una imagen que muestra puntos de colores en grupos etiquetados como nieve, lluvia, granizo y sin lluvia, encerrados con una forma y bordeados entre sí.

Figura 4. Clústeres de patrones climáticos etiquetados como nieve, aguanieve, lluvia y sin lluvia.

Comprueba tu comprensión

¿Qué distingue un enfoque supervisado de uno no supervisado?
Un enfoque supervisado recibe datos que contienen la respuesta correcta.
Un enfoque supervisado recibe datos que contienen la respuesta correcta. El trabajo del modelo es encontrar conexiones en los datos que produzcan la respuesta correcta. Un enfoque no supervisado recibe datos sin la respuesta correcta. Su trabajo es encontrar grupos en los datos.
Por lo general, un enfoque supervisado usa el agrupamiento en clústeres.
Un enfoque no supervisado usa el agrupamiento en clústeres.
Un enfoque no supervisado sabe cómo etiquetar clústeres de datos.
Un enfoque no supervisado no sabe qué significan los clústeres de datos. Según tu comprensión de los datos, depende de ti definirlos.

Aprendizaje por refuerzo

Los modelos de aprendizaje por refuerzo hacen predicciones mediante recompensas o penalizaciones basadas en acciones realizadas dentro de un entorno. Un sistema de aprendizaje por refuerzo genera una política que define la mejor estrategia para obtener la mayor cantidad de recompensas.

El aprendizaje por refuerzo se usa con el objetivo de entrenar robots para que realicen tareas, como caminar por una habitación, y programas de software, como AlphaGo, para jugar a Go.

IA generativa

La IA generativa es una clase de modelos que crea contenido a partir de entradas del usuario. Por ejemplo, la IA generativa puede crear imágenes, composiciones musicales y chistes únicos; puede resumir artículos, explicar cómo realizar una tarea o editar una foto.

La IA generativa puede tomar una variedad de entradas y crear una variedad de salidas, como texto, imágenes, audio y video. También puede tomar y crear combinaciones de estos. Por ejemplo, un modelo puede tomar una imagen como entrada y crear una imagen y texto como salida, o tomar una imagen y texto como entrada y crear un video como salida.

Podemos analizar los modelos generativos por sus entradas y salidas, que por lo general se escriben como “tipo de entrada” a “tipo de salida”. Por ejemplo, la siguiente es una lista parcial de algunas entradas y salidas para modelos generativos:

  • Texto a texto
  • Texto a imagen
  • Texto a video
  • Texto a código
  • Texto a voz
  • Imagen y texto a imagen

En la siguiente tabla, se muestran ejemplos de modelos generativos, sus entradas y un ejemplo de su posible resultado:

Modelo Entrada Ejemplo de resultado
Texto a texto ¿Quién inventó la carrera Le Mans? El club de automóviles del Ouest (ACO), una organización de automovilismo fundada en 1906, fundó las 24 Horas de Le Mans. La primera carrera se llevó a cabo el 26 y el 27 de mayo de 1923 en el circuito de Sarthe, un circuito vial de 13,426 kilómetros (13,345 kilómetros) ubicado cerca de la ciudad de Le Mans, en Francia. Originalmente, se concibió como una forma de promover la ACO y la región de Sarthe.
Fuente: Bard
Texto a imagen Un pulpo alienígena flota en un portal y lee un periódico. Imagen de la caricatura de un pulpo.
Fuente: Imagen
Texto a video Un oso de peluche fotorrealista nadando en el océano de San Francisco. El oso de peluche se sumerge en el agua. El oso de peluche nada en el agua con peces de colores. Un oso panda nadando bajo el agua. Video de un oso de peluche nadando bajo el agua.
Fuente: Phenaki
Texto a código Escribe un bucle de Python que se repita en una lista de números y, luego, imprima los números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fuente: Bard
Imagen a texto Imagen de un flamenco. Este es un flamenco. Se encuentran en el Caribe.
Fuente: Google DeepMind

¿Cómo funciona la IA generativa? En un nivel alto, los modelos generativos aprenden patrones en los datos con el objetivo de producir datos nuevos pero similares. Los modelos generativos son como los siguientes:

  • Comediantes que aprenden a imitar a los demás al observar los comportamientos y el estilo de hablar de las personas
  • Los artistas que aprenden a pintar con un estilo particular estudiando muchas pinturas en ese estilo
  • Haz covers de bandas que aprendan a sonar como un grupo de música específico escuchando mucha música de ese grupo

Para producir resultados únicos y creativos, los modelos generativos se entrenan inicialmente mediante un enfoque no supervisado, en el que el modelo aprende a imitar los datos con los que se entrena. A veces, el modelo se entrena aún más con aprendizaje supervisado o por refuerzo sobre datos específicos relacionados con tareas que se le puede pedir al modelo que realice, por ejemplo, resumir un artículo o editar una foto.

La IA generativa es una tecnología que evoluciona rápidamente y se descubren casos de uso nuevos de manera constante. Por ejemplo, los modelos generativos ayudan a las empresas a definir mejor las imágenes de productos de comercio electrónico, ya que quitan automáticamente fondos distractores o mejoran la calidad de las imágenes de baja resolución.