Comprende el problema

Para comprender el problema, realiza las siguientes tareas:

  • Indica el objetivo del producto que estás desarrollando o refactorizando.
  • Determina si el objetivo se resuelve mejor con AA predictivo, IA generativa o una solución que no sea de AA.
  • Verifica que tengas los datos necesarios para entrenar un modelo si usas un enfoque de AA predictivo.

Indicar el objetivo

Comienza por indicar tu objetivo en términos que no sean del AA. El objetivo es la respuesta a la pregunta «¿Qué estoy tratando de lograr?».

En la siguiente tabla, se indican claramente los objetivos para apps hipotéticas:

Aplicación Objetivo
App de clima Calcular las precipitaciones en incrementos de seis horas para una región geográfica.
App de moda Generar una variedad de diseños de camisas.
App de video Recomienda videos útiles.
App de correo electrónico Detecta spam.
App financiera Resume la información financiera de múltiples fuentes de noticias.
App de mapas Calcula la duración del viaje.
App de banca electrónica Identifica transacciones fraudulentas.
Aplicación de gastronomía Identificar la cocina según el menú de un restaurante
App de comercio electrónico Responde las opiniones con respuestas útiles.

Caso de uso claro para el AA

Algunos ven el AA como una herramienta universal que se puede aplicar a todos los problemas. En realidad, el AA es una herramienta especializada que se adapta solo a problemas particulares. No es conveniente implementar una solución de AA compleja cuando funcionará una más simple que no es de AA.

Los sistemas de AA se pueden dividir en dos categorías amplias: AA predictivo y, también, IA generativa. En la siguiente tabla, se enumeran las características que lo definen:

Entrada Resultado Técnica de entrenamiento
AA predictivo Texto
Imagen
Audio
Video
Numérico
Realiza una predicción, por ejemplo, puede clasificar un correo electrónico como spam o no, adivinar las precipitaciones del día o predecir el precio de una acción. Por lo general, el resultado se puede verificar con la realidad. Por lo general, usa muchos datos para entrenar un modelo de aprendizaje supervisado, no supervisado o por refuerzo a fin de que realice una tarea específica.
IA generativa Texto
Imagen
Audio
Video
Numérico
Genera resultados en función de la intención del usuario; por ejemplo, al resumir un artículo o producir un clip de audio o un video corto. Por lo general, usa muchos datos sin etiquetar para entrenar un modelo de lenguaje extenso o un generador de imágenes a fin de completar los datos faltantes. El modelo se puede usar para tareas que se pueden enmarcar como tareas de completar los espacios en blanco, o se puede ajustar entrenando con datos etiquetados para alguna tarea específica, como la clasificación.

Para confirmar que el AA es el enfoque correcto, primero verifica que tu solución actual que no es de AA esté optimizada. Si no tienes implementada una solución que no sea de AA, intenta resolver el problema de forma manual mediante una heurística.

La solución que no es de AA es la comparativa que usarás para determinar si el AA es un buen caso de uso para tu problema. Ten en cuenta las siguientes preguntas cuando compares un enfoque que no sea de AA con uno de AA:

  • Calidad. ¿Cuánto mejor cree que puede ser una solución de AA? Si crees que una solución de AA podría ser solo una pequeña mejora, eso podría indicar que la solución actual es la mejor.

  • Costo y mantenimiento. ¿Qué tan costosa es la solución de AA a corto y largo plazo? En algunos casos, cuesta mucho más en términos de recursos de procesamiento y tiempo para implementar el AA. Ten en cuenta las siguientes preguntas:

    • ¿La solución de AA puede justificar el aumento en el costo? Ten en cuenta que las pequeñas mejoras en los sistemas grandes pueden justificar con facilidad el costo y el mantenimiento de la implementación de una solución de AA.
    • ¿Cuánto mantenimiento requerirá la solución? En muchos casos, las implementaciones de AA necesitan mantenimiento dedicado a largo plazo.
    • ¿Tu producto tiene los recursos para apoyar la capacitación o la contratación de personas con experiencia en AA?

Comprueba tu comprensión

¿Por qué es importante tener una solución o una heurística que no sea de AA antes de analizar una solución de AA?
Una solución que no es de AA es la comparativa con la que se debe medir una solución de AA.
Las soluciones que no son de AA ayudan a determinar cuánto costará una solución de AA.

AA y datos predictivos

Los datos son la fuerza motriz del AA predictivo. Para realizar buenas predicciones, necesitas datos que contengan funciones con poder predictivo. Tus datos deben tener las siguientes características:

  • Abundante. Cuantos más ejemplos útiles y relevantes en tu conjunto de datos, mejor será tu modelo.

  • Coherentes y confiables. Tener datos que se recopilen de manera coherente y confiable producirá un mejor modelo. Por ejemplo, un modelo meteorológico basado en el AA se beneficiará de los datos recopilados durante muchos años de los mismos instrumentos confiables.

  • Confiable. Comprende de dónde vendrán tus datos. ¿Serán los datos de fuentes de confianza que controlas, como los registros de tu producto, o serán de fuentes de las que no tienes mucha información, como la salida de otro sistema de AA?

  • Disponible Asegúrate de que todas las entradas estén disponibles en el momento de la predicción en el formato correcto. Si es difícil obtener ciertos valores de atributos en el momento de la predicción, omite esos atributos de tus conjuntos de datos.

  • Correcto. En conjuntos de datos grandes, es inevitable que algunas etiquetas tengan valores incorrectos, pero si más de un pequeño porcentaje de etiquetas son incorrectos, el modelo producirá predicciones deficientes.

  • Representante. Los conjuntos de datos deben ser lo más representativos posible del mundo real. En otras palabras, los conjuntos de datos deben reflejar con precisión los eventos, los comportamientos de los usuarios o los fenómenos del mundo real que se modela. El entrenamiento en conjuntos de datos no representativos puede causar un rendimiento deficiente cuando se le pide al modelo que haga predicciones del mundo real.

Si no puedes obtener los datos que necesitas en el formato requerido, el modelo realizará predicciones deficientes.

Poder predictivo

Para que un modelo haga buenas predicciones, los atributos de tu conjunto de datos deben tener poder predictivo. Cuanto más correlacionado esté un atributo con una etiqueta, más probable será que lo prediga.

Algunas funciones tendrán más poder predictivo que otras. Por ejemplo, en un conjunto de datos del clima, los atributos como cloud_coverage, temperature y dew_point serían mejores predictores de lluvia que moon_phase o day_of_week. Para el ejemplo de la app de video, puedes suponer que funciones como video_description, length y views podrían ser buenos predictores de los videos que un usuario querría mirar.

Ten en cuenta que el poder predictivo de un componente puede cambiar debido a que cambia el contexto o el dominio. Por ejemplo, en una app de video, una función como upload_date podría, en general, estar correlacionadamente débil con la etiqueta. Sin embargo, en el subdominio de videos de juegos, upload_date puede estar estrechamente correlacionado con la etiqueta.

Determinar qué atributos tienen poder predictivo puede ser un proceso lento. Puedes explorar de forma manual el poder predictivo de un atributo si lo quitas y lo agregas mientras entrenas un modelo. Puedes automatizar la búsqueda del poder predictivo de un atributo mediante algoritmos como la correlación de Pearson, la información mutua ajustada (AMI) y el valor de Shapley, que proporcionan una evaluación numérica para analizar el poder predictivo de un atributo.

Comprueba tu comprensión

Cuando analizas tus conjuntos de datos, ¿cuáles son los tres atributos clave que debes buscar?
Representativos del mundo real.
Contiene valores correctos.
Los elementos tienen poder predictivo para la etiqueta.
Es lo suficientemente pequeño como para cargarse en una máquina local.
Se recopila de una variedad de fuentes impredecibles.

Si deseas obtener más información sobre el análisis y la preparación de tus conjuntos de datos, consulta Preparación de datos e ingeniería de atributos para el aprendizaje automático.

Predicciones frente a acciones

Predecir algo no tiene valor si no puedes convertirlo en una acción que ayude a los usuarios. Es decir, tu producto debe tomar medidas a partir del resultado del modelo.

Por ejemplo, un modelo que predice si a un usuario le resultará útil un video debería enviar un feed a una app que recomiende videos útiles. Un modelo que predice si lloverá debe alimentar una app meteorológica.

Comprueba tu comprensión

En función de la siguiente situación, determina si el uso del AA es el mejor enfoque para el problema.

Un equipo de ingeniería de una gran organización es responsable de administrar las llamadas telefónicas entrantes.

Objetivo: Informar a los emisores cuánto tiempo esperarán en espera según el volumen de llamadas actual.

No tienen una solución, pero creen que una heurística sería dividir la cantidad actual de clientes que están en espera por la cantidad de empleados que responden teléfonos y, luego, multiplicarla por 10 minutos. Sin embargo, saben que algunos clientes resuelven sus problemas en dos minutos, mientras que otros pueden tardar hasta 45 minutos o más.

Es probable que su heurística no les proporcione un número lo suficientemente preciso. Puede crear un conjunto de datos con las siguientes columnas: number_of_callcenter_phones, user_issue, time_to_resolve, call_time y time_on_hold.

Usa el AA. El equipo de ingeniería tiene un objetivo claramente definido. Su heurística no será lo suficientemente buena para su caso práctico. Parece que el conjunto de datos tiene características predictivas para la etiqueta time_on_hold.
No uses AA. Aunque tienen un objetivo definido con claridad, primero deben implementar y optimizar una solución que no sea de AA. Además, parece que su conjunto de datos no contiene suficientes atributos con poder predictivo.