Comprende el problema

Para comprender el problema, realiza las siguientes tareas:

Indica el objetivo del producto que estás desarrollando o refactorizando.
Determina si el objetivo se resuelve mejor con el AA predictivo, la IA generativa o una solución que no sea de AA.
Verifica que tengas los datos necesarios para entrenar un modelo si usas un enfoque de AA predictivo.

Indica el objetivo

Comienza por indicar tu objetivo en términos que no sean de AA. El objetivo es la respuesta a la pregunta “¿Qué quiero lograr?”.

En la siguiente tabla, se indican claramente los objetivos de apps hipotéticas:

Aplicación	Objetivo
App del clima	Calcula la precipitación en incrementos de seis horas para una región geográfica.
App de moda	Genera una variedad de diseños de camisas.
App de video	Recomienda videos útiles.
App de Mail	Detecta spam.
App financiera	Resumir información financiera de varias fuentes de noticias
App de mapas	Calcula el tiempo de viaje.
App bancaria	Identificar transacciones fraudulentas
App de restaurantes	Identificar la cocina por el menú de un restaurante
App de comercio electrónico	Responde las opiniones con respuestas útiles.

Caso de uso claro para el AA

Algunos ven el AA como una herramienta universal que se puede aplicar a todos los problemas. En realidad, el AA es una herramienta especializada adecuada solo para problemas particulares. No querrás implementar una solución de AA compleja cuando una solución más simple que no sea de AA funcione.

Los sistemas de AA se pueden dividir en dos grandes categorías: AA predictivo y IA generativa. En la siguiente tabla, se enumeran sus características definitorias:

	Entrada	Resultado	Técnica de entrenamiento
AA predictivo	Texto Imagen Audio Video Numérico	Realiza una predicción, por ejemplo, clasifica un correo electrónico como spam o no spam, adivina la cantidad de lluvia de mañana o predice el precio de una acción. Por lo general, el resultado se puede verificar en función de la realidad.	Por lo general, usa muchos datos para entrenar un modelo de aprendizaje supervisado, no supervisado o por refuerzo para realizar una tarea específica.
IA generativa	Texto Imagen Audio Video Numérico	Genera resultados según la intención del usuario, por ejemplo, para resumir un artículo o producir un clip de audio o un video corto.	Por lo general, usa muchos datos sin etiquetar para entrenar un gran modelo de lenguaje o generador de imágenes para completar los datos faltantes. Luego, el modelo se puede usar para tareas que se pueden enmarcar como tareas de completar el espacio en blanco, o se puede ajustar con el entrenamiento en datos etiquetados para alguna tarea específica, como la clasificación.

Para confirmar que el AA es el enfoque correcto, primero verifica que tu solución actual que no es de AA esté optimizada. Si no tienes implementada una solución que no sea de IA, intenta resolver el problema de forma manual con una heurística.

La solución que no es de AA es la comparativa que usarás para determinar si el AA es un buen caso de uso para tu problema. Ten en cuenta las siguientes preguntas cuando compares un enfoque que no sea de AA con uno de AA:

Calidad: ¿Qué tan mejor crees que puede ser una solución de AA? Si crees que una solución de AA podría ser solo una pequeña mejora, es posible que la solución actual sea la mejor.
Costo y mantenimiento. ¿Qué tan costosa es la solución de AA a corto y largo plazo? En algunos casos, cuesta mucho más en términos de recursos de procesamiento y tiempo implementar el AA. Ten en cuenta las siguientes preguntas:
- ¿La solución de AA puede justificar el aumento en el costo? Ten en cuenta que las mejoras pequeñas en sistemas grandes pueden justificar fácilmente el costo y el mantenimiento de la implementación de una solución de AA.
- ¿Cuánto mantenimiento requerirá la solución? En muchos casos, las implementaciones de la IA requieren un mantenimiento a largo plazo dedicado.
- ¿Tu producto tiene los recursos para respaldar la capacitación o contratación de personas con experiencia en AA?

Comprueba tu comprensión

¿Por qué es importante tener una solución o heurística que no sea de AA antes de analizar una solución de AA?

Una solución que no es de AA es la comparativa para medir una solución de AA.

Las soluciones que no son de AA te ayudan a determinar cuánto costará una solución de AA.

AA y datos predictivos

Los datos son la fuerza impulsora del AA predictivo. Para realizar buenas predicciones, necesitas datos que contengan atributos con capacidad predictiva. Tus datos deben tener las siguientes características:

Abundantes. Cuantos más ejemplos relevantes y útiles haya en tu conjunto de datos, mejor será tu modelo.
Coherente y confiable. Tener datos recopilados de manera coherente y confiable producirá un mejor modelo. Por ejemplo, un modelo climático basado en el AA se beneficiará de los datos recopilados durante muchos años a partir de los mismos instrumentos confiables.
Confiable. Comprender de dónde provendrán tus datos ¿Los datos provendrán de fuentes confiables que controlas, como los registros de tu producto, o de fuentes de las que no tienes mucha información, como el resultado de otro sistema de IA?
Disponible. Asegúrate de que todas las entradas estén disponibles en el momento de la predicción en el formato correcto. Si será difícil obtener ciertos valores de atributos en el momento de la predicción, omite esos atributos de tus conjuntos de datos.
Correcto. En conjuntos de datos grandes, es inevitable que algunas etiquetas tengan valores incorrectos, pero si más de un pequeño porcentaje de etiquetas son incorrectas, el modelo producirá predicciones deficientes.
Representante: Los conjuntos de datos deben ser lo más representativos posible del mundo real. En otras palabras, los conjuntos de datos deben reflejar con precisión los eventos, los comportamientos de los usuarios o los fenómenos del mundo real que se modelan. El entrenamiento en conjuntos de datos no representativos puede provocar un rendimiento bajo cuando se le pide al modelo que realice predicciones del mundo real.

Si no puedes obtener los datos que necesitas en el formato requerido, tu modelo hará predicciones deficientes.

Poder predictivo

Para que un modelo realice buenas predicciones, los atributos de tu conjunto de datos deben tener poder predictivo. Cuanto más correlacionado esté un atributo con una etiqueta, más probable será que se predique.

Algunas funciones tendrán más poder predictivo que otras. Por ejemplo, en un conjunto de datos del clima, atributos como cloud_coverage, temperature y dew_point serían mejores predictores de lluvia que moon_phase o day_of_week. En el ejemplo de la app de videos, podrías plantear la hipótesis de que atributos como video_description, length y views podrían ser buenos predictores de los videos que un usuario querría mirar.

Determinar qué atributos tienen poder predictivo puede ser un proceso que requiere mucho tiempo. Puedes explorar manualmente el poder predictivo de una función quitándola y añadiéndola mientras entrenas un modelo. Puedes automatizar la búsqueda del poder predictivo de una función con algoritmos como la correlación de Pearson, la información mutua ajustada (AMI) y el valor de Shapley, que proporcionan una evaluación numérica para analizar el poder predictivo de una función.

Comprueba tu comprensión

Cuando analices tus conjuntos de datos, ¿cuáles son los tres atributos clave que debes buscar?

Representativo del mundo real.

Contiene valores correctos.

Los atributos tienen poder predictivo para la etiqueta.

Lo suficientemente pequeño como para cargarse en una máquina local.

Se recopilan de una variedad de fuentes impredecibles.

Para obtener más orientación sobre cómo analizar y preparar tus conjuntos de datos, consulta Preparación de datos y creación de atributos para el aprendizaje automático.

Comparación entre las predicciones y las acciones

No tiene sentido predecir algo si no puedes convertir la predicción en una acción que ayude a los usuarios. Es decir, tu producto debe tomar medidas a partir del resultado del modelo.

Por ejemplo, un modelo que predice si un usuario encontrará útil un video debería alimentar una app que recomiende videos útiles. Un modelo que predice si lloverá debe ingresar a una app del clima.

Comprueba tu comprensión

En función de la siguiente situación, determina si usar el AA es el mejor enfoque para el problema.

Un equipo de ingeniería de una organización grande es responsable de administrar las llamadas telefónicas entrantes.

Objetivo: Informar a los que llaman cuánto tiempo permanecerán en espera, según el volumen de llamadas actual.

No tiene ninguna solución, pero cree que una heurística sería dividir la cantidad actual de clientes en espera por la cantidad de empleados que responden teléfonos y, luego, multiplicar por 10 minutos. Sin embargo, sabe que algunos clientes resuelven sus problemas en dos minutos, mientras que otros pueden tardar hasta 45 minutos o más.

Es probable que su heurística no le proporcione un número lo suficientemente preciso. Pueden crear un conjunto de datos con las siguientes columnas: number_of_callcenter_phones, user_issue, time_to_resolve, call_time y time_on_hold.

Usa el AA. El equipo de ingeniería tiene un objetivo claramente definido. Su heurística no será lo suficientemente buena para su caso de uso. Al parecer, el conjunto de datos tiene atributos predictivos para la etiqueta time_on_hold.

No uses el AA. Aunque tiene un objetivo claramente definido, primero debe implementar y optimizar una solución que no sea de AA. Además, su conjunto de datos no parece contener suficientes características con poder predictivo.

Enmarcado de problemas

Definición de un problema de AA

Comprende el problema Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Indica el objetivo

Caso de uso claro para el AA

Comprueba tu comprensión

AA y datos predictivos

Poder predictivo

Comprueba tu comprensión

Comparación entre las predicciones y las acciones

Comprueba tu comprensión

Comprende el problema