Para comprender el problema, realiza las siguientes tareas:
- Indica el objetivo del producto que estás desarrollando o refactorizando.
- Determina si el objetivo se resuelve mejor con el AA predictivo, la IA generativa o una solución que no sea de AA.
- Verifica que tengas los datos necesarios para entrenar un modelo si usas un enfoque de AA predictivo.
Indica el objetivo
Comienza por indicar tu objetivo en términos que no sean de AA. El objetivo es la respuesta a la pregunta “¿Qué quiero lograr?”.
En la siguiente tabla, se indican claramente los objetivos de apps hipotéticas:
Aplicación | Objetivo |
---|---|
App del clima | Calcula la precipitación en incrementos de seis horas para una región geográfica. |
App de moda | Genera una variedad de diseños de camisas. |
App de video | Recomienda videos útiles. |
App de Mail | Detecta spam. |
App financiera | Resumir información financiera de varias fuentes de noticias |
App de mapas | Calcula el tiempo de viaje. |
App bancaria | Identificar transacciones fraudulentas |
App de restaurantes | Identificar la cocina por el menú de un restaurante |
App de comercio electrónico | Responde las opiniones con respuestas útiles. |
Caso de uso claro para el AA
Algunos ven el AA como una herramienta universal que se puede aplicar a todos los problemas. En realidad, el AA es una herramienta especializada adecuada solo para problemas particulares. No querrás implementar una solución de AA compleja cuando una solución más simple que no sea de AA funcione.
Los sistemas de AA se pueden dividir en dos grandes categorías: AA predictivo y IA generativa. En la siguiente tabla, se enumeran sus características definitorias:
Entrada | Resultado | Técnica de entrenamiento | |
---|---|---|---|
AA predictivo |
Texto Imagen Audio Video Numérico |
Realiza una predicción, por ejemplo, clasifica un correo electrónico como spam o no spam, adivina la cantidad de lluvia de mañana o predice el precio de una acción. Por lo general, el resultado se puede verificar en función de la realidad. | Por lo general, usa muchos datos para entrenar un modelo de aprendizaje supervisado, no supervisado o por refuerzo para realizar una tarea específica. |
IA generativa |
Texto Imagen Audio Video Numérico |
Genera resultados según la intención del usuario, por ejemplo, para resumir un artículo o producir un clip de audio o un video corto. | Por lo general, usa muchos datos sin etiquetar para entrenar un gran modelo de lenguaje o generador de imágenes para completar los datos faltantes. Luego, el modelo se puede usar para tareas que se pueden enmarcar como tareas de completar el espacio en blanco, o se puede ajustar con el entrenamiento en datos etiquetados para alguna tarea específica, como la clasificación. |
Para confirmar que el AA es el enfoque correcto, primero verifica que tu solución actual que no es de AA esté optimizada. Si no tienes implementada una solución que no sea de IA, intenta resolver el problema de forma manual con una heurística.
La solución que no es de AA es la comparativa que usarás para determinar si el AA es un buen caso de uso para tu problema. Ten en cuenta las siguientes preguntas cuando compares un enfoque que no sea de AA con uno de AA:
Calidad: ¿Qué tan mejor crees que puede ser una solución de AA? Si crees que una solución de AA podría ser solo una pequeña mejora, es posible que la solución actual sea la mejor.
Costo y mantenimiento. ¿Qué tan costosa es la solución de AA a corto y largo plazo? En algunos casos, cuesta mucho más en términos de recursos de procesamiento y tiempo implementar el AA. Ten en cuenta las siguientes preguntas:
- ¿La solución de AA puede justificar el aumento en el costo? Ten en cuenta que las mejoras pequeñas en sistemas grandes pueden justificar fácilmente el costo y el mantenimiento de la implementación de una solución de AA.
- ¿Cuánto mantenimiento requerirá la solución? En muchos casos, las implementaciones de la IA requieren un mantenimiento a largo plazo dedicado.
- ¿Tu producto tiene los recursos para respaldar la capacitación o contratación de personas con experiencia en AA?
Comprueba tu comprensión
AA y datos predictivos
Los datos son la fuerza impulsora del AA predictivo. Para realizar buenas predicciones, necesitas datos que contengan atributos con capacidad predictiva. Tus datos deben tener las siguientes características:
Abundantes. Cuantos más ejemplos relevantes y útiles haya en tu conjunto de datos, mejor será tu modelo.
Coherente y confiable. Tener datos recopilados de manera coherente y confiable producirá un mejor modelo. Por ejemplo, un modelo climático basado en el AA se beneficiará de los datos recopilados durante muchos años a partir de los mismos instrumentos confiables.
Confiable. Comprender de dónde provendrán tus datos ¿Los datos provendrán de fuentes confiables que controlas, como los registros de tu producto, o de fuentes de las que no tienes mucha información, como el resultado de otro sistema de IA?
Disponible. Asegúrate de que todas las entradas estén disponibles en el momento de la predicción en el formato correcto. Si será difícil obtener ciertos valores de atributos en el momento de la predicción, omite esos atributos de tus conjuntos de datos.
Correcto. En conjuntos de datos grandes, es inevitable que algunas etiquetas tengan valores incorrectos, pero si más de un pequeño porcentaje de etiquetas son incorrectas, el modelo producirá predicciones deficientes.
Representante: Los conjuntos de datos deben ser lo más representativos posible del mundo real. En otras palabras, los conjuntos de datos deben reflejar con precisión los eventos, los comportamientos de los usuarios o los fenómenos del mundo real que se modelan. El entrenamiento en conjuntos de datos no representativos puede provocar un rendimiento bajo cuando se le pide al modelo que realice predicciones del mundo real.
Si no puedes obtener los datos que necesitas en el formato requerido, tu modelo hará predicciones deficientes.
Poder predictivo
Para que un modelo realice buenas predicciones, los atributos de tu conjunto de datos deben tener poder predictivo. Cuanto más correlacionado esté un atributo con una etiqueta, más probable será que se predique.
Algunas funciones tendrán más poder predictivo que otras. Por ejemplo, en un conjunto de datos del clima, atributos como cloud_coverage
, temperature
y dew_point
serían mejores predictores de lluvia que moon_phase
o day_of_week
. En el ejemplo de la app de videos, podrías plantear la hipótesis de que atributos como video_description
, length
y views
podrían ser buenos predictores de los videos que un usuario querría mirar.
Determinar qué atributos tienen poder predictivo puede ser un proceso que requiere mucho tiempo. Puedes explorar manualmente el poder predictivo de una función quitándola y añadiéndola mientras entrenas un modelo. Puedes automatizar la búsqueda del poder predictivo de una función con algoritmos como la correlación de Pearson, la información mutua ajustada (AMI) y el valor de Shapley, que proporcionan una evaluación numérica para analizar el poder predictivo de una función.
Comprueba tu comprensión
Para obtener más orientación sobre cómo analizar y preparar tus conjuntos de datos, consulta Preparación de datos y creación de atributos para el aprendizaje automático.
Comparación entre las predicciones y las acciones
No tiene sentido predecir algo si no puedes convertir la predicción en una acción que ayude a los usuarios. Es decir, tu producto debe tomar medidas a partir del resultado del modelo.
Por ejemplo, un modelo que predice si un usuario encontrará útil un video debería alimentar una app que recomiende videos útiles. Un modelo que predice si lloverá debe ingresar a una app del clima.
Comprueba tu comprensión
En función de la siguiente situación, determina si usar el AA es el mejor enfoque para el problema.
Un equipo de ingeniería de una organización grande es responsable de administrar las llamadas telefónicas entrantes.
Objetivo: Informar a los que llaman cuánto tiempo permanecerán en espera, según el volumen de llamadas actual.
No tiene ninguna solución, pero cree que una heurística sería dividir la cantidad actual de clientes en espera por la cantidad de empleados que responden teléfonos y, luego, multiplicar por 10 minutos. Sin embargo, sabe que algunos clientes resuelven sus problemas en dos minutos, mientras que otros pueden tardar hasta 45 minutos o más.
Es probable que su heurística no le proporcione un número lo suficientemente preciso. Pueden crear un conjunto de datos con las siguientes columnas: number_of_callcenter_phones
, user_issue
, time_to_resolve
, call_time
y time_on_hold
.
time_on_hold
.