Para entender el problema, realiza las siguientes tareas:
- Indica el objetivo del producto que estás desarrollando o refactorizando.
- Determinar si el objetivo se resuelve de la mejor manera con AA predictivo, la IA generativa o una solución que no es de AA.
- Verifica que tengas los datos necesarios para entrenar un modelo si usas un enfoque de AA predictivo.
Indicar el objetivo
Comienza por indicar tu objetivo en términos que no sean de AA. El objetivo es la respuesta a la pregunta “¿Qué estoy tratando de lograr?”.
En la siguiente tabla, se indican claramente los objetivos de apps hipotéticas:
Aplicación | Objetivo |
---|---|
App de Clima | Calcula la precipitación en incrementos de seis horas para una región geográfica. |
App de moda | Genera una variedad de diseños de camisas. |
App de video | Recomienda videos útiles. |
App de correo electrónico | Detectar spam |
App de finanzas | Resumir información financiera de varias fuentes de noticias |
App de mapas | Calcula el tiempo de viaje. |
App bancaria | Identificar transacciones fraudulentas |
App de restaurantes | Identificar el tipo de cocina según el menú de un restaurante. |
App de comercio electrónico | Responde las opiniones con respuestas útiles. |
Caso de uso claro para el AA
Algunos ven el AA como una herramienta universal que puede aplicarse a todos los problemas. En real, el AA es una herramienta especializada adecuada solo para problemas particulares. Tú no quieren implementar una solución de AA compleja cuando una solución más simple que no es de AA funcionará.
Los sistemas de AA se pueden dividir en dos categorías amplias: AA predictivo y IA generativa. En la siguiente tabla, se enumeran sus características definitorias:
Entrada | Resultado | Técnica de entrenamiento | |
---|---|---|---|
AA predictivo |
Texto Imagen Audio Video Numérico |
Realiza una predicción, por ejemplo, la clasificación de un correo electrónico como spam o no como spam, adivinar la lluvia de mañana, o el precio de una acción. Por lo general, el resultado se puede verificar con la realidad. | Por lo general, usa muchos datos para entrenar un modelo no supervisado o por refuerzo para realizar un tarea específica. |
IA generativa |
Texto Imagen Audio Video Numéricas |
Genera resultados según la intención del usuario, por ejemplo, para resumir un artículo o producir un clip de audio o un video corto. | Por lo general, usa muchos datos sin etiquetas para entrenar un modelo grande de lenguaje. o un generador de imágenes para completar los datos faltantes. El modelo se puede usar para tareas que se pueden enmarcar como tareas en las que se debe completar un espacio en blanco, o se puede se ajustará entrenando con datos etiquetados para una tarea específica, como clasificación. |
Para confirmar que el AA sea el enfoque correcto, primero verifica que tu campaña actual que no es de AA que tu solución esté optimizada. Si no tienes implementada una solución que no sea de AA, intenta resolver el problema de forma manual con una heurística.
La solución que no es de AA es la comparativa que usarás para determinar si el AA es un un buen caso de uso para tu problema. Ten en cuenta las siguientes preguntas cuando compares un enfoque que no es de AA y uno de AA:
Calidad. ¿Qué tan mejor crees que puede ser una solución de AA? Si crees que una solución de AA podría ser solo una pequeña mejora, es posible que la solución actual sea la mejor.
Costo y mantenimiento. ¿Qué tan costosa es la solución de AA tanto en a corto y largo plazo? En algunos casos, cuesta mucho más en términos de recursos de procesamiento y tiempo implementar el AA. Ten en cuenta las siguientes preguntas:
- ¿Puede la solución de AA justificar el aumento en el costo? Ten en cuenta que las mejoras pequeñas en sistemas grandes pueden justificar fácilmente el costo y el mantenimiento de la implementación de una solución de AA.
- ¿Cuánto mantenimiento requerirá la solución? En muchos casos, el AA de Google Cloud necesitan un mantenimiento dedicado y a largo plazo.
- ¿Tu producto tiene los recursos para respaldar la capacitación o contratación de personas con experiencia en AA?
Comprueba tu comprensión
AA predictivo y datos
Los datos son la fuerza impulsora del AA predictivo. Para corregir predicciones, necesitas datos que contiene atributos con predicción energía. Tus datos deben tener las siguientes características:
Abundantes. Cuantos más ejemplos relevantes y útiles haya en tu conjunto de datos, mejor será tu modelo.
Coherentes y confiables. Tener datos que sean coherentes y confiables recopilaste producirá un mejor modelo. Por ejemplo, un modelo climático basado en el AA se beneficiará de los datos recopilados durante muchos años a partir de los mismos instrumentos confiables.
Confiable. Comprende de dónde provienen tus datos. ¿Los datos provendrán de fuentes confiables que controlas, como los registros de tu producto, o de fuentes de las que no tienes mucha información, como el resultado de otro sistema de IA?
Disponible. Asegúrate de que todas las entradas estén disponibles en el momento de la predicción en el formato correcto. Si será difícil obtener ciertos valores de atributos al el momento de la predicción, omite esos atributos de tus conjuntos de datos.
Correcto. En conjuntos de datos grandes, es inevitable que Las etiquetas tendrán valores incorrectos pero si más de un pequeño porcentaje de las etiquetas son incorrectos, el modelo producir malas predicciones.
Representante: Los conjuntos de datos deben ser lo más representativos posible del mundo real. En otras palabras, los conjuntos de datos deben reflejar con precisión los eventos, los comportamientos de los usuarios o los fenómenos del mundo real que se modelan. Entrenar con conjuntos de datos no representativos puede causar un rendimiento deficiente cuando se le pide al modelo que haga predicciones del mundo real.
Si no puedes obtener los datos que necesitas en el formato requerido, tu modelo predicciones deficientes.
Poder predictivo
Para que un modelo realice buenas predicciones, los atributos de tu conjunto de datos deben tener poder predictivo. Cuanto más correlacionado esté un atributo con una etiqueta, más probable es es predecirlos.
Algunas funciones tendrán más poder predictivo que otras. Por ejemplo, en un conjunto de datos del clima, atributos como cloud_coverage
, temperature
y dew_point
serían mejores predictores de lluvia que moon_phase
o day_of_week
. En el ejemplo de la app de videos, podrías plantear la hipótesis de que atributos como video_description
, length
y views
podrían ser buenos predictores de los videos que un usuario querría mirar.
Ten en cuenta que el poder predictivo
de un atributo puede cambiar debido al contexto
cambios de dominio. Por ejemplo, en la app de video, una función como upload_date
podría, en general, tener una correlación débil con la etiqueta. Sin embargo, en
el subdominio de videos de juegos, upload_date
puede tener una fuerte correlación con
la etiqueta.
Determinar qué atributos tienen poder predictivo puede llevar mucho tiempo el proceso de administración de recursos. Puedes explorar manualmente el poder predictivo de una función quitándola y agregándola mientras entrenas un modelo. Puedes automatizar la búsqueda del poder predictivo de una función con algoritmos como la correlación de Pearson, la información mutua ajustada (AMI) y el valor de Shapley, que proporcionan una evaluación numérica para analizar el poder predictivo de una función.
Comprueba tu comprensión
Para obtener más orientación sobre el análisis y la preparación de tus conjuntos de datos, consulta Data Preparation and Feature Engineering for Machine Learning.
Comparación entre las predicciones y las acciones
Predecir algo no tiene valor si no puedes convertir la predicción en una acción que ayuda a los usuarios. Es decir, tu producto debe actuar desde el salida del modelo.
Por ejemplo, un modelo que predice si un usuario encontrará útil un video se debe ingresar en una aplicación que recomiende videos útiles. Un modelo que predice si lloverá debe ingresar a una app del clima.
Comprueba tu comprensión
De acuerdo con la siguiente situación, determina si el uso del AA es la mejor opción. abordar el problema.
Un equipo de ingeniería de una gran organización es responsable de administrar llamadas telefónicas entrantes.
Objetivo: Informar a los que llaman cuánto tiempo permanecerán en espera, según el volumen de llamadas actual.
No tiene ninguna solución, pero cree que una heurística sería dividir la cantidad actual de clientes en espera por la cantidad de empleados que responden teléfonos y, luego, multiplicar por 10 minutos. Sin embargo, sabe que algunos clientes resuelven sus problemas en dos minutos, mientras que otros pueden tardar hasta 45 minutos o más.
Es probable que su heurística no le proporcione un número lo suficientemente preciso. Pueden crear un conjunto de datos con las siguientes columnas: number_of_callcenter_phones
, user_issue
, time_to_resolve
, call_time
y time_on_hold
.
time_on_hold
.