Para entender el problema, realiza las siguientes tareas:
- Indica el objetivo del producto que estás desarrollando o refactorizando.
- Determinar si el objetivo se resuelve de la mejor manera con AA predictivo, la IA generativa o una solución que no es de AA.
- Verifica que tengas los datos necesarios para entrenar un modelo si usas un de AA predictivo.
Indicar el objetivo
Empieza por definir tu objetivo en términos no relacionados con el AA. El objetivo es la respuesta a la «¿Qué estoy tratando de lograr?».
En la siguiente tabla, se establecen claramente los objetivos para apps hipotéticas:
Aplicación | Objetivo |
---|---|
App de Clima | Calcula las precipitaciones en incrementos de seis horas para una región geográfica. |
App de moda | Generar una variedad de diseños de camisas. |
App de video | Recomienda videos útiles. |
App de correo electrónico | Detectar spam |
App financiera | Resumir información financiera de varias fuentes de noticias |
App de mapas | Calcula la duración del viaje. |
App de banca | Identificar transacciones fraudulentas |
App de restaurantes | Identificar el tipo de cocina según el menú de un restaurante. |
App de comercio electrónico | Responde las opiniones con respuestas útiles. |
Caso de uso claro para el AA
Algunos ven el AA como una herramienta universal que puede aplicarse a todos los problemas. En real, el AA es una herramienta especializada adecuada solo para problemas particulares. Tú no quieren implementar una solución de AA compleja cuando una solución más simple que no es de AA funcionará.
Los sistemas de AA pueden dividirse en dos grandes categorías: el AA predictivo y IA generativa. Lo siguiente enumera las características que la definen:
Entrada | Resultado | Técnica de entrenamiento | |
---|---|---|---|
AA predictivo |
Texto Imagen Audio Video Numérico |
Realiza una predicción, por ejemplo, la clasificación de un correo electrónico como spam o no como spam, adivinar la lluvia de mañana, o el precio de una acción. Por lo general, el resultado se puede verificar con la realidad. | Por lo general, usa muchos datos para entrenar un modelo no supervisado o por refuerzo para realizar un tarea específica. |
IA generativa |
Texto Imagen Audio Video Numéricas |
Genera resultados basados en la intención del usuario. Por ejemplo, resumir un artículo o producir un clip de audio o un video corto. | Por lo general, usa muchos datos sin etiquetas para entrenar un modelo grande de lenguaje. o un generador de imágenes para completar los datos faltantes. El modelo se puede usar para tareas que se pueden enmarcar como tareas en las que se debe completar un espacio en blanco, o se puede se ajustará entrenando con datos etiquetados para una tarea específica, como clasificación. |
Para confirmar que el AA sea el enfoque correcto, primero verifica que tu campaña actual que no es de AA que tu solución esté optimizada. Si no tienes implementada una solución que no sea de AA, prueba resolver el problema de forma manual mediante un heurística.
La solución que no es de AA es la comparativa que usarás para determinar si el AA es un un buen caso de uso para tu problema. Ten en cuenta las siguientes preguntas cuando compares un enfoque que no es de AA y uno de AA:
Calidad. ¿Cuánto crees que puede ser una solución de AA? Si Piensa que una solución de AA podría ser solo una pequeña mejora, lo que podría indicar si la solución actual es la mejor.
Costo y mantenimiento. ¿Qué tan costosa es la solución de AA tanto en a corto y largo plazo? En algunos casos, cuesta mucho más recursos de procesamiento y tiempo para implementar el AA. Ten en cuenta las siguientes preguntas:
- ¿Puede la solución de AA justificar el aumento en el costo? Ten en cuenta que las Las mejoras en sistemas grandes pueden justificar fácilmente el costo el mantenimiento necesario para implementar una solución de AA.
- ¿Cuánto mantenimiento requerirá la solución? En muchos casos, el AA de Google Cloud necesitan un mantenimiento dedicado y a largo plazo.
- ¿Tu producto cuenta con los recursos necesarios para respaldar las capacitaciones o la contratación? personas con experiencia en AA?
Comprueba tu comprensión
AA predictivo y datos
Los datos son la fuerza impulsora del AA predictivo. Para corregir predicciones, necesitas datos que contiene atributos con predicción energía. Tus datos deben tener las siguientes características:
Abundancia. Los ejemplos más relevantes y útiles en tu dataset, mejor será tu modelo.
Coherentes y confiables. Tener datos que sean coherentes y confiables recopilaste producirá un mejor modelo. Por ejemplo, un clima basado en AA se beneficiará de los datos recopilados a lo largo de muchos años de la misma con instrumentos.
Confiable. Comprende de dónde provienen tus datos. ¿Serán los datos de fuentes confiables que tú controlas, como los registros de tu producto, o ¿será de fuentes de las que no tienes mucha información, como el resultado de otra un sistema de AA?
Disponible. Asegúrate de que todas las entradas estén disponibles en el momento de la predicción en el formato correcto. Si será difícil obtener ciertos valores de atributos al el momento de la predicción, omite esos atributos de tus conjuntos de datos.
Correcto. En conjuntos de datos grandes, es inevitable que Las etiquetas tendrán valores incorrectos pero si más de un pequeño porcentaje de las etiquetas son incorrectos, el modelo producir malas predicciones.
Representante. Los conjuntos de datos deben ser tan representativos de los al mundo como sea posible. En otras palabras, los conjuntos de datos deben reflejar con exactitud los eventos, los comportamientos de los usuarios o los fenómenos del mundo real modelado. Entrenar con conjuntos de datos no representativos puede causar un rendimiento deficiente cuando se le pide al modelo que haga predicciones del mundo real.
Si no puedes obtener los datos que necesitas en el formato requerido, tu modelo predicciones deficientes.
Poder predictivo
Para que un modelo haga buenas predicciones, los atributos del conjunto de datos deben tener poder predictivo. Cuanto más correlacionado esté un atributo con una etiqueta, más probable es es predecirlos.
Algunas funciones tendrán más capacidad predictiva que otras. Por ejemplo, en una
conjunto de datos meteorológicos, los atributos como cloud_coverage
, temperature
y
dew_point
sería un mejor predictor de la lluvia que moon_phase
o
day_of_week
Para el ejemplo de la aplicación de video, podrías suponer una hipótesis de que
como video_description
, length
y views
podrían ser buenos predictores de
qué videos le gustaría ver a un usuario.
Ten en cuenta que el poder predictivo
de un atributo puede cambiar debido al contexto
cambios de dominio. Por ejemplo, en la app de video, una función como upload_date
podría, en general, tener una correlación débil con la etiqueta. Sin embargo, en
el subdominio de videos de juegos, upload_date
puede tener una fuerte correlación con
la etiqueta.
Determinar qué atributos tienen poder predictivo puede llevar mucho tiempo el proceso de administración de recursos. Para explorar manualmente el poder predictivo de una función, quita y agregarlo mientras entrenas un modelo. Puedes automatizar la búsqueda de poder predictivo mediante algoritmos como Correlación de Pearson, Información mutua ajustada (AMI), y Valor de Shapley, que proporcionan una evaluación numérica para analizar el poder predictivo de una feature.
Comprueba tu comprensión
Para obtener más orientación sobre el análisis y la preparación de tus conjuntos de datos, consulta Data Preparation and Feature Engineering for Machine Learning.
Predicciones frente a acciones
Predecir algo no tiene valor si no puedes convertir la predicción en una acción que ayuda a los usuarios. Es decir, tu producto debe actuar desde el salida del modelo.
Por ejemplo, un modelo que predice si un usuario encontrará útil un video se debe ingresar en una aplicación que recomiende videos útiles. Un modelo que predice si lloverá debería introducirse en una app meteorológica.
Comprueba tu comprensión
De acuerdo con la siguiente situación, determina si el uso del AA es la mejor opción. abordar el problema.
Un equipo de ingeniería de una gran organización es responsable de administrar llamadas telefónicas entrantes.
Objetivo: Informa a las personas que llaman cuánto tiempo esperarán en línea en función del el volumen de la llamada actual.
No tienen ninguna solución, pero creen que una heurística dividir el presupuesto cantidad de clientes en espera por la cantidad de empleados que atienden teléfonos, y luego multiplicar por 10 minutos. Sin embargo, Saben que algunos clientes resuelven sus problemas en dos minutos, mientras que otras pueden tardar hasta 45 minutos o más.
Es probable que su heurística no proporcione un número lo suficientemente preciso. Ellas
puedes crear un conjunto de datos con las siguientes columnas:
number_of_callcenter_phones
, user_issue
,
time_to_resolve
, call_time
time_on_hold
time_on_hold
.