Ponga a prueba sus conocimientos
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Las siguientes preguntas te ayudarán a consolidar tus conocimientos sobre los conceptos básicos del AA.
Poder predictivo
Los modelos de AA supervisados se entrenan con conjuntos de datos con ejemplos etiquetados. El modelo aprende a predecir la etiqueta a partir de los atributos. Sin embargo, no todos los atributos de un conjunto de datos tienen poder predictivo. En algunos casos, solo algunas características actúan como predictores de la etiqueta. En el siguiente conjunto de datos, usa el precio como la etiqueta y las columnas restantes como las características.
¿Cuáles de las siguientes opciones crees que son los mejores predictores del precio de un automóvil?
Make_model, year, miles
Es probable que la marca o el modelo, el año y el kilometraje de un automóvil sean algunos de los predictores más sólidos de su precio.
Color, altura y make_model.
La altura y el color de un automóvil no son predictores sólidos del precio de un automóvil.
Millas, caja de cambios, marca_modelo.
La caja de cambios no es un predictor principal del precio.
Tire_size, wheel_base, year.
El tamaño de los neumáticos y la distancia entre ejes no son buenos predictores del precio de un automóvil.
Aprendizaje supervisado y no supervisado
Según el problema, usarás un enfoque supervisado o no supervisado.
Por ejemplo, si conoces de antemano el valor o la categoría que deseas predecir, deberías usar el aprendizaje supervisado. Sin embargo, si quieres saber si tu conjunto de datos contiene segmentaciones o agrupaciones de ejemplos relacionados, debes usar el aprendizaje no supervisado.
Supongamos que tienes un conjunto de datos de usuarios de un sitio web de compras en línea que contiene las siguientes columnas:
Si quisieras comprender los tipos de usuarios que visitan el sitio, ¿usarías el aprendizaje supervisado o no supervisado?
Aprendizaje no supervisado.
Como queremos que el modelo agrupe grupos de clientes relacionados,
usaremos el aprendizaje no supervisado. Después de que el modelo agrupó a los usuarios,
creamos nuestros propios nombres para cada clúster, por ejemplo,
"buscadores de descuentos", "buscadores de ofertas", "navegadores", "leales"
y "errantes".
Aprendizaje supervisado porque intento predecir a qué clase pertenece un usuario.
En el aprendizaje supervisado, el conjunto de datos debe contener la etiqueta que intentas predecir. En el conjunto de datos, no hay ninguna etiqueta que haga referencia a una categoría de usuario.
Supongamos que tienes un conjunto de datos de uso de energía para casas con las siguientes columnas:
¿Qué tipo de AA usarías para predecir los kilovatios-hora utilizados por año en una casa recién construida?
Aprendizaje supervisado.
El aprendizaje supervisado se entrena con ejemplos etiquetados. En este conjunto de datos, “kilowatt hours used per year” sería la etiqueta porque es el valor que deseas que el modelo prediga. Las características serían “metros cuadrados”, “ubicación” y “año de construcción”.
Aprendizaje no supervisado.
El aprendizaje no supervisado usa ejemplos sin etiqueta. En este ejemplo, “kilowatt hours used per year” sería la etiqueta porque es el valor que deseas que el modelo prediga.
Supongamos que tienes un conjunto de datos de vuelos con las siguientes columnas:
Si quisieras predecir el costo de un boleto de avión, ¿usarías la regresión o la clasificación?
Regresión
El resultado de un modelo de regresión es un valor numérico.
Clasificación
El resultado de un modelo de clasificación es un valor discreto, generalmente una palabra. En este caso, el costo de un boleto de avión es un valor numérico.
En función del conjunto de datos, ¿podrías entrenar un modelo de clasificación para clasificar el costo de un boleto de avión como “alto”, “promedio” o “bajo”?
Sí, pero primero debemos convertir los valores numéricos de la columna airplane_ticket_cost
en valores categóricos.
Es posible crear un modelo de clasificación a partir del conjunto de datos.
Harías algo como lo siguiente:
- Busca el costo promedio de un boleto del aeropuerto de salida al aeropuerto de destino.
- Determina los umbrales que constituirían “alto”, “promedio” y “bajo”.
- Compara el costo previsto con los umbrales y muestra la
categoría en la que se encuentra el valor.
No. No es posible crear un modelo de clasificación. Los valores de airplane_ticket_cost
son numéricos, no categóricos.
Con un poco de trabajo, podrías crear un modelo de clasificación.
No. Los modelos de clasificación solo predicen dos categorías, como spam
o not_spam
. Este modelo tendría que predecir tres categorías.
Los modelos de clasificación pueden predecir varias categorías. Se llaman modelos de clasificación de varias clases.
Entrenamiento y evaluación
Después de entrenar un modelo, lo evaluamos con un conjunto de datos con ejemplos etiquetados y comparamos el valor previsto del modelo con el valor real de la etiqueta.
Selecciona las dos mejores respuestas para la pregunta.
Si las predicciones del modelo están muy lejos, ¿qué podrías hacer para mejorarlas?
Vuelve a entrenar el modelo, pero usa solo las características que crees que tienen el poder predictivo más fuerte para la etiqueta.
Volver a entrenar el modelo con menos atributos, pero con más poder predictivo, puede producir un modelo que realice mejores predicciones.
No puedes corregir un modelo cuyas predicciones están muy lejos.
Es posible corregir un modelo cuyas predicciones no son precisas. La mayoría de los modelos requieren varias rondas de entrenamiento hasta que hacen predicciones útiles.
Vuelve a entrenar el modelo con un conjunto de datos más grande y diverso.
Los modelos entrenados en conjuntos de datos con más ejemplos y un rango más amplio de valores pueden producir mejores predicciones porque el modelo tiene una mejor solución generalizada para la relación entre los atributos y la etiqueta.
Prueba con otro enfoque de entrenamiento. Por ejemplo, si usaste un enfoque supervisado, prueba uno no supervisado.
Un enfoque de entrenamiento diferente no produciría mejores predicciones.
Ya puedes dar el siguiente paso en tu recorrido de AA:
Guía People + AI. Si buscas un conjunto de métodos, prácticas recomendadas y ejemplos presentados por Googlers, expertos de la industria y la investigación académica para usar el AA.
Enmarcado de problemas. Si buscas un enfoque probado en el campo para crear modelos de AA y evitar errores comunes en el camino.
Curso intensivo de aprendizaje automático. Si estás
preparado para un enfoque práctico y detallado para aprender más sobre el AA.
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-07-27 (UTC)
[null,null,["Última actualización: 2025-07-27 (UTC)"],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["# Test Your Understanding\n\n\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n----------------\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n------------------------------------\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n-----------------------\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]