Teste seu conhecimento
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
As perguntas a seguir ajudam você a entender melhor os conceitos básicos de ML.
Poder preditivo
Os modelos de ML supervisionados são treinados com conjuntos de dados que têm exemplos rotulados. O modelo
aprende a prever o rótulo com base nos atributos. No entanto, nem todos os recursos em um conjunto de dados têm poder preditivo. Em alguns casos, apenas alguns recursos atuam como
preditivos do rótulo. No conjunto de dados abaixo, use o preço como rótulo e as colunas restantes como os recursos.
Quais três características você acha que são os melhores preditores do preço de um carro?
Make_model, year, miles.
A marca/modelo, o ano e a quilometragem do carro provavelmente estão entre os principais fatores de previsão do preço.
Cor, altura, make_model.
A altura e a cor de um carro não são bons indicadores do preço dele.
Miles, caixa multiplicadora, make_model.
A caixa de câmbio não é um indicador principal de preço.
Tire_size, wheel_base, year.
O tamanho dos pneus e a distância entre eixos não são bons indicadores do preço de um carro.
Aprendizado supervisionado e não supervisionado
Dependendo do problema, você vai usar uma abordagem supervisionada ou não supervisionada.
Por exemplo, se você souber de antemão o valor ou a categoria que quer prever,
use o aprendizado supervisionado. No entanto, se você quiser saber se o conjunto de dados
contém segmentações ou agrupamentos de exemplos relacionados, use
a aprendizagem não supervisionada.
Digamos que você tenha um conjunto de dados de usuários de um site de compras on-line com as seguintes colunas:
Se você quisesse entender os tipos de usuários que visitam o site, usaria o aprendizado supervisionado ou não supervisionado?
Aprendizado não supervisionado.
Como queremos que o modelo agrupe grupos de clientes relacionados, vamos usar o aprendizado não supervisionado. Depois que o modelo agrupa os usuários, criamos nossos próprios nomes para cada cluster, por exemplo, "procuradores de descontos", "procuradores de ofertas", "navegadores", "fiéis" e "vagabundos".
Supervisão, porque estou tentando prever a classe
a que um usuário pertence.
No aprendizado supervisionado, o conjunto de dados precisa conter o rótulo que você está tentando prever. No conjunto de dados, não há um rótulo que se refira a uma categoria de usuário.
Digamos que você tenha um conjunto de dados de uso de energia para residências com as seguintes colunas:
Que tipo de ML você usaria para prever os quilowatts-hora usados por ano em uma casa recém-construída?
Aprendizado supervisionado.
O aprendizado supervisionado é treinado com exemplos rotulados. Nesse conjunto de dados, "kilowatt-hora usados por ano" seria o rótulo, porque é o valor que você quer que o modelo preveja. Os atributos seriam "metros quadrados", "localização" e "ano de construção".
Aprendizado não supervisionado.
O aprendizado não supervisionado usa exemplos não rotulados. Neste exemplo, "kilowatt-hora usados por ano" seria o rótulo, porque é o valor que você quer que o modelo preveja.
Digamos que você tenha um conjunto de dados de voos com as seguintes colunas:
Se você quisesse prever o custo de uma passagem aérea, usaria regressão ou classificação?
Regressão
A saída de um modelo de regressão é um valor numérico.
Classificação
A saída de um modelo de classificação é um valor discreto,
normalmente uma palavra. Nesse caso, o custo de uma passagem aérea é um valor numérico.
Com base no conjunto de dados, você poderia treinar um modelo de classificação para classificar o custo de uma passagem aérea como "alto", "médio" ou "baixo"?
Sim, mas primeiro precisamos converter os valores numéricos na coluna airplane_ticket_cost
em valores categóricos.
É possível criar um modelo de classificação com base no conjunto de dados.
Você faria algo como o seguinte:
- Encontre o custo médio de uma passagem do aeroporto de partida para o aeroporto de destino.
- Determine os limites que seriam considerados "altos", "médios"
e "baixos".
- Compare o custo previsto com os limites e mostre a
categoria em que o valor se enquadra.
Não. Não é possível criar um modelo de classificação. Os valores de airplane_ticket_cost
são numéricos, não categóricos.
Com um pouco de trabalho, você pode criar um modelo de classificação.
Não. Os modelos de classificação só preveem duas categorias, como
spam
ou not_spam
. Esse modelo precisaria prever
três categorias.
Os modelos de classificação podem prever várias categorias. Eles são chamados de modelos de classificação multiclasse.
Treinamento e avaliação
Depois de treinar um modelo, avaliamos usando um conjunto de dados com exemplos rotulados
e comparamos o valor previsto do modelo com o valor real do rótulo.
Selecione as duas melhores respostas para a pergunta.
Se as previsões do modelo estiverem muito distantes, o que você pode fazer para melhorá-las?
Treine o modelo novamente, mas use apenas os recursos que você acredita ter o maior poder de previsão para o rótulo.
Treinar o modelo novamente com menos atributos, mas com mais poder de previsão, pode produzir um modelo que faça previsões melhores.
Não é possível corrigir um modelo com previsões muito distantes.
É possível corrigir um modelo com previsões incorretas. A maioria dos modelos exige várias rodadas de treinamento até fazer previsões úteis.
Treine o modelo novamente usando um conjunto de dados maior e mais diverso.
Os modelos treinados em conjuntos de dados com mais exemplos e uma faixa mais ampla de valores podem produzir previsões melhores porque têm uma solução mais generalizada para a relação entre os recursos e o rótulo.
Tente uma abordagem de treinamento diferente. Por exemplo, se você usou uma abordagem supervisionada, tente uma abordagem não supervisionada.
Uma abordagem de treinamento diferente não produziria previsões melhores.
Agora você está pronto para dar o próximo passo na sua jornada de ML:
Guia Pessoas + IA. Se você estiver
procurando um conjunto de métodos, práticas recomendadas e exemplos apresentados por
Googlers, especialistas do setor e pesquisas acadêmicas para usar a ML.
Definição do problema. Se você está procurando
uma abordagem testada em campo para criar modelos de ML e evitar armadilhas comuns
pelo caminho.
Curso intensivo de machine learning. Se você estiver
pronto para uma abordagem prática e detalhada para aprender mais sobre ML.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-07-27 UTC.
[null,null,["Última atualização 2025-07-27 UTC."],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["# Test Your Understanding\n\n\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n----------------\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n------------------------------------\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n-----------------------\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]