בחינת ההבנה שלכם
קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
השאלות הבאות יעזרו לכם לחדד את ההבנה שלכם לגבי מושגי הליבה של למידת המכונה.
יכולת חיזוי
מודלים של למידת מכונה (ML) בפיקוח עוברים אימון באמצעות מערכי נתונים עם דוגמאות מתויגות. המודל לומד לחזות את התווית מהמאפיינים. עם זאת, לא לכל מאפיין בקבוצת נתונים יש יכולת חיזוי. במקרים מסוימים, רק כמה תכונות משמשות כחזויות לתיוג. במערך הנתונים שבהמשך, משתמשים במחיר בתור התווית ובעמודות הנותרות בתור המאפיינים.
לדעתך, אילו שלוש תכונות הן הסבירות ביותר לחזות את מחיר הרכב?
Make_model, year, miles.
סביר להניח ששם היצרן, הדגם, שנת הייצור והקילומטראז' של הרכב הם בין הגורמים החזקים ביותר שמשפיעים על המחיר שלו.
Color, height, make_model.
הגובה והצבע של הרכב הם לא גורמים חזקים שמשפיעים על המחיר שלו.
Miles, gearbox, make_model.
תיבת ההילוכים היא לא גורם עיקרי שמשפיע על המחיר.
Tire_size, wheel_base, year.
גודל הצמיגים ובסיס הגלגלים הם לא גורמים חזקים שמשפיעים על מחיר הרכב.
למידה מונחית ולא מונחית
בהתאם לבעיה, תשתמשו בגישה בפיקוח או ללא פיקוח.
לדוגמה, אם אתם יודעים מראש את הערך או הקטגוריה שאתם רוצים לחזות, תוכלו להשתמש בלמידה בפיקוח. עם זאת, אם רוצים לדעת אם מערך הנתונים מכיל פילוח או קיבוץ של דוגמאות קשורות, צריך להשתמש בלמידה ללא הדרכה.
נניח שיש לכם מערך נתונים של משתמשים באתר של קניות אונליין, והוא מכיל את העמודות הבאות:
אם תרצו להבין את סוגי המשתמשים שמבקרים באתר, האם תשתמשו בלמידה בפיקוח או בלמידה ללא פיקוח?
למידה לא מפוקחת.
אנחנו רוצים שהמודל יקבץ קבוצות של לקוחות קשורים, ולכן נשתמש בלמידה ללא הדרכה. אחרי שהמודל יקיבוץ את המשתמשים, נגדיר שמות משותפים לכל אשכול, למשל 'מחפשי הנחות', 'ציידי מבצעים', 'גולשים', 'נאמנים' ו'נודדים'.
למידה בפיקוח, כי אני מנסה לחזות לאיזו כיתה משתייך המשתמש.
בלמידה מבוקרת, מערך הנתונים צריך לכלול את התווית שאתם מנסים לחזות. אין במערך הנתונים תווית שמפנה לקטגוריה של משתמש.
נניח שיש לכם מערך נתונים של שימוש באנרגיה בבתים עם העמודות הבאות:
באיזה סוג של למידת מכונה היית משתמש כדי לחזות את מספר שעות הקילוואט שנעשה בהן שימוש בשנה בבית שנבנה לאחרונה?
למידה מפוקחת.
למידה בפיקוח מתבצעת על דוגמאות מתויגות. במערך הנתונים הזה, התווית תהיה 'קילוואט-שעה בשימוש בשנה' כי זה הערך שרוצים שהמודל יחזה. התכונות יהיו: 'שטח בנוי', 'מיקום' ו'שנת בנייה'.
למידה לא מפוקחת.
בלמידה בלתי מונחית נעשה שימוש בדוגמאות לא מתויגות. בדוגמה הזו, התווית תהיה 'קילוואט-שעה בשנה' כי זה הערך שרוצים שהמודל יחזה.
נניח שיש לכם מערך נתונים של טיסות עם העמודות הבאות:
אם רוצים לחזות את העלות של כרטיס טיסה, משתמשים ברגרסיה או בסיווג?
רגרסיה
הפלט של מודל רגרסיה הוא ערך מספרי.
סיווג
הפלט של מודל סיווג הוא ערך בדיד, בדרך כלל מילה. במקרה הזה, העלות של כרטיס טיסה היא ערך מספרי.
על סמך מערך הנתונים, האם אפשר לאמן מודל סיווג כדי לסווג את העלות של כרטיס טיסה כ'גבוהה', 'ממוצעת' או 'נמוכה'?
כן, אבל קודם כול צריך להמיר את הערכים המספריים בעמודה airplane_ticket_cost
לערכים קטגוריאליים.
אפשר ליצור מודל סיווג ממערך הנתונים.
מבצעים את הפעולות הבאות:
- חיפוש העלות הממוצעת של כרטיס משדה התעופה של המוצא לשדה התעופה של היעד.
- קובעים את ערכי הסף שייחשבו כ'גבוה', 'ממוצע' ו'נמוך'.
- השוואת העלות הצפויה לערכי הסף והצגת הקטגוריה שבה נמצא הערך.
לא. אי אפשר ליצור מודל סיווג. הערכים של airplane_ticket_cost
הם מספריים ולא קטגוריים.
עם קצת עבודה, תוכלו ליצור מודל סיווג.
לא. מודלים של סיווג צופים רק שתי קטגוריות, כמו spam
או not_spam
. המודל הזה יצטרך לחזות שלוש קטגוריות.
מודלים של סיווג יכולים לחזות כמה קטגוריות. הם נקראים מודלים של סיווג רב-רמות.
אימון והערכה
אחרי שאנחנו מארגנים מודל, אנחנו מעריכים אותו באמצעות מערך נתונים עם דוגמאות מתויגות, ומשווים את הערך המשוער של המודל לערך בפועל של התווית.
בוחרים את שתי התשובות הטובות ביותר לשאלה.
אם התחזיות של המודל שגויות, מה אפשר לעשות כדי לשפר אותן?
מאומנים מחדש את המודל, אבל משתמשים רק בתכונות שלדעתכם יש להן את יכולת החיזוי החזקה ביותר של התווית.
אימון מחדש של המודל עם פחות תכונות, אבל עם יותר יכולת חיזוי, יכול להניב מודל שמבצע חיזויים טובים יותר.
אי אפשר לתקן מודל שהתחזיות שלו שגויות.
אפשר לתקן מודל שהתחזיות שלו שגויות. רוב המודלים דורשים כמה מחזורי אימון עד שהם מספקים תחזיות שימושיות.
מאומנים מחדש את המודל באמצעות מערך נתונים גדול ומגוון יותר.
מודלים שמותאמים על סמך מערכי נתונים עם יותר דוגמאות ומגוון רחב יותר של ערכים יכולים לספק תחזיות טובות יותר, כי למודל יש פתרון כללי טוב יותר לקשר בין המאפיינים לבין התווית.
נסו גישה אחרת לאימון. לדוגמה, אם השתמשתם בגישה בפיקוח, נסו גישה ללא פיקוח.
גישה שונה של אימון לא תניב תחזיות טובות יותר.
עכשיו אתם מוכנים לעבור לשלב הבא במסע שלכם ב-ML:
מדריך לאנשים ו-AI אם אתם מחפשים קבוצה של שיטות, שיטות מומלצות ודוגמאות לשימוש ב-ML, שמוצגות על ידי גוגלרים, מומחים בתעשייה ומחקרים אקדמיים.
מסגור הבעיה. אם אתם מחפשים גישה שנבדקה בשטח ליצירת מודלים של למידת מכונה ולהימנעות ממלכודות נפוצות.
קורס מקוצר על למידת מכונה אם אתם מוכנים ללמוד על למידת מכונה בצורה מעמיקה ומעשית.
אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers. Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.
עדכון אחרון: 2025-07-27 (שעון UTC).
[null,null,["עדכון אחרון: 2025-07-27 (שעון UTC)."],[[["\u003cp\u003eThis page tests your understanding of core machine learning (ML) concepts through interactive questions.\u003c/p\u003e\n"],["\u003cp\u003eIt covers fundamental ML topics such as predictive power of features, supervised and unsupervised learning, and model training and evaluation.\u003c/p\u003e\n"],["\u003cp\u003eYou'll learn how to choose the right ML approach for different problems and assess the effectiveness of a trained model.\u003c/p\u003e\n"],["\u003cp\u003eLinks to further resources are provided to deepen your understanding of ML and its practical applications.\u003c/p\u003e\n"]]],[],null,["# Test Your Understanding\n\n\u003cbr /\u003e\n\nThe following questions help you solidify your understanding of core ML concepts.\n\nPredictive power\n----------------\n\nSupervised ML models are trained using datasets with labeled examples. The model\nlearns how to predict the label from the features. However, not every feature in\na dataset has predictive power. In some instances, only a few features act as\npredictors of the label. In the dataset below, use price as the label\nand the remaining columns as the features.\n\nWhich three features do you think are likely the greatest predictors for a car's price? \nMake_model, year, miles. \nA car's make/model, year, and miles are likely to be among the strongest predictors for its price. \nColor, height, make_model. \nA car's height and color are not strong predictors for a car's price. \nMiles, gearbox, make_model. \nThe gearbox isn't a main predictor of price. \nTire_size, wheel_base, year. \nTire size and wheel base aren't strong predictors for a car's price.\n\nSupervised and unsupervised learning\n------------------------------------\n\nBased on the problem, you'll use either a supervised or unsupervised approach.\nFor example, if you know beforehand the value or category you want to predict,\nyou'd use supervised learning. However, if you wanted to learn if your dataset\ncontains any segmentations or groupings of related examples, you'd use\nunsupervised learning.\n\nSuppose you had a dataset of users for an online shopping website, and it contained the following columns:\n\nIf you wanted to understand the types of users that visit the site, would you use supervised or unsupervised learning? \nUnsupervised learning. \nBecause we want the model to cluster groups of related customers, we'd use unsupervised learning. After the model clustered the users, we'd create our own names for each cluster, for example, \"discount seekers,\" \"deal hunters,\" \"surfers,\" \"loyal,\" and \"wanderers.\" \nSupervised learning because I'm trying to predict which class a user belongs to. \nIn supervised learning, the dataset must contain the label you're trying to predict. In the dataset, there is no label that refers to a category of user.\n\nSuppose you had an energy usage dataset for homes with the following columns:\n\nWhat type of ML would you use to predict the kilowatt hours used per year for a newly constructed house? \nSupervised learning. \nSupervised learning trains on labeled examples. In this dataset \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict. The features would be \"square footage,\" \"location,\" and \"year built.\" \nUnsupervised learning. \nUnsupervised learning uses unlabeled examples. In this example, \"kilowatt hours used per year\" would be the label because this is the value you want the model to predict.\n\nSuppose you had a flight dataset with the following columns:\n\nIf you wanted to predict the cost of an airplane ticket, would you use regression or classification? \nRegression \nA regression model's output is a numeric value. \nClassification \nA classification model's output is a discrete value, normally a word. In this case, the cost of an airplane ticket is a numeric value. \nBased on the dataset, could you train a classification model to classify the cost of an airplane ticket as \"high,\" \"average,\" or \"low\"? \nYes, but we'd first need to convert the numeric values in the `airplane_ticket_cost` column to categorical values. \nIt's possible to create a classification model from the dataset. You would do something like the following:\n\n1. Find the average cost of a ticket from the departure airport to the destination airport.\n2. Determine the thresholds that would constitute \"high,\" \"average,\" and \"low\".\n3. Compare the predicted cost to the thresholds and output the category the value falls within. \nNo. It's not possible to create a classification model. The `airplane_ticket_cost` values are numeric not categorical. \nWith a little bit of work, you could create a classification model. \nNo. Classification models only predict two categories, like `spam` or `not_spam`. This model would need to predict three categories. \nClassification models can predict multiple categories. They're called multiclass classification models.\n\nTraining and evaluating\n-----------------------\n\nAfter we've trained a model, we evaluate it by using a dataset with labeled examples\nand compare the model's predicted value to the label's actual value.\n\nSelect the two best answers for the question. \nIf the model's predictions are far off, what might you do to make them better? \nRetrain the model, but use only the features you believe have the strongest predictive power for the label. \nRetraining the model with fewer features, but that have more predictive power, can produce a model that makes better predictions. \nYou can't fix a model whose predictions are far off. \nIt's possible to fix a model whose predictions are off. Most models require multiple rounds of training until they make useful predictions. \nRetrain the model using a larger and more diverse dataset. \nModels trained on datasets with more examples and a wider range of values can produce better predictions because the model has a better generalized solution for the relationship between the features and the label. \nTry a different training approach. For example, if you used a supervised approach, try an unsupervised approach. \nA different training approach would not produce better predictions.\n\nYou're now ready to take the next step in your ML journey:\n\n- [People + AI Guidebook](https://pair.withgoogle.com/guidebook/). If you're\n looking for a set of methods, best practices and examples presented by\n Googlers, industry experts, and academic research for using ML.\n\n- [Problem Framing](/machine-learning/problem-framing). If you're looking for\n a field-tested approach for creating ML models and avoiding common pitfalls\n along the way.\n\n- [Machine Learning Crash Course](/machine-learning/crash-course). If you're\n ready for an in-depth and hands-on approach to learning more about ML."]]