דף זה תורגם על ידי Cloud Translation API.

מהי למידה חישובית?

למידת מכונה (ML) מאפשרת לנו להשתמש בחלק מהטכנולוגיות החשובות ביותר, החל מאפליקציות תרגום ועד לכלי רכב אוטונומיים. הקורס הזה מסביר את המושגים המרכזיים של למידת מכונה.

למידת מכונה היא דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. באמצעות למידת מכונה אפשר לחזות את מזג האוויר, להעריך זמני נסיעה, להמליץ על שירים, להשלים אוטומטית משפטים, לסכם מאמרים וליצור תמונות שלא נראו קודם.

באופן בסיסי, למידת מכונה היא תהליך של אימון תוכנה שנקראת מודל, כדי לבצע תחזיות מועילות או ליצור תוכן מנתונים.

לדוגמה, נניח שאנחנו רוצים ליצור אפליקציה לחיזוי כמות המשקעים. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. בגישה רגילה, היינו יוצרים ייצוג פיזי של האטמוספירה והמשטח של כדור הארץ, ומחשבים כמויות אדירות של משוואות דינמיקה של נוזלים. זה קשה מאוד.

באמצעות גישה של למידת מכונה, נוכל לספק למודל למידת מכונה כמויות אדירות של נתוני מזג אוויר, עד שהוא ילמד את הקשר המתמטי בין דפוסי מזג האוויר שגורמים לכמויות שונות של גשם. לאחר מכן נוסיף למודל את נתוני מזג האוויר הנוכחיים, והוא יחזה את כמות הגשם.

בדיקת ההבנה

מהו 'מודל' בלמידת מכונה?

מודל הוא יחס מתמטי שמבוסס על נתונים שבהם מערכת למידת המכונה משתמשת כדי לבצע תחזיות

מודל הוא חלק מחומרת המחשב

מודל הוא ייצוג קטן יותר של הנושא שאתם חוקרים.

סוגי מערכות למידת מכונה

מערכות למידת מכונה נכללות באחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע תחזיות או ליצור תוכן:

למידה מונחית
למידה בלתי מונחית
למידה חיזוקים
‫AI גנרטיבי

למידה מונחית

מודלים של למידה בפיקוח יכולים לבצע תחזיות אחרי שהם רואים הרבה נתונים עם התשובות הנכונות, ולאחר מכן מגלים את הקשרים בין הרכיבים בנתונים שמניבים את התשובות הנכונות. זה כמו תלמיד שמלמד את עצמו חומר חדש על ידי לימוד מבחנים ישנים שמכילים גם שאלות וגם תשובות. אחרי שהתלמידים מתאמנים על מספיק בחינות ישנות, הם מוכנים היטב לבחינה חדשה. מערכות ה-ML האלה הן 'מודרכות' במובן שאדם נותן למערכת ה-ML נתונים עם התוצאות הנכונות הידועות.

שניים מתרחישי השימוש הנפוצים ביותר בלמידה בפיקוח הם רגרסיה וסיווג.

רגרסיה

מודל רגרסיה מנבא ערך מספרי. לדוגמה, מודל מזג אוויר שמתאר את כמות הגשם, בסנטימטרים או במילימטרים, הוא מודל רגרסיה.

בטבלה הבאה מפורטות דוגמאות נוספות למודלים של רגרסיה:

תרחיש	נתוני קלט אפשריים	חיזוי מספרי
מחיר הבית בעתיד	שטח בגודל רגל רבוע, מיקוד, מספר חדרי שינה וחדרי אמבטיה, גודל המגרש, שיעור הריבית על המשכנתה, שיעור מס הנכס, עלויות הבנייה ומספר הבתים למכירה באזור.	מחיר הבית.
מועד הנסיעה העתידי	תנאי התנועה ההיסטוריים (שנאספים מסמארטפונים, מחזישני תנועה, מאפליקציות לשירותי נסיעה ומאפליקציות ניווט אחרות), המרחק ליעד ותנאי מזג האוויר.	משך הזמן, בדקות ובשניות, עד להגעה ליעד.

סיווג

מודלים של סיווג צופים את הסבירות שדבר מסוים ייכלל בקטגוריה מסוימת. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, מודל הסיווג מניב ערך שמציין אם משהו שייך לקטגוריה מסוימת או לא. לדוגמה, מודל סיווג משמש לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.

מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-רמות. מודלים של סיווג בינארי מניבים ערך מתוך קטגוריה שמכילה רק שני ערכים, לדוגמה, מודל שמניב את הערך rain או את הערך no rain. מודלים של סיווג בכמה כיתות מניבים ערך מכיתה שמכילה יותר משני ערכים. לדוגמה, מודל שיכול להפיק את הערכים rain,‏ hail,‏ snow או sleet.

בדיקת ההבנה

אם רוצים להשתמש במודל למידת מכונה כדי לחזות את צריכת האנרגיה במבנים מסחריים, באיזה סוג של מודל משתמשים?

רגרסיה

צריכת האנרגיה נמדדת בקילוואט-שעה (kWh), שהוא מספר, ולכן כדאי להשתמש במודל רגרסיה.

סיווג

מודלים של סיווג צופים אם משהו שייך לקטגוריה מסוימת או לא, ואילו מודלים של רגרסיה צופים מספר. מכיוון שצריכת האנרגיה נמדדת בקילוואט-שעה (kWh), שהוא מספר, כדאי להשתמש במודל רגרסיה.

למידה בלתי מונחית

מודלים של למידה בלתי מפוקחת מבצעים חיזויים על סמך נתונים שלא מכילים תשובות נכונות. המטרה של מודל למידה בלתי מונחית היא לזהות דפוסים משמעותיים בנתונים. במילים אחרות, אין למודל רמזים לגבי סיווג כל נתון, אלא הוא צריך להסיק את הכללים שלו בעצמו.

מודל נפוץ של למידה בלתי מונחית משתמש בשיטה שנקראת קיבוץ. המודל מוצא נקודות נתונים שמסמנות קיבוצים טבעיים.

תמונה שבה מוצגים נקודות צבעוניות באשכול.

איור 1. מודל למידת מכונה (ML) שמקבץ נקודות נתונים דומות.

תמונה שבה מוצגים נקודות צבעוניות בצבירים שמקובצים בצורה מסוימת ומחוברים זה לזה.

איור 2. קבוצות של אשכולות עם תחומים מוגדרים.

הקיבוץ שונה מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל ללא הדרכה עשוי לקבץ קבוצת נתונים של מזג אוויר על סמך הטמפרטורה, וכך לחשוף פילוח שמגדיר את עונות השנה. לאחר מכן תוכלו לנסות לתת שמות לאשכולות האלה על סמך ההבנה שלכם לגבי מערך הנתונים.

תמונה שמציגה נקודות צבעוניות בצבעים שונים, עם תוויות של שלג, גשם, ברד ואין גשם.

איור 3. מודל ML שמקבץ דפוסי מזג אוויר דומים.

תמונה שבה מוצגות נקודות צבעוניות בצבעים שונים, שמסומנות בתווית 'שלג', 'גשם', 'גשם גרעיני' ו'אין גשם', שמוקפות בצורה מסוימת ומחוברות זו לזו.

איור 4. אשכולות של דפוסי מזג אוויר שמסומנים בתווית 'שלג', 'גשם', 'גשם מעורב בשלג' ו'ללא גשם'.

בדיקת ההבנה

מה ההבדל בין גישה בפיקוח לבין גישה ללא פיקוח?

בגישה בפיקוח, ניתנים נתונים שמכילים את התשובה הנכונה.

בגישה בפיקוח, ניתנים נתונים שמכילים את התשובה הנכונה. תפקיד המודל הוא למצוא חיבורים בנתונים שמניבים את התשובה הנכונה. בגישה ללא הדרכה, המערכת מקבלת נתונים ללא התשובה הנכונה. התפקיד שלו הוא למצוא קיבוצים בנתונים.

בדרך כלל, בגישה בפיקוח נעשה שימוש בצבירה.

בגישה ללא הדרכה נעשה שימוש בצבירה.

גישה ללא הדרכה יודעת לתייג אשכולות של נתונים.

בגישה ללא הדרכה, לא ידוע מה המשמעות של אשכולות הנתונים. על סמך ההבנה שלכם לגבי הנתונים, אתם יכולים להגדיר אותם.

למידה חיזוקים

מודלים של למידת חיזוק מבצעים תחזיות על סמך תגמולים או קנסות על סמך פעולות שמבוצעות בסביבה. מערכת למידה לחיזוק יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר לקבלת כמה שיותר פרסים.

למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר, ותוכנות תוכנה כמו AlphaGo לשחק במשחק Go.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, AI גנרטיבי יכול ליצור תמונות, קומפוזיציות מוזיקה וגם בדיחות ייחודיות. הוא יכול לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.

בינה מלאכותית גנרטיבית יכולה לקבל מגוון מקורות קלט וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו וסרטונים. הוא יכול גם ליצור שילובים שלהם. לדוגמה, מודל יכול לקבל תמונה כקלט וליצור תמונה וטקסט כפלט, או לקבל תמונה וטקסט כקלט וליצור סרטון כפלט.

אפשר לדבר על מודלים גנרטיביים לפי הקלט והפלט שלהם, שבדרך כלל נכתבים בתור 'סוג הקלט'-ל'סוג הפלט'. לדוגמה, הרשימה הבאה היא רשימה חלקית של חלק מהקלט והפלט של מודלים גנרטיביים:

טקסט לטקסט
טקסט לתמונה
טקסט לווידאו
טקסט לקוד
טקסט לדיבור
תמונה וטקסט לתמונה

בטבלה הבאה מפורטות דוגמאות למודלים גנרטיביים, הקלט שלהם ודוגמה לפלט האפשרי שלהם:

דגם	קלט	פלט לדוגמה
טקסט לטקסט	מי המציא את מרוץ לה מאן?	מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (ACO), ארגון רכב שנוסד בשנת 1906. המרוץ הראשון התקיים ב-26 וב-27 במאי 1923 במסלול Sarthe, מסלול דרכים באורך 13.426 ק"מ (8.345 מייל) שנמצא ליד העיירה לה מאן בצרפת. המרוץ נוצר במקור כדרך לקדם את ACO ואת אזור Sarthe. מקור: Bard
טקסט לתמונה	תמנון חייזרי צף דרך פורטל בזמן שהוא קורא עיתון.	מקור: Imagen
טקסט לווידאו	דובון פוטו-ריאליסטי שוחה באוקיינוס בסן פרנסיסקו. הדובי נכנס למים. הדובי ממשיך לשחות מתחת למים עם דגים צבעוניים. דוב פנדה שוחה מתחת למים.	מקור: Phenaki
טקסט לקוד	כתיבה של לולאה ב-Python שמריצה לולאה על רשימת מספרים ומדפיסה את המספרים הראשוניים.	for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) מקור: Bard
המרת תמונה לטקסט		זהו פלמינגו. הם נמצאים באיים הקריביים. מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? ברמה גבוהה, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה ליצור נתונים חדשים אך דומים. מודלים גנרטיביים הם כמו:

קומיקאים שמחקים אנשים אחרים על ידי התבוננות בהתנהגות ובסגנון הדיבור שלהם
אומנים שלומדים לצייר בסגנון מסוים על ידי לימוד של הרבה ציורים בסגנון הזה
להקות קאברים שמקשיבות להרבה מוזיקה של להקה מסוימת כדי ללמוד איך להישמע כמוה

כדי ליצור תוצרים ייחודיים וקריאייטיביים, המודלים הגנרטיביים עוברים אימון ראשוני באמצעות גישה ללא הדרכה, שבה המודל לומד לחקות את הנתונים שעליהם הוא מתאמן. לפעמים המודלים עוברים אימון נוסף באמצעות למידה מבוקרת או למידה לחיזוק על נתונים ספציפיים שקשורים למשימות שהמודל עשוי לבצע, למשל סיכום של מאמר או עריכת תמונה.

AI גנרטיבי הוא טכנולוגיה שמתפתחת במהירות, ומתגלים כל הזמן תרחישים חדשים לשימוש בה. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את תמונות המוצרים שלהם בתחום המסחר האלקטרוני על ידי הסרה אוטומטית של עיוותים ברקע או שיפור האיכות של תמונות ברזולוציה נמוכה.

מבוא ללמידה חישובית

למידה בפיקוח