מהי למידה חישובית?

למידת מכונה (ML) מאפשרת לנו להשתמש בחלק מהטכנולוגיות החשובות ביותר, החל מאפליקציות תרגום ועד לכלי רכב אוטונומיים. הקורס הזה מסביר את המושגים המרכזיים של למידת מכונה.

למידת מכונה היא דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. באמצעות למידת מכונה אפשר לחזות את מזג האוויר, להעריך זמני נסיעה, להמליץ על שירים, להשלים אוטומטית משפטים, לסכם מאמרים וליצור תמונות שלא נראו קודם.

באופן בסיסי, למידת מכונה היא תהליך של אימון תוכנה שנקראת מודל, כדי לבצע תחזיות מועילות או ליצור תוכן מנתונים.

לדוגמה, נניח שאנחנו רוצים ליצור אפליקציה לחיזוי כמות המשקעים. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. בגישה רגילה, היינו יוצרים ייצוג פיזי של האטמוספירה והמשטח של כדור הארץ, ומחשבים כמויות אדירות של משוואות דינמיקה של נוזלים. זה קשה מאוד.

באמצעות גישה של למידת מכונה, נוכל לספק למודל למידת מכונה כמויות אדירות של נתוני מזג אוויר, עד שהוא ילמד את הקשר המתמטי בין דפוסי מזג האוויר שגורמים לכמויות שונות של גשם. לאחר מכן נוסיף למודל את נתוני מזג האוויר הנוכחיים, והוא יחזה את כמות הגשם.

בדיקת ההבנה

מהו 'מודל' בלמידת מכונה?
מודל הוא יחס מתמטי שמבוסס על נתונים שבהם מערכת למידת המכונה משתמשת כדי לבצע תחזיות
מודל הוא חלק מחומרת המחשב
מודל הוא ייצוג קטן יותר של הנושא שאתם חוקרים.

סוגי מערכות למידת מכונה

מערכות למידת מכונה נכללות באחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע תחזיות או ליצור תוכן:

  • למידה מונחית
  • למידה בלתי מונחית
  • למידה חיזוקים
  • ‫AI גנרטיבי

למידה מונחית

מודלים של למידה בפיקוח יכולים לבצע תחזיות אחרי שהם רואים הרבה נתונים עם התשובות הנכונות, ולאחר מכן מגלים את הקשרים בין הרכיבים בנתונים שמניבים את התשובות הנכונות. זה כמו תלמיד שמלמד את עצמו חומר חדש על ידי לימוד מבחנים ישנים שמכילים גם שאלות וגם תשובות. אחרי שהתלמידים מתאמנים על מספיק בחינות ישנות, הם מוכנים היטב לבחינה חדשה. מערכות ה-ML האלה הן 'מודרכות' במובן שאדם נותן למערכת ה-ML נתונים עם התוצאות הנכונות הידועות.

שניים מתרחישי השימוש הנפוצים ביותר בלמידה בפיקוח הם רגרסיה וסיווג.

רגרסיה

מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שמתאר את כמות הגשם, בסנטימטרים או במילימטרים, הוא מודל רגרסיה.

בטבלה הבאה מפורטות דוגמאות נוספות למודלים של רגרסיה:

תרחיש נתוני קלט אפשריים חיזוי מספרי
מחיר הבית בעתיד שטח בגודל רגל מרובע, מיקוד, מספר חדרי שינה וחדרי אמבטיה, גודל המגרש, שיעור הריבית על המשכנתה, שיעור מס הנכס, עלויות הבנייה ומספר הבתים למכירה באזור. מחיר הבית.
מועד הנסיעה העתידי תנאי התנועה ההיסטוריים (שנאספים מסמארטפונים, מחזישני תנועה, מאפליקציות לשירותי נסיעה ומאפליקציות ניווט אחרות), המרחק ליעד ותנאי מזג האוויר. משך הזמן, בדקות ובשניות, עד להגעה ליעד.

סיווג

מודלים של סיווג צופים את הסבירות שדבר מסוים ייכלל בקטגוריה מסוימת. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, מודל הסיווג מניב ערך שמציין אם משהו שייך לקטגוריה מסוימת או לא. לדוגמה, מודל סיווג משמש לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.

מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-רמות. מודלים של סיווג בינארי מניבים ערך מתוך קטגוריה שמכילה רק שני ערכים, לדוגמה, מודל שמניב את הערך rain או את הערך no rain. מודלים של סיווג בכמה כיתות מניבים ערך מכיתה שמכילה יותר משני ערכים. לדוגמה, מודל שיכול להפיק את הערכים rain,‏ hail,‏ snow או sleet.

בדיקת ההבנה

אם רוצים להשתמש במודל למידת מכונה כדי לחזות את צריכת האנרגיה במבנים מסחריים, באיזה סוג של מודל משתמשים?
רגרסיה
צריכת האנרגיה נמדדת בקילוואט-שעה (kWh), שהוא מספר, ולכן צריך להשתמש במודל רגרסיה.
סיווג
מודלים של סיווג צופים אם משהו שייך לקטגוריה או לא, בעוד שמודלים של רגרסיה צופים מספר. מכיוון שצריכת האנרגיה נמדדת בקילוואט-שעה (kWh), שהיא מספר, כדאי להשתמש במודל רגרסיה.

למידה בלתי מונחית

מודלים של למידה בלתי מפוקחת מבצעים חיזויים על סמך נתונים שלא מכילים תשובות נכונות. המטרה של מודל למידה בלתי מונחית היא לזהות דפוסים משמעותיים בנתונים. במילים אחרות, אין למודל רמזים לגבי סיווג כל נתון, אלא הוא צריך להסיק את הכללים שלו בעצמו.

מודל נפוץ של למידה בלתי מונחית משתמש בשיטה שנקראת קיבוץ. המודל מוצא נקודות נתונים שמסמנות קיבוצים טבעיים.

תמונה שבה מוצגים נקודות צבעוניות בצבירים.

איור 1. מודל למידת מכונה (ML) שמקבץ נקודות נתונים דומות.

תמונה שבה מוצגים נקודות צבעוניות בצבירים שמוקפים בצורה ומחוברים זה לזה.

איור 2. קבוצות של אשכולות עם תחומים מוגדרים.

הקיבוץ שונה מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל ללא הדרכה עשוי לקבץ קבוצת נתונים של מזג אוויר על סמך הטמפרטורה, וכך לחשוף פילוח שמגדיר את עונות השנה. לאחר מכן תוכלו לנסות לתת שמות לאשכולות האלה על סמך ההבנה שלכם לגבי מערך הנתונים.

תמונה שבה מוצגות נקודות צבעוניות בצבעים שונים, עם תוויות של שלג, גשם, ברד ואין גשם.

איור 3. מודל ML שמקבץ דפוסי מזג אוויר דומים.

תמונה שבה מוצגות נקודות צבעוניות בצבעים שונים, שמסומנות בתווית 'שלג', 'גשם', 'גשם גרעיני' ו'אין גשם', שמוקפות בצורה מסוימת ומחוברות זו לזו.

איור 4. אשכולות של דפוסי מזג אוויר שמסומנים בתווית 'שלג', 'גשם', 'גשם מעורב בשלג' ו'ללא גשם'.

בדיקת ההבנה

מה ההבדל בין גישה בפיקוח לבין גישה ללא פיקוח?
בגישה בפיקוח, ניתנים נתונים שמכילים את התשובה הנכונה.
בגישה בפיקוח, ניתנים נתונים שמכילים את התשובה הנכונה. תפקיד המודל הוא למצוא חיבורים בנתונים שמניבים את התשובה הנכונה. בגישה ללא הדרכה, המערכת מקבלת נתונים ללא התשובה הנכונה. התפקיד שלו הוא למצוא קיבוצים בנתונים.
בדרך כלל, בגישה בפיקוח נעשה שימוש בצבירה.
בגישה ללא הדרכה נעשה שימוש בצבירה.
גישה ללא הדרכה יודעת לתייג אשכולות של נתונים.
בגישה ללא הדרכה, לא ידוע מה המשמעות של אשכולות הנתונים. על סמך ההבנה שלכם לגבי הנתונים, אתם יכולים להגדיר אותם.

למידה חיזוקים

מודלים של למידת חיזוק מבצעים תחזיות על סמך תגמולים או קנסות על סמך פעולות שמבוצעות בסביבה. מערכת למידה לחיזוק יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר לקבלת כמה שיותר פרסים.

למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר, ותוכנות תוכנה כמו AlphaGo לשחק במשחק Go.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, AI גנרטיבי יכול ליצור תמונות, קומפוזיציות מוזיקה וגם בדיחות ייחודיות. הוא יכול לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.

בינה מלאכותית גנרטיבית יכולה לקבל מגוון מקורות קלט וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו וסרטונים. הוא יכול גם ליצור שילובים שלהם. לדוגמה, מודל יכול לקבל תמונה כקלט וליצור תמונה וטקסט כפלט, או לקבל תמונה וטקסט כקלט וליצור סרטון כפלט.

אפשר לדבר על מודלים גנרטיביים לפי הקלט והפלט שלהם, שבדרך כלל נכתבים בתור 'סוג הקלט'-ל'סוג הפלט'. לדוגמה, הרשימה הבאה היא רשימה חלקית של חלק מהקלט והפלט של מודלים גנרטיביים:

  • טקסט לטקסט
  • טקסט לתמונה
  • טקסט לווידאו
  • טקסט לקוד
  • טקסט לדיבור
  • תמונה וטקסט לתמונה

בטבלה הבאה מפורטות דוגמאות למודלים גנרטיביים, הקלט שלהם ודוגמה לפלט האפשרי שלהם:

דגם קלט פלט לדוגמה
טקסט לטקסט מי המציא את מרוץ לה מאן? מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (ACO), ארגון רכב שנוסד בשנת 1906. המרוץ הראשון התקיים ב-26 וב-27 במאי 1923 במסלול Sarthe, מסלול דרכים באורך 13.426 ק"מ (8.345 מייל) שנמצא ליד העיירה לה מאן בצרפת. המרוץ נוצר במקור כדרך לקדם את ACO ואת אזור Sarthe.
מקור: Bard
טקסט לתמונה תמנון חייזרי צף דרך פורטל בזמן שהוא קורא עיתון. תמונה של תמנון מצוייר.
מקור: Imagen
טקסט לווידאו דובון פוטו-ריאליסטי שוחה באוקיינוס בסן פרנסיסקו. הדובי נכנס למים. הדובי ממשיך לשחות מתחת למים עם דגים צבעוניים. דוב פנדה שוחה מתחת למים. סרטון של דובי שחייה מתחת למים.
מקור: Phenaki
טקסט לקוד כתיבה של לולאה ב-Python שמריצה לולאה על רשימת מספרים ומדפיסה את המספרים הראשוניים.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

מקור: Bard
המרת תמונה לטקסט תמונה של פלמינגו. זוהי פלמינגו. הם נמצאים באיים הקריביים.
מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? ברמה גבוהה, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה ליצור נתונים חדשים אך דומים. מודלים גנרטיביים הם כמו:

  • קומיקאים שמלמדים את עצמם לחקות אנשים על ידי התבוננות בהתנהגות ובסגנון הדיבור שלהם
  • אומנים שלומדים לצייר בסגנון מסוים על ידי לימוד של הרבה ציורים בסגנון הזה
  • להקות קאברים שמלמדות את עצמן לנגן כמו להקת מוזיקה ספציפית על ידי האזנה להרבה מוזיקה של הלהקה הזו

כדי ליצור תוצרים ייחודיים וקריאייטיביים, המודלים הגנרטיביים עוברים אימון ראשוני באמצעות גישה ללא הדרכה, שבה המודל לומד לחקות את הנתונים שעליהם הוא מתאמן. לפעמים המודל עובר אימון נוסף באמצעות למידה מבוקרת או למידה לחיזוק על נתונים ספציפיים שקשורים למשימות שהמודל עשוי לבצע, למשל סיכום של מאמר או עריכת תמונה.

AI גנרטיבי הוא טכנולוגיה שמתפתחת במהירות, ומתגלים כל הזמן תרחישים חדשים לשימוש בה. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את תמונות המוצרים שלהם בתחום המסחר האלקטרוני על ידי הסרה אוטומטית של עיוותים ברקע או שיפור האיכות של תמונות ברזולוציה נמוכה.