מהי למידה חישובית?

למידת מכונה (ML) מפעילה חלק מהטכנולוגיות הכי חשובות שבהן אנחנו משתמשים, מאפליקציות תרגום ועד לכלי רכב אוטונומיים. בקורס הזה מוסברים המושגים הבסיסיים של למידת מכונה.

ה-ML מציע דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. למידת מכונה יכולה לחזות את מזג האוויר, להעריך את משך הנסיעה, להמליץ על שירים, להשלים משפטים באופן אוטומטי, לסכם מאמרים וליצור תמונות שלא נראו אף פעם.

במילים פשוטות, למידת מכונה היא תהליך של אימון תוכנה, שנקראת מודל, כדי ליצור תחזיות שימושיות או ליצור תוכן (כמו טקסט, תמונות, אודיו או וידאו) מנתונים.

לדוגמה, נניח שאנחנו רוצים ליצור אפליקציה לחיזוי גשמים. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. בגישה המסורתית, אנחנו יוצרים ייצוג מבוסס-פיזיקה של האטמוספירה ופני השטח של כדור הארץ, ומבצעים חישובים של כמויות עצומות של משוואות דינמיקה של נוזלים. זה קשה מאוד.

בגישה של למידת מכונה, נותנים למודל למידת מכונה כמויות עצומות של נתוני מזג אוויר עד שהמודל לומד את הקשר המתמטי בין דפוסי מזג אוויר שמייצרים כמויות שונות של גשם. לאחר מכן נספק למודל את נתוני מזג האוויר הנוכחיים, והוא ינבא את כמות הגשם.

בדיקת ההבנה

מהו 'מודל' בלמידת מכונה?
מודל הוא קשר מתמטי שנגזר מנתונים, ומערכת ML משתמשת בו כדי ליצור תחזיות
מודל הוא רכיב חומרה במחשב
מודל הוא ייצוג קטן יותר של הדבר שנבדק.

סוגים של מערכות ML

מערכות ML נחלקות לאחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע חיזויים או ליצור תוכן:

  • למידה מונחית
  • למידה לא מפוקחת
  • למידת חיזוק
  • ‫AI גנרטיבי

למידה מונחית

מודלים של למידה מפוקחת יכולים לבצע חיזויים אחרי שהם מעבדים הרבה נתונים עם התשובות הנכונות, ואז לגלות את הקשרים בין הרכיבים בנתונים שמניבים את התשובות הנכונות. זה כמו שתלמיד לומד חומר חדש על ידי עיון במבחנים ישנים שכוללים גם שאלות וגם תשובות. אחרי שהתלמידים מתרגלים מספיק מבחנים ישנים, הם מוכנים לגשת למבחן חדש. מערכות ה-ML האלה הן "מפוקחות" במובן זה שאדם מספק למערכת ה-ML נתונים עם תוצאות נכונות ידועות.

שני תרחישי השימוש הנפוצים ביותר ללמידה מפוקחת הם רגרסיה וסיווג.

רגרסיה

מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שמנבא את כמות הגשם, באינצ'ים או במילימטרים, הוא מודל רגרסיה.

בטבלה הבאה מופיעות דוגמאות נוספות למודלים של רגרסיה:

תרחיש נתוני קלט אפשריים חיזוי מספרי
מחיר עתידי של בית שטח הבית, המיקוד, מספר חדרי השינה והשירותים, גודל המגרש, שיעור הריבית על המשכנתא, שיעור מס הרכוש, עלויות הבנייה ומספר הבתים למכירה באזור. מחיר הבית.
שעת נסיעה עתידית תנאי התנועה ההיסטוריים (שנאספים מסמארטפונים, מחיישני תנועה, מאפליקציות להזמנת נסיעות ומאפליקציות ניווט אחרות), המרחק מהיעד ותנאי מזג האוויר. הזמן בדקות ובשניות עד להגעה ליעד.

סיווג

מודלים של סיווג חוזים את הסבירות שפריט מסוים שייך לקטגוריה. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, הפלט של מודלים של סיווג הוא ערך שמציין אם פריט מסוים שייך לקטגוריה מסוימת או לא. לדוגמה, מודלים של סיווג משמשים לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.

מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-מחלקתי. מודלים של סיווג בינארי מחזירים ערך ממחלקה שמכילה רק שני ערכים, לדוגמה, מודל שמחזיר rain או no rain. מודלים של סיווג רב-מחלקתי מחזירים ערך ממחלקה שמכילה יותר משני ערכים, לדוגמה, מודל שיכול להחזיר את הערכים rain,‏ hail,‏ snow או sleet.

בדיקת ההבנה

אם היית רוצה להשתמש במודל ML כדי לחזות את צריכת האנרגיה של בניינים מסחריים, באיזה סוג של מודל היית משתמש?
רגרסיה
השימוש באנרגיה נמדד בקילוואט-שעה (kWh), שהוא מספר, ולכן כדאי להשתמש במודל רגרסיה.
סיווג
מודלים של סיווג חוזים אם משהו שייך לקטגוריה מסוימת, ומודלים של רגרסיה חוזים מספר. מכיוון שצריכת האנרגיה נמדדת בקילוואט לשעה (kWh), שהוא מספר, כדאי להשתמש במודל רגרסיה.

למידה לא מפוקחת

מודלים של למידה לא מפוקחת חוזים תוצאות על סמך נתונים שלא מכילים תשובות נכונות. המטרה של מודל למידה בלתי מונחית היא לזהות דפוסים משמעותיים בנתונים. במילים אחרות, המודל לא מקבל רמזים לגבי האופן שבו צריך לסווג כל נתון, אלא צריך להסיק את הכללים בעצמו.

מודל נפוץ של למידה בלתי מונחית משתמש בטכניקה שנקראת אשכולות. המודל מוצא נקודות נתונים שמגדירות קיבוצים טבעיים.

תמונה שבה רואים נקודות צבעוניות באשכולות.

איור 1. מודל ML שמבצע אשכול של נקודות נתונים דומות.

תמונה שבה רואים נקודות צבעוניות באשכולות, שמוקפות בצורה וגובלות זו בזו.

איור 2. קבוצות של אשכולות עם גבולות טבעיים.

האשכולות שונים מהסיווגים כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל לא מפוקח עשוי לבצע אשכול של מערך נתונים של מזג האוויר על סמך הטמפרטורה, ולחשוף פילוחים שמגדירים את העונות. אחר כך תוכלו לנסות לתת שמות לאשכולות האלה על סמך ההבנה שלכם לגבי מערך הנתונים.

תמונה שבה רואים נקודות צבעוניות באשכולות עם התוויות 'שלג', 'גשם', 'ברד' ו'ללא גשם'.

איור 3. מודל ML שמבצע אשכול של דפוסי מזג אוויר דומים.

תמונה שבה רואים נקודות צבעוניות באשכולות עם התוויות 'שלג', 'גשם', 'ברד' ו'ללא גשם', שמוקפות בצורה וגובלות זו בזו.

איור 4. אוספים של דפוסי מזג אוויר שמסומנים כשלג, גשם מעורב בשלג, גשם וללא גשם.

בדיקת ההבנה

מה ההבדל בין גישה בפיקוח לבין גישה ללא פיקוח?
בגישה מבוקרת, המערכת מקבלת נתונים שמכילים את התשובה הנכונה.
בגישה מבוקרת, המערכת מקבלת נתונים שמכילים את התשובה הנכונה. המטרה של המודל היא למצוא קשרים בנתונים שיובילו לתשובה הנכונה. בגישה לא מפוקחת, המודל מקבל נתונים ללא התשובה הנכונה. התפקיד שלו הוא למצוא קיבוצים בנתונים.
בגישה מבוקרת נעשה בדרך כלל שימוש באשכולות.
גישה לא מפוקחת משתמשת באשכולות.
גישה לא מפוקחת יודעת איך לתייג אשכולות של נתונים.
גישה לא מפוקחת לא יודעת מה המשמעות של אשכולות הנתונים. ההגדרה שלהם תלויה בהבנה שלכם את הנתונים.

למידת חיזוק

מודלים של למידת חיזוק מפיקים תחזיות על ידי קבלת תגמולים או עונשים על סמך פעולות שבוצעו בסביבה מסוימת. מערכת למידת חיזוקים יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר להשגת התגמולים המקסימליים.

למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר, ולתוכנות כמו AlphaGo כדי לשחק במשחק Go.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, בינה מלאכותית גנרטיבית יכולה ליצור תמונות ייחודיות, יצירות מוזיקליות ובדיחות, לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.

בינה מלאכותית גנרטיבית יכולה לקבל מגוון קלטים וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו ווידאו. הוא יכול גם ליצור שילובים של אלה. לדוגמה, מודל יכול לקבל תמונה כקלט וליצור תמונה וטקסט כפלט, או לקבל תמונה וטקסט כקלט וליצור סרטון כפלט.

אפשר לדון במודלים גנרטיביים לפי הקלט והפלט שלהם, בדרך כלל בצורה של 'סוג הקלט' ל'סוג הפלט'. לדוגמה, זו רשימה חלקית של כמה קלטים ופלטים של מודלים גנרטיביים:

  • טקסט לטקסט
  • טקסט לתמונה
  • טקסט לווידאו
  • טקסט לקוד
  • טקסט לדיבור
  • תמונה וטקסט לתמונה

בטבלה הבאה מוצגות דוגמאות למודלים גנרטיביים, לקלט שלהם ולפלט האפשרי שלהם:

דגם קלט פלט לדוגמה
טקסט לטקסט מי המציא את מרוץ לה מאן? מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (מועדון הרכב של המערב, ACO), ארגון רכב שנוסד בשנת 1906. המרוץ הראשון התקיים ב-26 וב-27 במאי 1923 במסלול סארת', מסלול כביש באורך 13.426 ק"מ (8.345 מייל) שנמצא ליד העיירה לה מאן בצרפת. המרוץ נוצר במקור כדרך לקדם את ACO ואת אזור סארט.
מקור: Bard
טקסט לתמונה תמנון חייזרי צף דרך פורטל בזמן שהוא קורא עיתון. תמונה של תמנון מצויר.
מקור: Imagen
טקסט לווידאו תמונה פוטו-ריאליסטית של דובון ששוחה באוקיינוס בסן פרנסיסקו. הדובי נכנס מתחת למים. דובון שוחה מתחת למים עם דגים צבעוניים. פנדה שוחה מתחת למים. סרטון של דובי שוחה מתחת למים.
מקור: Phenaki
טקסט לקוד כתוב לולאת Python שחוזרת על רשימה של מספרים ומדפיסה את המספרים הראשוניים.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

מקור: Bard
תמונה לטקסט תמונה של פלמינגו. This is a flamingo. הם נמצאים באיים הקריביים.
מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? באופן כללי, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה ליצור נתונים חדשים אבל דומים. דוגמאות למודלים גנרטיביים:

  • קומיקאים שלומדים לחקות אחרים על ידי התבוננות בהתנהגויות של אנשים ובסגנון הדיבור שלהם
  • אומנים שלומדים לצייר בסגנון מסוים על ידי לימוד של הרבה ציורים בסגנון הזה
  • להקות קאברים שלומדות להישמע כמו להקת מוזיקה ספציפית על ידי האזנה להרבה מוזיקה של אותה להקה

כדי ליצור פלט ייחודי ויצירתי, המודלים הגנרטיביים עוברים אימון ראשוני בגישה לא מפוקחת, שבה המודל לומד לחקות את הנתונים שעליהם הוא מתאמן. לפעמים המודל עובר אימון נוסף באמצעות למידה מפוקחת או למידת חיזוק על נתונים ספציפיים שקשורים למשימות שהמודל עשוי להתבקש לבצע, למשל סיכום מאמר או עריכת תמונה.

AI גנרטיבי הוא טכנולוגיה שמתפתחת במהירות, וכל הזמן מתגלים שימושים חדשים. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את תמונות המוצרים שלהם במסחר אלקטרוני על ידי הסרה אוטומטית של רקעים שמסיחים את הדעת או שיפור האיכות של תמונות ברזולוציה נמוכה.