מהי למידה חישובית?

למידת מכונה (ML) מפעילה חלק מהטכנולוגיות הכי חשובות שבהן אנחנו משתמשים, מאפליקציות תרגום ועד לכלי רכב אוטונומיים. בקורס הזה מוסברים המושגים הבסיסיים של למידת מכונה.

ה-ML מציע דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. ה-ML יכול לחזות את מזג האוויר, להעריך את משך הנסיעה, להמליץ על שירים, להשלים משפטים באופן אוטומטי, לסכם מאמרים וליצור תמונות שלא נראו קודם.

במילים פשוטות, למידת מכונה היא תהליך של אימון תוכנה, שנקראת מודל, כדי ליצור תחזיות שימושיות או ליצור תוכן (כמו טקסט, תמונות, אודיו או וידאו) מנתונים.

לדוגמה, נניח שאנחנו רוצים ליצור אפליקציה לחיזוי גשמים. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. בגישה המסורתית, אנחנו יוצרים ייצוג מבוסס-פיזיקה של האטמוספירה ופני השטח של כדור הארץ, ומחשבים כמויות עצומות של משוואות דינמיקה של נוזלים. זה קשה מאוד.

בגישה של למידת מכונה, אנחנו נותנים למודל למידת מכונה כמויות עצומות של נתוני מזג אוויר עד שהמודל לומד את הקשר המתמטי בין דפוסי מזג אוויר שמייצרים כמויות שונות של גשם. לאחר מכן, נזין למודל את נתוני מזג האוויר הנוכחיים, והוא יחזה את כמות הגשם.

בדיקת ההבנה

מהו 'מודל' בלמידת מכונה?
מודל הוא קשר מתמטי שנגזר מנתונים, ומערכת ML משתמשת בו כדי ליצור תחזיות
מודל הוא רכיב חומרה במחשב
מודל הוא ייצוג קטן יותר של הדבר שנבדק.

סוגים של מערכות ML

מערכות ML משתייכות לאחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע חיזויים או ליצור תוכן:

  • למידה מונחית
  • למידה לא מפוקחת
  • למידת חיזוק
  • ‫AI גנרטיבי

למידה מונחית

מודלים של למידה מפוקחת יכולים להפיק תחזיות אחרי שהם מעבדים הרבה נתונים עם תשובות נכונות, ואז לגלות את הקשרים בין הרכיבים בנתונים שמניבים את התשובות הנכונות. זה כמו שתלמיד לומד חומר חדש על ידי עיון במבחנים ישנים שכוללים גם שאלות וגם תשובות. אחרי שהתלמידים מתרגלים מספיק מבחנים ישנים, הם מוכנים לגשת למבחן חדש. מערכות ה-ML האלה הן "מפוקחות" במובן זה שאדם מספק למערכת ה-ML נתונים עם תוצאות נכונות ידועות.

שני התרחישים הנפוצים ביותר לשימוש בלמידה מפוקחת הם רגרסיה וסיווג.

רגרסיה

מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שמנבא את כמות הגשם, באינצ'ים או במילימטרים, הוא מודל רגרסיה.

בטבלה הבאה מופיעות דוגמאות נוספות למודלים של רגרסיה:

תרחיש נתוני קלט אפשריים חיזוי מספרי
מחיר עתידי של בית שטח הבית, המיקוד, מספר חדרי השינה והשירותים, גודל המגרש, שיעור הריבית על המשכנתא, שיעור מס הרכוש, עלויות הבנייה ומספר הבתים למכירה באזור. מחיר הבית.
זמן הנסיעה העתידי תנאי התנועה ההיסטוריים (שנאספים מסמארטפונים, מחיישני תנועה, מאפליקציות להזמנת נסיעות ומאפליקציות ניווט אחרות), המרחק מהיעד ותנאי מזג האוויר. הזמן בדקות ובשניות להגעה ליעד.

סיווג

מודלים של סיווג חוזים את הסבירות שפריט מסוים שייך לקטגוריה מסוימת. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, הפלט של מודלים של סיווג הוא ערך שמציין אם פריט מסוים שייך לקטגוריה מסוימת או לא. לדוגמה, מודלים של סיווג משמשים לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.

מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-מחלקתי. מודלים של סיווג בינארי מחזירים ערך ממחלקה שמכילה רק שני ערכים, לדוגמה, מודל שמחזיר rain או no rain. מודלים של סיווג רב-מחלקתי מחזירים ערך ממחלקה שמכילה יותר משני ערכים. לדוגמה, מודל שיכול להחזיר את הערכים rain,‏ hail,‏ snow או sleet.

בדיקת ההבנה

אם היית רוצה להשתמש במודל למידת מכונה כדי לחזות את צריכת האנרגיה של בניינים מסחריים, באיזה סוג של מודל היית משתמש?
רגרסיה
השימוש באנרגיה נמדד בקילוואט לשעה (kWh), שהוא מספר, ולכן כדאי להשתמש במודל רגרסיה.
סיווג
מודלים של סיווג חוזים אם משהו שייך לקטגוריה מסוימת, ומודלים של רגרסיה חוזים מספר. צריכת האנרגיה נמדדת בקילוואט לשעה (kWh), ולכן כדאי להשתמש במודל רגרסיה.

למידה לא מפוקחת

מודל של למידה בלתי מונחית נועד לזהות דפוסים משמעותיים במערך נתונים. לדוגמה, הרבה מודלים של למידה לא מפוקחת מסתמכים על טכניקה שנקראת אשכולות כדי לארגן נתונים דומים לקבוצות ('אשכולות').

תמונה שבה רואים נקודות צבעוניות באשכולות.

איור 1. מודל ML שמבצע אשכול של נקודות נתונים דומות.

תמונה שבה רואים נקודות צבעוניות באשכולות, שמוקפים בצורה וגובלים זה בזה.

איור 2. קבוצות של אשכולות עם גבולות טבעיים.

האשכולות שונים מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל לא מפוקח יכול לבצע אשכול של מערך נתונים של מזג האוויר על סמך הטמפרטורה, ולחשוף פילוחים שמגדירים את העונות. אחר כך אפשר לנסות לתת שמות לאשכולות האלה על סמך ההבנה של מערך הנתונים.

תמונה שבה רואים נקודות צבעוניות באשכולות עם התוויות 'שלג', 'גשם', 'ברד' ו'ללא גשם'.

איור 3. מודל ML שמבצע אשכול של דפוסי מזג אוויר דומים.

תמונה שבה רואים נקודות צבעוניות באשכולות שמסומנות כשלג, גשם, ברד ואין גשם, והן מוקפות בצורה וגובלות זו בזו.

איור 4. אוספים של דפוסי מזג אוויר שמסומנים כשלג, גשם מעורב בשלג, גשם וללא גשם.

בדיקת ההבנה

מה ההבדל בין גישה בפיקוח לבין גישה ללא פיקוח?
בגישה מבוקרת, המערכת מקבלת נתונים שמכילים את התשובה הנכונה.
בגישה מבוקרת, המערכת מקבלת נתונים שמכילים את התשובה הנכונה. המטרה של המודל היא למצוא קשרים בנתונים שיובילו לתשובה הנכונה. בגישה לא מפוקחת, המערכת מקבלת נתונים ללא התשובה הנכונה. התפקיד שלו הוא למצוא קיבוצים בנתונים.
בגישה מבוקרת נעשה בדרך כלל שימוש באשכולות.
גישה לא מפוקחת משתמשת באשכולות.
גישה לא מפוקחת יודעת איך לתייג אשכולות של נתונים.
גישה לא מפוקחת לא יודעת מה המשמעות של אשכולות הנתונים. ההגדרה שלהם תלויה בהבנה שלכם את הנתונים.

למידת חיזוק

מודלים של למידת חיזוק מפיקים תחזיות על ידי קבלת תגמולים או עונשים על סמך פעולות שבוצעו בסביבה מסוימת. מערכת למידת חיזוקים יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר להשגת התגמולים המקסימליים.

למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר, ולתוכנות כמו AlphaGo כדי לשחק במשחק גו.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, AI גנרטיבי יכול ליצור תמונות ייחודיות, יצירות מוזיקליות ובדיחות, לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.

בינה מלאכותית גנרטיבית יכולה לקבל מגוון קלטים וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו וסרטונים. הוא יכול גם ליצור שילובים של אלה. לדוגמה, מודל יכול לקבל תמונה כקלט וליצור תמונה וטקסט כפלט, או לקבל תמונה וטקסט כקלט וליצור סרטון כפלט.

אפשר לדון במודלים גנרטיביים לפי הקלט והפלט שלהם, בדרך כלל בצורה של 'סוג הקלט' ל'סוג הפלט'. לדוגמה, זו רשימה חלקית של כמה קלטים ופלטים של מודלים גנרטיביים:

  • טקסט לטקסט
  • טקסט לתמונה
  • טקסט לווידאו
  • טקסט לקוד
  • המרת טקסט לדיבור (TTS)
  • תמונה וטקסט לתמונה

בטבלה הבאה מופיעות דוגמאות למודלים גנרטיביים, לקלט שלהם ולפלט האפשרי שלהם:

דגם קלט פלט לדוגמה
טקסט לטקסט מי המציא את מרוץ לה מאן? מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (מועדון הרכב של המערב, ACO), ארגון רכב שנוסד בשנת 1906. המרוץ הראשון התקיים ב-26 וב-27 במאי 1923 במסלול סארת', מסלול כביש באורך 13.426 ק"מ (8.345 מייל) שנמצא ליד העיירה לה מאן בצרפת. המרוץ נוצר במקור כדי לקדם את ACO ואת אזור סארט.
מקור: Bard
טקסט לתמונה תמנון חייזרי צף דרך פורטל בזמן שהוא קורא עיתון. תמונה של תמנון מצויר.
מקור: Imagen
טקסט לווידאו תמונה פוטו-ריאליסטית של דובון טדי שוחה באוקיינוס בסן פרנסיסקו. הדובי נכנס מתחת למים. דובון שוחה מתחת למים עם דגים צבעוניים. פנדת ענק שוחה מתחת למים. סרטון של דובי שוחה מתחת למים.
מקור: Phenaki
טקסט לקוד כתוב לולאת Python שחוזרת על רשימה של מספרים ומדפיסה את המספרים הראשוניים.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

מקור: Bard
תמונה לטקסט תמונה של פלמינגו. זה פלמינגו. הם נמצאים באיים הקריביים.
מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? באופן כללי, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה ליצור נתונים חדשים אבל דומים. דוגמאות ל-Generative models:

  • קומיקאים שלומדים לחקות אחרים על ידי התבוננות בהתנהגויות של אנשים ובסגנון הדיבור שלהם
  • אומנים שלומדים לצייר בסגנון מסוים על ידי לימוד של הרבה ציורים בסגנון הזה
  • להקות קאברים שלומדות להישמע כמו להקת מוזיקה ספציפית על ידי האזנה להרבה מוזיקה של אותה להקה

כדי ליצור פלט ייחודי ויצירתי, המודלים הגנרטיביים עוברים אימון ראשוני בגישה לא מפוקחת, שבה המודל לומד לחקות את הנתונים שעליהם הוא מתאמן. לפעמים המודל עובר אימון נוסף באמצעות למידה מפוקחת או למידת חיזוק על נתונים ספציפיים שקשורים למשימות שהמודל עשוי להתבקש לבצע, למשל סיכום מאמר או עריכת תמונה.

AI גנרטיבי הוא טכנולוגיה שמתפתחת במהירות, וכל הזמן מתגלים שימושים חדשים. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את תמונות המוצרים שלהם במסחר אלקטרוני על ידי הסרה אוטומטית של רקעים שמסיחים את הדעת או שיפור האיכות של תמונות ברזולוציה נמוכה.