מהי למידה חישובית?

למידת מכונה (ML) מפעילה חלק מהטכנולוגיות החשובות ביותר שבהן אנחנו משתמשים, מאפליקציות תרגום ועד כלי רכב אוטונומיים. בקורס הזה נסביר את המושגים המרכזיים שמאחורי למידת מכונה.

ML מציע דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. למידת מכונה יכולה לחזות את מזג האוויר, להעריך זמני נסיעה, להמליץ על שירים, להשלים אוטומטית משפטים, לסכם מאמרים וליצור תמונות שלא נראו בעבר.

במונחים בסיסיים, למידת מכונה היא התהליך של אימון קטע תוכנה, שנקרא model, כדי לבצע חיזויים שימושיים או ליצור תוכן מנתונים.

לדוגמה, נניח שרצינו ליצור אפליקציה לחיזוי גשם. אנחנו יכולים להשתמש בגישה מסורתית או בגישה של למידת מכונה. באמצעות הגישה המסורתית, היינו יוצרים ייצוג מבוסס-פיזיקה של האטמוספירה ופני השטח של כדור הארץ, ומחשבים כמויות אדירות של משוואות דינמיות נוזליות. זה קשה מאוד.

באמצעות גישה של למידת מכונה, היינו נותנים למודל למידת מכונה כמויות עצומות של נתוני מזג אוויר, עד שמודל למידת המכונה ילמד בסופו של דבר את הקשר המתמטי בין דפוסי מזג אוויר שמייצרים כמויות שונות של גשם. לאחר מכן נותנים למודל את נתוני מזג האוויר הנוכחיים, והיא יכולה לחזות את כמות הגשם.

בחינת ההבנה

מהו "מודל" בלמידת מכונה?
מודל הוא קשר מתמטי שנגזר מנתונים שמערכת למידת מכונה משתמשת בהם כדי לבצע חיזויים
מודל הוא סוג של חומרת מחשב
מודל הוא ייצוג קטן יותר של הפריט שלומדים.

סוגים של מערכות למידת מכונה

מערכות למידת מכונה שייכות לאחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע חיזויים או ליצור תוכן:

  • למידה מונחית
  • למידה בלתי מונחית
  • למידת חיזוק
  • ‫AI גנרטיבי

למידה מונחית

מודלים של למידה מבוקרת יכולים ליצור תחזיות אחרי שהם רואים הרבה נתונים עם התשובות הנכונות, ואז מגלים את הקשרים בין הרכיבים בנתונים שמספקים את התשובות הנכונות. הדבר דומה ללמידה של חומר חדש על ידי לימוד בחינות ישנות שמכילות גם שאלות וגם תשובות. אחרי שהתלמיד מתאמן על מספיק בחינות ישנות, הוא מוכן היטב לבחינה חדשה. מערכות למידת המכונה האלה 'מפוקחות', מהבחינה שבן אדם מספק לה את התוצאות הידועות הנכונות.

שניים מהתרחישים הנפוצים ביותר של למידה מונחית הם רגרסיה וסיווג.

רגרסיה

מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שחוזה את כמות הגשם באינצ'ים או במילימטרים הוא מודל רגרסיה.

בטבלה הבאה מפורטות דוגמאות נוספות של מודלים של רגרסיה:

תרחיש נתוני קלט אפשריים חיזוי מספרי
מחיר בית עתידי קטעי וידאו רבועים, מיקוד, מספר חדרי שינה וחדרי רחצה, גודל מגרש, שיעור ריבית על משכנתאות, שיעור מס רכוש, עלויות בנייה ומספר הבתים למכירה באזור. מחיר הבית.
זמן נסיעה עתידי נתונים היסטוריים לגבי מצב התנועה (שנאספו מסמארטפונים, מחיישני תנועה, מהגעה לאתר ומאפליקציות ניווט אחרות), המרחק מהיעד ותנאי מזג האוויר. הזמן בדקות ובשניות להגיע ליעד.

סיווג

מודלים של סיווג חוזים את הסבירות שפריט כלשהו שייך לקטגוריה. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, מודלים של סיווג מפיקים ערך שמציין אם משהו שייך לקטגוריה מסוימת או לא. לדוגמה, מודלים של סיווג משמשים לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.

המודלים של הסיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג מרובה סיווגים. מודלים של סיווג בינאריים מפיקים ערך ממחלקה שמכילה רק שני ערכים, לדוגמה, מודל שמפיק את הפלט rain או no rain. מודלים של סיווג מרובה מחלקות מפיקים ערך ממחלקה שמכילה יותר משני ערכים, לדוגמה, מודל שיכול להפיק פלט של rain, hail, snow או sleet.

בחינת ההבנה

אם רוצים להשתמש במודל למידת מכונה כדי לחזות את צריכת האנרגיה במבנים מסחריים, באיזה סוג של מודל תשתמשו?
רגרסיה
צריכת האנרגיה נמדדת בקילוואט-שעה (קוט"ש), שהוא מספר, לכן כדאי להשתמש במודל רגרסיה.
סיווג
מודלים של סיווג חוזים אם פריט מסוים שייך לקטגוריה, ואילו מודלים של רגרסיה חוזים מספר. מכיוון שצריכת האנרגיה נמדדת בקילוואט-שעה (קוט"ש), שהוא מספר, מומלץ להשתמש במודל רגרסיה.

למידה בלתי מונחית

מודלים של למידה לא מונחית יוצרים תחזיות על ידי נתונים שלא מכילים תשובות נכונות. המטרה של מודל למידה בלתי מונחית היא לזהות דפוסים משמעותיים בין הנתונים. במילים אחרות, למודל אין רמזים לגבי אופן הסיווג של כל פיסת נתונים, אלא הוא צריך להסיק כללים משלו.

במודל של למידה בלתי מונחית שנמצא בשימוש נפוץ, נעשה שימוש בשיטה שנקראת אשכולות. המודל מוצא נקודות נתונים שמגדירות קבוצות טבעיות.

תמונה שמציגה נקודות צבעוניות באשכולות.

איור 1. מודל למידת מכונה שמקבץ באשכולות של נקודות נתונים דומות.

תמונה שבה מוצגות נקודות צבעוניות באשכולות, שמוקפים בצורה וגובלים זה את זה.

איור 2. קבוצות אשכולות עם קווים מפרידים טבעיים.

האשכולות שונים מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל לא בפיקוח עשוי לקבץ מערך נתונים של מזג אוויר על סמך הטמפרטורה, וכך לחשוף פילוחים שמגדירים את העונות. לאחר מכן תוכלו לנסות לתת לאשכולות האלה שם על סמך מה שהבנתם לגבי מערך הנתונים.

תמונה שמציגה נקודות צבעוניות באשכולות שמסומנים כשלג, גשם, ברד וללא גשם.

איור 3. מודל למידת מכונה שמקבץ אשכולות של דפוסי מזג אוויר דומים.

תמונה שמציגה נקודות צבעוניות באשכולות שמסומנים כשלג, גשם, ברד וללא גשם שתחומים בצורות שונות וגבול ביניהם.

איור 4. אשכולות של דפוסי מזג אוויר שמסומנים כשלג, בשלג, גשם וללא גשם.

בחינת ההבנה

מה ההבדל בין גישה בפיקוח לבין גישה בלתי מונחית?
בגישה בפיקוח מקבלים נתונים שמכילים את התשובה הנכונה.
בגישה בפיקוח מקבלים נתונים שמכילים את התשובה הנכונה. התפקיד של המודל הוא למצוא חיבורים בנתונים שמספקים את התשובה הנכונה. בגישה בלתי מונחית מקבלים נתונים ללא התשובה הנכונה. התפקיד שלו הוא למצוא קבוצות בנתונים.
בגישה בפיקוח נעשה בדרך כלל שימוש באשכולות.
בגישה לא מונחית נעשה שימוש באשכולות.
גישה לא מונחית יודעת איך לתייג אשכולות נתונים.
גישה לא מונחית לא יודעת מה המשמעות של אשכולות נתונים. על סמך הבנת הנתונים, אתם קובעים את ההגדרות שלהם.

למידת חיזוק

מודלים של למידת חיזוק יוצרים תחזיות על ידי קבלת תגמולים או עונשים על סמך הפעולות שמבוצעות בסביבה. מערכת למידת חיזוק יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר לקבלת כמה שיותר פרסים.

חיזוק הלמידה משמש לאימון רובוטים לביצוע משימות כמו הליכה בחדר, ותוכנות כמו AlphaGo לשחק במשחק Go.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, בינה מלאכותית גנרטיבית יכולה ליצור תמונות ייחודיות, יצירות מוזיקליות ובדיחות, היא יכולה לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.

בינה מלאכותית גנרטיבית יכולה להשתמש במגוון מקורות קלט וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו ווידאו. הוא יכול גם לקחת וליצור שילובים שלהם. לדוגמה, מודל יכול לקחת תמונה כקלט וליצור תמונה וטקסט כפלט, או לצלם תמונה וטקסט כקלט וליצור סרטון כפלט.

אנחנו יכולים לדון במודלים גנרטיביים לפי הקלט והפלט שלהם, שבדרך כלל נכתבים כ'סוג קלט' ל'סוג פלט'. לדוגמה, זו רשימה חלקית של מקורות קלט ופלט מסוימים במודלים גנרטיביים:

  • טקסט לטקסט
  • טקסט לתמונה
  • טקסט לווידאו
  • טקסט לקוד
  • טקסט לדיבור
  • תמונה וטקסט לתמונה

בטבלה הבאה מפורטות דוגמאות למודלים גנרטיביים, הקלט שלהם ודוגמה לפלט האפשרי שלהם:

מודל קלט פלט לדוגמה
טקסט לטקסט מי המציא את מרוץ לה מאן? מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (ACO), ארגון מוטורי שהוקם בשנת 1906. המרוץ הראשון נערך ב-26 וב-27 במאי 1923 במסלול סארת, מסלול כביש באורך 13.426 ק"מ (8.345 ק"מ) שנמצא ליד העיר לה מאן שבצרפת. מרוץ מתוכנן במקור כדרך לקדם את ה-ACO ואת אזור סארטה.
מקור: Bard
טקסט לתמונה תמנון חייזרי צף דרך פורטל וקורא עיתון. תמונה של תמנון מצויר.
מקור: תמונה
טקסט לווידאו דובי פוטוריאליסטי שוחה באוקיינוס בסן פרנסיסקו. הדובי יורד מתחת למים. הדובי ממשיך לשחות מתחת למים עם דגים צבעוניים. דוב פנדה שוחה מתחת למים. סרטון של דובי שוחה מתחת למים.
מקור: פנאקי
טקסט לקוד כותבים לולאת Python שחוזרת על עצמה בלופ רשימת מספרים ומדפיסה את המספרים הראשוניים.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

מקור: Bard
תמונה לטקסט תמונה של פלמינגו. זה פלמינגו. אפשר למצוא אותם בקריביים.
מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? ברמה הכללית, מודלים גנרטיביים לומדים דפוסי נתונים במטרה להפיק נתונים חדשים אך דומים. דוגמאות למודלים גנרטיביים:

  • קומיקאים שלומדים לחקות אחרים על ידי בחינת ההתנהגות וסגנון הדיבור של אנשים
  • אומנים שלומדים לצייר בסגנון מסוים על ידי חקר ציורים רבים בסגנון הזה
  • להקות גרסאות כיסוי שלומדות להישמע כמו קבוצת מוזיקה מסוימת על ידי האזנה להמון מוזיקה של הקבוצה הזו

כדי להפיק פלטים ייחודיים ויצירתיים, בהתחלה מתבצע אימון של מודלים גנרטיביים באמצעות גישה לא מונחית, שבה המודל לומד לחקות את הנתונים שעליהם הוא מבוסס. לפעמים מאמנים את המודל עוד יותר באמצעות למידה מבוקרת או למידה מחיזוק על נתונים ספציפיים שקשורים למשימות שהמודל יתבקש לבצע, כמו לסכם מאמר או לערוך תמונה.

בינה מלאכותית גנרטיבית היא טכנולוגיה שמתפתחת במהירות, וכל הזמן מגלים תרחישים חדשים. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את התמונות של מוצרי המסחר האלקטרוני שלהם על ידי הסרה אוטומטית של רקעים שמסיחים את הדעת או שיפור האיכות של תמונות ברזולוציה נמוכה.