מהי למידה חישובית?

למידת מכונה (ML) מתבססת על כמה מהטכנולוגיות החשובות ביותר שבהן אנחנו משתמשים, מאפליקציות תרגום ועד כלי רכב אוטונומיים. בקורס הזה מוסברים המושגים המרכזיים שמאחורי למידת מכונה.

בלמידת מכונה יש דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. בלמידת מכונה יכולה לחזות את מזג האוויר, להעריך זמני נסיעה, להמליץ על שירים, להשלים אוטומטית משפטים, לסכם מאמרים וליצור תמונות שלא ראית בעבר.

במילים פשוטות, למידת מכונה היא תהליך של אימון של תוכנה מסוימת, שנקרא model, כדי ליצור חיזויים שימושיים או ליצור תוכן מנתונים.

לדוגמה, נניח שרצינו ליצור אפליקציה לחיזוי כמות הגשם. אנחנו יכולים להשתמש בגישה מסורתית או בגישה בלמידת מכונה. באמצעות גישה מסורתית, היינו יוצרים ייצוג מבוסס-פיזיקה של האטמוספירה ופני השטח של כדור הארץ, ומחשבים כמויות עצומות של משוואות דינמיות של נוזלים. זה קשה מאוד.

באמצעות גישת למידת מכונה, היינו נותנים למודל ML כמויות עצומות של נתוני מזג אוויר עד שמודל למידת המכונה ילמד בסופו של דבר את הקשר המתמטי בין דפוסי מזג אוויר שמייצרים כמויות שונות של גשם. לאחר מכן נותנים למודל את נתוני מזג האוויר הנוכחיים, והוא יחזה את כמות הגשם.

בדיקת ההבנה

מהו ה "מודל" בלמידת מכונה?
מודל הוא קשר מתמטי שנגזר מנתונים שמערכת למידת מכונה משתמשת בהם כדי ליצור תחזיות
מודל הוא קטע של חומרת מחשב
מודל הוא ייצוג קטן יותר של הדבר שחוקרים.

סוגים של מערכות למידת מכונה

מערכות למידת מכונה שייכות לאחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות ליצור חיזויים או ליצור תוכן:

  • למידה מונחית
  • למידה בלתי מונחית
  • למידת חיזוק
  • Generative AI

למידה מונחית

מודלים של למידה מבוקרת יכולים ליצור תחזיות אחרי שהם רואים הרבה נתונים עם התשובות הנכונות, ואז מגלים את הקשרים בין הרכיבים בנתונים שמהם מתקבלות התשובות הנכונות. הדבר דומה ללמידה של תלמיד שלומד חומר חדש באמצעות בחינות ישנות שמכילות גם שאלות וגם תשובות. לאחר שהתלמיד עבר אימון על מספיק בחינות ישנות, הוא יהיה מוכן היטב לבחינה חדשה. מערכות למידת המכונה 'מפוקחות' בכך שבן אדם מספק נתונים למערכת למידת מכונה עם התוצאות הנכונות.

שניים מהתרחישים הנפוצים ביותר של למידה מונחית הם רגרסיה וסיווג.

רגרסיה

מודל רגרסיה יוצר חיזוי של ערך מספרי. לדוגמה, מודל מזג אוויר שמנבא את כמות הגשם באינצ'ים או במילימטרים הוא מודל רגרסיה.

בטבלה שבהמשך מוצגות דוגמאות נוספות של מודלים של רגרסיה:

תרחיש נתוני קלט אפשריים חיזוי מספרי
מחיר דירה עתידי שטח רבוע, מיקוד, מספר חדרי שינה וחדרי רחצה, גודל המגרש, שיעור הריבית על משכנתה, שיעור מס הרכוש, עלויות הבנייה ומספר הבתים למכירה באזור. מחיר הבית.
זמן נסיעה עתידי נתונים היסטוריים לגבי מצב התנועה (נאספים מסמארטפונים, חיישני תנועה, הזמנה לנסיעה ואפליקציות ניווט אחרות), המרחק מהיעד ותנאי מזג האוויר. הזמן בדקות ובשניות עד להגעה ליעד.

סיווג

מודלים של סיווג חוזים את הסבירות שפריט כלשהו יהיה שייך לקטגוריה מסוימת. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, מודלים של סיווג מפיקים ערך שקובע אם משהו מסוים שייך לקטגוריה מסוימת או לא. לדוגמה, מודלים של סיווג משמשים לחיזוי אם הודעת אימייל היא ספאם או אם תמונה מסוימת מכילה חתול.

מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-מחלקות. מודלים של סיווג בינאריים מקבלים ערך ממחלקה שמכילה רק שני ערכים. לדוגמה, מודל שמפיק את הפלט rain או no rain. מודלים של סיווג מרובה מחלקות פלט ערך ממחלקה שמכילה יותר משני ערכים. לדוגמה, מודל שיכול להפיק פלט rain, hail, snow או sleet.

בדיקת ההבנה

אם רצית להשתמש במודל למידת מכונה כדי לחזות את צריכת האנרגיה בבניינים מסחריים, באיזה סוג של מודל היית משתמש?
רגרסיה
צריכת האנרגיה נמדדת בקילוואט-שעה (קוט"ש), שהוא מספר, לכן מומלץ להשתמש במודל רגרסיה.
סיווג
מודלים של סיווג חוזים אם פריט מסוים שייך לקטגוריה או לא, ואילו מודלים של רגרסיה חוזים מספר. מכיוון שצריכת האנרגיה נמדדת בקילוואט-שעה (קוט"ש), שהוא מספר, מומלץ להשתמש במודל רגרסיה.

למידה בלתי מונחית

מודלים של למידה בלתי מונחית מספקים תחזיות על סמך נתונים שלא מכילים תשובות נכונות. המטרה של מודל של למידה בלתי מונחית היא לזהות דפוסים משמעותיים בין הנתונים. כלומר, למודל אין רמזים לגבי אופן הסיווג של כל פיסת נתונים, אלא הוא צריך להסיק את הכללים שלו.

במודל של למידה בלתי מונחית שבדרך כלל משתמשים בו ללא פיקוח, מיושמת שיטה שנקראת אשכולות. המודל מוצא נקודות נתונים שמגדירות קבוצות טבעיות.

תמונה של נקודות צבעוניות באשכולות.

איור 1. מודל למידת מכונה שמקבצים נקודות נתונים דומות.

תמונה שבה מוצגות נקודות צבעוניות באשכולות, שמוקפים בצורה כלשהי וגובלים זו בזו.

איור 2. קבוצות של אשכולות עם גבולות טבעיים.

קיבוץ הנתונים שונה מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל ללא פיקוח עשוי לקבץ מערך נתונים של מזג אוויר על סמך הטמפרטורה, וכך לחשוף פילוחים שמגדירים את העונות. לאחר מכן תוכלו לנסות לתת לאשכולות האלה שם על סמך ההבנה שלכם לגבי מערך הנתונים.

תמונה של נקודות צבעוניות באשכולות שמסומנים כשלג, גשם, ברד או גשם.

איור 3. מודל למידת מכונה שמקבצים דפוסי מזג אוויר דומים.

תמונה של נקודות צבעוניות באשכולות שמסומנים כשלג, גשם, ברד וללא גשם, מוקפים בצורות שונות וגובלות זו בזו.

איור 4. אשכולות של דפוסי מזג אוויר שמסומנים כשלג, גשם מעורב בשלג, גשם וללא גשם.

בדיקת ההבנה

מה ההבדל בין גישה בפיקוח לבין גישה שאינה בפיקוח?
כשמשתמשים בגישה בפיקוח, מקבלים נתונים שמכילים את התשובה הנכונה.
כשמשתמשים בגישה בפיקוח, מקבלים נתונים שמכילים את התשובה הנכונה. התפקיד של המודל הוא למצוא חיבורים בנתונים שמניבים את התשובה הנכונה. בגישה לא מונחית מקבלים נתונים ללא התשובה הנכונה. המשימה היא למצוא קיבוצים בנתונים.
בגישה בפיקוח משתמשים בדרך כלל באשכולות.
בגישה שאינה בפיקוח נעשה שימוש באשכולות.
כשמשתמשים בגישה לא מונחית, המערכת יודעת איך לתייג אשכולות נתונים.
כשמשתמשים בגישה שאינה בפיקוח, המערכת לא יודעת מה המשמעות של אשכולות נתונים. אתם יכולים להגדיר את הנתונים לפי הבנתכם.

למידת חיזוק

מודלים של למידת חיזוק יוצרים תחזיות על ידי קבלת תגמולים או עונשים על סמך הפעולות שמבוצעות בסביבה. מערכת למידת חיזוק יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר לקבלת כמה שיותר תגמולים.

למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר ותוכנות תוכנה כמו AlphaGo שבהן משחקים את משחק Go.

Generative AI

בינה מלאכותית גנרטיבית היא קבוצה של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, בינה מלאכותית גנרטיבית יכולה ליצור תמונות חדשות, יצירות מוזיקליות ובדיחות, היא יכולה לסכם מאמרים, להסביר איך לבצע משימות ולערוך תמונות.

בינה מלאכותית גנרטיבית יכולה להשתמש במגוון קלטים וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו ווידאו. הוא יכול גם לקחת וליצור שילובים שלהם. לדוגמה, מודל יכול לקחת תמונה כקלט וליצור תמונה וטקסט כפלט, או לצלם תמונה וטקסט בתור קלט וליצור סרטון בתור פלט.

ניתן לדון במודלים גנרטיביים לפי הקלט והפלט שלהם, שבדרך כלל כתובים כ'סוג קלט' ל'סוג פלט'. לדוגמה, זו רשימה חלקית של מקורות קלט ופלט של מודלים גנרטיביים:

  • טקסט לטקסט
  • טקסט לתמונה
  • טקסט לווידאו
  • טקסט לקוד
  • טקסט לדיבור
  • תמונה וטקסט לתמונה

בטבלה הבאה תוכלו למצוא דוגמאות למודלים גנרטיביים, הקלט שלהם ודוגמה לפלט האפשרי שלהם:

מודל קלט פלט לדוגמה
טקסט לטקסט מי המציא את המרוץ לה מאן? מרוץ 24 השעות של לה מאן נוסד על ידי ה-Automobile Club de l'Ouest (ACO), ארגון מוטורי שהוקם בשנת 1906. המרוץ הראשון נערך בתאריכים 26 ו-27 במאי 1923 במסלול סארטה, מסלול כביש באורך 13.426 ק"מ (שאורכו 24.95 ק"מ) שנמצא ליד העיר לה מאן שבצרפת. מטרת הבחירות היא לקדם את ה-ACO ואת אזור סארת.
מקור: Bard
טקסט לתמונה תמנון חייזרי מרחף דרך פורטל וקורא עיתון. תמונה של תמנון מצויר.
מקור: תמונה
טקסט לווידאו דובי דובי שוחה באוקיינוס בסן פרנסיסקו. הדובי שוכב מתחת למים. הדובי ממשיך לשחות מתחת למים עם דגים צבעוניים. דוב פנדה שוחה מתחת למים. סרטון של דובי שוחה מתחת למים.
מקור: פנאקי
טקסט לקוד כותבים לולאה ב-Python שחוזרת על פני רשימת מספרים ומדפיסים את המספרים הראשוניים.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

מקור: Bard
תמונה לטקסט תמונה של פלמינגו. זה פלמינגו. אפשר למצוא אותם באיים הקריביים.
מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? ברמה גבוהה, מודלים גנרטיביים לומדים תבניות של נתונים במטרה להפיק נתונים חדשים אבל דומים. דוגמאות למודלים גנרטיביים:

  • קומיקאים שלומדים לחקות אחרים על ידי בחינת ההתנהגות וסגנון הדיבור של אנשים
  • אומנים שלומדים לצייר בסגנון מסוים, באמצעות חקר ציורים רבים בסגנון הזה
  • גרסאות כיסוי של להקות שלומדות להישמע כמו קבוצת מוזיקה מסוימת, על ידי האזנה להמון מוזיקה של הלהקה הזו

כדי להפיק פלטים ייחודיים ויצירתיים, בהתחלה מאמנים מודלים גנרטיביים באמצעות גישה לא מונחית, שבה המודל לומד לחקות את הנתונים שעליהם התאמן. לפעמים המודל עובר אימון נוסף תוך שימוש בלמידה מונחית או בלמידה מבוקרת על נתונים ספציפיים שקשורים למשימות שהמודל יתבקש לבצע, כמו לסכם מאמר או לערוך תמונה.

בינה מלאכותית גנרטיבית היא טכנולוגיה שמתפתחת במהירות, וכל הזמן מתגלים תרחישים חדשים לדוגמה. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את התמונות של מוצרי המסחר האלקטרוני שלהם על ידי הסרה אוטומטית של רקעים שמסיחים את הדעת או שיפור האיכות של תמונות ברזולוציה נמוכה.