מהי למידה חישובית?

למידת מכונה (ML) מפעילה כמה מהטכנולוגיות החשובות ביותר שבהן אנחנו משתמשים, מאפליקציות תרגום לכלי רכב אוטונומיים. בקורס הזה נסביר את הליבה העקרונות של למידת מכונה.

למידת מכונה מציעה דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן. למידת מכונה יכולה לחזות את מזג האוויר, להעריך זמני נסיעה, להמליץ שירים, השלמה אוטומטית של משפטים, סיכומי מאמרים שלא ראית בעבר.

במונחים בסיסיים, למידת מכונה היא תהליך אימון של תוכנה שנקראת מודל, כדי להפוך חיזויים או ליצור תוכן .

לדוגמה, נניח שרצינו ליצור אפליקציה שמטרתה לחזות גשם. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. באמצעות ניצור ייצוג מבוסס-פיזיקה של האטמוספירה של כדור הארץ וחישוב כמויות עצומות של משוואות של דינמיקת נוזלים. הדבר קשה מאוד.

באמצעות גישת למידת מכונה, נספק למודל למידת מכונה כמויות עצומות של נתוני מזג אוויר עד שמודל למידת המכונה למד בסופו של דבר את הקשר המתמטי בין דפוסים שונים שמניבים כמויות שונות של גשם. לאחר מכן נעניק את במודל של נתוני מזג האוויר הנוכחיים, ולחזות את כמות הגשם.

בדיקת ההבנה

מהו 'מודל' בלמידת מכונה?
מודל הוא קשר מתמטי הנובע מנתונים שנוצרו על ידי למידת מכונה שהמערכת משתמשת בה כדי לבצע חיזויים
מודל הוא חלק של חומרת מחשב
מודל הוא ייצוג קטן יותר של מה שאתם חוקרים.

סוגים של מערכות למידת מכונה

מערכות למידת מכונה נכללות באחת או יותר מהקטגוריות הבאות, על סמך האופן שבו הן ללמוד לבצע חיזויים או ליצור תוכן:

  • למידה מונחית
  • למידה בלתי מונחית
  • חיזוק הלמידה
  • ‫AI גנרטיבי

למידה מונחית

למידה מבוקרת מודלים יכולים לבצע תחזיות אחרי שהם רואים הרבה נתונים עם התשובות הנכונות ואז לגלות את הקשרים בין הרכיבים בנתונים כדי להפיק את התשובות הנכונות. זה כמו תלמיד שלומד חומר חדש ללמוד מבחנים ישנים שיש בהם גם שאלות וגם תשובות. אחרי שהתלמיד לאחר שקיבל מספיק בחינות ישנות, התלמיד מוכן לגשת לבחינה חדשה. מערכות למידת המכונה האלה נמצאות בפיקוח במובן שבני אדם נותנים למערכת למידת מכונה עם התוצאות הנכונות הידועות.

שניים מהתרחישים לדוגמה הנפוצים ביותר של למידה מונחית הם רגרסיה של משפטים יחידים,

רגרסיה

מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שצופה את כמות הגשם, אינץ' או מילימטרים, הוא מודל של רגרסיה.

בטבלה שבהמשך תוכלו למצוא דוגמאות נוספות למודלים של רגרסיה:

תרחיש נתוני קלט אפשריים חיזוי מספרי
מחיר בית עתידי קטעי וידאו מרובעים, מיקוד, מספר חדרי שינה וחדרי רחצה, גודל המגרש שיעור הריבית על משכנתאות, שיעור מס הרכוש, עלויות הבנייה מספר הבתים למכירה באזור. מחיר הבית.
זמן נסיעה עתידי נתוני תנועה היסטוריים (שנאספו מסמארטפונים, נתוני תנועה חיישנים, נסיעות ברד ואפליקציות ניווט אחרות), המרחק מ היעד ותנאי מזג האוויר. זמן ההגעה ליעד בדקות ובשניות.

סיווג

חוזים של מודלים של סיווג הסבירות שמשהו שייך לקטגוריה. בניגוד למודלים של רגרסיה, שהפלט שלו הוא מספר, מודלים של סיווג פלט ערך האם משהו שייך לקטגוריה מסוימת או לא. לדוגמה, מודלים של סיווג משמשים לחיזוי אם אימייל הוא ספאם או אם תמונה שמכיל חתול.

מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי של סיווג מרובה. מודלים בינאריים של סיווג בינאריים מפיקים ערך שמכיל רק שני ערכים, לדוגמה, מודל שמפיק rain או no rain. מודלים של סיווג מרובה מחלקות פלט ערך מתוך שמכיל יותר משני ערכים, לדוגמה, מודל שיכול להפיק פלט rain, hail, snow או sleet.

בדיקת ההבנה

אם רוצים להשתמש במודל למידת מכונה כדי לחזות את צריכת האנרגיה למטרות מסחריות בניינים, באיזה סוג דגם היית רוצה להשתמש?
רגרסיה
צריכת האנרגיה נמדדת לפי קילוואט לשעה (kWh), שהיא מספר, אז כדאי להשתמש במודל רגרסיה.
סיווג
מודלים של סיווג חוזים אם פריט מסוים שייך לקטגוריה מסוימת, ואילו ומודלים של רגרסיה חוזים מספר. כי צריכת האנרגיה נמדדת קילוואט-שעות (kWh), שהוא מספר, מומלץ להשתמש במודל רגרסיה.

למידה בלתי מונחית

למידה בלתי מונחית לביצוע תחזיות על ידי קבלת נתונים שלא מכילים שום תשובות. המטרה של מודל למידה בלתי מונחית היא לזהות בין הנתונים. במילים אחרות, למודל אין רמזים לגבי לסווג כל פיסת נתונים, אבל במקום זאת היא צריכה להסיק כללים משלו.

מודל של למידה בלתי מונחית שנמצא בשימוש נפוץ מתבסס על שיטה שנקראת אשכולות. המודל מוצא נקודות על הגרף שמפרידים בין קבוצות טבעיות.

תמונה שבה מוצגות נקודות צבעוניות באשכולות.

איור 1. מודל למידת מכונה שמקבץ נקודות נתונים דומות.

תמונה שבה מוצגות נקודות צבעוניות באשכולות שמוקפים בצורה וגבולות זה לזה.

איור 2. קבוצות של אשכולות עם סיווגים טבעיים.

האשכולות שונה מהסיווג כי הקטגוריות לא מוגדרות על ידי את/ה. לדוגמה, מודל לא בפיקוח עשוי לקבץ מערך נתונים של מזג אוויר על סמך של הטמפרטורה, וכך חושפת קטעים שמגדירים את עונות. לאחר מכן ייתכן לנסות לתת שמות לאשכולות האלה על סמך ההבנה שלכם לגבי מערך הנתונים.

תמונה שבה מוצגות נקודות צבעוניות באשכולות עם תווית כמו שלג, גשם, ברד ואין גשם.

איור 3. מודל למידת מכונה שמקבץ דפוסי מזג אוויר דומים.

תמונה שבה מוצגות נקודות צבעוניות באשכולות עם תוויות שמסומנות בשלג, גשם, ברד וללא גשם, שסוגרות זו לזו וגבולות ביניהן.

איור 4. אשכולות של דפוסי מזג אוויר שמתויגים כמו שלג, גשם מעורב בשלג לגשם ובלי גשם.

בדיקת ההבנה

מה מבדיל בין גישה בפיקוח לבין גישה לא מפוקחת?
בגישה בפיקוח, המערכת מקבלת נתונים שיש בהם תשובה נכונה.
בגישה בפיקוח, המערכת מקבלת נתונים שיש בהם תשובה נכונה. התפקיד של המודל הוא למצוא חיבורים בנתונים שמייצרים את תשובה. בגישה לא מפוקחת מקבלת נתונים בלי התשובה הנכונה. התפקיד שלו הוא למצוא קיבוצים בנתונים.
בגישה בפיקוח נעשה בדרך כלל שימוש באשכולות.
גישה לא מפוקחת משתמשת באשכולות.
גישה לא מפוקחת יודעת איך לתייג אשכולות נתונים.
גישה לא מפוקחת לא יודעת מה המשמעות של אשכולות הנתונים. בהתבסס על הבנת הנתונים, אתם מחליטים להגדיר אותם.

חיזוק הלמידה

חיזוק הלמידה מספקים תחזיות על ידי קבלת תגמולים או עונשים על סמך פעולות שמבוצעות בסביבה מסוימת. חיזוק יוצרת מדיניות מגדיר את האסטרטגיה הטובה ביותר לקבלת כמה שיותר פרסים.

למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה ברחבי החדר, ותוכנות כמו AlphaGo כדי לשחק במשחק Go.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא סוג של מודלים שיכולה ליצור תוכן מפרטים של משתמשים. לדוגמה, בינה מלאכותית גנרטיבית יכולה ליצור תמונות ייחודיות, יצירות מוזיקליות ובדיחות; הוא יכול לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.

בינה מלאכותית גנרטיבית יכולה להשתמש במגוון של סוגי קלט וליצור מגוון פלטים, טקסט, תמונות, אודיו ווידאו. היא יכולה גם לקחת וליצור שילובים של האלה. לדוגמה, מודל יכול לקחת תמונה כקלט וליצור תמונה טקסט בתור פלט, או לצלם תמונה וטקסט כקלט וליצור סרטון כפלט.

ניתן לדון במודלים גנרטיביים לפי הקלט והפלט שלהם, שבדרך כלל כתובים ל"סוג קלט" ל"סוג של פלט". לדוגמה, רשימה של כמה סוגי קלט ופלט למודלים גנרטיביים:

  • טקסט לטקסט
  • טקסט לתמונה
  • טקסט לווידאו
  • טקסט לקוד
  • טקסט לדיבור
  • תמונה וטקסט לתמונה

בטבלה הבאה מפורטות דוגמאות למודלים גנרטיביים, הקלט שלהם דוגמה לפלט האפשרי שלהם:

דגם קלט פלט לדוגמה
טקסט לטקסט מי המציא את המרוץ לה מאן? אירוע 24 השעות של לה מאן הוקם על ידי מועדון הרכב של דה ל'וסט (Automobile Club de l'Ouest) (ACO), ארגון מוטורי שהוקם בשנת 1906. המרוץ הראשון נערך ב-26 וב-27 במאי 1923 על מעגל הסרט, 13.426 ק"מ מעגל תנועה באורך של 13.5 ק"מ שנמצא ליד העיר לה מאן בצרפת. המרוץ הוקם במקור במטרה לקדם את ה-ACO אזור סארת.
מקור: Bard
טקסט לתמונה תמנון חייזרי צף בפורטל ומקריא עיתון. תמונה של תמנון מצויר.
מקור: תמונה
טקסט לווידאו דובי פוטוריאליסטי שוחה בים בסן פרנסיסקו. הדובון נופל למים. הדובון ממשיך לשחות במים עם הדגים הצבעוניים. דוב פנדה שוחה מתחת למים. סרטון של דובי שוחה מתחת למים.
מקור: Phenaki
טקסט לקוד כותבים לולאה של Python שחוזרת על עצמה לרשימת מספרים ומדפיסים את המספרים הראשוניים.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

מקור: Bard
תמונה לטקסט תמונה של פלמינגו. זהו פלמינגו. ניתן למצוא אותם באיים הקריביים.
מקור: Google DeepMind

איך פועלת בינה מלאכותית גנרטיבית? ברמה גבוהה, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה להפיק נתונים חדשים אבל דומים. גנרטיבית נראה כך:

  • קומיקאים שלומדים לחקות אחרים באמצעות צפייה בהתנהגויות של אנשים סגנון הדיבור
  • אומנים שלמדו לאמן בסגנון מסוים ציורים בסגנון הזה
  • להקות גרסאות כיסוי שלומדות להישמע כמו קבוצת מוזיקה ספציפית אחרי שמאזינים הרבה מוזיקה של הקבוצה

כדי להפיק פלטים ייחודיים ויצירתיים, מודלים גנרטיביים עוברים אימון מקדים בגישה בלתי מונחית, שבה המודל לומד לחקות את הנתונים אימנו את המודל. לפעמים המודל עוד מאומנות באמצעות חיזוק הלמידה על נתונים ספציפיים שקשורים למשימות שהמודל עשוי להיות שנדרש לבצע, לדוגמה, לסכם מאמר או לערוך תמונה.

הבינה המלאכותית הגנרטיבית היא טכנולוגיה שמתפתחת במהירות, ומתבססת על תרחישים חדשים כל הזמן על אנשים לגלות אותו. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את הביצועים שלהם את תמונות מוצרי המסחר האלקטרוני שלהם על ידי הסרה אוטומטית של רקעים שמסיחים את הדעת או שיפור האיכות של תמונות ברזולוציה נמוכה.