למידת מכונה (ML) מאפשרת לנו להשתמש בחלק מהטכנולוגיות החשובות ביותר, החל מאפליקציות תרגום ועד לכלי רכב אוטונומיים. הקורס הזה מסביר את המושגים המרכזיים של למידת מכונה.
למידת מכונה היא דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. באמצעות למידת מכונה אפשר לחזות את מזג האוויר, להעריך זמני נסיעה, להמליץ על שירים, להשלים אוטומטית משפטים, לסכם מאמרים וליצור תמונות שלא נראו קודם.
באופן בסיסי, למידת מכונה היא תהליך של אימון תוכנה שנקראת מודל, כדי לבצע תחזיות מועילות או ליצור תוכן מנתונים.
לדוגמה, נניח שאנחנו רוצים ליצור אפליקציה לחיזוי כמות המשקעים. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. בגישה רגילה, היינו יוצרים ייצוג פיזי של האטמוספירה והמשטח של כדור הארץ, ומחשבים כמויות אדירות של משוואות דינמיקה של נוזלים. זה קשה מאוד.
באמצעות גישה של למידת מכונה, נוכל לספק למודל למידת מכונה כמויות אדירות של נתוני מזג אוויר, עד שהוא ילמד את הקשר המתמטי בין דפוסי מזג האוויר שגורמים לכמויות שונות של גשם. לאחר מכן נוסיף למודל את נתוני מזג האוויר הנוכחיים, והוא יחזה את כמות הגשם.
בדיקת ההבנה
סוגי מערכות למידת מכונה
מערכות למידת מכונה נכללות באחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע תחזיות או ליצור תוכן:
- למידה מונחית
- למידה בלתי מונחית
- למידה חיזוקים
- AI גנרטיבי
למידה מונחית
מודלים של למידה בפיקוח יכולים לבצע תחזיות אחרי שהם רואים הרבה נתונים עם התשובות הנכונות, ולאחר מכן מגלים את הקשרים בין הרכיבים בנתונים שמניבים את התשובות הנכונות. זה כמו תלמיד שמלמד את עצמו חומר חדש על ידי לימוד מבחנים ישנים שמכילים גם שאלות וגם תשובות. אחרי שהתלמידים מתאמנים על מספיק בחינות ישנות, הם מוכנים היטב לבחינה חדשה. מערכות ה-ML האלה הן 'מודרכות' במובן שאדם נותן למערכת ה-ML נתונים עם התוצאות הנכונות הידועות.
שניים מתרחישי השימוש הנפוצים ביותר בלמידה בפיקוח הם רגרסיה וסיווג.
רגרסיה
מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שמתאר את כמות הגשם, בסנטימטרים או במילימטרים, הוא מודל רגרסיה.
בטבלה הבאה מפורטות דוגמאות נוספות למודלים של רגרסיה:
תרחיש | נתוני קלט אפשריים | חיזוי מספרי |
---|---|---|
מחיר הבית בעתיד | שטח בגודל רגל מרובע, מיקוד, מספר חדרי שינה וחדרי אמבטיה, גודל המגרש, שיעור הריבית על המשכנתה, שיעור מס הנכס, עלויות הבנייה ומספר הבתים למכירה באזור. | מחיר הבית. |
מועד הנסיעה העתידי | תנאי התנועה ההיסטוריים (שנאספים מסמארטפונים, מחזישני תנועה, מאפליקציות לשירותי נסיעה ומאפליקציות ניווט אחרות), המרחק ליעד ותנאי מזג האוויר. | משך הזמן, בדקות ובשניות, עד להגעה ליעד. |
סיווג
מודלים של סיווג צופים את הסבירות שדבר מסוים ייכלל בקטגוריה מסוימת. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, מודל הסיווג מניב ערך שמציין אם משהו שייך לקטגוריה מסוימת או לא. לדוגמה, מודל סיווג משמש לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.
מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-רמות. מודלים של סיווג בינארי מניבים ערך מתוך קטגוריה שמכילה רק שני ערכים, לדוגמה, מודל שמניב את הערך rain
או את הערך no rain
. מודלים של סיווג בכמה כיתות מניבים ערך מכיתה שמכילה יותר משני ערכים. לדוגמה, מודל שיכול להפיק את הערכים rain
, hail
, snow
או sleet
.
בדיקת ההבנה
למידה בלתי מונחית
מודלים של למידה בלתי מפוקחת מבצעים חיזויים על סמך נתונים שלא מכילים תשובות נכונות. המטרה של מודל למידה בלתי מונחית היא לזהות דפוסים משמעותיים בנתונים. במילים אחרות, אין למודל רמזים לגבי סיווג כל נתון, אלא הוא צריך להסיק את הכללים שלו בעצמו.
מודל נפוץ של למידה בלתי מונחית משתמש בשיטה שנקראת קיבוץ. המודל מוצא נקודות נתונים שמסמנות קיבוצים טבעיים.
איור 1. מודל למידת מכונה (ML) שמקבץ נקודות נתונים דומות.
איור 2. קבוצות של אשכולות עם תחומים מוגדרים.
הקיבוץ שונה מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל ללא הדרכה עשוי לקבץ קבוצת נתונים של מזג אוויר על סמך הטמפרטורה, וכך לחשוף פילוח שמגדיר את עונות השנה. לאחר מכן תוכלו לנסות לתת שמות לאשכולות האלה על סמך ההבנה שלכם לגבי מערך הנתונים.
איור 3. מודל ML שמקבץ דפוסי מזג אוויר דומים.
איור 4. אשכולות של דפוסי מזג אוויר שמסומנים בתווית 'שלג', 'גשם', 'גשם מעורב בשלג' ו'ללא גשם'.
בדיקת ההבנה
למידה חיזוקים
מודלים של למידת חיזוק מבצעים תחזיות על סמך תגמולים או קנסות על סמך פעולות שמבוצעות בסביבה. מערכת למידה לחיזוק יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר לקבלת כמה שיותר פרסים.
למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר, ותוכנות תוכנה כמו AlphaGo לשחק במשחק Go.
AI גנרטיבי
בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, AI גנרטיבי יכול ליצור תמונות, קומפוזיציות מוזיקה וגם בדיחות ייחודיות. הוא יכול לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.
בינה מלאכותית גנרטיבית יכולה לקבל מגוון מקורות קלט וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו וסרטונים. הוא יכול גם ליצור שילובים שלהם. לדוגמה, מודל יכול לקבל תמונה כקלט וליצור תמונה וטקסט כפלט, או לקבל תמונה וטקסט כקלט וליצור סרטון כפלט.
אפשר לדבר על מודלים גנרטיביים לפי הקלט והפלט שלהם, שבדרך כלל נכתבים בתור 'סוג הקלט'-ל'סוג הפלט'. לדוגמה, הרשימה הבאה היא רשימה חלקית של חלק מהקלט והפלט של מודלים גנרטיביים:
- טקסט לטקסט
- טקסט לתמונה
- טקסט לווידאו
- טקסט לקוד
- טקסט לדיבור
- תמונה וטקסט לתמונה
בטבלה הבאה מפורטות דוגמאות למודלים גנרטיביים, הקלט שלהם ודוגמה לפלט האפשרי שלהם:
דגם | קלט | פלט לדוגמה |
---|---|---|
טקסט לטקסט | מי המציא את מרוץ לה מאן? |
מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (ACO), ארגון רכב שנוסד בשנת 1906. המרוץ הראשון התקיים ב-26 וב-27 במאי 1923 במסלול Sarthe, מסלול דרכים באורך 13.426 ק"מ (8.345 מייל) שנמצא ליד העיירה לה מאן בצרפת.
המרוץ נוצר במקור כדרך לקדם את ACO ואת אזור Sarthe. מקור: Bard |
טקסט לתמונה | תמנון חייזרי צף דרך פורטל בזמן שהוא קורא עיתון. |
מקור: Imagen |
טקסט לווידאו | דובון פוטו-ריאליסטי שוחה באוקיינוס בסן פרנסיסקו. הדובי נכנס למים. הדובי ממשיך לשחות מתחת למים עם דגים צבעוניים. דוב פנדה שוחה מתחת למים. |
מקור: Phenaki |
טקסט לקוד | כתיבה של לולאה ב-Python שמריצה לולאה על רשימת מספרים ומדפיסה את המספרים הראשוניים. |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) מקור: Bard |
המרת תמונה לטקסט |
זוהי פלמינגו. הם נמצאים באיים הקריביים. מקור: Google DeepMind |
איך פועלת בינה מלאכותית גנרטיבית? ברמה גבוהה, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה ליצור נתונים חדשים אך דומים. מודלים גנרטיביים הם כמו:
- קומיקאים שמלמדים את עצמם לחקות אנשים על ידי התבוננות בהתנהגות ובסגנון הדיבור שלהם
- אומנים שלומדים לצייר בסגנון מסוים על ידי לימוד של הרבה ציורים בסגנון הזה
- להקות קאברים שמלמדות את עצמן לנגן כמו להקת מוזיקה ספציפית על ידי האזנה להרבה מוזיקה של הלהקה הזו
כדי ליצור תוצרים ייחודיים וקריאייטיביים, המודלים הגנרטיביים עוברים אימון ראשוני באמצעות גישה ללא הדרכה, שבה המודל לומד לחקות את הנתונים שעליהם הוא מתאמן. לפעמים המודל עובר אימון נוסף באמצעות למידה מבוקרת או למידה לחיזוק על נתונים ספציפיים שקשורים למשימות שהמודל עשוי לבצע, למשל סיכום של מאמר או עריכת תמונה.
AI גנרטיבי הוא טכנולוגיה שמתפתחת במהירות, ומתגלים כל הזמן תרחישים חדשים לשימוש בה. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את תמונות המוצרים שלהם בתחום המסחר האלקטרוני על ידי הסרה אוטומטית של עיוותים ברקע או שיפור האיכות של תמונות ברזולוציה נמוכה.