למידת מכונה (ML) מפעילה חלק מהטכנולוגיות הכי חשובות שבהן אנחנו משתמשים, מאפליקציות תרגום ועד לכלי רכב אוטונומיים. בקורס הזה מוסברים המושגים הבסיסיים של למידת מכונה.
ה-ML מציע דרך חדשה לפתור בעיות, לענות על שאלות מורכבות וליצור תוכן חדש. ה-ML יכול לחזות את מזג האוויר, להעריך את משך הנסיעה, להמליץ על שירים, להשלים משפטים באופן אוטומטי, לסכם מאמרים וליצור תמונות שלא נראו קודם.
במילים פשוטות, למידת מכונה היא תהליך של אימון תוכנה, שנקראת מודל, כדי ליצור תחזיות שימושיות או ליצור תוכן (כמו טקסט, תמונות, אודיו או וידאו) מנתונים.
לדוגמה, נניח שאנחנו רוצים ליצור אפליקציה לחיזוי גשמים. אפשר להשתמש בגישה מסורתית או בגישה של למידת מכונה. בגישה המסורתית, אנחנו יוצרים ייצוג מבוסס-פיזיקה של האטמוספירה ופני השטח של כדור הארץ, ומחשבים כמויות עצומות של משוואות דינמיקה של נוזלים. זה קשה מאוד.
בגישה של למידת מכונה, אנחנו נותנים למודל למידת מכונה כמויות עצומות של נתוני מזג אוויר עד שהמודל לומד את הקשר המתמטי בין דפוסי מזג אוויר שמייצרים כמויות שונות של גשם. לאחר מכן, נזין למודל את נתוני מזג האוויר הנוכחיים, והוא יחזה את כמות הגשם.
בדיקת ההבנה
סוגים של מערכות ML
מערכות ML משתייכות לאחת או יותר מהקטגוריות הבאות, בהתאם לאופן שבו הן לומדות לבצע חיזויים או ליצור תוכן:
- למידה מונחית
- למידה לא מפוקחת
- למידת חיזוק
- AI גנרטיבי
למידה מונחית
מודלים של למידה מפוקחת יכולים להפיק תחזיות אחרי שהם מעבדים הרבה נתונים עם תשובות נכונות, ואז לגלות את הקשרים בין הרכיבים בנתונים שמניבים את התשובות הנכונות. זה כמו שתלמיד לומד חומר חדש על ידי עיון במבחנים ישנים שכוללים גם שאלות וגם תשובות. אחרי שהתלמידים מתרגלים מספיק מבחנים ישנים, הם מוכנים לגשת למבחן חדש. מערכות ה-ML האלה הן "מפוקחות" במובן זה שאדם מספק למערכת ה-ML נתונים עם תוצאות נכונות ידועות.
שני התרחישים הנפוצים ביותר לשימוש בלמידה מפוקחת הם רגרסיה וסיווג.
רגרסיה
מודל רגרסיה חוזה ערך מספרי. לדוגמה, מודל מזג אוויר שמנבא את כמות הגשם, באינצ'ים או במילימטרים, הוא מודל רגרסיה.
בטבלה הבאה מופיעות דוגמאות נוספות למודלים של רגרסיה:
| תרחיש | נתוני קלט אפשריים | חיזוי מספרי |
|---|---|---|
| מחיר עתידי של בית | שטח הבית, המיקוד, מספר חדרי השינה והשירותים, גודל המגרש, שיעור הריבית על המשכנתא, שיעור מס הרכוש, עלויות הבנייה ומספר הבתים למכירה באזור. | מחיר הבית. |
| זמן הנסיעה העתידי | תנאי התנועה ההיסטוריים (שנאספים מסמארטפונים, מחיישני תנועה, מאפליקציות להזמנת נסיעות ומאפליקציות ניווט אחרות), המרחק מהיעד ותנאי מזג האוויר. | הזמן בדקות ובשניות להגעה ליעד. |
סיווג
מודלים של סיווג חוזים את הסבירות שפריט מסוים שייך לקטגוריה מסוימת. בניגוד למודלים של רגרסיה, שהפלט שלהם הוא מספר, הפלט של מודלים של סיווג הוא ערך שמציין אם פריט מסוים שייך לקטגוריה מסוימת או לא. לדוגמה, מודלים של סיווג משמשים לחיזוי אם אימייל הוא ספאם או אם תמונה מכילה חתול.
מודלים של סיווג מחולקים לשתי קבוצות: סיווג בינארי וסיווג רב-מחלקתי. מודלים של סיווג בינארי מחזירים ערך ממחלקה שמכילה רק שני ערכים, לדוגמה, מודל שמחזיר rain או no rain. מודלים של סיווג רב-מחלקתי מחזירים ערך ממחלקה שמכילה יותר משני ערכים. לדוגמה, מודל שיכול להחזיר את הערכים rain, hail, snow או sleet.
בדיקת ההבנה
למידה לא מפוקחת
מודל של למידה בלתי מונחית נועד לזהות דפוסים משמעותיים במערך נתונים. לדוגמה, הרבה מודלים של למידה לא מפוקחת מסתמכים על טכניקה שנקראת אשכולות כדי לארגן נתונים דומים לקבוצות ('אשכולות').
איור 1. מודל ML שמבצע אשכול של נקודות נתונים דומות.
איור 2. קבוצות של אשכולות עם גבולות טבעיים.
האשכולות שונים מהסיווג כי אתם לא מגדירים את הקטגוריות. לדוגמה, מודל לא מפוקח יכול לבצע אשכול של מערך נתונים של מזג האוויר על סמך הטמפרטורה, ולחשוף פילוחים שמגדירים את העונות. אחר כך אפשר לנסות לתת שמות לאשכולות האלה על סמך ההבנה של מערך הנתונים.
איור 3. מודל ML שמבצע אשכול של דפוסי מזג אוויר דומים.
איור 4. אוספים של דפוסי מזג אוויר שמסומנים כשלג, גשם מעורב בשלג, גשם וללא גשם.
בדיקת ההבנה
למידת חיזוק
מודלים של למידת חיזוק מפיקים תחזיות על ידי קבלת תגמולים או עונשים על סמך פעולות שבוצעו בסביבה מסוימת. מערכת למידת חיזוקים יוצרת מדיניות שמגדירה את האסטרטגיה הטובה ביותר להשגת התגמולים המקסימליים.
למידת חיזוק משמשת לאימון רובוטים לביצוע משימות, כמו הליכה בחדר, ולתוכנות כמו AlphaGo כדי לשחק במשחק גו.
AI גנרטיבי
בינה מלאכותית גנרטיבית היא סוג של מודלים שיוצרים תוכן מקלט של משתמשים. לדוגמה, AI גנרטיבי יכול ליצור תמונות ייחודיות, יצירות מוזיקליות ובדיחות, לסכם מאמרים, להסביר איך לבצע משימה או לערוך תמונה.
בינה מלאכותית גנרטיבית יכולה לקבל מגוון קלטים וליצור מגוון פלטים, כמו טקסט, תמונות, אודיו וסרטונים. הוא יכול גם ליצור שילובים של אלה. לדוגמה, מודל יכול לקבל תמונה כקלט וליצור תמונה וטקסט כפלט, או לקבל תמונה וטקסט כקלט וליצור סרטון כפלט.
אפשר לדון במודלים גנרטיביים לפי הקלט והפלט שלהם, בדרך כלל בצורה של 'סוג הקלט' ל'סוג הפלט'. לדוגמה, זו רשימה חלקית של כמה קלטים ופלטים של מודלים גנרטיביים:
- טקסט לטקסט
- טקסט לתמונה
- טקסט לווידאו
- טקסט לקוד
- המרת טקסט לדיבור (TTS)
- תמונה וטקסט לתמונה
בטבלה הבאה מופיעות דוגמאות למודלים גנרטיביים, לקלט שלהם ולפלט האפשרי שלהם:
| דגם | קלט | פלט לדוגמה |
|---|---|---|
| טקסט לטקסט | מי המציא את מרוץ לה מאן? |
מרוץ 24 השעות של לה מאן נוסד על ידי Automobile Club de l'Ouest (מועדון הרכב של המערב, ACO), ארגון רכב שנוסד בשנת 1906. המרוץ הראשון התקיים ב-26 וב-27 במאי 1923 במסלול סארת', מסלול כביש באורך 13.426 ק"מ (8.345 מייל) שנמצא ליד העיירה לה מאן בצרפת.
המרוץ נוצר במקור כדי לקדם את ACO ואת אזור סארט. מקור: Bard |
| טקסט לתמונה | תמנון חייזרי צף דרך פורטל בזמן שהוא קורא עיתון. |
![]() מקור: Imagen |
| טקסט לווידאו | תמונה פוטו-ריאליסטית של דובון טדי שוחה באוקיינוס בסן פרנסיסקו. הדובי נכנס מתחת למים. דובון שוחה מתחת למים עם דגים צבעוניים. פנדת ענק שוחה מתחת למים. |
![]() מקור: Phenaki |
| טקסט לקוד | כתוב לולאת Python שחוזרת על רשימה של מספרים ומדפיסה את המספרים הראשוניים. |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) מקור: Bard |
| תמונה לטקסט | ![]() |
זה פלמינגו. הם נמצאים באיים הקריביים. מקור: Google DeepMind |
איך פועלת בינה מלאכותית גנרטיבית? באופן כללי, מודלים גנרטיביים לומדים דפוסים בנתונים במטרה ליצור נתונים חדשים אבל דומים. דוגמאות ל-Generative models:
- קומיקאים שלומדים לחקות אחרים על ידי התבוננות בהתנהגויות של אנשים ובסגנון הדיבור שלהם
- אומנים שלומדים לצייר בסגנון מסוים על ידי לימוד של הרבה ציורים בסגנון הזה
- להקות קאברים שלומדות להישמע כמו להקת מוזיקה ספציפית על ידי האזנה להרבה מוזיקה של אותה להקה
כדי ליצור פלט ייחודי ויצירתי, המודלים הגנרטיביים עוברים אימון ראשוני בגישה לא מפוקחת, שבה המודל לומד לחקות את הנתונים שעליהם הוא מתאמן. לפעמים המודל עובר אימון נוסף באמצעות למידה מפוקחת או למידת חיזוק על נתונים ספציפיים שקשורים למשימות שהמודל עשוי להתבקש לבצע, למשל סיכום מאמר או עריכת תמונה.
AI גנרטיבי הוא טכנולוגיה שמתפתחת במהירות, וכל הזמן מתגלים שימושים חדשים. לדוגמה, מודלים גנרטיביים עוזרים לעסקים לשפר את תמונות המוצרים שלהם במסחר אלקטרוני על ידי הסרה אוטומטית של רקעים שמסיחים את הדעת או שיפור האיכות של תמונות ברזולוציה נמוכה.


