הדף הזה מכיל מונחים במילון המונחים של סוכנים דיגיטליים. כאן אפשר לראות את כל המונחים במילון המונחים.
A
לפעול
שלב בלולאה של סוכן שבו הסוכן מבצע את הפעולה שנבחרה במהלך שלב ההסבר. לדוגמה, שלב הפעולה יכול לשלוח בקשת API.
פעולה
בלמידת חיזוק, המנגנון שבאמצעותו הסוכן עובר בין מצבים של הסביבה. הסוכן בוחר את הפעולה באמצעות מדיניות.
מרחב פעולה
קבוצת המשאבים שסוכן יכול להשתמש בהם כדי לבצע משימה. מרחב הפעולה יכול לכלול את הכלים וממשקי ה-API שהסוכן יכול להפעיל, ואת ההרשאות שיש לסוכן. באופן כללי, מרחב הפעולה צריך להיות גדול מספיק כדי שהסוכן יוכל לבצע את המשימה. אם מרחב הפעולות קטן מדי, יכול להיות שלא יהיו לסוכן מספיק משאבים כדי לבצע את המשימה. אם מרחב הפעולה גדול מדי, הסוכן נוטה להיות מועד יותר לטעויות.
סוכן
תוכנה שיכולה להסיק מסקנות לגבי קלט של משתמשים כדי לתכנן ולבצע פעולות בשם המשתמש.
בלמידת חיזוק, סוכן הוא הישות שמשתמשת במדיניות כדי למקסם את התשואה הצפויה שמתקבלת ממעבר בין מצבים של הסביבה.
אג'נטי
צורת התואר של agent. המונח 'אקטיבי' מתייחס לתכונות של סוכנים (כמו אוטונומיה).
לולאה אג'נטית
מחזור שסוכן חוזר עליו עד שמתקיים תנאי סיום. המחזור בדרך כלל מורכב מארבעת השלבים הבאים:
תהליך עבודה אג'נטי
תהליך דינמי שבו סוכן מתכנן ומבצע פעולות באופן אוטונומי כדי להשיג מטרה. התהליך עשוי לכלול ניתוח, הפעלה של כלים חיצוניים ותיקון עצמי של התוכנית.
תזמור של סוכנים
ניהול וניתוב מרוכזים של משימות בין כמה סוכנים משנה או קריאות ל-LLM. תזמור סוכנים (Agent orchestration) מפרק משימות מורכבות לתתי-משימות קטנות יותר ומקצה אותן לסוכני המשנה המתאימים ביותר.
סוכן אוטונומי
סוכן שפועל להשגת יעד מורכב באמצעות תכנון, פעולה והתאמה ללא התערבות אנושית רציפה.
E
סוכן להערכה
סוכן שמעריך את התוצאות של סוכן אחר לפני שהתוצאות האלה סופיות. אפשר לדמיין נציג אחד שמייצר מוצר ונציג נפרד – נציג ההערכה – שבודק את המוצר לפני שהוא יוצא לשוק.
מבקר הוא מילה נרדפת לסוכן מעריך.
F
משוב
שלב בלולאה של סוכן שבו הסוכן מעריך את הפעולה שבוצעה במהלך שלב הפעולה. לדוגמה, אם הסוכן שלח בקשת API במהלך שלב הפעולה, בשלב המשוב אפשר לקבוע אם תגובת ה-API הייתה מוצלחת.
G
המודלים של Gemini
מודלים מולטימודאליים מבוססי Transformer חדשניים של Google. מודלים של Gemini מיועדים במיוחד לשילוב עם סוכנים.
המשתמשים יכולים לקיים אינטראקציה עם מודלים של Gemini במגוון דרכים, כולל באמצעות ממשק דיאלוג אינטראקטיבי וערכות SDK.
סוכנים גנרטיביים (סימולקרה)
סוכנים עם אישיות, זיכרונות ושגרות ייחודיים שמדמים התנהגות אנושית מציאותית.
פרטים נוספים זמינים במאמר Generative Agents: Interactive Simulacra of Human Behavior.
M
סוכן מנהל
נציג ששולט בנציג משנה אחד או יותר.
שיתוף פעולה בין כמה סוכנים
מסגרת שבה סוכני AI מומחים רבים מקיימים אינטראקציה, מתווכחים או מעבירים משימות אחד לשני כדי לפתור בעיה מורכבת.
O
תצפית
שלב בלולאה של סוכן שבו הסוכן בודק או מעריך היבט מסוים של ההתקדמות שלו. לדוגמה, נניח שבשלב הפעולה נוצר קוד מסוים. לכן, בשלב observe יכול להיות שיופעלו בדיקות על הקוד שנוצר.
P
plan-and-solve
אסטרטגיה אג'נטית שבה המודל מנסח קודם תוכנית מפורטת בת כמה שלבים, לפני שהוא מנסה לבצע פעולות כלשהן.
פלאגין
כלי מודולרי סטנדרטי שאפשר לחבר בקלות לסוכן כדי להרחיב את היכולות שלו. לדוגמה, פלאגין של GitHub מאפשר לסוכנים לבצע פעולות כמו קריאת בעיות ב-GitHub ויצירת בקשות משיכה.
זיכרון פרוצדורלי
בסוכנים, הידע על אופן ביצוע פעולה כלשהי. לדוגמה, יכול להיות שסוכן יפתח זיכרון פרוצדורלי של איך לחפש באינטרנט ואז יציג את שלושת האתרים המובילים.
R
reason
שלב בלולאה של סוכן שבו הסוכן קובע מה לעשות. לדוגמה, הסוכן יכול לקבוע שצריך לשלוח בקשת API מסוימת.
הרהורים
אסטרטגיה לשיפור האיכות של תהליך עבודה מבוסס-סוכן על ידי בדיקה (רפלקציה) של פלט של שלב מסוים לפני העברת הפלט הזה לשלב הבא.
הבודק הוא לרוב אותו LLM שיצר את התשובה (אבל יכול להיות שזה יהיה LLM אחר). איך יכול להיות שאותו LLM שיצר תשובה ישפוט בצורה הוגנת את התשובה שהוא יצר? הטריק הוא להכניס את ה-LLM למצב חשיבה ביקורתי (רפלקטיבי). התהליך הזה דומה לתהליך שבו סופר משתמש בחשיבה יצירתית כדי לכתוב טיוטה ראשונה, ואז עובר לחשיבה ביקורתית כדי לערוך אותה.
לדוגמה, נניח שיש תהליך עבודה מבוסס-סוכן שהשלב הראשון שלו הוא ליצור טקסט לספלי קפה. ההנחיה לשלב הזה יכולה להיות:
אתם אנשים יצירתיים. תייצר טקסט הומוריסטי ומקורי באורך של פחות מ-50 תווים שמתאים לספל קפה.
עכשיו דמיינו את ההנחיה הרפלקטיבית הבאה:
אתה שותה קפה. האם התגובה הקודמת מצחיקה?
לאחר מכן, יכול להיות שרק טקסט שמקבל ציון גבוה של השתקפות יעבור לשלב הבא בתהליך העבודה.
סוכן נתב
סוכן שמסווג שאילתת משתמש ואז מפעיל את הסוכן המתאים ביותר לטיפול בה.
S
תיקון עצמי
היכולת של סוכן לזהות שגיאה בפלט שלו ואז לנסות גישה אחרת.
הסמוי הסופי
בלמידת חיזוק, ערכי הפרמטרים שמתארים את ההגדרה הנוכחית של הסביבה, שהסוכן משתמש בה כדי לבחור פעולה.
סוכן מכונת מצבים
סוכן שתהליכי העבודה שלו מוגבלים על ידי כללים נוקשים. בדרך כלל, סוכני מכונת מצבים עושים פחות טעויות מסוכנים אוטונומיים, אבל אין להם את החופש להתאים את עצמם למצבים שלא נכללים במגבלות שלהם.
סוכן משנה
מודל מיוחד וממוקד שמופעל על ידי סוכן ניהול כדי לטפל בקבוצת משנה ספציפית של בעיה גדולה יותר. בדרך כלל, ל-sub-agents יש מרחב פעולה מצומצם יותר מאשר לאגנטים.
T
תנאי סיום
ב-AI סוכן, הקריטריונים המוגדרים מראש שמנחים את הסוכן להפסיק את האיטרציה. לדוגמה, הנה כמה תנאי סיום אפשריים:
- הסוכן השלים את המטרה.
- הסוכן לא יכול להשתמש במשאבים נוספים.
- human-in-the-loop זיהה בעיה.
בלמידת חיזוק, התנאים שמגדירים מתי מסתיים פרק, למשל כשהסוכן מגיע למצב מסוים או חורג ממספר סף של מעברים בין מצבים. לדוגמה, באיקס עיגול, פרק מסתיים כששחקן מסמן שלושה ריבועים רצופים או כשכל הריבועים מסומנים.