הדף הזה מכיל מונחי מילון מונחים של TensorFlow. לכל המונחים במילון המונחים, לחצו כאן.
B
הֶקֵּשׁ באצווה
התהליך של הסקת חיזויים מדוגמאות ללא תווית המחולקות לקבוצות משנה קטנות יותר ("אצווה").
הסקת המסקנות מאצווה יכולה למנף את תכונות המקבילות של צ'יפים של מאיץ. כלומר, מספר מאיצים יכולים בו-זמנית להסיק תחזיות על קבוצות שונות של דוגמאות ללא תוויות, וכך להגדיל באופן משמעותי את מספר ההסקות לשנייה.
C
Cloud TPU
מאיץ חומרה ייעודי, שמטרתו להאיץ עומסי עבודה של למידת מכונה ב-Google Cloud.
D
Dataset API (tf.data)
API ברמה גבוהה של TensorFlow לקריאת נתונים ולהפיכתם לצורה שנדרשת על ידי אלגוריתם של למידת מכונה.
אובייקט tf.data.Dataset
מייצג רצף של רכיבים, שבו כל רכיב מכיל Tensor אחד או יותר. אובייקט tf.data.Iterator
מספק גישה לרכיבים של Dataset
.
לפרטים נוספים על Dataset API, קראו את המאמר tf.data: Build צינורות קלט של TensorFlow במדריך למתכנתים של TensorFlow.
מכשיר
מונח עמוס מדי עם שתי ההגדרות האפשריות הבאות:
- קטגוריית חומרה שיכולה להריץ סשן TensorFlow, כולל מעבדי CPU, מעבדי GPU ו-TPUs.
- כשמאמנים מודל ML על צ'יפים של מאיץ (GPUs או TPU), החלק במערכת שמבצע למעשה מניפולציה של tensors ו-embeddings. המכשיר פועל על צ'יפים של מאיץ. לעומת זאת, המארח פועל בדרך כלל על מעבד (CPU).
ה.
ביצוע נלהב
סביבת תכנות ב-TensorFlow שבה operations פועלות באופן מיידי. לעומת זאת, פעולות שנקראות ביצוע תרשים לא פועלות עד שהן עוברות הערכה מפורשת. ביצוע Eager הוא ממשק חיוני, בדומה לקוד ברוב שפות התכנות. בדרך כלל, קל יותר לנפות באגים בתוכניות הפעלה נלהבות מאשר תוכנות לביצוע תרשימים.
מעריך
TensorFlow API שהוצא משימוש. השתמשו ב-tf.keras במקום בכלי הערכה.
נ
הנדסת פיצ'רים (feature engineering)
תהליך שכולל את השלבים הבאים:
- להחליט אילו תכונות יכולות להועיל לאימון המודל.
- המרת נתונים גולמיים ממערך הנתונים לגרסאות יעילות של התכונות האלה.
לדוגמה, יכול להיות שתגלו ש-temperature
יכול להיות תכונה מועילה. לאחר מכן תוכלו להתנסות בקטגוריות כדי לבצע אופטימיזציה של מה שהמודל יכול ללמוד מטווחים שונים של temperature
.
לפעמים הנדסת התכונות נקראת חילוץ תכונות או פיצ'ר.
מפרט תכונות
מתאר את המידע הנדרש לחילוץ נתוני תכונות ממאגר הפרוטוקול tf.Example. מכיוון שמאגר הפרוטוקול tf.Example הוא רק מאגר של נתונים, צריך לציין את הפרטים הבאים:
- הנתונים לחילוץ (כלומר, המפתחות של התכונות)
- סוג הנתונים (לדוגמה, מספר ממשי (float) או Int)
- האורך (קבוע או משתנה)
G
תרשים
ב-TensorFlow, מפרט חישוב. הצמתים בתרשים מייצגים פעולות. הקצוות מכוונים ומייצגים העברה של התוצאה של פעולה (Tensor) כאופרנד לפעולה אחרת. אפשר להשתמש ב-TensorBoard כדי להציג תרשים באופן חזותי.
ביצוע גרף
סביבת תכנות של TensorFlow שבה קודם כל התוכנית יוצרת תרשים ולאחר מכן מבצעת את כל התרשים או חלק ממנו. ביצוע תרשים הוא מצב הביצוע המוגדר כברירת מחדל ב-TensorFlow 1.x.
בניגוד ל-eager ביצוע.
H
מארח
כשמאמנים מודל ML על צ'יפים של מאיצים (GPUs או TPUs), החלק במערכת ששולט בשני הרכיבים הבאים:
- הזרימה הכוללת של הקוד.
- החילוץ והטרנספורמציה של צינור הקלט
המארח בדרך כלל פועל במעבד (CPU) ולא בצ'יפ המאיץ; המכשיר מבצע מניפולציה של tensors על הצ'יפים של המאיץ.
L
Layers API (tf.layers)
ממשק API של TensorFlow לבניית רשת נוירונים עמוקה כקומפוזיציה של שכבות. אפשר ליצור שכבות ב-Layers API מסוגים שונים, כמו:
tf.layers.Dense
לשכבה שמחוברת באופן מלא.tf.layers.Conv2D
לשכבה קונבולטורית.
ה-Layers API פועל בהתאם למוסכמות של Keras ל-layers API. כלומר, מלבד קידומת אחרת, לכל הפונקציות ב-Layers API יש אותם שמות וחתימות כמו לפונקציות המקבילות ב-Keraslayers API.
M
רשת
בתכנות מקבילות של למידת מכונה, מונח שקשור להקצאת הנתונים והמודל לצ'יפים של TPU, והגדרת האופן שבו הערכים האלה יפוצלו או ישוכפלו.
רשת היא מונח עמוס מדי, שיכול להיות בעל אחת מהאפשרויות הבאות:
- פריסה פיזית של שבבי TPU.
- מבנה לוגי מופשט למיפוי הנתונים והמודל לצ'יפים של TPU.
בכל מקרה, הרשת מצוינת כצורה.
ערך
נתון סטטיסטי שחשוב לכם.
מטרה היא מדד שמערכת למידת מכונה מנסה לבצע לו אופטימיזציה.
לא
צומת (תרשים TensorFlow)
פעולה בגרף של TensorFlow.
O
פעולה (op)
ב-TensorFlow, כל תהליך שיוצר, משנה או משמיד Tensor, לדוגמה, הכפלה של מטריצה היא פעולה שמקבלת שני tensor כקלט ויוצרת Tensor אחד כפלט.
P
שרת פרמטרים (PS)
משימה שעוקבת אחרי הפרמטרים של המודל בהגדרה מבוזרת.
Q
רשימת סרטונים
פעולה של TensorFlow שמטמיעה מבנה נתונים של תור. לרוב בשימוש בכנס I/O.
R
דירוג (Tensor)
מספר המימדים בTensor. לדוגמה, לסקלרי יש דירוג 0, לווקטור יש דירוג 1 ולמטריצה יש דירוג 2.
חשוב להבין מה ההבדל עם דירוג (ordinality).
תיקיית שורש
הספרייה שציינתם לאירוח ספריות משנה של נקודת הביקורת ב-TensorFlow וקובצי אירועים בכמה מודלים.
S
SavedModel
הפורמט המומלץ לשמירה ולשחזור של מודלים של TensorFlow. SaveModel הוא פורמט סריאליזציה נייטרלי וניתן לשחזור. הפורמט הזה מאפשר למערכות ולכלים ברמה גבוהה יותר ליצור מודלים של TensorFlow, לצרוך ולשנות אותם.
לפרטים המלאים, עיינו בפרק 'שמירה ושחזור' במדריך למתכנתים של TensorFlow.
חסכוני
אובייקט TensorFlow שאחראי לשמירת נקודות הביקורת של המודל.
פיצול
חלוקה לוגית של ערכת האימון או של המודל. בדרך כלל, תהליכים מסוימים יוצרים פיצולים על ידי חלוקת הדוגמאות או הפרמטרים למקטעים בגודל שווה (בדרך כלל). לאחר מכן, כל פיצול מוקצה למכונה אחרת.
פיצול של מודל נקרא מקביליות של מודלים; פיצול נתונים נקרא מקביליות של נתונים.
סיכום
ב-TensorFlow, ערך או קבוצת ערכים שמחושבים בשלב מסוים, ומשמשים בדרך כלל למעקב אחר מדדי המודל במהלך האימון.
T
Tensor
מבנה הנתונים הראשי בתוכניות TensorFlow. טנזורים הם מבני נתונים N-ממדיים (כאשר N יכול להיות גדול מאוד), בדרך כלל הם סקלריים, וקטורים או מטריצות. הרכיבים של Tensor יכולים להכיל ערכים של מספרים שלמים, ערכים של נקודה צפה (floating-point) או מחרוזת.
TensorBoard
בלוח הבקרה מוצגים הסיכומים שנשמרו במהלך הפעלה של תוכנית אחת או יותר של TensorFlow.
TensorFlow
פלטפורמה מבוזרת ורחבת היקף ללמידת מכונה. המונח מתייחס גם לשכבת ה-API הבסיסית בסטאק TensorFlow, שתומך בחישוב כללי בתרשימים של זרימת נתונים.
TensorFlow משמש בעיקר ללמידת מכונה, אבל אפשר להשתמש ב-TensorFlow גם למשימות שהן לא ML שמחייבות חישוב מספרי באמצעות תרשימי זרימת נתונים.
מגרש משחקים ב-TensorFlow
תוכנית שממחישה איך היפר-פרמטרים שונים משפיעים על אימון המודל (בעיקר רשתות נוירונים). נכנסים אל http://playground.tensorflow.org כדי להתנסות ב-TensorFlow Playground.
מילוי בקשות ב-TensorFlow
פלטפורמה לפריסה של מודלים מאומנים בסביבת הייצור.
יחידת עיבוד Tensor (TPU)
מעגל משולב ספציפי לאפליקציה (ASIC) שמבצע אופטימיזציה לביצועים של עומסי עבודה של למידת מכונה. ה-ASIC הזה פרוס כצ'יפים של TPU במכשיר TPU.
דירוג Tensor
ראו דירוג (Tensor).
צורת Tensor
מספר הרכיבים שTensor מכיל במאפיינים שונים.
לדוגמה, ל-Tensor [5, 10]
יש צורה של 5 במימד אחד ו-10 במימד אחר.
גודל Tensor
המספר הכולל של הסקלרים שTensor מכיל. לדוגמה, ל-Tensor [5, 10]
יש גודל של 50.
tf.Example
מאגר פרוטוקול אינטרנט סטנדרטי לתיאור נתוני קלט לאימון מודלים של למידת מכונה או להסקת הנתונים.
tf.keras
הטמעה של Keras המשולבת ב-TensorFlow.
TPU
קיצור של יחידת עיבוד Tensor.
שבב TPU
תהליך האצה של אלגברה לינארית שניתן לתכנות עם זיכרון בעל רוחב פס גבוה על שבב המותאם לעומסי עבודה של למידת מכונה. במכשיר TPU פרוסים מספר צ'יפים של TPU.
מכשיר TPU
מעגל מודפס (PCB) עם כמה שבבי TPU, ממשקי רשת עם רוחב פס גבוה וחומרת קירור למערכת.
מאסטר של TPU
תהליך התיאום המרכזי שפועל במכונה מארחת ששולחת ומקבלת נתונים, תוצאות, תוכניות, ביצועים ומידע על תקינות המערכת אל עובדי TPU. המאסטר של TPU מנהל גם את ההגדרה והכיבוי של מכשירי TPU.
צומת TPU
משאב TPU ב-Google Cloud עם סוג TPU ספציפי. צומת ה-TPU מתחבר לרשת ה-VPC שלכם מרשת VPC השכנה. צומתי TPU הם משאב שמוגדר ב-Cloud TPU API.
TPU Pod
הגדרה ספציפית של מכשירי TPU במרכז הנתונים של Google. כל המכשירים ב-TPU Pod מחוברים זה לזה באמצעות רשת ייעודית במהירות גבוהה. TPU Pod הוא ההגדרה הגדולה ביותר של מכשירי TPU שזמינים לגרסת TPU ספציפית.
משאב TPU
ישות TPU ב-Google Cloud שאתם יוצרים, מנהלים או צורכים. לדוגמה, צומתי TPU וסוגי TPU הם משאבים של TPU.
פלח TPU
קטע TPU הוא חלק חלקי בלבד ממכשירי TPU ב-TPU Pod. כל המכשירים בפלח TPU מחוברים זה לזה באמצעות רשת ייעודית במהירות גבוהה.
סוג TPU
הגדרה של מכשיר TPU אחד או יותר עם גרסה ספציפית של חומרת TPU. בוחרים סוג TPU כשיוצרים צומת TPU ב-Google Cloud. לדוגמה, סוג v2-8
TPU הוא מכשיר TPU v2 יחיד עם 8 ליבות. לסוג TPU מסוג v3-2048
יש 256 מכשירי TPU v3 עם חיבור לרשת ו-2,048 ליבות בסך הכול. סוגי TPU הם משאבים שמוגדרים ב-Cloud TPU API.
עובד TPU
תהליך שפועל במכונה מארחת ומפעיל תוכנות למידת מכונה במכשירי TPU.