הדף הזה מכיל מונחים ממילון TensorFlow. כאן מפורטות כל ההגדרות במילון.
B
הסקת מסקנות באצווה
תהליך הסקת תחזיות על סמך כמה דוגמאות ללא תוויות שמחולקות לקבוצות משנה קטנות יותר ('קבוצות').
ניתן להשתמש בהסקת נתונים בכמות גדולה (batch) כדי לנצל את תכונות ההרצה במקביל של שבבי המאיץ. כלומר, כמה מאיצים יכולים להסיק בו-זמנית תחזיות על קבוצות שונות של דוגמאות ללא תוויות, וכך להגדיל באופן משמעותי את מספר ההסקות לשנייה.
למידע נוסף, ראו מערכות למידת מכונה בסביבת ייצור: יצירת מסקנות סטטית לעומת דינמית במדריך למתחילים בנושא למידת מכונה.
C
Cloud TPU
מעבד חומרה ייעודי שמיועד להאיץ עומסי עבודה של למידת מכונה ב-Google Cloud.
D
Dataset API (tf.data)
ממשק API ברמה גבוהה של TensorFlow לקריאת נתונים ולהמרתם לפורמט הנדרש לאלגוריתם של למידת מכונה.
אובייקט tf.data.Dataset
מייצג רצף של רכיבים, שבהם כל רכיב מכיל Tensor אחד או יותר. אובייקט tf.data.Iterator
מספק גישה לרכיבים של Dataset
.
מכשיר
מונח עם עומס יתר עם שתי ההגדרות האפשריות הבאות:
- קטגוריה של חומרה שיכולה להריץ סשן של TensorFlow, כולל מעבדי CPU, מעבדי GPU ו-TPU.
- כשמאמנים מודל למידת מכונה בשבבי מאיץ (GPU או TPU), החלק במערכת שמבצע בפועל את הפעולות על טנסורים ומיקומים מוטמעים. המכשיר פועל על שבבי מאיץ. לעומת זאת, המארח פועל בדרך כלל במעבד.
E
ביצוע מיידי
סביבת תכנות של TensorFlow שבה פעולות פועלות באופן מיידי. לעומת זאת, פעולות שנקראות בביצוע גרף לא פועלות עד שהן נבדקות באופן מפורש. ביצוע מיידי הוא ממשק אימפרטיבי, בדומה לקוד ברוב שפות התכנות. בדרך כלל קל יותר לנפות באגים בתוכניות לביצוע מיידי מאשר בתוכניות לביצוע גרפי.
Estimator
ממשק API של TensorFlow שהוצא משימוש. שימוש ב-tf.keras במקום ב-Estimators.
F
הנדסת פיצ'רים (feature engineering)
תהליך שכולל את השלבים הבאים:
- לקבוע אילו תכונות עשויות להיות שימושיות באימון מודל.
- המרת נתונים גולמיים ממערך הנתונים לגרסאות יעילות של התכונות האלה.
לדוגמה, יכול להיות שתבחרו להשתמש בתכונה temperature
. לאחר מכן, תוכלו להתנסות בחלוקה לקטגוריות כדי לבצע אופטימיזציה של מה שהמודל יכול ללמוד מטווחים שונים של temperature
.
לפעמים ההנדסה של המאפיינים נקראת חילוץ מאפיינים או יצירת מאפיינים.
למידע נוסף, אפשר לעיין בקטע נתונים מספריים: איך מודל מטמיע נתונים באמצעות וקטורים של מאפיינים במדריך למתחילים בנושא למידת מכונה.
מפרט תכונה
תיאור המידע הנדרש כדי לחלץ נתוני מאפיינים ממאגר הפרוטוקול tf.Example. מאחר שמאגר הפרוטוקול tf.Example הוא רק מאגר לנתונים, צריך לציין את הפרטים הבאים:
- הנתונים לחילוץ (כלומר, המפתחות של התכונות)
- סוג הנתונים (לדוגמה, float או int)
- האורך (קבוע או משתנה)
G
תרשים
ב-TensorFlow, מפרט חישוב. הצמתים בתרשים מייצגים פעולות. הקצוות הם מונחים ומציגים העברה של התוצאה של פעולה (Tensor) כאופרטנד לפעולה אחרת. שימוש ב-TensorBoard כדי להציג תרשים באופן חזותי.
ביצוע גרף
סביבת תכנות של TensorFlow שבה התוכנית יוצרת קודם תרשים ואז מבצעת את כל התרשים או חלק ממנו. ביצוע גרפים הוא מצב הביצוע שמוגדר כברירת מחדל ב-TensorFlow 1.x.
בניגוד לביצוע מיידי.
H
מארח
כשמאמנים מודל למידת מכונה בשבבי מואץ (GPU או TPU), החלק במערכת ששולט בשני הדברים הבאים:
- זרימת הקוד הכוללת.
- החילוץ והטרנספורמציה של צינור הקלט.
המארח פועל בדרך כלל במעבד (CPU), ולא בצ'יפ מואץ. המכשיר מבצע מניפולציות על טנסורים בצ'יפים המואצים.
L
Layers API (tf.layers)
ממשק API של TensorFlow ליצירת רשת עצבית עמוקה כהרכב של שכבות. באמצעות Layers API אפשר ליצור סוגים שונים של שכבות, כמו:
tf.layers.Dense
לשכבה מקושרת באופן מלא.tf.layers.Conv2D
לשכבת convolve.
Layers API פועל לפי המוסכמות של ממשקי ה-API של השכבות ב-Keras. כלומר, מלבד תחילית שונה, לכל הפונקציות ב-Layers API יש את אותם שמות וחתימות כמו של המקבילות שלהן ב-Layers API של Keras.
M
רשת
בתכנות מקבילי של למידת מכונה, מונח שמשויך להקצאת הנתונים והמודל לצ'יפים של TPU, ולהגדרת האופן שבו הערכים האלה יתחלקו או ישוחזרו.
המונח Mesh הוא מונח בעל עומס יתר, שיכול להתייחס לאחד מהמונחים הבאים:
- פריסה פיזית של צ'יפים של TPU.
- מבנה לוגי מופשט למיפוי הנתונים והמודל לצ'יפים של ה-TPU.
בכל מקרה, רשת מצוינה כצורה.
ערך
נתון סטטיסטי שחשוב לכם.
יעד הוא מדד שמערכת למידת המכונה מנסה לבצע אופטימיזציה שלו.
לא
צומת (תרשים TensorFlow)
פעולה בתרשים של TensorFlow.
O
פעולה (op)
ב-TensorFlow, כל פרוצדורה שיוצרת, מבצעת מניפולציות או מוחקת Tensor. לדוגמה, כפל מטריצות הוא פעולה שמקבלת שני עותקים של Tensor כקלט ויוצרת עותקי Tensor אחד כפלט.
P
שרת פרמטרים (PS)
משימה שמשמשת למעקב אחרי הפרמטרים של מודל בסביבה מבוזרת.
Q
רשימת סרטונים
פעולה ב-TensorFlow שמטמיעה מבנה נתונים של תור. בדרך כלל משתמשים בהם ב-I/O.
R
rank (Tensor)
מספר המאפיינים בTensor. לדוגמה, למשתנה סקלרי יש דרגה 0, למשתנה וקטור יש דרגה 1 ולמטריצה יש דרגה 2.
לא להתבלבל עם דירוג (סדר).
תיקיית שורש
הספרייה שציינתם לאירוח ספריות משנה של קובצי האירועים ונקודות הבדיקה של TensorFlow של כמה מודלים.
S
SavedModel
הפורמט המומלץ לשמירת מודלים של TensorFlow ולשחזור שלהם. SavedModel הוא פורמט סריאליזציה שניתן לשחזור, ללא תלות בשפה, שמאפשר למערכות ולכלים ברמה גבוהה יותר ליצור, לצרוך ולשנות מודלים של TensorFlow.
פרטים מלאים זמינים בקטע שמירה ושחזור במדריך למפתחים של TensorFlow.
חסכוני
אובייקט TensorFlow שאחראי לשמירת נקודות עצירה של מודל.
פצל
חלוקה לוגית של קבוצת האימון או של המודל. בדרך כלל, תהליך כלשהו יוצר קטעי קוד על ידי חלוקה של הדוגמאות או של הפרמטרים לקטעים (בדרך כלל) בגודל שווה. לאחר מכן, כל שריד מוקצה למכונה אחרת.
חלוקת מודל לשברים נקראת מקבילות מודל, וחלוקת נתונים לשברים נקראת מקבילות נתונים.
סיכום
ב-TensorFlow, ערך או קבוצת ערכים שמחושבים בשלב מסוים, בדרך כלל לצורך מעקב אחר מדדי המודל במהלך האימון.
T
Tensor
מבנה הנתונים הראשי בתוכניות TensorFlow. טינסורים הם מבני נתונים ב-N מימדים (כאשר N יכול להיות גדול מאוד), בדרך כלל סקלריים, וקטורים או מטריצות. הרכיבים של טנזור יכולים להכיל ערכים של מספרים שלמים, ערכים של נקודה צפה או מחרוזות.
TensorBoard
מרכז הבקרה שבו מוצגים הסיכומים שנשמרו במהלך ההרצה של תוכנית TensorFlow אחת או יותר.
TensorFlow
פלטפורמה מבוזרת ללמידת מכונה בקנה מידה גדול. המונח מתייחס גם לשכבת ה-API הבסיסית ב-TensorFlow, שתומכת בחישוב כללי בתרשימי תעבורת נתונים.
אמנם TensorFlow משמש בעיקר ללמידת מכונה, אבל אפשר להשתמש בו גם למשימות שאינן של למידת מכונה, שדורשות חישובים מספריים באמצעות תרשים של תעבורת נתונים.
TensorFlow Playground
תוכנית שמציגה באופן חזותי את ההשפעה של פרמטרים היפר-מרחביים שונים על אימון המודלים (בעיקר רשתות נוירונליות). אפשר להיכנס לכתובת http://playground.tensorflow.org כדי להתנסות ב-TensorFlow Playground.
TensorFlow Serving
פלטפורמה לפריסה של מודלים מאומנים בסביבת ייצור.
Tensor Processing Unit (TPU)
מעגל משולב לאפליקציות ספציפיות (ASIC) שמבצע אופטימיזציה של הביצועים של עומסי עבודה של למידת מכונה. מערכי ה-ASIC האלה נפרסים כצ'יפים של TPU במכשיר TPU.
דירוג טינסור
מידע נוסף זמין במאמר rank (Tensor).
צורת הטנזור
מספר הרכיבים שTensor מכיל במאפיינים שונים.
לדוגמה, ל-Tensor מסוג [5, 10]
יש צורה של 5 במאפיין אחד ו-10 במאפיין אחר.
גודל הטנזור
המספר הכולל של המשתנים הסקלרים שTensor מכיל. לדוגמה, למערך [5, 10]
יש גודל של 50.
tf.Example
מאגר פרוטוקול סטנדרטי לתיאור נתוני קלט לאימון או להסקה של מודל למידת מכונה.
tf.keras
הטמעה של Keras שמשולבת ב-TensorFlow.
TPU
קיצור של Tensor Processing Unit.
צ'יפ TPU
מעבד לינארי לתכנות עם זיכרון ברוחב פס גבוה על שבב, שמותאם לאופטימיזציה של עומסי עבודה של למידת מכונה. כמה צ'יפים של TPU נפרסים במכשיר TPU.
מכשיר TPU
לוח מעגלים מודפסים (PCB) עם כמה שבבי TPU, ממשקי רשת עם רוחב פס גבוה וחומרה לקרור המערכת.
TPU master
תהליך התיאום המרכזי שפועל במכונה המארחת, ששולח ומקבל נתונים, תוצאות, תוכניות, ביצועים ומידע על בריאות המערכת למשימות ה-TPU. המאסטר של TPU מנהל גם את ההגדרה וההשבתה של מכשירי TPU.
צומת TPU
משאב TPU ב-Google Cloud עם סוג TPU ספציפי. צומת ה-TPU מתחבר לרשת ה-VPC שלכם מרשת VPC עמית. צמתים של TPU הם משאבים שמוגדרים ב-Cloud TPU API.
TPU Pod
תצורה ספציפית של מכשירי TPU במרכז הנתונים של Google. כל המכשירים ב-TPU Pod מחוברים זה לזה דרך רשת ייעודית במהירות גבוהה. אשכול TPU הוא ההגדרה הגדולה ביותר של מכשירי TPU שזמינה לגרסה ספציפית של TPU.
משאב TPU
ישות TPU ב-Google Cloud שאתם יוצרים, מנהלים או צורכים. לדוגמה, צומתי TPU וסוגי TPU הם משאבי TPU.
פרוסת TPU
פרוסת TPU היא חלק יחסי ממכשירי ה-TPU בTPU Pod. כל המכשירים בפלחי TPU מחוברים זה לזה דרך רשת ייעודית במהירות גבוהה.
סוג ה-TPU
הגדרה של מכשיר TPU אחד או יותר עם גרסת חומרה ספציפית של TPU. בוחרים את סוג ה-TPU כשיוצרים צומת TPU ב-Google Cloud. לדוגמה, סוג TPU מסוג v2-8
הוא מכשיר TPU v2 יחיד עם 8 ליבות. לסוג TPU v3-2048
יש 256 מכשירי TPU v3 ברשת, עם סך של 2048 ליבות. סוגי TPU הם משאבים שמוגדרים ב-Cloud TPU API.
TPU worker
תהליך שפועל במכונה מארחת ומריץ תוכניות של למידת מכונה במכשירי TPU.