מילון מונחים ללמידת מכונה: TensorFlow

הדף הזה מכיל מונחים ממילון TensorFlow. כאן מפורטות כל ההגדרות במילון.

B

הסקת מסקנות באצווה

#TensorFlow
#GoogleCloud

תהליך הסקת תחזיות על סמך כמה דוגמאות ללא תוויות שמחולקות לקבוצות משנה קטנות יותר ('קבוצות').

ניתן להשתמש בהסקת נתונים בכמות גדולה (batch) כדי לנצל את תכונות ההרצה במקביל של שבבי המאיץ. כלומר, כמה מאיצים יכולים להסיק בו-זמנית תחזיות על קבוצות שונות של דוגמאות ללא תוויות, וכך להגדיל באופן משמעותי את מספר ההסקות לשנייה.

למידע נוסף, ראו מערכות למידת מכונה בסביבת ייצור: יצירת מסקנות סטטית לעומת דינמית במדריך למתחילים בנושא למידת מכונה.

C

Cloud TPU

#TensorFlow
#GoogleCloud

מעבד חומרה ייעודי שמיועד להאיץ עומסי עבודה של למידת מכונה ב-Google Cloud.

D

Dataset API‏ (tf.data)

#TensorFlow

ממשק API ברמה גבוהה של TensorFlow לקריאת נתונים ולהמרתם לפורמט הנדרש לאלגוריתם של למידת מכונה. אובייקט tf.data.Dataset מייצג רצף של רכיבים, שבהם כל רכיב מכיל Tensor אחד או יותר. אובייקט tf.data.Iterator מספק גישה לרכיבים של Dataset.

מכשיר

#TensorFlow
#GoogleCloud

מונח עם עומס יתר עם שתי ההגדרות האפשריות הבאות:

  1. קטגוריה של חומרה שיכולה להריץ סשן של TensorFlow, כולל מעבדי CPU, מעבדי GPU ו-TPU.
  2. כשמאמנים מודל למידת מכונה בשבבי מאיץ (GPU או TPU), החלק במערכת שמבצע בפועל את הפעולות על טנסורים ומיקומים מוטמעים. המכשיר פועל על שבבי מאיץ. לעומת זאת, המארח פועל בדרך כלל במעבד.

E

ביצוע מיידי

#TensorFlow

סביבת תכנות של TensorFlow שבה פעולות פועלות באופן מיידי. לעומת זאת, פעולות שנקראות בביצוע גרף לא פועלות עד שהן נבדקות באופן מפורש. ביצוע מיידי הוא ממשק אימפרטיבי, בדומה לקוד ברוב שפות התכנות. בדרך כלל קל יותר לנפות באגים בתוכניות לביצוע מיידי מאשר בתוכניות לביצוע גרפי.

Estimator

#TensorFlow

ממשק API של TensorFlow שהוצא משימוש. שימוש ב-tf.keras במקום ב-Estimators.

F

הנדסת פיצ'רים (feature engineering)

#fundamentals
#TensorFlow

תהליך שכולל את השלבים הבאים:

  1. לקבוע אילו תכונות עשויות להיות שימושיות באימון מודל.
  2. המרת נתונים גולמיים ממערך הנתונים לגרסאות יעילות של התכונות האלה.

לדוגמה, יכול להיות שתבחרו להשתמש בתכונה temperature. לאחר מכן, תוכלו להתנסות בחלוקה לקטגוריות כדי לבצע אופטימיזציה של מה שהמודל יכול ללמוד מטווחים שונים של temperature.

לפעמים ההנדסה של המאפיינים נקראת חילוץ מאפיינים או יצירת מאפיינים.

למידע נוסף, אפשר לעיין בקטע נתונים מספריים: איך מודל מטמיע נתונים באמצעות וקטורים של מאפיינים במדריך למתחילים בנושא למידת מכונה.

מפרט תכונה

#TensorFlow

תיאור המידע הנדרש כדי לחלץ נתוני מאפיינים ממאגר הפרוטוקול tf.Example. מאחר שמאגר הפרוטוקול tf.Example הוא רק מאגר לנתונים, צריך לציין את הפרטים הבאים:

  • הנתונים לחילוץ (כלומר, המפתחות של התכונות)
  • סוג הנתונים (לדוגמה, float או int)
  • האורך (קבוע או משתנה)

G

תרשים

#TensorFlow

ב-TensorFlow, מפרט חישוב. הצמתים בתרשים מייצגים פעולות. הקצוות הם מונחים ומציגים העברה של התוצאה של פעולה (Tensor) כאופרטנד לפעולה אחרת. שימוש ב-TensorBoard כדי להציג תרשים באופן חזותי.

ביצוע גרף

#TensorFlow

סביבת תכנות של TensorFlow שבה התוכנית יוצרת קודם תרשים ואז מבצעת את כל התרשים או חלק ממנו. ביצוע גרפים הוא מצב הביצוע שמוגדר כברירת מחדל ב-TensorFlow 1.x.

בניגוד לביצוע מיידי.

H

מארח

#TensorFlow
#GoogleCloud

כשמאמנים מודל למידת מכונה בשבבי מואץ (GPU או TPU), החלק במערכת ששולט בשני הדברים הבאים:

  • זרימת הקוד הכוללת.
  • החילוץ והטרנספורמציה של צינור הקלט.

המארח פועל בדרך כלל במעבד (CPU), ולא בצ'יפ מואץ. המכשיר מבצע מניפולציות על טנסורים בצ'יפים המואצים.

L

Layers API‏ (tf.layers)

#TensorFlow

ממשק API של TensorFlow ליצירת רשת עצבית עמוקה כהרכב של שכבות. באמצעות Layers API אפשר ליצור סוגים שונים של שכבות, כמו:

Layers API פועל לפי המוסכמות של ממשקי ה-API של השכבות ב-Keras. כלומר, מלבד תחילית שונה, לכל הפונקציות ב-Layers API יש את אותם שמות וחתימות כמו של המקבילות שלהן ב-Layers API של Keras.

M

רשת

#TensorFlow
#GoogleCloud

בתכנות מקבילי של למידת מכונה, מונח שמשויך להקצאת הנתונים והמודל לצ'יפים של TPU, ולהגדרת האופן שבו הערכים האלה יתחלקו או ישוחזרו.

המונח Mesh הוא מונח בעל עומס יתר, שיכול להתייחס לאחד מהמונחים הבאים:

  • פריסה פיזית של צ'יפים של TPU.
  • מבנה לוגי מופשט למיפוי הנתונים והמודל לצ'יפים של ה-TPU.

בכל מקרה, רשת מצוינה כצורה.

ערך

#TensorFlow

נתון סטטיסטי שחשוב לכם.

יעד הוא מדד שמערכת למידת המכונה מנסה לבצע אופטימיזציה שלו.

לא

צומת (תרשים TensorFlow)

#TensorFlow

פעולה בתרשים של TensorFlow.

O

פעולה (op)

#TensorFlow

ב-TensorFlow, כל פרוצדורה שיוצרת, מבצעת מניפולציות או מוחקת Tensor. לדוגמה, כפל מטריצות הוא פעולה שמקבלת שני עותקים של Tensor כקלט ויוצרת עותקי Tensor אחד כפלט.

P

שרת פרמטרים (PS)

#TensorFlow

משימה שמשמשת למעקב אחרי הפרמטרים של מודל בסביבה מבוזרת.

Q

רשימת סרטונים

#TensorFlow

פעולה ב-TensorFlow שמטמיעה מבנה נתונים של תור. בדרך כלל משתמשים בהם ב-I/O.

R

rank (Tensor)

#TensorFlow

מספר המאפיינים בTensor. לדוגמה, למשתנה סקלרי יש דרגה 0, למשתנה וקטור יש דרגה 1 ולמטריצה יש דרגה 2.

לא להתבלבל עם דירוג (סדר).

תיקיית שורש

#TensorFlow

הספרייה שציינתם לאירוח ספריות משנה של קובצי האירועים ונקודות הבדיקה של TensorFlow של כמה מודלים.

S

SavedModel

#TensorFlow

הפורמט המומלץ לשמירת מודלים של TensorFlow ולשחזור שלהם. SavedModel הוא פורמט סריאליזציה שניתן לשחזור, ללא תלות בשפה, שמאפשר למערכות ולכלים ברמה גבוהה יותר ליצור, לצרוך ולשנות מודלים של TensorFlow.

פרטים מלאים זמינים בקטע שמירה ושחזור במדריך למפתחים של TensorFlow.

חסכוני

#TensorFlow

אובייקט TensorFlow שאחראי לשמירת נקודות עצירה של מודל.

פצל

#TensorFlow
#GoogleCloud

חלוקה לוגית של קבוצת האימון או של המודל. בדרך כלל, תהליך כלשהו יוצר קטעי קוד על ידי חלוקה של הדוגמאות או של הפרמטרים לקטעים (בדרך כלל) בגודל שווה. לאחר מכן, כל שריד מוקצה למכונה אחרת.

חלוקת מודל לשברים נקראת מקבילות מודל, וחלוקת נתונים לשברים נקראת מקבילות נתונים.

סיכום

#TensorFlow

ב-TensorFlow, ערך או קבוצת ערכים שמחושבים בשלב מסוים, בדרך כלל לצורך מעקב אחר מדדי המודל במהלך האימון.

T

Tensor

#TensorFlow

מבנה הנתונים הראשי בתוכניות TensorFlow. טינסורים הם מבני נתונים ב-N מימדים (כאשר N יכול להיות גדול מאוד), בדרך כלל סקלריים, וקטורים או מטריצות. הרכיבים של טנזור יכולים להכיל ערכים של מספרים שלמים, ערכים של נקודה צפה או מחרוזות.

TensorBoard

#TensorFlow

מרכז הבקרה שבו מוצגים הסיכומים שנשמרו במהלך ההרצה של תוכנית TensorFlow אחת או יותר.

TensorFlow

#TensorFlow

פלטפורמה מבוזרת ללמידת מכונה בקנה מידה גדול. המונח מתייחס גם לשכבת ה-API הבסיסית ב-TensorFlow, שתומכת בחישוב כללי בתרשימי תעבורת נתונים.

אמנם TensorFlow משמש בעיקר ללמידת מכונה, אבל אפשר להשתמש בו גם למשימות שאינן של למידת מכונה, שדורשות חישובים מספריים באמצעות תרשים של תעבורת נתונים.

TensorFlow Playground

#TensorFlow

תוכנית שמציגה באופן חזותי את ההשפעה של פרמטרים היפר-מרחביים שונים על אימון המודלים (בעיקר רשתות נוירונליות). אפשר להיכנס לכתובת http://playground.tensorflow.org כדי להתנסות ב-TensorFlow Playground.

TensorFlow Serving

#TensorFlow

פלטפורמה לפריסה של מודלים מאומנים בסביבת ייצור.

Tensor Processing Unit‏ (TPU)

#TensorFlow
#GoogleCloud

מעגל משולב לאפליקציות ספציפיות (ASIC) שמבצע אופטימיזציה של הביצועים של עומסי עבודה של למידת מכונה. מערכי ה-ASIC האלה נפרסים כצ'יפים של TPU במכשיר TPU.

דירוג טינסור

#TensorFlow

מידע נוסף זמין במאמר rank (Tensor).

צורת הטנזור

#TensorFlow

מספר הרכיבים שTensor מכיל במאפיינים שונים. לדוגמה, ל-Tensor מסוג [5, 10] יש צורה של 5 במאפיין אחד ו-10 במאפיין אחר.

גודל הטנזור

#TensorFlow

המספר הכולל של המשתנים הסקלרים שTensor מכיל. לדוגמה, למערך [5, 10] יש גודל של 50.

tf.Example

#TensorFlow

מאגר פרוטוקול סטנדרטי לתיאור נתוני קלט לאימון או להסקה של מודל למידת מכונה.

tf.keras

#TensorFlow

הטמעה של Keras שמשולבת ב-TensorFlow.

TPU

#TensorFlow
#GoogleCloud

קיצור של Tensor Processing Unit.

צ'יפ TPU

#TensorFlow
#GoogleCloud

מעבד לינארי לתכנות עם זיכרון ברוחב פס גבוה על שבב, שמותאם לאופטימיזציה של עומסי עבודה של למידת מכונה. כמה צ'יפים של TPU נפרסים במכשיר TPU.

מכשיר TPU

#TensorFlow
#GoogleCloud

לוח מעגלים מודפסים (PCB) עם כמה שבבי TPU, ממשקי רשת עם רוחב פס גבוה וחומרה לקרור המערכת.

TPU master

#TensorFlow
#GoogleCloud

תהליך התיאום המרכזי שפועל במכונה המארחת, ששולח ומקבל נתונים, תוצאות, תוכניות, ביצועים ומידע על בריאות המערכת למשימות ה-TPU. המאסטר של TPU מנהל גם את ההגדרה וההשבתה של מכשירי TPU.

צומת TPU

#TensorFlow
#GoogleCloud

משאב TPU ב-Google Cloud עם סוג TPU ספציפי. צומת ה-TPU מתחבר לרשת ה-VPC שלכם מרשת VPC עמית. צמתים של TPU הם משאבים שמוגדרים ב-Cloud TPU API.

TPU Pod

#TensorFlow
#GoogleCloud

תצורה ספציפית של מכשירי TPU במרכז הנתונים של Google. כל המכשירים ב-TPU Pod מחוברים זה לזה דרך רשת ייעודית במהירות גבוהה. אשכול TPU הוא ההגדרה הגדולה ביותר של מכשירי TPU שזמינה לגרסה ספציפית של TPU.

משאב TPU

#TensorFlow
#GoogleCloud

ישות TPU ב-Google Cloud שאתם יוצרים, מנהלים או צורכים. לדוגמה, צומתי TPU וסוגי TPU הם משאבי TPU.

פרוסת TPU

#TensorFlow
#GoogleCloud

פרוסת TPU היא חלק יחסי ממכשירי ה-TPU בTPU Pod. כל המכשירים בפלחי TPU מחוברים זה לזה דרך רשת ייעודית במהירות גבוהה.

סוג ה-TPU

#TensorFlow
#GoogleCloud

הגדרה של מכשיר TPU אחד או יותר עם גרסת חומרה ספציפית של TPU. בוחרים את סוג ה-TPU כשיוצרים צומת TPU ב-Google Cloud. לדוגמה, סוג TPU מסוג v2-8 הוא מכשיר TPU v2 יחיד עם 8 ליבות. לסוג TPU‏ v3-2048 יש 256 מכשירי TPU v3 ברשת, עם סך של 2048 ליבות. סוגי TPU הם משאבים שמוגדרים ב-Cloud TPU API.

TPU worker

#TensorFlow
#GoogleCloud

תהליך שפועל במכונה מארחת ומריץ תוכניות של למידת מכונה במכשירי TPU.