מילון מונחים ללמידת מכונה: TensorFlow

הדף הזה מכיל מונחי מילון מונחים של TensorFlow. לכל המונחים במילון המונחים, לחצו כאן.

B

הֶקֵּשׁ באצווה

#TensorFlow
#GoogleCloud

התהליך של הסקת חיזויים מדוגמאות ללא תווית המחולקות לקבוצות משנה קטנות יותר ("אצווה").

הסקת המסקנות מאצווה יכולה למנף את תכונות המקבילות של צ'יפים של מאיץ. כלומר, מספר מאיצים יכולים בו-זמנית להסיק תחזיות על קבוצות שונות של דוגמאות ללא תוויות, וכך להגדיל באופן משמעותי את מספר ההסקות לשנייה.

C

Cloud TPU

#TensorFlow
#GoogleCloud

מאיץ חומרה ייעודי, שמטרתו להאיץ עומסי עבודה של למידת מכונה ב-Google Cloud.

D

Dataset API (tf.data)

#TensorFlow

API ברמה גבוהה של TensorFlow לקריאת נתונים ולהפיכתם לצורה שנדרשת על ידי אלגוריתם של למידת מכונה. אובייקט tf.data.Dataset מייצג רצף של רכיבים, שבו כל רכיב מכיל Tensor אחד או יותר. אובייקט tf.data.Iterator מספק גישה לרכיבים של Dataset.

לפרטים נוספים על Dataset API, קראו את המאמר tf.data: Build צינורות קלט של TensorFlow במדריך למתכנתים של TensorFlow.

מכשיר

#TensorFlow
#GoogleCloud

מונח עמוס מדי עם שתי ההגדרות האפשריות הבאות:

  1. קטגוריית חומרה שיכולה להריץ סשן TensorFlow, כולל מעבדי CPU, מעבדי GPU ו-TPUs.
  2. כשמאמנים מודל ML על צ'יפים של מאיץ (GPUs או TPU), החלק במערכת שמבצע למעשה מניפולציה של tensors ו-embeddings. המכשיר פועל על צ'יפים של מאיץ. לעומת זאת, המארח פועל בדרך כלל על מעבד (CPU).

ה.

ביצוע נלהב

#TensorFlow

סביבת תכנות ב-TensorFlow שבה operations פועלות באופן מיידי. לעומת זאת, פעולות שנקראות ביצוע תרשים לא פועלות עד שהן עוברות הערכה מפורשת. ביצוע Eager הוא ממשק חיוני, בדומה לקוד ברוב שפות התכנות. בדרך כלל, קל יותר לנפות באגים בתוכניות הפעלה נלהבות מאשר תוכנות לביצוע תרשימים.

מעריך

#TensorFlow

TensorFlow API שהוצא משימוש. השתמשו ב-tf.keras במקום בכלי הערכה.

נ

הנדסת פיצ'רים (feature engineering)

#fundamentals
#TensorFlow

תהליך שכולל את השלבים הבאים:

  1. להחליט אילו תכונות יכולות להועיל לאימון המודל.
  2. המרת נתונים גולמיים ממערך הנתונים לגרסאות יעילות של התכונות האלה.

לדוגמה, יכול להיות שתגלו ש-temperature יכול להיות תכונה מועילה. לאחר מכן תוכלו להתנסות בקטגוריות כדי לבצע אופטימיזציה של מה שהמודל יכול ללמוד מטווחים שונים של temperature.

לפעמים הנדסת התכונות נקראת חילוץ תכונות או פיצ'ר.

מפרט תכונות

#TensorFlow

מתאר את המידע הנדרש לחילוץ נתוני תכונות ממאגר הפרוטוקול tf.Example. מכיוון שמאגר הפרוטוקול tf.Example הוא רק מאגר של נתונים, צריך לציין את הפרטים הבאים:

  • הנתונים לחילוץ (כלומר, המפתחות של התכונות)
  • סוג הנתונים (לדוגמה, מספר ממשי (float) או Int)
  • האורך (קבוע או משתנה)

G

תרשים

#TensorFlow

ב-TensorFlow, מפרט חישוב. הצמתים בתרשים מייצגים פעולות. הקצוות מכוונים ומייצגים העברה של התוצאה של פעולה (Tensor) כאופרנד לפעולה אחרת. אפשר להשתמש ב-TensorBoard כדי להציג תרשים באופן חזותי.

ביצוע גרף

#TensorFlow

סביבת תכנות של TensorFlow שבה קודם כל התוכנית יוצרת תרשים ולאחר מכן מבצעת את כל התרשים או חלק ממנו. ביצוע תרשים הוא מצב הביצוע המוגדר כברירת מחדל ב-TensorFlow 1.x.

בניגוד ל-eager ביצוע.

H

מארח

#TensorFlow
#GoogleCloud

כשמאמנים מודל ML על צ'יפים של מאיצים (GPUs או TPUs), החלק במערכת ששולט בשני הרכיבים הבאים:

  • הזרימה הכוללת של הקוד.
  • החילוץ והטרנספורמציה של צינור הקלט

המארח בדרך כלל פועל במעבד (CPU) ולא בצ'יפ המאיץ; המכשיר מבצע מניפולציה של tensors על הצ'יפים של המאיץ.

L

Layers API (tf.layers)

#TensorFlow

ממשק API של TensorFlow לבניית רשת נוירונים עמוקה כקומפוזיציה של שכבות. אפשר ליצור שכבות ב-Layers API מסוגים שונים, כמו:

ה-Layers API פועל בהתאם למוסכמות של Keras ל-layers API. כלומר, מלבד קידומת אחרת, לכל הפונקציות ב-Layers API יש אותם שמות וחתימות כמו לפונקציות המקבילות ב-Keraslayers API.

M

רשת

#TensorFlow
#GoogleCloud

בתכנות מקבילות של למידת מכונה, מונח שקשור להקצאת הנתונים והמודל לצ'יפים של TPU, והגדרת האופן שבו הערכים האלה יפוצלו או ישוכפלו.

רשת היא מונח עמוס מדי, שיכול להיות בעל אחת מהאפשרויות הבאות:

  • פריסה פיזית של שבבי TPU.
  • מבנה לוגי מופשט למיפוי הנתונים והמודל לצ'יפים של TPU.

בכל מקרה, הרשת מצוינת כצורה.

ערך

#TensorFlow

נתון סטטיסטי שחשוב לכם.

מטרה היא מדד שמערכת למידת מכונה מנסה לבצע לו אופטימיזציה.

לא

צומת (תרשים TensorFlow)

#TensorFlow

פעולה בגרף של TensorFlow.

O

פעולה (op)

#TensorFlow

ב-TensorFlow, כל תהליך שיוצר, משנה או משמיד Tensor, לדוגמה, הכפלה של מטריצה היא פעולה שמקבלת שני tensor כקלט ויוצרת Tensor אחד כפלט.

P

שרת פרמטרים (PS)

#TensorFlow

משימה שעוקבת אחרי הפרמטרים של המודל בהגדרה מבוזרת.

Q

רשימת סרטונים

#TensorFlow

פעולה של TensorFlow שמטמיעה מבנה נתונים של תור. לרוב בשימוש בכנס I/O.

R

דירוג (Tensor)

#TensorFlow

מספר המימדים בTensor. לדוגמה, לסקלרי יש דירוג 0, לווקטור יש דירוג 1 ולמטריצה יש דירוג 2.

חשוב להבין מה ההבדל עם דירוג (ordinality).

תיקיית שורש

#TensorFlow

הספרייה שציינתם לאירוח ספריות משנה של נקודת הביקורת ב-TensorFlow וקובצי אירועים בכמה מודלים.

S

SavedModel

#TensorFlow

הפורמט המומלץ לשמירה ולשחזור של מודלים של TensorFlow. SaveModel הוא פורמט סריאליזציה נייטרלי וניתן לשחזור. הפורמט הזה מאפשר למערכות ולכלים ברמה גבוהה יותר ליצור מודלים של TensorFlow, לצרוך ולשנות אותם.

לפרטים המלאים, עיינו בפרק 'שמירה ושחזור' במדריך למתכנתים של TensorFlow.

חסכוני

#TensorFlow

אובייקט TensorFlow שאחראי לשמירת נקודות הביקורת של המודל.

פיצול

#TensorFlow
#GoogleCloud

חלוקה לוגית של ערכת האימון או של המודל. בדרך כלל, תהליכים מסוימים יוצרים פיצולים על ידי חלוקת הדוגמאות או הפרמטרים למקטעים בגודל שווה (בדרך כלל). לאחר מכן, כל פיצול מוקצה למכונה אחרת.

פיצול של מודל נקרא מקביליות של מודלים; פיצול נתונים נקרא מקביליות של נתונים.

סיכום

#TensorFlow

ב-TensorFlow, ערך או קבוצת ערכים שמחושבים בשלב מסוים, ומשמשים בדרך כלל למעקב אחר מדדי המודל במהלך האימון.

T

Tensor

#TensorFlow

מבנה הנתונים הראשי בתוכניות TensorFlow. טנזורים הם מבני נתונים N-ממדיים (כאשר N יכול להיות גדול מאוד), בדרך כלל הם סקלריים, וקטורים או מטריצות. הרכיבים של Tensor יכולים להכיל ערכים של מספרים שלמים, ערכים של נקודה צפה (floating-point) או מחרוזת.

TensorBoard

#TensorFlow

בלוח הבקרה מוצגים הסיכומים שנשמרו במהלך הפעלה של תוכנית אחת או יותר של TensorFlow.

TensorFlow

#TensorFlow

פלטפורמה מבוזרת ורחבת היקף ללמידת מכונה. המונח מתייחס גם לשכבת ה-API הבסיסית בסטאק TensorFlow, שתומך בחישוב כללי בתרשימים של זרימת נתונים.

TensorFlow משמש בעיקר ללמידת מכונה, אבל אפשר להשתמש ב-TensorFlow גם למשימות שהן לא ML שמחייבות חישוב מספרי באמצעות תרשימי זרימת נתונים.

מגרש משחקים ב-TensorFlow

#TensorFlow

תוכנית שממחישה איך היפר-פרמטרים שונים משפיעים על אימון המודל (בעיקר רשתות נוירונים). נכנסים אל http://playground.tensorflow.org כדי להתנסות ב-TensorFlow Playground.

מילוי בקשות ב-TensorFlow

#TensorFlow

פלטפורמה לפריסה של מודלים מאומנים בסביבת הייצור.

יחידת עיבוד Tensor (TPU)

#TensorFlow
#GoogleCloud

מעגל משולב ספציפי לאפליקציה (ASIC) שמבצע אופטימיזציה לביצועים של עומסי עבודה של למידת מכונה. ה-ASIC הזה פרוס כצ'יפים של TPU במכשיר TPU.

דירוג Tensor

#TensorFlow

ראו דירוג (Tensor).

צורת Tensor

#TensorFlow

מספר הרכיבים שTensor מכיל במאפיינים שונים. לדוגמה, ל-Tensor [5, 10] יש צורה של 5 במימד אחד ו-10 במימד אחר.

גודל Tensor

#TensorFlow

המספר הכולל של הסקלרים שTensor מכיל. לדוגמה, ל-Tensor [5, 10] יש גודל של 50.

tf.Example

#TensorFlow

מאגר פרוטוקול אינטרנט סטנדרטי לתיאור נתוני קלט לאימון מודלים של למידת מכונה או להסקת הנתונים.

tf.keras

#TensorFlow

הטמעה של Keras המשולבת ב-TensorFlow.

TPU

#TensorFlow
#GoogleCloud

קיצור של יחידת עיבוד Tensor.

שבב TPU

#TensorFlow
#GoogleCloud

תהליך האצה של אלגברה לינארית שניתן לתכנות עם זיכרון בעל רוחב פס גבוה על שבב המותאם לעומסי עבודה של למידת מכונה. במכשיר TPU פרוסים מספר צ'יפים של TPU.

מכשיר TPU

#TensorFlow
#GoogleCloud

מעגל מודפס (PCB) עם כמה שבבי TPU, ממשקי רשת עם רוחב פס גבוה וחומרת קירור למערכת.

מאסטר של TPU

#TensorFlow
#GoogleCloud

תהליך התיאום המרכזי שפועל במכונה מארחת ששולחת ומקבלת נתונים, תוצאות, תוכניות, ביצועים ומידע על תקינות המערכת אל עובדי TPU. המאסטר של TPU מנהל גם את ההגדרה והכיבוי של מכשירי TPU.

צומת TPU

#TensorFlow
#GoogleCloud

משאב TPU ב-Google Cloud עם סוג TPU ספציפי. צומת ה-TPU מתחבר לרשת ה-VPC שלכם מרשת VPC השכנה. צומתי TPU הם משאב שמוגדר ב-Cloud TPU API.

TPU Pod

#TensorFlow
#GoogleCloud

הגדרה ספציפית של מכשירי TPU במרכז הנתונים של Google. כל המכשירים ב-TPU Pod מחוברים זה לזה באמצעות רשת ייעודית במהירות גבוהה. TPU Pod הוא ההגדרה הגדולה ביותר של מכשירי TPU שזמינים לגרסת TPU ספציפית.

משאב TPU

#TensorFlow
#GoogleCloud

ישות TPU ב-Google Cloud שאתם יוצרים, מנהלים או צורכים. לדוגמה, צומתי TPU וסוגי TPU הם משאבים של TPU.

פלח TPU

#TensorFlow
#GoogleCloud

קטע TPU הוא חלק חלקי בלבד ממכשירי TPU ב-TPU Pod. כל המכשירים בפלח TPU מחוברים זה לזה באמצעות רשת ייעודית במהירות גבוהה.

סוג TPU

#TensorFlow
#GoogleCloud

הגדרה של מכשיר TPU אחד או יותר עם גרסה ספציפית של חומרת TPU. בוחרים סוג TPU כשיוצרים צומת TPU ב-Google Cloud. לדוגמה, סוג v2-8 TPU הוא מכשיר TPU v2 יחיד עם 8 ליבות. לסוג TPU מסוג v3-2048 יש 256 מכשירי TPU v3 עם חיבור לרשת ו-2,048 ליבות בסך הכול. סוגי TPU הם משאבים שמוגדרים ב-Cloud TPU API.

עובד TPU

#TensorFlow
#GoogleCloud

תהליך שפועל במכונה מארחת ומפעיל תוכנות למידת מכונה במכשירי TPU.