本頁面包含 TensorFlow 術語。如要查看所有詞彙,請按這裡。
C
Cloud TPU
專門設計的硬體加速器,用於加快 Google Cloud 上的機器學習工作負載。
D
Dataset API (tf.data)
高階 TensorFlow API,用於讀取資料並轉換成機器學習演算法所需的格式。tf.data.Dataset
物件代表元素序列,其中每個元素都包含一或多個 Tensor。tf.data.Iterator
物件可存取 Dataset
的元素。
裝置
這個詞彙有兩種可能的定義:
- 可執行 TensorFlow 工作階段的硬體類別,包括 CPU、GPU 和 TPU。
- 在加速器晶片 (GPU 或 TPU) 上訓練機器學習模型時,系統中實際操控張量和嵌入的部分。裝置搭載加速器晶片,相較之下,主機通常在 CPU 上執行。
E
Eager Execution
TensorFlow 程式設計環境,可立即執行作業。相反地,在圖形執行中呼叫的作業不會執行,直到明確評估為止。即時執行是命令式介面,與大多數程式設計語言中的程式碼非常相似。一般來說,相較於圖形執行程式,Eager Execution 程式的偵錯難度低得多。
Estimator
已淘汰的 TensorFlow API。請改用 tf.keras,而非 Estimator。
F
特徵工程
這項程序包含下列步驟:
- 判斷哪些特徵可能適合用來訓練模型。
- 將資料集中的原始資料轉換為這些特徵的有效版本。
舉例來說,您可能會判斷 temperature
是實用的功能。接著,您可以嘗試分組,最佳化模型從不同 temperature
範圍學習的內容。
詳情請參閱機器學習速成課程中的「數值資料:模型如何使用特徵向量擷取資料」。
功能規格
說明從 tf.Example 通訊協定緩衝區擷取特徵資料所需的資訊。由於 tf.Example 通訊協定緩衝區只是資料的容器,因此您必須指定下列項目:
- 要擷取的資料 (即功能的鍵)
- 資料類型 (例如 float 或 int)
- 長度 (固定或可變)
G
圖表
在 TensorFlow 中,這是運算規格。圖中的節點代表作業。邊緣是有方向性的,代表將作業結果 (Tensor) 做為運算元傳遞至另一項作業。使用 TensorBoard 將圖表視覺化。
圖表執行
TensorFlow 程式設計環境,程式會先建構圖表,然後執行該圖表的部分或全部內容。TensorFlow 1.x 的預設執行模式為圖形執行。
與「急切執行」形成對比。
H
主機
在加速器晶片 (GPU 或 TPU) 上訓練 ML 模型時,系統中負責控制下列兩項作業的部分:
- 程式碼的整體流程。
- 輸入管道的擷取和轉換作業。
主機通常在 CPU 上執行,而不是在加速器晶片上執行;裝置會在加速器晶片上操控張量。
L
Layers API (tf.layers)
TensorFlow API,用於建構深層類神經網路,做為層的組合。Layers API 可讓您建構不同類型的圖層,例如:
tf.layers.Dense
,適用於全連接層。tf.layers.Conv2D
代表卷積層。
Layers API 遵循 Keras layers API 慣例。 也就是說,除了前置字元不同之外,Layers API 中的所有函式名稱和簽章,都與 Keras 層 API 中的對應函式相同。
M
網格
在機器學習平行程式設計中,這個詞彙與將資料和模型指派給 TPU 晶片,以及定義這些值如何分片或複製有關。
「網格」一詞有多種含意,可能指下列任一項目:
- TPU 晶片的實體配置。
- 抽象邏輯建構體,用於將資料和模型對應至 TPU 晶片。
無論是哪種情況,網格都會指定為形狀。
指標
您重視的統計資料。
目標是機器學習系統嘗試最佳化的指標。
否
節點 (TensorFlow 圖形)
TensorFlow 圖形中的運算。
O
作業 (op)
在 TensorFlow 中,凡是建立、操控或毀損 Tensor 的程序,舉例來說,矩陣乘法運算會將兩個張量做為輸入,並產生一個張量做為輸出。
P
參數伺服器 (PS)
這項工作會在分散式環境中追蹤模型的參數。
Q
佇列
實作佇列資料結構的 TensorFlow Operation。通常用於 I/O。
R
秩 (張量)
Tensor中的維度數量。舉例來說,純量的等級為 0,向量的等級為 1,矩陣的等級為 2。
請勿與排名 (序數)混淆。
根目錄
您指定的目錄,用於代管多個模型的 TensorFlow 檢查點和事件檔案的子目錄。
日
SavedModel
建議用來儲存及復原 TensorFlow 模型的格式。SavedModel 是與語言無關且可復原的序列化格式,可讓高階系統和工具產生、使用及轉換 TensorFlow 模型。
如需完整詳細資料,請參閱 TensorFlow 程式設計人員指南的「儲存及還原」一節。
平價
負責儲存模型檢查點的 TensorFlow 物件。
資料分割
訓練集或模型的邏輯劃分。通常,某些程序會將範例或參數分成 (通常) 大小相等的區塊,藉此建立分片。然後將每個分片指派給不同的機器。
模型分割稱為「模型平行處理」;資料分割稱為「資料平行處理」。
摘要
在 TensorFlow 中,於特定步驟計算的值或一組值,通常用於在訓練期間追蹤模型指標。
T
Tensor
TensorFlow 程式中的主要資料結構。張量是 N 維 (N 可能非常大) 資料結構,最常見的是純量、向量或矩陣。Tensor 的元素可以保存整數、浮點數或字串值。
TensorBoard
這個資訊主頁會顯示在執行一或多個 TensorFlow 程式期間儲存的摘要。
TensorFlow
大規模分散式機器學習平台。這個詞彙也指 TensorFlow 堆疊中的基本 API 層,支援資料流圖形的一般運算。
雖然 TensorFlow 主要用於機器學習,但您也可以將 TensorFlow 用於非機器學習工作,這類工作需要使用資料流圖形進行數值運算。
TensorFlow Playground
這項程式會以視覺化方式呈現不同的超參數如何影響模型 (主要是神經網路) 訓練。前往 http://playground.tensorflow.org ,試用 TensorFlow Playground。
TensorFlow Serving
用於在實際工作環境中部署訓練好的模型。
Tensor Processing Unit (TPU)
特殊應用積體電路 (ASIC),可提升機器學習工作負載的效能。這些 ASIC 會以多個 TPU 晶片的形式部署在 TPU 裝置上。
張量的秩
請參閱「秩 (張量)」。
張量形狀
Tensor在各個維度中包含的元素數量。舉例來說,[5, 10]
張量在一個維度中的形狀為 5,在另一個維度中則為 10。
張量大小
Tensor所含的純量總數。舉例來說,[5, 10]
張量的大小為 50。
tf.Example
標準通訊協定緩衝區,用於說明機器學習模型訓練或推論的輸入資料。
tf.keras
整合至 TensorFlow 的 Keras 實作項目。
TPU
TPU 晶片
可程式化線性代數加速器,搭載晶片內高頻寬記憶體,專為機器學習工作負載最佳化。TPU 裝置上部署了多個 TPU 晶片。
TPU 裝置
印刷電路板 (PCB),內含多個 TPU 晶片、高頻寬網路介面和系統冷卻硬體。
TPU 節點
Google Cloud 上的 TPU 資源,具有特定 TPU 類型。TPU 節點會從對等互連虛擬私有雲網路連線至虛擬私有雲網路。TPU 節點是 Cloud TPU API 中定義的資源。
TPU Pod
Google 資料中心內的TPU 裝置特定配置。TPU Pod 中的所有裝置都會透過專用高速網路互相連線。TPU Pod 是特定 TPU 版本可用的最大TPU 裝置配置。
TPU 資源
您在 Google Cloud 上建立、管理或使用的 TPU 實體。舉例來說,TPU 節點和 TPU 類型都是 TPU 資源。
TPU 配量
TPU 配量是 TPU Pod 中 TPU 裝置的一小部分。TPU 配量中的所有裝置都會透過專用高速網路互相連線。
TPU 類型
一或多個 TPU 裝置的設定,並搭配特定 TPU 硬體版本。在 Google Cloud 上建立 TPU 節點時,您會選取 TPU 類型。舉例來說,v2-8
TPU 類型是具有 8 個核心的單一 TPU v2 裝置。v3-2048
TPU 類型有 256 部聯網 TPU v3 裝置,總共有 2048 個核心。TPU 類型是Cloud TPU API 中定義的資源。
TPU 工作站
在主機上執行的程序,可在 TPU 裝置上執行機器學習程式。