機器學習詞彙表:TensorFlow

本頁面包含 TensorFlow 術語。如要查看所有詞彙,請按這裡

C

Cloud TPU

#TensorFlow
#GoogleCloud

專門設計的硬體加速器,用於加快 Google Cloud 上的機器學習工作負載。

D

Dataset API (tf.data)

#TensorFlow

高階 TensorFlow API,用於讀取資料並轉換成機器學習演算法所需的格式。tf.data.Dataset 物件代表元素序列,其中每個元素都包含一或多個 Tensortf.data.Iterator 物件可存取 Dataset 的元素。

裝置

#TensorFlow
#GoogleCloud

這個詞彙有兩種可能的定義:

  1. 可執行 TensorFlow 工作階段的硬體類別,包括 CPU、GPU 和 TPU
  2. 加速器晶片 (GPU 或 TPU) 上訓練機器學習模型時,系統中實際操控張量嵌入的部分。裝置搭載加速器晶片,相較之下,主機通常在 CPU 上執行。

E

Eager Execution

#TensorFlow

TensorFlow 程式設計環境,可立即執行作業。相反地,在圖形執行中呼叫的作業不會執行,直到明確評估為止。即時執行是命令式介面,與大多數程式設計語言中的程式碼非常相似。一般來說,相較於圖形執行程式,Eager Execution 程式的偵錯難度低得多。

Estimator

#TensorFlow

已淘汰的 TensorFlow API。請改用 tf.keras,而非 Estimator。

F

特徵工程

#fundamentals
#TensorFlow

這項程序包含下列步驟:

  1. 判斷哪些特徵可能適合用來訓練模型。
  2. 將資料集中的原始資料轉換為這些特徵的有效版本。

舉例來說,您可能會判斷 temperature 是實用的功能。接著,您可以嘗試分組,最佳化模型從不同 temperature 範圍學習的內容。

特徵工程有時也稱為「特徵擷取」或「特徵化」

詳情請參閱機器學習速成課程中的「數值資料:模型如何使用特徵向量擷取資料」。

功能規格

#TensorFlow

說明從 tf.Example 通訊協定緩衝區擷取特徵資料所需的資訊。由於 tf.Example 通訊協定緩衝區只是資料的容器,因此您必須指定下列項目:

  • 要擷取的資料 (即功能的鍵)
  • 資料類型 (例如 float 或 int)
  • 長度 (固定或可變)

G

圖表

#TensorFlow

在 TensorFlow 中,這是運算規格。圖中的節點代表作業。邊緣是有方向性的,代表將作業結果 (Tensor) 做為運算元傳遞至另一項作業。使用 TensorBoard 將圖表視覺化。

圖表執行

#TensorFlow

TensorFlow 程式設計環境,程式會先建構圖表,然後執行該圖表的部分或全部內容。TensorFlow 1.x 的預設執行模式為圖形執行。

與「急切執行」形成對比。

H

主機

#TensorFlow
#GoogleCloud

加速器晶片 (GPU 或 TPU) 上訓練 ML 模型時,系統中負責控制下列兩項作業的部分:

  • 程式碼的整體流程。
  • 輸入管道的擷取和轉換作業。

主機通常在 CPU 上執行,而不是在加速器晶片上執行;裝置會在加速器晶片上操控張量

L

Layers API (tf.layers)

#TensorFlow

TensorFlow API,用於建構深層類神經網路,做為層的組合。Layers API 可讓您建構不同類型的圖層,例如:

  • tf.layers.Dense,適用於全連接層
  • tf.layers.Conv2D 代表卷積層。

Layers API 遵循 Keras layers API 慣例。 也就是說,除了前置字元不同之外,Layers API 中的所有函式名稱和簽章,都與 Keras 層 API 中的對應函式相同。

M

網格

#TensorFlow
#GoogleCloud

在機器學習平行程式設計中,這個詞彙與將資料和模型指派給 TPU 晶片,以及定義這些值如何分片或複製有關。

「網格」一詞有多種含意,可能指下列任一項目:

  • TPU 晶片的實體配置。
  • 抽象邏輯建構體,用於將資料和模型對應至 TPU 晶片。

無論是哪種情況,網格都會指定為形狀

指標

#TensorFlow
#指標

您重視的統計資料。

目標是機器學習系統嘗試最佳化的指標。

節點 (TensorFlow 圖形)

#TensorFlow

TensorFlow 圖形中的運算。

O

作業 (op)

#TensorFlow

在 TensorFlow 中,凡是建立、操控或毀損 Tensor 的程序,舉例來說,矩陣乘法運算會將兩個張量做為輸入,並產生一個張量做為輸出。

P

參數伺服器 (PS)

#TensorFlow

這項工作會在分散式環境中追蹤模型的參數

Q

佇列

#TensorFlow

實作佇列資料結構的 TensorFlow Operation。通常用於 I/O。

R

秩 (張量)

#TensorFlow

Tensor中的維度數量。舉例來說,純量的等級為 0,向量的等級為 1,矩陣的等級為 2。

請勿與排名 (序數)混淆。

根目錄

#TensorFlow

您指定的目錄,用於代管多個模型的 TensorFlow 檢查點和事件檔案的子目錄。

SavedModel

#TensorFlow

建議用來儲存及復原 TensorFlow 模型的格式。SavedModel 是與語言無關且可復原的序列化格式,可讓高階系統和工具產生、使用及轉換 TensorFlow 模型。

如需完整詳細資料,請參閱 TensorFlow 程式設計人員指南的「儲存及還原」一節。

平價

#TensorFlow

負責儲存模型檢查點的 TensorFlow 物件

資料分割

#TensorFlow
#GoogleCloud

訓練集模型的邏輯劃分。通常,某些程序會將範例參數分成 (通常) 大小相等的區塊,藉此建立分片。然後將每個分片指派給不同的機器。

模型分割稱為「模型平行處理」;資料分割稱為「資料平行處理」

摘要

#TensorFlow

在 TensorFlow 中,於特定步驟計算的值或一組值,通常用於在訓練期間追蹤模型指標。

T

Tensor

#TensorFlow

TensorFlow 程式中的主要資料結構。張量是 N 維 (N 可能非常大) 資料結構,最常見的是純量、向量或矩陣。Tensor 的元素可以保存整數、浮點數或字串值。

TensorBoard

#TensorFlow

這個資訊主頁會顯示在執行一或多個 TensorFlow 程式期間儲存的摘要。

TensorFlow

#TensorFlow

大規模分散式機器學習平台。這個詞彙也指 TensorFlow 堆疊中的基本 API 層,支援資料流圖形的一般運算。

雖然 TensorFlow 主要用於機器學習,但您也可以將 TensorFlow 用於非機器學習工作,這類工作需要使用資料流圖形進行數值運算。

TensorFlow Playground

#TensorFlow

這項程式會以視覺化方式呈現不同的超參數如何影響模型 (主要是神經網路) 訓練。前往 http://playground.tensorflow.org ,試用 TensorFlow Playground。

TensorFlow Serving

#TensorFlow

用於在實際工作環境中部署訓練好的模型。

Tensor Processing Unit (TPU)

#TensorFlow
#GoogleCloud

特殊應用積體電路 (ASIC),可提升機器學習工作負載的效能。這些 ASIC 會以多個 TPU 晶片的形式部署在 TPU 裝置上。

張量的秩

#TensorFlow

請參閱「秩 (張量)」。

張量形狀

#TensorFlow

Tensor在各個維度中包含的元素數量。舉例來說,[5, 10] 張量在一個維度中的形狀為 5,在另一個維度中則為 10。

張量大小

#TensorFlow

Tensor所含的純量總數。舉例來說,[5, 10] 張量的大小為 50。

tf.Example

#TensorFlow

標準通訊協定緩衝區,用於說明機器學習模型訓練或推論的輸入資料。

tf.keras

#TensorFlow

整合至 TensorFlowKeras 實作項目。

TPU

#TensorFlow
#GoogleCloud

Tensor Processing Unit 的縮寫。

TPU 晶片

#TensorFlow
#GoogleCloud

可程式化線性代數加速器,搭載晶片內高頻寬記憶體,專為機器學習工作負載最佳化。TPU 裝置上部署了多個 TPU 晶片。

TPU 裝置

#TensorFlow
#GoogleCloud

印刷電路板 (PCB),內含多個 TPU 晶片、高頻寬網路介面和系統冷卻硬體。

TPU 節點

#TensorFlow
#GoogleCloud

Google Cloud 上的 TPU 資源,具有特定 TPU 類型。TPU 節點會從對等互連虛擬私有雲網路連線至虛擬私有雲網路。TPU 節點是 Cloud TPU API 中定義的資源。

TPU Pod

#TensorFlow
#GoogleCloud

Google 資料中心內的TPU 裝置特定配置。TPU Pod 中的所有裝置都會透過專用高速網路互相連線。TPU Pod 是特定 TPU 版本可用的最大TPU 裝置配置。

TPU 資源

#TensorFlow
#GoogleCloud

您在 Google Cloud 上建立、管理或使用的 TPU 實體。舉例來說,TPU 節點TPU 類型都是 TPU 資源。

TPU 配量

#TensorFlow
#GoogleCloud

TPU 配量是 TPU PodTPU 裝置的一小部分。TPU 配量中的所有裝置都會透過專用高速網路互相連線。

TPU 類型

#TensorFlow
#GoogleCloud

一或多個 TPU 裝置的設定,並搭配特定 TPU 硬體版本。在 Google Cloud 上建立 TPU 節點時,您會選取 TPU 類型。舉例來說,v2-8 TPU 類型是具有 8 個核心的單一 TPU v2 裝置。v3-2048 TPU 類型有 256 部聯網 TPU v3 裝置,總共有 2048 個核心。TPU 類型是Cloud TPU API 中定義的資源。

TPU 工作站

#TensorFlow
#GoogleCloud

在主機上執行的程序,可在 TPU 裝置上執行機器學習程式。