Questa pagina contiene i termini del glossario di TensorFlow. Per tutti i termini del glossario, fai clic qui.
B
inferenza batch
Il processo di detrazione delle previsioni su più esempi non etichettati suddiviso in sottoinsiemi più piccoli ("batch").
L'inferenza batch può sfruttare le funzionalità di parallelizzazione dei chip di acceleratore. Ciò significa che più acceleratori possono dedurre contemporaneamente le previsioni su diversi batch di esempi non etichettati, aumentando drasticamente il numero di inferenze al secondo.
C
Cloud TPU
Un acceleratore hardware specializzato per velocizzare i carichi di lavoro di machine learning su Google Cloud.
D
API Dataset (tf.data)
Un'API TensorFlow di alto livello per la lettura dei dati e la loro trasformazione in un formato richiesto da un algoritmo di machine learning.
Un oggetto tf.data.Dataset
rappresenta una sequenza di elementi in cui
ogni elemento contiene uno o più Tensor. Un oggetto tf.data.Iterator
fornisce l'accesso agli elementi di un Dataset
.
Per maggiori dettagli sull'API Dataset, consulta tf.data: Build TensorFlow input pipelines nella Guida per i programmatori TensorFlow.
dispositivo
Un termine sovraccarico con le seguenti due possibili definizioni:
- Una categoria di hardware in grado di eseguire una sessione TensorFlow, che include CPU, GPU e TPU.
- Durante l'addestramento di un modello ML su chip di acceleratori (GPU o TPU), la parte del sistema che manipola effettivamente i tensori e gli incorporamenti. Il dispositivo viene eseguito su chip di accelerazione. Al contrario, l'host di solito viene eseguito su una CPU.
E
esecuzione impaziente
Un ambiente di programmazione TensorFlow in cui le operations vengono eseguite immediatamente. Al contrario, le operazioni chiamate in esecuzione del grafico non vengono eseguite finché non vengono valutate esplicitamente. L'esecuzione impaziente è un'interfaccia imperativa, molto simile al codice nella maggior parte dei linguaggi di programmazione. I programmi di esecuzione più entusiasti sono generalmente molto più semplici da eseguire rispetto ai programmi di esecuzione di grafici.
Strumento di stima
Un'API TensorFlow deprecata. Utilizza tf.keras anziché lo strumento per la stima.
F
e applicazione del feature engineering.
Un processo che prevede i seguenti passaggi:
- Determinare quali caratteristiche potrebbero essere utili per addestrare un modello.
- Convertire i dati non elaborati dal set di dati in versioni efficienti di queste caratteristiche.
Ad esempio, potresti determinare che temperature
potrebbe essere una funzionalità
utile. Poi, potresti sperimentare il bucketing per ottimizzare le informazioni che il modello può apprendere da diversi intervalli temperature
.
Il feature engineering a volte viene chiamato estrazione delle caratteristiche o caratterizzazione.
specifica della funzionalità
Descrive le informazioni necessarie per estrarre i dati delle features dal buffer di protocollo tf.Example. Poiché il buffer di protocollo tf.Example è solo un container di dati, devi specificare quanto segue:
- I dati da estrarre (ovvero le chiavi per le caratteristiche)
- Il tipo di dati (ad esempio, float o int)
- Lunghezza (fissa o variabile)
G
grafico
In TensorFlow, una specifica di calcolo. I nodi nel grafico rappresentano le operazioni. I bordi sono diretti e rappresentano il passaggio del risultato di un'operazione (Tensor) come operando a un'altra operazione. Utilizza TensorBoard per visualizzare un grafico.
esecuzione del grafico
Un ambiente di programmazione TensorFlow in cui il programma crea prima un grafico e poi ne esegue tutto o parte. L'esecuzione del grafico è la modalità di esecuzione predefinita in TensorFlow 1.x.
In contrasto con l'esecuzione eager.
V
organizzatore
Durante l'addestramento di un modello di ML su chip di acceleratore (GPU o TPU), la parte del sistema che controlla entrambi i seguenti aspetti:
- Il flusso complessivo del codice.
- Estrazione e trasformazione della pipeline di input.
In genere l'host viene eseguito su una CPU, non su un chip di acceleratore; il dispositivo manipola i tensori sui chip dell'acceleratore.
L
API Livelli (tf.layers)
Un'API TensorFlow per realizzare una rete neurale profonda come composizione di livelli. L'API Livelli consente di creare diversi tipi di livelli, tra cui:
tf.layers.Dense
per un livello completamente connesso.tf.layers.Conv2D
per un livello convoluzionale.
L'API Livelli segue le convenzioni delle API dei livelli Keras. Ciò significa che, a parte un prefisso diverso, tutte le funzioni dell'API Livelli hanno gli stessi nomi e firme delle loro controparti nell'API Keras Layer.
L
mesh
Nella programmazione parallela di ML, termine associato all'assegnazione di dati e modello ai chip TPU e alla definizione del modo in cui questi valori verranno messi in shard o replicati.
Mesh è un termine di sovraccarico che può indicare una delle seguenti situazioni:
- Un layout fisico dei chip TPU.
- Un costrutto logico astratto per la mappatura di dati e modello ai chip TPU.
In entrambi i casi, un mesh viene specificato come forma.
metrica
Una statistica che ti interessa.
Un obiettivo è una metrica che un sistema di machine learning prova a ottimizzare.
N
nodo (grafico TensorFlow)
Un'operazione in un grafico TensorFlow.
O
operazione (op)
In TensorFlow, qualsiasi procedura che crea, manipola o distrugge un Tensor. Ad esempio, una moltiplicazione di matrici è un'operazione che richiede due Tensor come input e genera un Tensor come output.
P
Server dei parametri (PS)
Un job che tiene traccia dei parametri di un modello in un'impostazione distribuita.
D
queue
Un'operazione TensorFlow che implementa una struttura di dati in coda. Utilizzata generalmente in I/O.
R
ranking (Tensor)
Il numero di dimensioni in un Tensor. Ad esempio, uno scalare ha un rango di 0, un vettore ha un rango 1 e una matrice ha un rango 2.
Da non confondere con il ranking (ordinalità).
directory root
La directory specificata per l'hosting delle sottodirectory del checkpoint TensorFlow e dei file degli eventi di più modelli.
S
SavedModel
Formato consigliato per salvare e recuperare i modelli TensorFlow. SaveModel è un formato di serializzazione recuperabile e indipendente dal linguaggio, che consente a sistemi e strumenti di livello superiore di produrre, utilizzare e trasformare modelli di TensorFlow.
Per informazioni dettagliate, consulta il capitolo Salvataggio e ripristino della Guida per i programmatori di TensorFlow.
Economico
Un oggetto TensorFlow responsabile del salvataggio dei checkpoint del modello.
shard
Una divisione logica del set di addestramento o del modello. In genere, un processo crea shard dividendo gli esempi o i parametri in blocchi (di solito) di dimensioni uguali. Ogni shard viene quindi assegnato a una macchina diversa.
Lo sharding di un modello è chiamato Parallelismo del modello, mentre lo sharding dei dati è chiamato Parallelismo dei dati.
riassunto
In TensorFlow, un valore o un insieme di valori calcolato in un determinato passaggio, solitamente utilizzato per monitorare le metriche del modello durante l'addestramento.
T
Tensore
La struttura principale dei dati nei programmi TensorFlow. I tensori sono strutture di dati N-dimensionali (dove N potrebbe essere molto grande), più comunemente scalari, vettori o matrici. Gli elementi di un Tensor possono contenere valori interi, in virgola mobile o stringa.
TensorBoard
La dashboard che mostra i riepiloghi salvati durante l'esecuzione di uno o più programmi TensorFlow.
TensorFlow
una piattaforma di machine learning distribuita su larga scala. Il termine si riferisce anche al livello API di base nello stack TensorFlow, che supporta il calcolo generale sui grafici di Dataflow.
Sebbene TensorFlow venga utilizzato principalmente per il machine learning, puoi utilizzarlo anche per attività non ML che richiedono un calcolo numerico utilizzando grafici di Dataflow.
TensorFlow Playground
Un programma che mostra in che modo i diversi iperparametri influenzano l'addestramento del modello (principalmente rete neurale). Vai alla pagina http://playground.tensorflow.org per sperimentare con TensorFlow Playground.
Pubblicazione su TensorFlow
una piattaforma per il deployment di modelli addestrati in produzione.
Tensor Processing Unit (TPU)
Un circuito integrato specifico per l'applicazione (ASIC) che ottimizza le prestazioni dei carichi di lavoro di machine learning. Questi ASIC vengono distribuiti come più chip TPU su un dispositivo TPU.
Ranking Tensor
Vedi il ranking (Tensor).
Forma del tensore
Il numero di elementi contenuti in Tensor in varie dimensioni.
Ad esempio, un Tensor [5, 10]
ha la forma 5 in una dimensione e 10 in un'altra.
Dimensione tensore
Il numero totale di scalari contenuti in Tensor. Ad esempio, un Tensor [5, 10]
ha una dimensione di 50.
tf.Example
Un buffer di protocollo standard per descrivere i dati di input per l'addestramento o l'inferenza del modello di machine learning.
tf.keras
Un'implementazione di Keras integrato in TensorFlow.
TPU
Abbreviazione di Tensor Processing Unit.
Chip TPU
Un acceleratore di algebra lineare programmabile con memoria su chip ad alta larghezza di banda, ottimizzato per i carichi di lavoro di machine learning. Su un dispositivo TPU è stato eseguito il deployment di più chip TPU.
Dispositivo TPU
Una scheda per circuiti stampati (PCB) con più chip TPU, interfacce di rete a larghezza di banda elevata e hardware di raffreddamento del sistema.
Master TPU
Il processo di coordinamento centrale in esecuzione su una macchina host che invia e riceve dati, risultati, programmi, prestazioni e informazioni sullo stato del sistema ai worker TPU. Il master TPU gestisce anche la configurazione e l'arresto dei dispositivi TPU.
Nodo TPU
Una risorsa TPU su Google Cloud con un tipo di TPU specifico. Il nodo TPU si connette alla tua rete VPC da una rete VPC peer. I nodi TPU sono una risorsa definita nell'API Cloud TPU.
pod di TPU
Una configurazione specifica dei dispositivi TPU in un data center di Google. Tutti i dispositivi in un pod TPU sono connessi tra loro tramite una rete dedicata ad alta velocità. Un pod TPU è la configurazione più grande di dispositivi TPU disponibile per una versione di TPU specifica.
Risorsa TPU
Un'entità TPU su Google Cloud che crei, gestisci o utilizzi. Ad esempio, i nodi TPU e i tipi TPU sono risorse TPU.
Sezione TPU
Una sezione TPU è una parte frazionata dei dispositivi TPU in un pod TPU. Tutti i dispositivi nella sezione TPU sono connessi tra loro tramite una rete dedicata ad alta velocità.
Tipo di TPU
Una configurazione di uno o più dispositivi TPU con una versione hardware TPU specifica. Selezioni un tipo di TPU quando crei
un nodo TPU su Google Cloud. Ad esempio, un tipo di TPU v2-8
è un singolo dispositivo TPU v2 con 8 core. Un tipo di TPU v3-2048
ha 256
dispositivi TPU v3 in rete e un totale di 2048 core. I tipi di TPU sono una risorsa
definita nell'API Cloud TPU.
worker TPU
Un processo che viene eseguito su una macchina host ed esegue programmi di machine learning su dispositivi TPU.