Glossario del machine learning: TensorFlow

Questa pagina contiene i termini del glossario di TensorFlow. Per tutti i termini del glossario, fai clic qui.

B

inferenza batch

#TensorFlow
#GoogleCloud

Il processo di detrazione delle previsioni su più esempi non etichettati suddiviso in sottoinsiemi più piccoli ("batch").

L'inferenza batch può sfruttare le funzionalità di parallelizzazione dei chip di acceleratore. Ciò significa che più acceleratori possono dedurre contemporaneamente le previsioni su diversi batch di esempi non etichettati, aumentando drasticamente il numero di inferenze al secondo.

C

Cloud TPU

#TensorFlow
#GoogleCloud

Un acceleratore hardware specializzato per velocizzare i carichi di lavoro di machine learning su Google Cloud.

D

API Dataset (tf.data)

#TensorFlow

Un'API TensorFlow di alto livello per la lettura dei dati e la loro trasformazione in un formato richiesto da un algoritmo di machine learning. Un oggetto tf.data.Dataset rappresenta una sequenza di elementi in cui ogni elemento contiene uno o più Tensor. Un oggetto tf.data.Iterator fornisce l'accesso agli elementi di un Dataset.

Per maggiori dettagli sull'API Dataset, consulta tf.data: Build TensorFlow input pipelines nella Guida per i programmatori TensorFlow.

dispositivo

#TensorFlow
#GoogleCloud

Un termine sovraccarico con le seguenti due possibili definizioni:

  1. Una categoria di hardware in grado di eseguire una sessione TensorFlow, che include CPU, GPU e TPU.
  2. Durante l'addestramento di un modello ML su chip di acceleratori (GPU o TPU), la parte del sistema che manipola effettivamente i tensori e gli incorporamenti. Il dispositivo viene eseguito su chip di accelerazione. Al contrario, l'host di solito viene eseguito su una CPU.

E

esecuzione impaziente

#TensorFlow

Un ambiente di programmazione TensorFlow in cui le operations vengono eseguite immediatamente. Al contrario, le operazioni chiamate in esecuzione del grafico non vengono eseguite finché non vengono valutate esplicitamente. L'esecuzione impaziente è un'interfaccia imperativa, molto simile al codice nella maggior parte dei linguaggi di programmazione. I programmi di esecuzione più entusiasti sono generalmente molto più semplici da eseguire rispetto ai programmi di esecuzione di grafici.

Strumento di stima

#TensorFlow

Un'API TensorFlow deprecata. Utilizza tf.keras anziché lo strumento per la stima.

F

e applicazione del feature engineering.

#fundamentals
#TensorFlow

Un processo che prevede i seguenti passaggi:

  1. Determinare quali caratteristiche potrebbero essere utili per addestrare un modello.
  2. Convertire i dati non elaborati dal set di dati in versioni efficienti di queste caratteristiche.

Ad esempio, potresti determinare che temperature potrebbe essere una funzionalità utile. Poi, potresti sperimentare il bucketing per ottimizzare le informazioni che il modello può apprendere da diversi intervalli temperature.

Il feature engineering a volte viene chiamato estrazione delle caratteristiche o caratterizzazione.

specifica della funzionalità

#TensorFlow

Descrive le informazioni necessarie per estrarre i dati delle features dal buffer di protocollo tf.Example. Poiché il buffer di protocollo tf.Example è solo un container di dati, devi specificare quanto segue:

  • I dati da estrarre (ovvero le chiavi per le caratteristiche)
  • Il tipo di dati (ad esempio, float o int)
  • Lunghezza (fissa o variabile)

G

grafico

#TensorFlow

In TensorFlow, una specifica di calcolo. I nodi nel grafico rappresentano le operazioni. I bordi sono diretti e rappresentano il passaggio del risultato di un'operazione (Tensor) come operando a un'altra operazione. Utilizza TensorBoard per visualizzare un grafico.

esecuzione del grafico

#TensorFlow

Un ambiente di programmazione TensorFlow in cui il programma crea prima un grafico e poi ne esegue tutto o parte. L'esecuzione del grafico è la modalità di esecuzione predefinita in TensorFlow 1.x.

In contrasto con l'esecuzione eager.

V

organizzatore

#TensorFlow
#GoogleCloud

Durante l'addestramento di un modello di ML su chip di acceleratore (GPU o TPU), la parte del sistema che controlla entrambi i seguenti aspetti:

  • Il flusso complessivo del codice.
  • Estrazione e trasformazione della pipeline di input.

In genere l'host viene eseguito su una CPU, non su un chip di acceleratore; il dispositivo manipola i tensori sui chip dell'acceleratore.

L

API Livelli (tf.layers)

#TensorFlow

Un'API TensorFlow per realizzare una rete neurale profonda come composizione di livelli. L'API Livelli consente di creare diversi tipi di livelli, tra cui:

L'API Livelli segue le convenzioni delle API dei livelli Keras. Ciò significa che, a parte un prefisso diverso, tutte le funzioni dell'API Livelli hanno gli stessi nomi e firme delle loro controparti nell'API Keras Layer.

L

mesh

#TensorFlow
#GoogleCloud

Nella programmazione parallela di ML, termine associato all'assegnazione di dati e modello ai chip TPU e alla definizione del modo in cui questi valori verranno messi in shard o replicati.

Mesh è un termine di sovraccarico che può indicare una delle seguenti situazioni:

  • Un layout fisico dei chip TPU.
  • Un costrutto logico astratto per la mappatura di dati e modello ai chip TPU.

In entrambi i casi, un mesh viene specificato come forma.

metrica

#TensorFlow

Una statistica che ti interessa.

Un obiettivo è una metrica che un sistema di machine learning prova a ottimizzare.

N

nodo (grafico TensorFlow)

#TensorFlow

Un'operazione in un grafico TensorFlow.

O

operazione (op)

#TensorFlow

In TensorFlow, qualsiasi procedura che crea, manipola o distrugge un Tensor. Ad esempio, una moltiplicazione di matrici è un'operazione che richiede due Tensor come input e genera un Tensor come output.

P

Server dei parametri (PS)

#TensorFlow

Un job che tiene traccia dei parametri di un modello in un'impostazione distribuita.

D

queue

#TensorFlow

Un'operazione TensorFlow che implementa una struttura di dati in coda. Utilizzata generalmente in I/O.

R

ranking (Tensor)

#TensorFlow

Il numero di dimensioni in un Tensor. Ad esempio, uno scalare ha un rango di 0, un vettore ha un rango 1 e una matrice ha un rango 2.

Da non confondere con il ranking (ordinalità).

directory root

#TensorFlow

La directory specificata per l'hosting delle sottodirectory del checkpoint TensorFlow e dei file degli eventi di più modelli.

S

SavedModel

#TensorFlow

Formato consigliato per salvare e recuperare i modelli TensorFlow. SaveModel è un formato di serializzazione recuperabile e indipendente dal linguaggio, che consente a sistemi e strumenti di livello superiore di produrre, utilizzare e trasformare modelli di TensorFlow.

Per informazioni dettagliate, consulta il capitolo Salvataggio e ripristino della Guida per i programmatori di TensorFlow.

Economico

#TensorFlow

Un oggetto TensorFlow responsabile del salvataggio dei checkpoint del modello.

shard

#TensorFlow
#GoogleCloud

Una divisione logica del set di addestramento o del modello. In genere, un processo crea shard dividendo gli esempi o i parametri in blocchi (di solito) di dimensioni uguali. Ogni shard viene quindi assegnato a una macchina diversa.

Lo sharding di un modello è chiamato Parallelismo del modello, mentre lo sharding dei dati è chiamato Parallelismo dei dati.

riassunto

#TensorFlow

In TensorFlow, un valore o un insieme di valori calcolato in un determinato passaggio, solitamente utilizzato per monitorare le metriche del modello durante l'addestramento.

T

Tensore

#TensorFlow

La struttura principale dei dati nei programmi TensorFlow. I tensori sono strutture di dati N-dimensionali (dove N potrebbe essere molto grande), più comunemente scalari, vettori o matrici. Gli elementi di un Tensor possono contenere valori interi, in virgola mobile o stringa.

TensorBoard

#TensorFlow

La dashboard che mostra i riepiloghi salvati durante l'esecuzione di uno o più programmi TensorFlow.

TensorFlow

#TensorFlow

una piattaforma di machine learning distribuita su larga scala. Il termine si riferisce anche al livello API di base nello stack TensorFlow, che supporta il calcolo generale sui grafici di Dataflow.

Sebbene TensorFlow venga utilizzato principalmente per il machine learning, puoi utilizzarlo anche per attività non ML che richiedono un calcolo numerico utilizzando grafici di Dataflow.

TensorFlow Playground

#TensorFlow

Un programma che mostra in che modo i diversi iperparametri influenzano l'addestramento del modello (principalmente rete neurale). Vai alla pagina http://playground.tensorflow.org per sperimentare con TensorFlow Playground.

Pubblicazione su TensorFlow

#TensorFlow

una piattaforma per il deployment di modelli addestrati in produzione.

Tensor Processing Unit (TPU)

#TensorFlow
#GoogleCloud

Un circuito integrato specifico per l'applicazione (ASIC) che ottimizza le prestazioni dei carichi di lavoro di machine learning. Questi ASIC vengono distribuiti come più chip TPU su un dispositivo TPU.

Ranking Tensor

#TensorFlow

Vedi il ranking (Tensor).

Forma del tensore

#TensorFlow

Il numero di elementi contenuti in Tensor in varie dimensioni. Ad esempio, un Tensor [5, 10] ha la forma 5 in una dimensione e 10 in un'altra.

Dimensione tensore

#TensorFlow

Il numero totale di scalari contenuti in Tensor. Ad esempio, un Tensor [5, 10] ha una dimensione di 50.

tf.Example

#TensorFlow

Un buffer di protocollo standard per descrivere i dati di input per l'addestramento o l'inferenza del modello di machine learning.

tf.keras

#TensorFlow

Un'implementazione di Keras integrato in TensorFlow.

TPU

#TensorFlow
#GoogleCloud

Abbreviazione di Tensor Processing Unit.

Chip TPU

#TensorFlow
#GoogleCloud

Un acceleratore di algebra lineare programmabile con memoria su chip ad alta larghezza di banda, ottimizzato per i carichi di lavoro di machine learning. Su un dispositivo TPU è stato eseguito il deployment di più chip TPU.

Dispositivo TPU

#TensorFlow
#GoogleCloud

Una scheda per circuiti stampati (PCB) con più chip TPU, interfacce di rete a larghezza di banda elevata e hardware di raffreddamento del sistema.

Master TPU

#TensorFlow
#GoogleCloud

Il processo di coordinamento centrale in esecuzione su una macchina host che invia e riceve dati, risultati, programmi, prestazioni e informazioni sullo stato del sistema ai worker TPU. Il master TPU gestisce anche la configurazione e l'arresto dei dispositivi TPU.

Nodo TPU

#TensorFlow
#GoogleCloud

Una risorsa TPU su Google Cloud con un tipo di TPU specifico. Il nodo TPU si connette alla tua rete VPC da una rete VPC peer. I nodi TPU sono una risorsa definita nell'API Cloud TPU.

pod di TPU

#TensorFlow
#GoogleCloud

Una configurazione specifica dei dispositivi TPU in un data center di Google. Tutti i dispositivi in un pod TPU sono connessi tra loro tramite una rete dedicata ad alta velocità. Un pod TPU è la configurazione più grande di dispositivi TPU disponibile per una versione di TPU specifica.

Risorsa TPU

#TensorFlow
#GoogleCloud

Un'entità TPU su Google Cloud che crei, gestisci o utilizzi. Ad esempio, i nodi TPU e i tipi TPU sono risorse TPU.

Sezione TPU

#TensorFlow
#GoogleCloud

Una sezione TPU è una parte frazionata dei dispositivi TPU in un pod TPU. Tutti i dispositivi nella sezione TPU sono connessi tra loro tramite una rete dedicata ad alta velocità.

Tipo di TPU

#TensorFlow
#GoogleCloud

Una configurazione di uno o più dispositivi TPU con una versione hardware TPU specifica. Selezioni un tipo di TPU quando crei un nodo TPU su Google Cloud. Ad esempio, un tipo di TPU v2-8 è un singolo dispositivo TPU v2 con 8 core. Un tipo di TPU v3-2048 ha 256 dispositivi TPU v3 in rete e un totale di 2048 core. I tipi di TPU sono una risorsa definita nell'API Cloud TPU.

worker TPU

#TensorFlow
#GoogleCloud

Un processo che viene eseguito su una macchina host ed esegue programmi di machine learning su dispositivi TPU.