Glossário de machine learning: TensorFlow

Esta página contém termos do glossário do TensorFlow. Para todos os termos do glossário, clique aqui.

B

inferência em lote

#TensorFlow
#GoogleCloud

O processo de inferência de previsões em vários exemplos sem rótulos dividido em subconjuntos menores ("lotes").

A inferência em lote pode aproveitar os recursos de carregamento em paralelo dos ícones de acelerador. Ou seja, vários aceleradores podem inferir simultaneamente previsões em lotes diferentes de exemplos sem rótulos, aumentando drasticamente o número de inferências por segundo.

C

Cloud TPU

#TensorFlow
#GoogleCloud

Um acelerador de hardware especializado projetado para acelerar cargas de trabalho de machine learning no Google Cloud Platform.

D)

API Dataset (tf.data)

#TensorFlow

Uma API de alto nível do TensorFlow para ler dados e transformá-los em um formulário exigido por um algoritmo de machine learning. Um objeto tf.data.Dataset representa uma sequência de elementos, em que cada elemento contém um ou mais Tensores. Um objeto tf.data.Iterator fornece acesso aos elementos de um Dataset.

Para detalhes sobre a API Dataset, consulte tf.data: criar pipelines de entrada do TensorFlow no Guia do programador do TensorFlow.

dispositivo

#TensorFlow
#GoogleCloud

Um termo sobrecarregado com as duas definições a seguir:

  1. Uma categoria de hardware que pode executar uma sessão do TensorFlow, incluindo CPUs, GPUs e TPUs.
  2. Ao treinar um modelo de ML em ícones de acelerador (GPUs ou TPUs), a parte do sistema que realmente manipula tensores e embeddings. O dispositivo é executado em chips aceleradores. Por outro lado, o host normalmente é executado em uma CPU.

E

execução rápida

#TensorFlow

Um ambiente de programação do TensorFlow em que as operações são executadas imediatamente. Por outro lado, as operações chamadas na execução de gráfico não serão executadas até que sejam explicitamente avaliadas. A execução antecipada é uma interface imperativa que se parece muito com o código da maioria das linguagens de programação. Os programas de execução rápida geralmente são muito mais fáceis de depurar do que os programas de execução de gráficos.

Estimator

#TensorFlow

Uma API obsoleta do TensorFlow. Use tf.keras em vez de Estimators.

F

engenharia de atributos

#fundamentals
#TensorFlow

Um processo que envolve as seguintes etapas:

  1. Determinar quais recursos podem ser úteis no treinamento de um modelo.
  2. Converter dados brutos do conjunto de dados em versões eficientes desses recursos.

Por exemplo, é possível determinar que temperature pode ser um recurso útil. Em seguida, teste o agrupamento por classes para otimizar o que o modelo pode aprender com diferentes intervalos de temperature.

A engenharia de atributos também é chamada de extração de atributos.

especificação de recursos

#TensorFlow

Descreve as informações necessárias para extrair dados features do buffer de protocolo tf.Example. Como o buffer de protocolo tf.Example é apenas um contêiner de dados, é preciso especificar o seguinte:

  • os dados a extrair (ou seja, as chaves dos atributos)
  • o tipo de dados (por exemplo, float ou int)
  • O tamanho (fixo ou variável)

G

gráfico

#TensorFlow

No TensorFlow, uma especificação de computação. Os nós no gráfico representam operações. As arestas são direcionadas e representam a transmissão do resultado de uma operação (um Tensor) como um operando para outra operação. Use o TensorBoard para visualizar um gráfico.

execução do gráfico

#TensorFlow

Um ambiente de programação do TensorFlow em que o programa cria primeiro um gráfico e, em seguida, executa todo ou parte desse gráfico. A execução de gráficos é o modo de execução padrão no TensorFlow 1.x.

Contraste com a execução antecipada.

H

anfitrião

#TensorFlow
#GoogleCloud

Ao treinar um modelo de ML em ícones de acelerador (GPUs ou TPUs), a parte do sistema que controla os seguintes itens:

  • O fluxo geral do código.
  • Extração e transformação do pipeline de entrada.

O host normalmente é executado em uma CPU, não em um chip de acelerador. O dispositivo manipula tensores nos chips de acelerador.

L

API Layers (tf.layers)

#TensorFlow

Uma API do TensorFlow para criar uma rede neural profunda como uma composição de camadas. A API Layers permite criar diferentes tipos de layers, como:

A API Layers segue as convenções das APIs de camadas Keras. Ou seja, com um prefixo diferente, todas as funções na API Layers têm os mesmos nomes e assinaturas que as equivalentes na API Keras layers.

M

malha

#TensorFlow
#GoogleCloud

Na programação paralela de ML, um termo associado à atribuição de dados e modelo a chips de TPU e à definição de como esses valores serão fragmentados ou replicados.

"Malha" é um termo sobrecarregado que pode significar:

  • Um layout físico de chips da TPU.
  • Uma construção lógica abstrata para mapear os dados e o modelo para os chips de TPU.

Em ambos os casos, uma malha é especificada como uma forma.

métrica

#TensorFlow

Uma estatística de que você gosta.

Um objetivo é uma métrica que um sistema de machine learning tenta otimizar.

N

nó (gráfico do TensorFlow)

#TensorFlow

Uma operação em um gráfico do TensorFlow.

O

operação (op)

#TensorFlow

No TensorFlow, qualquer procedimento que crie, manipule ou destrua um Tensor. Por exemplo, um multiplicador de matriz é uma operação que usa dois tensores como entrada e gera um tensor como saída.

P

Servidor de parâmetros (PS)

#TensorFlow

Um job que monitora os parâmetros de um modelo em uma configuração distribuída.

Q

fila

#TensorFlow

Uma operação do TensorFlow que implementa uma estrutura de dados de fila. Normalmente usado em E/S.

Direita

classificação (Tensor)

#TensorFlow

O número de dimensões em um Tensor. Por exemplo, um escalar tem classificação 0, um vetor tem classificação 1 e uma matriz tem classificação 2.

Não confunda com classificação (ordem).

diretório raiz

#TensorFlow

O diretório que você especifica para hospedar subdiretórios dos arquivos de ponto de verificação e eventos do TensorFlow de vários modelos.

S

SavedModel

#TensorFlow

O formato recomendado para salvar e recuperar modelos do TensorFlow. O SavedModel é um formato de serialização recuperável e de linguagem neutra que permite a sistemas e ferramentas de nível superior produzir, consumir e transformar modelos do TensorFlow.

Para mais detalhes, consulte o capítulo Como salvar e restaurar no Guia do programador do TensorFlow.

Econômico

#TensorFlow

Um objeto do TensorFlow responsável por salvar os checkpoints do modelo.

fragmento

#TensorFlow
#GoogleCloud

Uma divisão lógica do conjunto de treinamento ou do modelo. Normalmente, alguns processos criam fragmentos dividindo os exemplos ou os parâmetros em blocos de tamanho igual (geralmente). Cada fragmento é atribuído a uma máquina diferente.

A fragmentação de um modelo é chamada de paralelismo de modelo. A fragmentação de dados é chamada de paralelismo de dados.

resumo

#TensorFlow

No TensorFlow, um valor ou conjunto de valores calculados em uma determinada etapa, geralmente usado para rastrear métricas de modelo durante o treinamento.

T

Tensor

#TensorFlow

A estrutura de dados principal em programas do TensorFlow. Tensores são estruturas de dados N-dimensionais (em que N pode ser muito grande), geralmente escalares, vetores ou matrizes. Os elementos de um tensor podem conter valores inteiros, de ponto flutuante ou de string.

TensorBoard

#TensorFlow

O painel que exibe os resumos salvos durante a execução de um ou mais programas do TensorFlow.

TensorFlow

#TensorFlow

Uma plataforma de aprendizado de máquina distribuída e em grande escala. O termo também se refere à camada de API básica na pilha do TensorFlow, que é compatível com computação geral em gráficos do Dataflow.

Embora o TensorFlow seja usado principalmente para machine learning, ele também pode ser usado para tarefas não relacionadas a ML que exigem computação numérica por meio de gráficos do Dataflow.

TensorFlow Playground

#TensorFlow

Um programa que visualiza como diferentes hiperparâmetros influenciam o treinamento de modelos (principalmente de rede neural). Acesse http://playground.tensorflow.org para testar o TensorFlow Playground.

TensorFlow Serving

#TensorFlow

Uma plataforma para implantar modelos treinados na produção.

Unidade de Processamento de Tensor (TPU)

#TensorFlow
#GoogleCloud

Um circuito integrado específico de aplicativos (ASIC, na sigla em inglês) que otimiza o desempenho das cargas de trabalho de machine learning. Esses ASICs são implantados como vários ícones de TPU em um dispositivo TPU.

Classificação de tensor

#TensorFlow

Consulte rank (Tensor).

Forma do tensor

#TensorFlow

O número de elementos que um Tensor contém em várias dimensões. Por exemplo, um tensor [5, 10] tem uma forma de 5 em uma dimensão e 10 em outra.

Tamanho do tensor

#TensorFlow

O número total de escalares que um Tensor contém. Por exemplo, um tensor [5, 10] tem um tamanho de 50.

tf.Exemplo

#TensorFlow

Um buffer de protocolo padrão para descrever dados de entrada para treinamento ou inferência de modelos de machine learning.

tf.keras

#TensorFlow

Uma implementação do Keras integrada ao TensorFlow.

TPU

#TensorFlow
#GoogleCloud

Abreviação de Unidade de Processamento de Tensor.

Chip TPU

#TensorFlow
#GoogleCloud

Um acelerador de álgebra linear programável com memória on-line de alta largura de banda otimizada para cargas de trabalho de machine learning. Vários chips de TPU são implantados em um dispositivo TPU.

Dispositivo TPU

#TensorFlow
#GoogleCloud

Uma placa de circuito impresso (PCB, na sigla em inglês) com vários ícones de TPU, interfaces de rede de alta largura de banda e hardware de refrigeração do sistema.

Mestre da TPU

#TensorFlow
#GoogleCloud

O processo de coordenação central executado em uma máquina host que envia e recebe dados, resultados, programas, desempenho e informações de integridade do sistema para os workers da TPU. O mestre da TPU também gerencia a configuração e o encerramento dos dispositivos da TPU.

Nó da TPU

#TensorFlow
#GoogleCloud

um recurso de TPU no Google Cloud Platform com um tipo de TPU específico; O nó da TPU se conecta à rede VPC de uma rede VPC com peering. Os nós da TPU são um recurso definido na API Cloud TPU.

Pod de TPU

#TensorFlow
#GoogleCloud

Uma configuração específica de dispositivos TPU em um data center do Google. Todos os dispositivos em um pod de TPU são conectados entre si por meio de uma rede dedicada de alta velocidade. Um pod de TPU é a maior configuração de dispositivos de TPU disponível para uma versão específica de TPU.

Recurso da TPU

#TensorFlow
#GoogleCloud

Uma entidade de TPU no Google Cloud Platform que você cria, gerencia ou consome. Por exemplo, nós de TPU e tipos de TPU são recursos da TPU.

Fatia de TPU

#TensorFlow
#GoogleCloud

Uma fração de TPU é uma parte fracionária dos dispositivos TPU em um pod da TPU. Todos os dispositivos em uma fração de TPU estão conectados uns aos outros em uma rede dedicada de alta velocidade.

Tipo de TPU

#TensorFlow
#GoogleCloud

Uma configuração de um ou mais dispositivos TPU com uma versão específica de hardware da TPU. Selecione um tipo de TPU ao criar um nó de TPU no Google Cloud Platform. Por exemplo, um tipo de TPU v2-8 é um dispositivo único de TPU v2 com 8 núcleos. Um tipo de TPU v3-2048 tem 256 dispositivos TPU v3 em rede e um total de 2.048 núcleos. Os tipos de TPU são um recurso definido na API Cloud TPU.

Worker TPU

#TensorFlow
#GoogleCloud

Um processo executado em uma máquina host e com programas de machine learning em dispositivos TPU.