Glosario de aprendizaje automático: TensorFlow

Esta página contiene los términos del glosario de TensorFlow. Para ver todos los términos del glosario, haz clic aquí.

B

inferencia por lotes

#TensorFlow
#GoogleCloud

Es el proceso de inferir predicciones en varios ejemplos sin etiqueta divididos en subconjuntos más pequeños (“lotes”).

La inferencia por lotes puede aprovechar las funciones de paralelización de los chips aceleradores. Es decir, varios aceleradores pueden inferir predicciones de forma simultánea en lotes de ejemplos sin etiquetar, lo que aumenta drásticamente la cantidad de inferencias por segundo.

C

Cloud TPU

#TensorFlow
#GoogleCloud

Un acelerador de hardware especializado diseñado para acelerar las cargas de trabajo de aprendizaje automático en Google Cloud.

D

API de Dataset (tf.data)

#TensorFlow

Una API de TensorFlow de alto nivel para leer datos y transformarlos en un formato que requiera un algoritmo de aprendizaje automático Un objeto tf.data.Dataset representa una secuencia de elementos, en la que cada uno contiene uno o más tensores. Un objeto tf.data.Iterator proporciona acceso a los elementos de una Dataset.

Para obtener detalles sobre la API de Dataset, consulta tf.data: Compila canalizaciones de entrada de TensorFlow en la Guía para programadores de TensorFlow.

dispositivo

#TensorFlow
#GoogleCloud

Término sobrecargado con las siguientes dos definiciones posibles:

  1. Categoría de hardware que puede ejecutar una sesión de TensorFlow y que incluye CPU, GPU y TPU.
  2. Cuando se entrena un modelo de AA con chips aceleradores (GPU o TPU), la parte del sistema que realmente manipula los tensores y las incorporaciones. El dispositivo se ejecuta en chips aceleradores. Por el contrario, el host suele ejecutarse en una CPU.

E

ejecución inmediata

#TensorFlow

Entorno de programación de TensorFlow en el que las operations se ejecutan de inmediato. Por el contrario, las operaciones llamadas ejecución por grafos no se ejecutan hasta que se evalúen explícitamente. La ejecución inmediata es una interfaz imperativa, tal como el código en la mayoría de los lenguajes de programación. Los programas de ejecución inmediata son generalmente mucho más fáciles de depurar que los programas de ejecución por grafos.

Estimador

#TensorFlow

Una API de TensorFlow obsoleta. Utiliza tf.keras en lugar de Estimadores.

F

ingeniería de atributos.

#fundamentals
#TensorFlow

Un proceso que implica los siguientes pasos:

  1. Determinar qué atributos podrían ser útiles para entrenar un modelo
  2. Convertir los datos sin procesar del conjunto de datos en versiones eficientes de esos atributos.

Por ejemplo, podrías determinar que temperature podría ser una función útil. Luego, puedes experimentar con el agrupamiento para optimizar lo que el modelo puede aprender de los diferentes rangos temperature.

En ocasiones, la ingeniería de atributos se denomina extracción de atributos o incorporación.

especificación de atributos

#TensorFlow

Describe la información necesaria para extraer los datos de features del búfer de protocolo tf.Example. Debido a que el búfer de protocolo tf.Example es solo un contenedor de datos, debes especificar lo siguiente:

  • Los datos que se extraerán (es decir, las claves de los atributos)
  • El tipo de datos (por ejemplo, flotante o int)
  • La longitud (fija o variable)

G

gráfico

#TensorFlow

En TensorFlow, especificación de procesamiento. Los nodos del grafo representan operaciones. Las conexiones están orientadas y representan el paso del resultado de una operación (un tensor) como un operando para otra operación. Usa TensorBoard para visualizar un gráfico.

ejecución por grafos

#TensorFlow

Entorno de programación de TensorFlow en el que el programa primero construye un gráfico y, luego, ejecuta todo o parte de ese grafo. La ejecución por grafos es el modo de ejecución predeterminado en TensorFlow 1.x.

Compara esto con la ejecución inmediata.

H

host

#TensorFlow
#GoogleCloud

Cuando se entrena un modelo de AA en chips aceleradores (GPU o TPU), es la parte del sistema que controla los siguientes aspectos:

  • El flujo general del código.
  • La extracción y transformación de la canalización de entrada.

Por lo general, el host se ejecuta en una CPU, no en un chip acelerador; el dispositivo manipula los tensores de los chips del acelerador.

L

API de Layers (tf.layers)

#TensorFlow

API de TensorFlow para construir una red neuronal profunda como una composición de capas. Esta API te permite compilar diferentes tipos de capas, como las siguientes:

La API de Layers sigue las convenciones de la API de capas de Keras. Es decir, aparte de un prefijo diferente, todas las funciones de la API de Layers tienen los mismos nombres y firmas que sus contrapartes en la API de Layers de Keras.

M

malla

#TensorFlow
#GoogleCloud

En la programación paralela del AA, es un término asociado con la asignación de los datos y el modelo a los chips TPU y la definición de cómo se fragmentarán o replicarán estos valores.

Malla es un término sobrecargado que puede significar cualquiera de las siguientes opciones:

  • Un diseño físico de chips TPU.
  • Una construcción lógica abstracta para asignar los datos y el modelo a los chips de TPU.

En cualquier caso, una malla se especifica como una forma.

métrica

#TensorFlow

Una estadística que te interesa.

Un objetivo es una métrica que un sistema de aprendizaje automático intenta optimizar.

N

nodo (grafo de TensorFlow)

#TensorFlow

Una operación en un gráfico de TensorFlow

O

operación (op)

#TensorFlow

En TensorFlow, cualquier procedimiento que crea, manipula o destruye un tensor. Por ejemplo, una multiplicación de matrices es una operación que toma dos tensores como entrada y genera un tensor como salida.

P

Servidor de parámetros (PS)

#TensorFlow

Un trabajo que realiza un seguimiento de los parámetros de un modelo en una configuración distribuida.

P.

cola

#TensorFlow

Una operación de TensorFlow que implementa una estructura de datos en cola. Por lo general, se usa en E/S.

R

rango (tensor)

#TensorFlow

La cantidad de dimensiones en un tensor. Por ejemplo, un escalar tiene rango 0, un vector tiene rango 1 y una matriz tiene rango 2.

No se debe confundir con rango (ordinalidad).

directorio raíz

#TensorFlow

El directorio que especificas para alojar subdirectorios del punto de control de TensorFlow y archivos de eventos de varios modelos.

S

SavedModel

#TensorFlow

El formato recomendado para guardar y recuperar modelos de TensorFlow. El modelo guardado es un formato de serialización recuperable y neutral del lenguaje que permite que los sistemas y las herramientas de nivel superior produzcan, consuman y transformen modelos de TensorFlow.

Para obtener más información, consulta la sección sobre cómo guardar y restablecer la Guía para programadores de TensorFlow.

Económico

#TensorFlow

Un objeto de TensorFlow responsable de guardar puntos de control del modelo

fragmento

#TensorFlow
#GoogleCloud

Es una división lógica del conjunto de entrenamiento o del modelo. Por lo general, algunos procesos crean fragmentos dividiendo los ejemplos o los parámetros en fragmentos (por lo general) del mismo tamaño. Luego, cada fragmento se asigna a una máquina diferente.

La fragmentación de un modelo se denomina paralelismo de modelos; la fragmentación de datos se denomina paralelismo de datos.

resumen

#TensorFlow

En TensorFlow, valor o conjunto de valores calculados en un paso en particular, que se suele usar para hacer un seguimiento de las métricas del modelo durante el entrenamiento.

T

Tensor

#TensorFlow

La principal estructura de datos en los programas de TensorFlow. Los tensores son estructuras de datos de n dimensiones (donde N podría ser muy grande), comúnmente escalares, vectores o matrices. Los elementos de un tensor pueden contener valores enteros, de punto flotante o de cadena.

TensorBoard

#TensorFlow

Panel en el que se muestran los resúmenes guardados durante la ejecución de uno o más programas de TensorFlow.

TensorFlow

#TensorFlow

Plataforma de aprendizaje automático distribuida a gran escala. El término también se refiere a la capa base de la API en la pila de TensorFlow, que admite el procesamiento general en los grafos de Dataflow.

Aunque TensorFlow se usa principalmente para el aprendizaje automático, también puedes usarlo para tareas que no son de AA que requieren procesamiento numérico mediante grafos de flujo.

TensorFlow Playground

#TensorFlow

Un programa que visualiza cómo los diferentes hiperparámetros influyen en el entrenamiento del modelo (principalmente de red neuronal). Para probar TensorFlow Playground, visita http://playground.tensorflow.org.

TensorFlow Serving

#TensorFlow

Una plataforma para implementar modelos entrenados en producción.

Unidad de procesamiento tensorial (TPU)

#TensorFlow
#GoogleCloud

Un circuito integrado específico de la aplicación (ASIC) que optimiza el rendimiento de las cargas de trabajo de aprendizaje automático. Estos ASIC se implementan como varios chips TPU en un dispositivo de TPU.

rango de tensor

#TensorFlow

Consulta rango (tensor).

Forma del tensor

#TensorFlow

Cantidad de elementos que contiene un tensor en distintas dimensiones. Por ejemplo, un tensor de [5, 10] tiene una forma de 5 en una dimensión y de 10 en otra.

Tamaño de tensor

#TensorFlow

Cantidad total de escalares que contiene un tensor. Por ejemplo, un tensor [5, 10] tiene un tamaño de 50.

tf.Example

#TensorFlow

Búfer de protocolo estándar que se usa para describir datos de entrada para el entrenamiento o la inferencia de modelos de aprendizaje automático.

tf.keras

#TensorFlow

Una implementación de Keras integrada en TensorFlow.

TPU

#TensorFlow
#GoogleCloud

Abreviatura de unidad de procesamiento tensorial.

chip TPU

#TensorFlow
#GoogleCloud

Acelerador de álgebra lineal programable con memoria de gran ancho de banda en chip que está optimizado para cargas de trabajo de aprendizaje automático. Varios chips TPU se implementan en un dispositivo de TPU.

Dispositivo de TPU

#TensorFlow
#GoogleCloud

Una placa de circuito impreso (PCB) con varios chips TPU, interfaces de red de ancho de banda alto y hardware de enfriamiento del sistema.

TPU principal

#TensorFlow
#GoogleCloud

Es el proceso de coordinación central que se ejecuta en una máquina anfitrión que envía y recibe datos, resultados, programas, información del estado del sistema y rendimiento a los trabajadores de TPU. La instancia principal de TPU también administra la configuración y el apagado de los dispositivos de TPU.

Nodo TPU

#TensorFlow
#GoogleCloud

Un recurso de TPU en Google Cloud con un tipo de TPU específico. El nodo TPU se conecta a tu red de VPC desde una red de VPC de intercambio de tráfico. Los nodos TPU son un recurso definido en la API de Cloud TPU.

pod de TPU

#TensorFlow
#GoogleCloud

Es una configuración específica de dispositivos de TPU en un centro de datos de Google. Todos los dispositivos en un pod de TPU están conectados entre sí a través de una red dedicada de alta velocidad. Un pod de TPU es la configuración más grande de dispositivos de TPU disponibles para una versión de TPU específica.

Recurso de TPU

#TensorFlow
#GoogleCloud

Una entidad de TPU en Google Cloud que creas, administras o consumes. Por ejemplo, los nodos TPU y los tipos de TPU son recursos de TPU.

Porción de TPU

#TensorFlow
#GoogleCloud

Una porción de TPU es una parte fraccionaria de los dispositivos de TPU en un Pod de TPU. Todos los dispositivos en una porción de TPU están conectados entre sí a través de una red dedicada de alta velocidad.

Tipo de TPU

#TensorFlow
#GoogleCloud

Es una configuración de uno o más dispositivos de TPU con una versión específica de hardware de TPU. El tipo de TPU se selecciona cuando creas un nodo TPU en Google Cloud. Por ejemplo, un tipo de TPU v2-8 es un dispositivo único de TPU v2 con 8 núcleos. Un tipo de TPU v3-2048 tiene 256 dispositivos TPU v3 conectados en red y un total de 2,048 núcleos. Los tipos de TPU son un recurso definido en la API de Cloud TPU.

trabajador TPU

#TensorFlow
#GoogleCloud

Un proceso que se ejecuta en una máquina anfitrión y ejecuta programas de aprendizaje automático en dispositivos de TPU.