이 페이지에는 TensorFlow 용어집 용어가 포함되어 있습니다. 모든 용어집 용어를 보려면 여기를 클릭하세요.
B
일괄 추론
라벨이 없는 여러 예에서 더 작은 하위 집합 ('배치')으로 나눈 여러 개의 예측을 추론하는 프로세스입니다.
일괄 추론은 가속기 칩의 동시 로드 기능을 활용할 수 있습니다. 즉, 여러 액셀러레이터가 라벨이 지정되지 않은 예의 서로 다른 배치에서 예측을 동시에 추론할 수 있어 초당 추론 횟수가 급격히 증가합니다.
C
Cloud TPU
Google Cloud에서 머신러닝 워크로드의 속도를 높이도록 설계된 특수 하드웨어 가속기입니다
D
Dataset API (tf.data)
데이터를 읽고 머신러닝 알고리즘에 필요한 형식으로 변환하는 고급 TensorFlow API입니다.
tf.data.Dataset
객체는 각 요소에 하나 이상의
텐서가 포함된 요소 시퀀스를 나타냅니다. tf.data.Iterator
객체는 Dataset
의 요소에 액세스할 수 있는 권한을 제공합니다.
Dataset API에 대한 자세한 내용은 TensorFlow 프로그래머 가이드의 tf.data: TensorFlow 입력 파이프라인 빌드를 참조하세요.
기기
다음과 같은 두 가지 정의가 있는 중복으로 정의된 용어입니다.
- CPU, GPU, TPU 등 TensorFlow 세션을 실행할 수 있는 하드웨어 카테고리입니다.
- 가속기 칩(GPU 또는 TPU)에서 ML 모델을 학습시킬 때, 이는 시스템에서 텐서와 임베딩을 실제로 조작하는 부분입니다. 기기가 가속기 칩에서 실행됩니다. 반면에 호스트는 일반적으로 CPU에서 실행됩니다.
E
즉시 실행
operations이 즉시 실행되는 TensorFlow 프로그래밍 환경입니다. 반면에 그래프 실행에서 호출되는 작업은 명시적으로 평가될 때까지 실행되지 않습니다. 즉시 실행은 대부분의 프로그래밍 언어로 된 코드와 마찬가지로 명령형 인터페이스입니다. 즉시 실행 프로그램은 일반적으로 그래프 실행 프로그램보다 디버그하기 쉽습니다.
에스티메이터
지원 중단된 TensorFlow API입니다. 에스티메이터 대신 tf.keras를 사용합니다.
F
특성 추출 단계를 포함합니다
다음 단계가 포함된 프로세스입니다.
- 모델 학습에 유용할 특성 결정
- 데이터 세트의 원시 데이터를 이러한 특성의 효율적인 버전으로 변환
예를 들어 temperature
가 유용한 기능이라고 판단할 수 있습니다. 그런 다음 버케팅을 실험하여 모델이 다양한 temperature
범위에서 학습할 수 있는 내용을 최적화할 수 있습니다.
특성 사양
tf.Example 프로토콜 버퍼에서 특성 데이터를 추출하는 데 필요한 정보를 설명합니다. tf.Example 프로토콜 버퍼는 데이터의 컨테이너이므로 다음을 지정해야 합니다.
- 추출할 데이터 (특성의 키)
- 데이터 유형 (예: float 또는 int)
- 길이 (고정 또는 가변)
G
그래프
TensorFlow에서는 계산 사양을 의미합니다. 그래프의 노드는 연산을 나타냅니다 에지는 방향성을 가지며, 연산의 결과 (텐서)를 다른 연산의 피연산자로 전달함을 의미합니다. TensorBoard를 사용하여 그래프를 시각화합니다.
그래프 실행
프로그램에서 먼저 그래프를 구성한 다음 그래프의 전체 또는 일부를 실행하는 TensorFlow 프로그래밍 환경입니다. 그래프 실행은 TensorFlow 1.x의 기본 실행 모드입니다.
즉시 실행과 대비되는 개념입니다.
H
호스트
가속기 칩(GPU 또는 TPU)에서 ML 모델을 학습시킬 때 시스템에서 다음 두 가지를 모두 제어하는 부분입니다.
- 코드의 전체 흐름
- 입력 파이프라인의 추출 및 변환
호스트는 일반적으로 가속기 칩이 아닌 CPU에서 실행됩니다. 기기는 가속기 칩의 텐서를 조작합니다.
L
Layers API (tf.layers)
레이어의 구성으로 심층 신경망을 구성하기 위한 TensorFlow API. 레이어 API를 사용하면 다음과 같은 다양한 유형의 레이어를 만들 수 있습니다.
tf.layers.Dense
: 완전 연결 레이어의 경우tf.layers.Conv2D
: 컨볼루셔널 레이어
Layers API는 Keras 레이어 API 규칙을 따릅니다. 즉, Layers API의 모든 함수는 다른 접두사를 제외하고, Keras 레이어 API의 함수와 이름 및 서명이 동일합니다.
월
메시
ML 병렬 프로그래밍에서 데이터와 모델을 TPU 칩에 할당하고 이러한 값의 샤딩 또는 복제 방법을 정의하는 것과 관련된 용어입니다.
메시는 오버로드된 용어로, 다음 중 하나를 의미할 수 있습니다.
- TPU 칩의 실제 레이아웃
- 데이터와 모델을 TPU 칩에 매핑하기 위한 추상 논리 구조입니다.
두 경우 모두 메시는 도형으로 지정됩니다.
측정항목
나에게 중요한 통계입니다.
목표는 머신러닝 시스템에서 최적화를 시도하는 측정항목입니다.
구매 불가
노드 (TensorFlow 그래프)
TensorFlow 그래프의 연산
O
작업 (op)
TensorFlow에서는 텐서를 만들거나 조작하거나 삭제하는 모든 절차를 의미합니다. 예를 들어 행렬 곱셈은 두 개의 텐서를 입력으로 사용하고 하나의 텐서를 출력으로 생성하는 작업입니다.
P
매개변수 서버 (PS)
모델의 매개변수를 분산형 환경에서 추적하는 작업입니다.
Q
현재 재생목록
대기열 데이터 구조를 구현하는 TensorFlow 작업입니다. 일반적으로 I/O에서 사용됩니다.
R
순위 (텐서)
텐서의 차원 수입니다. 예를 들어 스칼라의 순위는 0이고, 벡터의 순위는 1이며, 행렬의 순위는 2입니다.
순위 (순서수)와 혼동해서는 안 됩니다.
루트 디렉터리
여러 모델의 TensorFlow 체크포인트 및 이벤트 파일의 하위 디렉터리를 호스팅하도록 지정한 디렉터리입니다.
S
SavedModel
TensorFlow 모델 저장 및 복구에 권장되는 형식입니다. 저장된 모델은 언어 중립적이며 복구 가능한 직렬화 형식으로, 상위 수준 시스템과 도구에서 TensorFlow 모델을 생성, 소비, 변환할 수 있게 해줍니다.
자세한 내용은 TensorFlow 프로그래머 가이드에서 저장 및 복원 챕터를 참조하세요.
알뜰
모델 체크포인트 저장을 담당하는 TensorFlow 객체입니다.
샤드
학습 세트 또는 모델의 논리적 분할입니다. 일반적으로 일부 프로세스는 예시 또는 매개변수를 일반적으로 동일한 크기의 청크로 나누어 샤드를 만듭니다. 그런 다음 각 샤드는 다른 머신에 할당됩니다.
모델을 샤딩하는 것을 모델 동시 로드라고 하고, 데이터 샤딩을 데이터 동시 로드라고 합니다.
요약
TensorFlow에서는 특정 단계에 계산된 값 또는 값 집합을 의미하며, 일반적으로 학습 중에 모델 측정항목을 추적하는 데 사용됩니다.
T
텐서
TensorFlow 프로그램의 기본 데이터 구조입니다. 텐서는 N차원(여기서 N은 매우 클 수 있음) 데이터 구조로, 가장 일반적으로 스칼라, 벡터 또는 행렬입니다. 텐서의 요소는 정수, 부동 소수점, 문자열 값을 포함할 수 있습니다.
TensorBoard
하나 이상의 TensorFlow 프로그램을 실행하는 중에 저장된 요약을 표시하는 대시보드입니다.
TensorFlow
대규모 분산형 머신러닝 플랫폼입니다. 이 용어는 Dataflow 그래프에 대한 일반적인 계산을 지원하는 TensorFlow 스택의 기본 API 레이어를 나타내기도 합니다.
TensorFlow는 주로 머신러닝에 사용되지만, Dataflow 그래프를 사용한 수치 연산이 필요한 ML 이외의 작업에도 TensorFlow를 사용할 수 있습니다.
TensorFlow Playground
다양한 초매개변수가 모델(주로 신경망) 학습에 미치는 영향을 시각화한 프로그램입니다. TensorFlow Playground로 실험해 보려면 http://playground.tensorflow.org로 이동하세요.
TensorFlow Serving
학습된 모델을 프로덕션에 배포하기 위한 플랫폼
Tensor Processing Unit(TPU)
머신러닝 워크로드의 성능을 최적화하는 ASIC (Application-Specific Integrated Circuit)입니다. 이러한 ASIC는 TPU 기기에 여러 TPU 칩으로 배포됩니다.
텐서 차수
순위 (텐서)를 참조하세요.
텐서 형태
텐서가 다양한 차원에서 포함하는 요소의 수입니다.
예를 들어 [5, 10]
텐서의 형태는 한 차원에서 5, 다른 차원에서 10입니다.
텐서 크기
텐서가 포함하는 스칼라의 총 개수입니다. 예를 들어 [5, 10]
텐서의 크기는 50입니다.
tf.Example
머신러닝 모델 학습 또는 추론을 위한 입력 데이터를 설명하는 표준 프로토콜 버퍼입니다.
tf.keras
TensorFlow에 통합된 Keras 구현입니다.
TPU
Tensor Processing Unit의 약어입니다.
TPU 칩
머신러닝 워크로드에 최적화된 온칩 고대역폭 메모리를 갖춘 프로그래밍 가능한 선형 대수학 가속기입니다. 여러 TPU 칩이 TPU 기기에 배포됩니다.
TPU 기기
여러 TPU 칩, 고대역폭 네트워크 인터페이스, 시스템 냉각 하드웨어가 포함된 인쇄 회로 기판 (PCB)
TPU 마스터
데이터, 결과, 프로그램, 성능, 시스템 상태 정보를 TPU 작업자와 주고받는 호스트 머신에서 실행되는 중앙 조정 프로세스입니다. TPU 마스터는 또한 TPU 기기의 설정 및 종료를 관리합니다.
TPU 노드
특정 TPU 유형을 사용하는 Google Cloud의 TPU 리소스 TPU 노드는 피어 VPC 네트워크에서 VPC 네트워크에 연결됩니다. TPU 노드는 Cloud TPU API에 정의된 리소스입니다.
TPU Pod
Google 데이터 센터에 있는 TPU 기기의 특정 구성입니다. TPU Pod의 모든 기기는 전용 고속 네트워크를 통해 서로 연결됩니다. TPU Pod는 특정 TPU 버전에 사용할 수 있는 TPU 기기의 최대 구성입니다.
TPU 리소스
사용자가 만들거나 관리하거나 사용하는 Google Cloud의 TPU 항목입니다. 예를 들어 TPU 노드 및 TPU 유형은 TPU 리소스입니다.
TPU 슬라이스
TPU 슬라이스는 TPU Pod에 있는 TPU 기기의 일부분입니다. TPU 슬라이스의 모든 기기는 전용 고속 네트워크를 통해 서로 연결됩니다.
TPU 유형
특정 TPU 하드웨어 버전이 있는 하나 이상의 TPU 기기 구성입니다. Google Cloud에서 TPU 노드를 만들 때 TPU 유형을 선택합니다. 예를 들어 v2-8
TPU 유형은 코어가 8개인 단일 TPU v2 기기입니다. v3-2048
TPU 유형에는 256개의 네트워킹된 TPU v3 기기와 총 2,048개의 코어가 있습니다. TPU 유형은 Cloud TPU API에 정의된 리소스입니다.
TPU 워커
호스트 머신에서 실행되고 TPU 기기에서 머신러닝 프로그램을 실행하는 프로세스입니다.