Bảng thuật ngữ về công nghệ máy học: TensorFlow

Trang này chứa các thuật ngữ trong bảng thuật ngữ TensorFlow. Đối với tất cả các thuật ngữ, hãy nhấp vào đây.

B

dự đoán theo nhóm

#TensorFlow
#GoogleCloud

Quá trình suy đoán các dự đoán trên nhiều ví dụ chưa gắn nhãn được chia thành các tập hợp con nhỏ hơn ("lô".

Dự đoán theo lô có thể tận dụng các tính năng song song của các bộ tăng tốc. Điều này có nghĩa là nhiều trình tăng tốc có thể cùng lúc dự đoán được nhiều lô mẫu không được gắn nhãn, làm tăng đáng kể dự đoán mỗi giây.

C

Cloud TPU

#TensorFlow
#GoogleCloud

Trình tăng tốc phần cứng chuyên dụng được thiết kế để tăng tốc độ tải công việc máy học trên Google Cloud Platform.

D

API tập dữ liệu (tf.data)

#TensorFlow

API TensorFlow cấp cao để đọc và chuyển đổi dữ liệu thành dạng thức mà thuật toán học máy yêu cầu. Đối tượng tf.data.Dataset đại diện cho một chuỗi các phần tử, trong đó mỗi phần tử chứa một hoặc nhiều Cảm biến. Đối tượng tf.data.Iterator cung cấp quyền truy cập vào các phần tử của Dataset.

Để biết thông tin chi tiết về API Dataset, hãy xem tf.data: Xây dựng quy trình nhập dữ liệu TensorFlow trong Hướng dẫn dành cho lập trình viên TensorFlow.

thiết bị

#TensorFlow
#GoogleCloud

Thuật ngữ quá tải với hai định nghĩa có thể xảy ra sau đây:

  1. Một danh mục phần cứng có thể chạy phiên TensorFlow, bao gồm cả CPU, GPU và TPU.
  2. Khi huấn luyện một mô hình máy học trên chip tăng tốc (GPU hoặc TPU), bộ phận của hệ thống sẽ thực sự thao tác tensornhúng. Thiết bị chạy trên chip tăng tốc. Ngược lại, máy chủ thường chạy trên CPU.

E

thực thi sớm

#TensorFlow

Môi trường lập trình TensorFlow trong đó hoạt động chạy ngay lập tức. Ngược lại, các thao tác được gọi trong quá trình thực thi biểu đồ sẽ không chạy cho đến khi được đánh giá rõ ràng. Thực thi Eager là một giao diện bắt buộc, giống như mã trong hầu hết các ngôn ngữ lập trình. Chương trình thực thi Eager thường dễ gỡ lỗi hơn nhiều so với chương trình thực thi biểu đồ.

Công cụ ước tính

#TensorFlow

API TensorFlow không còn được dùng nữa. Sử dụng tf.keras thay vì Công cụ ước tính.

F

kỹ thuật tính năng

#fundamentals
#TensorFlow

Quy trình bao gồm các bước sau:

  1. Xác định những tính năng có thể hữu ích cho việc đào tạo mô hình.
  2. Chuyển đổi dữ liệu thô từ tập dữ liệu thành các phiên bản hiệu quả của các tính năng đó.

Ví dụ: bạn có thể xác định rằng temperature có thể là một tính năng hữu ích. Sau đó, bạn có thể thử nghiệm nhóm để tối ưu hoá những gì mà mô hình có thể học được từ nhiều dải ô temperature.

Kỹ thuật tính năng đôi khi được gọi là trích xuất tính năng.

thông số tính năng

#TensorFlow

Mô tả thông tin cần thiết để trích xuất dữ liệu features từ bộ đệm giao thức tf.Example. Vì vùng đệm giao thức tf.Example chỉ là vùng chứa cho dữ liệu, nên bạn phải chỉ định những nội dung sau:

  • dữ liệu cần trích xuất (đó là các khóa cho tính năng)
  • loại dữ liệu (ví dụ: float hoặc int)
  • Độ dài (cố định hoặc thay đổi)

G

đồ thị

#TensorFlow

Trong TensorFlow, một thông số tính toán. Các nút trong biểu đồ đại diện cho các thao tác. Các cạnh được định hướng và biểu thị việc truyền kết quả của một toán tử (Tensor) dưới dạng một toán tử cho một toán tử khác. Sử dụng TensorBoard để trực quan hoá một biểu đồ.

thực thi biểu đồ

#TensorFlow

Một môi trường lập trình TensorFlow, trong đó chương trình xây dựng biểu đồ lần đầu rồi thực thi tất cả hoặc một phần biểu đồ đó. Thực thi biểu đồ là chế độ thực thi mặc định trong TensorFlow 1.x.

Ngược với thực thi eager.

H

người tổ chức

#TensorFlow
#GoogleCloud

Khi huấn luyện mô hình máy học trên chip tăng tốc (GPU hoặc TPU), phần hệ thống kiểm soát cả hai điều sau:

  • Luồng tổng thể của mã.
  • Việc trích xuất và biến đổi quy trình nhập.

Máy chủ lưu trữ thường chạy trên CPU, không phải trên chip tăng tốc; thiết bị điều khiển tensor trên các chip tăng tốc.

L

API lớp (tf.layers)

#TensorFlow

Một API TensorFlow để xây dựng mạng nơ-ron sâu dưới dạng một cấu trúc của các lớp. API Lớp cho phép bạn tạo nhiều loại lớp, chẳng hạn như:

API lớp tuân theo các quy ước API lớp Keras. Điều đó có nghĩa là ngoài một tiền tố khác, tất cả các hàm trong API lớp đều có tên và chữ ký giống như các hàm cùng loại trong API lớp Keras.

T2

lưới

#TensorFlow
#GoogleCloud

Trong lập trình song song ML, một thuật ngữ liên quan đến việc chỉ định dữ liệu và mô hình cho các khối TPU, đồng thời xác định cách phân đoạn hoặc nhân bản các giá trị này.

Lưới là một thuật ngữ quá tải, có thể có một trong những nghĩa sau:

  • Bố cục thực tế của chip TPU.
  • Một cấu trúc logic trừu tượng để ánh xạ dữ liệu và mô hình tới các khối TPU.

Trong cả hai trường hợp, một lưới được chỉ định ở dạng shape (hình dạng).

chỉ số

#TensorFlow

Một số liệu thống kê mà bạn quan tâm.

Mục tiêu là một chỉ số mà hệ thống máy học cố gắng tối ưu hoá.

N

nút (Đồ thị TensorFlow)

#TensorFlow

Phép toán trên biểu đồ TensorFlow.

O

hoạt động (op)

#TensorFlow

Trong TensorFlow, mọi quy trình tạo, thao tác hoặc huỷ bỏ một Tensor (Tensor). Ví dụ: nhân ma trận là một thao tác lấy 2 Tensor làm đầu vào và tạo 1 Tensor làm đầu ra.

P

Máy chủ thông số (PS)

#TensorFlow

Công việc theo dõi các thông số của mô hình trong một chế độ cài đặt phân phối.

Hỏi

danh sách chờ

#TensorFlow

Toán tử TensorFlow triển khai cấu trúc dữ liệu hàng đợi. Thường được sử dụng trong I/O.

(phải)

thứ hạng (Cảm biến)

#TensorFlow

Số lượng kích thước trong một Tensor. Ví dụ: một đại lượng vô hướng có hạng 0, một vectơ có hạng 1 và một ma trận có hạng 2.

Đừng nhầm với thứ hạng (thứ tự).

thư mục gốc

#TensorFlow

Thư mục bạn chỉ định để lưu trữ các thư mục con của điểm kiểm tra TensorFlow và các tệp sự kiện của nhiều mô hình.

CN

Đã lưu mô hình

#TensorFlow

Định dạng đề xuất để lưu và khôi phục các mô hình TensorFlow. SavedModel là một định dạng chuyển đổi tuần tự trung tính, có thể khôi phục về ngôn ngữ, cho phép các hệ thống và công cụ cấp cao hơn tạo, sử dụng và biến đổi mô hình TensorFlow.

Xem chương Tiết kiệm và khôi phục trong Hướng dẫn dành cho lập trình viên TensorFlow để biết thông tin chi tiết đầy đủ.

Vận chuyển hàng tiết kiệm

#TensorFlow

Đối tượng TensorFlow chịu trách nhiệm lưu điểm kiểm tra mô hình.

phân đoạn

#TensorFlow
#GoogleCloud

Một phép chia logic cho tập huấn luyện hoặc mô hình. Thông thường, một số quy trình tạo ra các phân đoạn bằng cách chia example hoặc parameters thành các phân đoạn có kích thước bằng nhau (thường). Sau đó, mỗi phân đoạn được gán cho một máy khác nhau.

Phân đoạn mô hình được gọi là song song dữ liệu; dữ liệu phân đoạn được gọi là song song dữ liệu.

bản tóm tắt

#TensorFlow

Trong TensorFlow, một giá trị hoặc một tập hợp giá trị được tính toán ở một bước cụ thể, thường được dùng để theo dõi các chỉ số của mô hình trong quá trình huấn luyện.

T

Tensor

#TensorFlow

Cấu trúc dữ liệu chính trong các chương trình TensorFlow. Tensor là các cấu trúc dữ liệu N chiều (trong đó N có thể rất lớn), thường là vô hướng, vectơ hoặc ma trận nhất. Các phần tử của Tensor có thể chứa giá trị số nguyên, dấu phẩy động hoặc giá trị chuỗi.

TensorBoard

#TensorFlow

Trang tổng quan hiển thị nội dung tóm tắt đã lưu trong quá trình thực thi một hoặc nhiều chương trình TensorFlow.

TensorFlow

#TensorFlow

Một nền tảng máy học phân tán, có quy mô lớn. Thuật ngữ này cũng đề cập đến lớp API cơ sở trong ngăn xếp TensorFlow, hỗ trợ tính toán chung trên biểu đồ luồng dữ liệu.

Mặc dù TensorFlow chủ yếu dùng cho công nghệ máy học, nhưng bạn cũng có thể sử dụng TensorFlow cho các tác vụ không phải công nghệ máy học, đòi hỏi phải tính toán bằng biểu đồ dữ liệu.

Sân chơi TensorFlow

#TensorFlow

Một chương trình trực quan hóa mức độ ảnh hưởng của các siêu thông số khác nhau đến quá trình huấn luyện mô hình (chủ yếu là mạng nơ-ron). Hãy truy cập http://playground.tensorflow.org để thử nghiệm với TensorFlow Playground.

Phân phát TensorFlow

#TensorFlow

Một nền tảng để triển khai các mô hình đã qua đào tạo trong môi trường thực tế.

Bộ xử lý Tensor (TPU)

#TensorFlow
#GoogleCloud

Mạch tích hợp dành riêng cho ứng dụng (ASIC) giúp tối ưu hoá hiệu suất của khối lượng công việc máy học. Các ASIC này được triển khai dưới dạng nhiều chip TPU trên thiết bị TPU.

Xếp hạng của Tensor

#TensorFlow

Xem thứ hạng (Cảm biến).

Hình dạng Tensor

#TensorFlow

Số lượng phần tử mà một Tensor chứa trong các thứ nguyên khác nhau. Ví dụ: Tensor [5, 10] có hình dạng 5 chiều này và 10 chiều khác.

Kích thước Tensor

#TensorFlow

Tổng số đại lượng vô hướng của một Tensor. Ví dụ: Tensor [5, 10] có kích thước là 50.

Ví dụ

#TensorFlow

Bộ đệm giao thức tiêu chuẩn để mô tả dữ liệu đầu vào để đào tạo hoặc suy luận mô hình máy học.

tf.keras

#TensorFlow

Hoạt động triển khai Keras được tích hợp vào TensorFlow.

TPU

#TensorFlow
#GoogleCloud

Tên viết tắt của Bộ xử lý cảm biến.

Chip TPU

#TensorFlow
#GoogleCloud

Trình tăng tốc đại số tuyến tính có thể lập trình với bộ nhớ băng thông cao trên chip được tối ưu hoá cho khối lượng công việc máy học. Nhiều chip TPU được triển khai trên thiết bị TPU.

Thiết bị TPU

#TensorFlow
#GoogleCloud

Bảng mạch in (PCB) có nhiều chip TPU, giao diện mạng băng thông cao và phần cứng làm mát hệ thống.

TPU chính

#TensorFlow
#GoogleCloud

Quy trình điều phối tập trung chạy trên một máy chủ lưu trữ sẽ gửi và nhận dữ liệu, kết quả, chương trình, hiệu suất cũng như thông tin về tình trạng hệ thống cho nhân viên TPU. TPU chính cũng quản lý việc thiết lập và tắt thiết bị TPU.

Nút TPU

#TensorFlow
#GoogleCloud

Tài nguyên TPU trên Google Cloud Platform với một loại TPU cụ thể. Nút TPU kết nối với Mạng VPC của bạn từ một mạng VPC ngang hàng. Nút TPU là một tài nguyên được xác định trong API Cloud TPU.

Gói TPU

#TensorFlow
#GoogleCloud

Một cấu hình cụ thể của thiết bị TPU trong trung tâm dữ liệu của Google. Tất cả các thiết bị trong nhóm TPU được kết nối với nhau qua một mạng tốc độ cao chuyên dụng. Pod TPU là cấu hình lớn nhất của thiết bị TPU có sẵn cho một phiên bản TPU cụ thể.

Tài nguyên TPU

#TensorFlow
#GoogleCloud

Thực thể TPU trên Google Cloud Platform mà bạn tạo, quản lý hoặc sử dụng. Ví dụ: nút TPUloại TPU là tài nguyên TPU.

Lát cắt TPU

#TensorFlow
#GoogleCloud

Một lát TPU là một phần nhỏ của thiết bị TPU trong Pod TPU. Tất cả thiết bị trong lát cắt TPU được kết nối với nhau qua mạng tốc độ cao chuyên dụng.

Loại TPU

#TensorFlow
#GoogleCloud

Cấu hình của một hoặc nhiều thiết bị TPU với một phiên bản phần cứng TPU cụ thể. Bạn chọn loại TPU khi tạo nút TPU trên Google Cloud Platform. Ví dụ: loại TPU v2-8 là một thiết bị TPU v2 có 8 lõi. Một loại TPU v3-2048 có 256 thiết bị TPU nối mạng v3 và tổng số 2048 lõi. Các loại TPU là tài nguyên được xác định trong API Cloud TPU.

Nhân viên TPU

#TensorFlow
#GoogleCloud

Quy trình chạy trên máy chủ và thực thi các chương trình máy học trên thiết bị TPU.