Bảng thuật ngữ về công nghệ máy học: AI tạo sinh

Trang này chứa các thuật ngữ trong bảng thuật ngữ về AI tạo sinh. Để biết tất cả các thuật ngữ trong bảng thuật ngữ, hãy nhấp vào đây.

A

mô hình hồi quy tự động

#language
#image
#generativeAI (AI tạo sinh)

model dự đoán thông tin dự đoán dựa trên các dự đoán trước đó của riêng nó. Ví dụ: các mô hình ngôn ngữ tự động hồi quy sẽ dự đoán mã thông báo tiếp theo dựa trên mã thông báo dự đoán trước đó. Tất cả mô hình ngôn ngữ lớn dựa trên Transformer đều có tính hồi quy tự động.

Ngược lại, các mô hình hình ảnh dựa trên GAN thường không tự động hồi quy vì các mô hình này tạo hình ảnh trong một lần chuyển tiếp và không lặp lại trong các bước. Tuy nhiên, một số mô hình tạo hình ảnh tự động hồi quy vì các mô hình đó tạo hình ảnh theo các bước.

C

chuỗi lời nhắc suy nghĩ

#language
#generativeAI (AI tạo sinh)

Kỹ thuật kỹ thuật nhắc khuyến khích một mô hình ngôn ngữ lớn (LLM) để giải thích lý do của nó theo từng bước. Ví dụ: hãy xem xét lời nhắc sau đây, đặc biệt chú ý đến câu thứ hai:

Một người lái xe sẽ trải nghiệm bao nhiêu g lực khi lái một chiếc ô tô đi từ 0 đến 60 dặm/giờ trong 7 giây? Trong câu trả lời, hãy hiện tất cả các phép tính có liên quan.

Phản hồi của LLM có thể:

  • Hiển thị một chuỗi các công thức vật lý, kèm theo các giá trị 0, 60 và 7 ở các vị trí thích hợp.
  • Hãy giải thích lý do trường hợp này chọn các công thức đó và ý nghĩa của các biến.

Lời nhắc theo chuỗi tư duy buộc LLM thực hiện tất cả các phép tính, có thể dẫn đến câu trả lời chính xác hơn. Ngoài ra, tính năng nhắc chuỗi tư duy cho phép người dùng kiểm tra các bước của LLM để xác định xem câu trả lời có hợp lý hay không.

D

lời nhắc trực tiếp

#language
#generativeAI (AI tạo sinh)

Từ đồng nghĩa với lời nhắc chụp ảnh tự động.

tinh lọc

#generativeAI (AI tạo sinh)

Quá trình giảm kích thước của một model (gọi là model) thành mô hình nhỏ hơn (gọi là model) mô phỏng thông tin dự đoán của mô hình gốc một cách trung thực nhất có thể. Quy trình lọc rất hữu ích vì mô hình nhỏ hơn có hai lợi ích chính so với mô hình lớn hơn (giáo viên):

  • Thời gian suy luận nhanh hơn
  • Giảm mức sử dụng bộ nhớ và năng lượng

Tuy nhiên, dự đoán của học sinh thường không tốt bằng dự đoán của giáo viên.

Distillation huấn luyện mô hình học viên để giảm thiểu hàm giảm chất lượng dựa trên sự khác biệt giữa kết quả dự đoán của mô hình học viên và giáo viên.

So sánh và đối chiếu tinh lọc với các thuật ngữ sau:

F

nhắc vài lần

#language
#generativeAI (AI tạo sinh)

Một lời nhắc chứa nhiều ví dụ (một "một vài") ví dụ minh hoạ cách mô hình ngôn ngữ lớn sẽ phản hồi. Ví dụ: Lời nhắc dài sau đây có 2 ví dụ minh hoạ cách trả lời một truy vấn bằng một mô hình ngôn ngữ lớn.

Các phần của một lời nhắc Ghi chú
Đơn vị tiền tệ chính thức của quốc gia được chỉ định là gì? Câu hỏi mà bạn muốn LLM trả lời.
Pháp: EUR Một ví dụ.
Vương quốc Anh: GBP Một ví dụ khác.
Ấn Độ: Truy vấn thực tế.

Lời nhắc một lần ít thường tạo ra kết quả mong muốn hơn so với lời nhắc một lầnlời nhắc một lần. Tuy nhiên, lời nhắc chạy ít lần sẽ yêu cầu lời nhắc dài hơn.

Lời nhắc nhanh là một hình thức học nhanh áp dụng cho học tập dựa trên lời nhắc.

tinh chỉnh

#language
#image
#generativeAI (AI tạo sinh)

Lượt truyền huấn luyện thứ hai theo nhiệm vụ cụ thể được thực hiện trên một mô hình luyện sẵn để tinh chỉnh các tham số của mô hình đó cho một trường hợp sử dụng cụ thể. Ví dụ: trình tự huấn luyện đầy đủ cho một số mô hình ngôn ngữ lớn như sau:

  1. Đào tạo trước: Đào tạo một mô hình ngôn ngữ lớn trên một tập dữ liệu chung rộng lớn, chẳng hạn như tất cả các trang Wikipedia bằng tiếng Anh.
  2. Điều chỉnh tinh chỉnh: Huấn luyện mô hình đã luyện tập sẵn để thực hiện một nhiệm vụ cụ thể, chẳng hạn như phản hồi các thắc mắc y tế. Việc tinh chỉnh thường bao gồm hàng trăm hoặc hàng nghìn ví dụ tập trung vào một nhiệm vụ cụ thể.

Một ví dụ khác là trình tự huấn luyện đầy đủ cho một mô hình hình ảnh lớn như sau:

  1. Huấn luyện trước: Đào tạo một mô hình hình ảnh lớn trên một tập dữ liệu hình ảnh chung rộng lớn, chẳng hạn như tất cả hình ảnh trong Wikimedia common.
  2. Điều chỉnh tinh chỉnh: Huấn luyện mô hình đã luyện sẵn để thực hiện một nhiệm vụ cụ thể, chẳng hạn như tạo hình ảnh của cá voi sát thủ.

Việc tinh chỉnh có thể cần đến bất kỳ kết hợp nào của các chiến lược sau đây:

  • Sửa đổi tất cả các tham số hiện có của mô hình luyện sẵn. Quá trình này đôi khi gọi là điều chỉnh toàn bộ.
  • Chỉ sửa đổi một số tham số hiện có của mô hình luyện sẵn (thường là các lớp gần nhất với lớp đầu ra), trong khi giữ nguyên các tham số hiện có khác (thường là các lớp gần nhất với lớp đầu vào). Xem phần điều chỉnh hiệu quả thông số.
  • Thêm các lớp khác, thường là trên các lớp hiện có gần lớp đầu ra nhất.

Tinh chỉnh là một hình thức học tập chuyển giao. Do đó, quá trình tinh chỉnh có thể sử dụng một hàm mất dữ liệu khác hoặc một loại mô hình khác với các hàm dùng để huấn luyện mô hình đã huấn luyện trước. Ví dụ: bạn có thể tinh chỉnh mô hình hình ảnh lớn đã được huấn luyện trước để tạo mô hình hồi quy trả về số lượng chim trong hình ảnh đầu vào.

So sánh và đối chiếu tinh chỉnh với các thuật ngữ sau:

G

AI tạo sinh

#language
#image
#generativeAI (AI tạo sinh)

Một trường biến đổi mới nổi chưa có định nghĩa chính thức. Tuy nhiên, hầu hết các chuyên gia đều đồng ý rằng mô hình AI tạo sinh có thể tạo ra nội dung đáp ứng tất cả những điều kiện sau:

  • phức tạp
  • nhất quán
  • gốc

Ví dụ: một mô hình AI tạo sinh có thể tạo ra những bài tiểu luận hoặc hình ảnh phức tạp.

Một số công nghệ trước đây, trong đó có LSTMRNN, cũng có thể tạo ra nội dung nguyên gốc và nhất quán. Một số chuyên gia coi những công nghệ trước đây là AI tạo sinh, trong khi một số khác cảm thấy rằng AI tạo sinh thực sự cần đầu ra phức tạp hơn so với những công nghệ trước đó có thể tạo ra.

Trái ngược với công nghệ công nghệ học máy dự đoán.

I

học theo ngữ cảnh

#language
#generativeAI (AI tạo sinh)

Từ đồng nghĩa với lời nhắc chụp nhanh.

điều chỉnh hướng dẫn

#generativeAI (AI tạo sinh)

Một hình thức điều chỉnh chi tiết giúp cải thiện khả năng tuân theo hướng dẫn của mô hình AI tạo sinh. Việc điều chỉnh hướng dẫn bao gồm việc huấn luyện một mô hình trên một loạt lệnh nhắc hướng dẫn, thường bao gồm nhiều tác vụ. Sau đó, mô hình được điều chỉnh hướng dẫn thu được sẽ có xu hướng tạo ra các phản hồi hữu ích cho lời nhắc thực hiện thao tác 0 trong nhiều tác vụ.

So sánh và đối chiếu với:

O

nhắc một lần

#language
#generativeAI (AI tạo sinh)

Lời nhắc có chứa một ví dụ minh hoạ cách mô hình ngôn ngữ lớn sẽ phản hồi. Ví dụ: lời nhắc sau đây có chứa ví dụ minh hoạ một mô hình ngôn ngữ lớn về cách trả lời một truy vấn.

Các phần của một lời nhắc Ghi chú
Đơn vị tiền tệ chính thức của quốc gia được chỉ định là gì? Câu hỏi mà bạn muốn LLM trả lời.
Pháp: EUR Một ví dụ.
Ấn Độ: Truy vấn thực tế.

So sánh và đối chiếu lời nhắc một lần với các thuật ngữ sau:

Điểm

điều chỉnh tiết kiệm thông số

#language
#generativeAI (AI tạo sinh)

Một tập hợp các kỹ thuật để tinh chỉnh một mô hình ngôn ngữ đã luyện sẵn (PLM) hiệu quả hơn so với việc điều chỉnh toàn bộ. Các tính năng điều chỉnh có hiệu quả về tham số thường tinh chỉnh ít tham số hơn nhiều so với quá trình tinh chỉnh toàn bộ, nhưng thường tạo ra một mô hình ngôn ngữ lớn hoạt động hiệu quả (hoặc gần như tốt) dưới dạng một mô hình ngôn ngữ lớn được xây dựng từ quá trình tinh chỉnh toàn diện.

So sánh và đối chiếu tinh chỉnh tiết kiệm thông số bằng:

Tính năng điều chỉnh tiết kiệm thông số còn được gọi là điều chỉnh tiết kiệm thông số.

PLM (Nhà quản lý đối tác chiến lược)

#language
#generativeAI (AI tạo sinh)

Từ viết tắt của mô hình ngôn ngữ luyện trước.

mô hình luyện sẵn

#language
#image
#generativeAI (AI tạo sinh)

Các mô hình hoặc thành phần mô hình (chẳng hạn như vectơ nhúng) đã được huấn luyện. Đôi khi, bạn sẽ cung cấp các vectơ nhúng đã được huấn luyện trước vào mạng nơron. Những lúc khác, mô hình của bạn sẽ tự huấn luyện các vectơ nhúng thay vì dựa vào các vectơ nhúng đã được huấn luyện trước.

Thuật ngữ mô hình ngôn ngữ luyện trước dùng để chỉ một mô hình ngôn ngữ lớn đã trải qua quá trình đào tạo trước.

huấn luyện trước

#language
#image
#generativeAI (AI tạo sinh)

Huấn luyện ban đầu của một mô hình trên một tập dữ liệu lớn. Một số mô hình đã huấn luyện trước là những mô hình khổng lồ và thường phải được tinh chỉnh thông qua việc huấn luyện bổ sung. Ví dụ: các chuyên gia học máy có thể huấn luyện trước một mô hình ngôn ngữ lớn trên một tập dữ liệu văn bản khổng lồ, chẳng hạn như mọi trang tiếng Anh trên Wikipedia. Sau khi qua quá trình huấn luyện trước, mô hình kết quả có thể được tinh chỉnh thêm thông qua bất kỳ kỹ thuật nào sau đây:

lời nhắc

#language
#generativeAI (AI tạo sinh)

Mọi văn bản được nhập làm dữ liệu đầu vào cho một mô hình ngôn ngữ lớn để điều chỉnh hoạt động của mô hình đó theo một cách nhất định. Lời nhắc có thể ngắn như một cụm từ hoặc dài tuỳ ý (ví dụ: toàn bộ văn bản của một cuốn tiểu thuyết). Lời nhắc thuộc nhiều danh mục, bao gồm cả những lời nhắc hiển thị trong bảng sau:

Danh mục lời nhắc Ví dụ: Ghi chú
Question Một chú chim bồ câu bay nhanh đến mức nào?
Hướng dẫn Viết một bài thơ hài hước về vấn đề kiếm lời nhờ chênh lệch giá. Lời nhắc yêu cầu mô hình ngôn ngữ lớn làm điều gì đó.
Ví dụ: Dịch mã Markdown sang HTML. Ví dụ:
Markdown: * mục danh sách
HTML: <ul> <li>mục danh sách</li> </ul>
Câu đầu tiên trong lời nhắc mẫu này là một hướng dẫn. Phần còn lại của lời nhắc là ví dụ.
Vai trò Giải thích lý do tại sao phương pháp giảm độ dốc theo chiều dốc (gradient) được dùng trong quá trình đào tạo chương trình máy học để lên tiến sĩ vật lý. Phần đầu tiên của câu là một hướng dẫn; cụm từ "đối với một Tiến sĩ vật lý" là phần vai trò.
Dữ liệu đầu vào một phần để mô hình hoàn tất Thủ tướng Vương quốc Anh sống tại Lời nhắc nhập một phần có thể kết thúc đột ngột (như trong ví dụ này) hoặc kết thúc bằng dấu gạch dưới.

Mô hình AI tạo sinh có thể phản hồi lời nhắc bằng văn bản, mã, hình ảnh, nội dung nhúng, video... gần như bằng bất cứ thứ gì.

học tập dựa trên câu lệnh

#language
#generativeAI (AI tạo sinh)

Khả năng của một số mô hình cho phép chúng điều chỉnh hành vi để phản hồi phương thức nhập văn bản tuỳ ý (lời nhắc). Trong một mô hình học tập thông thường dựa trên câu lệnh, một mô hình ngôn ngữ lớn sẽ phản hồi câu lệnh bằng cách tạo văn bản. Ví dụ: giả sử người dùng nhập lời nhắc sau:

Tóm tắt Định luật chuyển động thứ ba của Newton.

Một mô hình có khả năng học dựa trên câu lệnh sẽ không được huấn luyện chuyên biệt để trả lời lời nhắc trước đó. Thay vào đó, mô hình này "nắm rõ" rất nhiều thông tin về vật lý, nhiều thông tin về các quy tắc ngôn ngữ chung và rất nhiều về những yếu tố tạo nên những câu trả lời thường hữu ích. Kiến thức đó đủ để đưa ra câu trả lời (hy vọng) hữu ích. Ý kiến phản hồi bổ sung của người dùng ("Câu trả lời đó quá phức tạp." hoặc "Phản ứng là gì?") cho phép một số hệ thống học tập dựa trên câu lệnh cải thiện dần mức độ hữu ích của câu trả lời.

thiết kế lời nhắc

#language
#generativeAI (AI tạo sinh)

Từ đồng nghĩa với kỹ thuật nhắc nhở.

kỹ thuật nhắc nhở

#language
#generativeAI (AI tạo sinh)

Nghệ thuật tạo lời nhắc gợi ra phản hồi mong muốn từ mô hình ngôn ngữ lớn. Con người thực hiện kỹ thuật lời nhắc. Việc viết những câu lệnh có cấu trúc hợp lý là một phần cần thiết để đảm bảo câu trả lời hữu ích từ một mô hình ngôn ngữ lớn. Kỹ thuật hiện lời nhắc phụ thuộc vào nhiều yếu tố, trong đó có:

Hãy xem phần Giới thiệu về thiết kế lời nhắc để biết thêm thông tin chi tiết về cách viết lời nhắc hữu ích.

Thiết kế lời nhắc là từ đồng nghĩa với kỹ thuật có tính nhắc nhở.

chỉnh lời nhắc

#language
#generativeAI (AI tạo sinh)

Cơ chế điều chỉnh hiệu quả tham số tìm hiểu "tiền tố" mà hệ thống sẽ thêm vào lời nhắc thực tế.

Một biến thể của tính năng điều chỉnh lời nhắc (đôi khi được gọi là điều chỉnh tiền tố) là thêm tiền tố ở mọi lớp. Ngược lại, hầu hết các thao tác điều chỉnh lời nhắc chỉ thêm tiền tố vào lớp đầu vào.

R

Học cách tăng cường kiến thức từ phản hồi của con người (RLHF)

#generativeAI (AI tạo sinh)
#rl

Sử dụng ý kiến phản hồi của nhân viên đánh giá để cải thiện chất lượng câu trả lời của mô hình. Ví dụ: cơ chế RLHF có thể yêu cầu người dùng đánh giá chất lượng phản hồi của mô hình bằng biểu tượng cảm xúc 👍 hoặc 👎. Sau đó, hệ thống có thể điều chỉnh các câu trả lời trong tương lai dựa trên ý kiến phản hồi đó.

nhắc vai trò

#language
#generativeAI (AI tạo sinh)

Một phần không bắt buộc của lời nhắc giúp xác định đối tượng mục tiêu cho phản hồi của mô hình AI tạo sinh. Nếu không có lời nhắc nhập vai, mô hình ngôn ngữ lớn sẽ đưa ra câu trả lời có thể hữu ích hoặc không hữu ích đối với người đặt câu hỏi. Với lời nhắc về vai trò, mô hình ngôn ngữ lớn có thể trả lời theo cách phù hợp và hữu ích hơn cho một đối tượng mục tiêu cụ thể. Ví dụ: phần lời nhắc về vai trò của các lời nhắc sau đây được in đậm:

  • Tóm tắt bài viết này dành cho tiến sĩ kinh tế.
  • Mô tả cách hoạt động của thuỷ triều đối với trẻ 10 tuổi.
  • Giải thích cuộc khủng hoảng tài chính năm 2008. Nói như bạn có thể nói với trẻ nhỏ hoặc một chú chó tha mồi lông vàng.

T

nhiệt độ

#language
#image
#generativeAI (AI tạo sinh)

Siêu tham số kiểm soát mức độ ngẫu nhiên của dữ liệu đầu ra của mô hình. Nhiệt độ cao hơn dẫn đến kết quả ngẫu nhiên nhiều hơn, trong khi nhiệt độ thấp hơn dẫn đến kết quả ngẫu nhiên ít hơn.

Việc chọn nhiệt độ tốt nhất phụ thuộc vào ứng dụng cụ thể và các thuộc tính mong muốn của đầu ra của mô hình. Ví dụ: bạn có thể tăng nhiệt độ khi tạo một ứng dụng tạo đầu ra mẫu quảng cáo. Ngược lại, bạn có thể giảm nhiệt độ khi xây dựng một mô hình phân loại hình ảnh hoặc văn bản để cải thiện độ chính xác và tính nhất quán của mô hình.

Nhiệt độ thường được dùng với softmax.

Z

nhắc lệnh cho phép lập trình tự động

#language
#generativeAI (AI tạo sinh)

Lời nhắc không đưa ra ví dụ về cách bạn muốn mô hình ngôn ngữ lớn phản hồi. Ví dụ:

Các phần của một lời nhắc Ghi chú
Đơn vị tiền tệ chính thức của quốc gia được chỉ định là gì? Câu hỏi mà bạn muốn LLM trả lời.
Ấn Độ: Truy vấn thực tế.

Mô hình ngôn ngữ lớn có thể phản hồi bằng bất kỳ nội dung nào sau đây:

  • Rupee
  • INR
  • Đồng rupi Ấn Độ
  • Đồng rupee
  • Đồng Rupee của Ấn Độ

Tất cả các câu trả lời đều đúng, mặc dù bạn có thể thích một định dạng cụ thể hơn.

So sánh và đối chiếu lời nhắc cài đặt 0 (zero-shot) với các thuật ngữ sau: