Hành động trò chuyện (Luồng hội thoại)

Hành động trò chuyện mở rộng chức năng của Trợ lý Google bằng cách cho phép nhà phát triển tạo trải nghiệm hoặc cuộc trò chuyện tuỳ chỉnh cho người dùng trên Trợ lý. Trong một cuộc trò chuyện, Hành động trò chuyện của bạn sẽ xử lý các yêu cầu từ Trợ lý và trả về phản hồi bằng các thành phần âm thanh và hình ảnh. Hành động trò chuyện cũng có thể kết nối với các dịch vụ bên ngoài để bổ sung thêm logic trò chuyện hoặc kinh doanh trước khi trả về câu trả lời.

Ví dụ: người dùng có thể gọi Hành động trò chuyện để nhận phản hồi từ dịch vụ thực hiện đơn hàng bên ngoài khi muốn tra cứu thông tin, nhận nội dung đề xuất dành riêng cho bạn hoặc thực hiện giao dịch liên quan đến việc thanh toán bằng hình thức kỹ thuật số.

Trong cuộc trò chuyện qua lại với Trợ lý Google, người dùng đặt câu hỏi và nhận câu trả lời khi một phiên hội nghị truyền hình đang diễn ra.
Hình 1. Ví dụ về một Hành động trò chuyện

Trường hợp sử dụng

Tính năng Hành động trò chuyện hoạt động hiệu quả nhất trong các trường hợp sử dụng đơn giản mà giúp bổ sung cho một trải nghiệm khác. Hành động trò chuyện hiệu quả thường thuộc các loại sau:

  • Những thông tin mà mọi người có thể dễ dàng trả lời. Những hành động có thể thực hiện được bằng những dữ liệu nhập quen thuộc như thời gian hoặc ngày tháng, chẳng hạn như đặt vé máy bay.
  • Hành động nhanh chóng nhưng hấp dẫn và hữu ích. Những tính năng này thường mang lại cho người dùng lợi ích ngay lập tức mà chỉ mất rất ít thời gian, chẳng hạn như biết được thời điểm đội thể thao họ yêu thích sẽ thi đấu tiếp theo.
  • Hành động vốn phù hợp hơn với giọng nói. Đây thường là những việc bạn muốn làm mà không cần dùng tay, chẳng hạn như nhận huấn luyện trong khi yoga hoặc tập thể dục nhẹ.

Cách hoạt động của tính năng Hành động trò chuyện

Khác với các ứng dụng truyền thống dành cho máy tính và thiết bị di động (sử dụng mô hình tập trung vào máy tính), người dùng tương tác với Actions cho Trợ lý thông qua cuộc trò chuyện qua lại giống như âm thanh tự nhiên. Hành động trò chuyện bắt đầu khi được người dùng gọi và tiếp tục cho đến khi người dùng chọn thoát (sử dụng cụm từ được xác định trước) hoặc Hành động trò chuyện biểu thị kết thúc cuộc trò chuyện.

Trong một cuộc trò chuyện, dữ liệu đầu vào của người dùng sẽ được Trợ lý chuyển đổi từ lời nói sang văn bản và được tạo thành các yêu cầu JSON để xử lý ngôn ngữ tự nhiên. Những yêu cầu này sẽ được gửi đến phương thức thực hiện cuộc trò chuyện.

Phương thức thực hiện cuộc trò chuyện của bạn sẽ phân tích cú pháp truy vấn của người dùng thành dữ liệu có cấu trúc, xử lý dữ liệu đó và trả về phản hồi JSON webhook cho Trợ lý. Sau đó, Trợ lý sẽ xử lý và hiển thị phản hồi của bạn cho người dùng.

Phương thức thực hiện cuộc trò chuyện có thể được biểu thị bằng dữ liệu đầu vào của yêu cầu JSON và dữ liệu đầu ra phản hồi webhook JSON.
Hình 2. Phương thức thực hiện cuộc trò chuyện là một hệ thống đầu ra JSON dưới dạng JSON

Việc xây dựng dịch vụ xử lý ngôn ngữ tự nhiên của riêng bạn có thể là một thách thức. Vì vậy, chúng tôi cung cấp Dialogflow như một cách để xử lý dịch vụ này cho bạn. Đối với các nhà phát triển không thể sử dụng Dialogflow, chúng tôi cũng cung cấp Actions SDK làm tuỳ chọn dự phòng với một đường dẫn phát triển riêng biệt nhưng có liên quan.

Sau khi bạn thiết lập một nhân viên hỗ trợ trong Dialogflow, phương thức thực hiện cuộc trò chuyện của bạn sẽ được tăng cường bằng các tính năng của Dialogflow, bao gồm cả khả năng sử dụng phương thức thực hiện bằng Dialogflow. Phương pháp này cho phép bạn tách riêng phương thức thực hiện cuộc trò chuyện khỏi các dịch vụ khác mà bạn có thể cần cung cấp cho người dùng kết quả mong muốn.

Actions on Google phân tích cú pháp lời nói của người dùng và gửi yêu cầu đến
            Dialogflow. Dialogflow khớp ý định và trích xuất các tham số để
            gửi đến phương thức thực hiện Dialogflow tương ứng. Sau đó, phương thức thực hiện sẽ gửi phản hồi trở lại Actions on Google. Thao tác này sẽ hiển thị phản hồi đó trên một nền tảng Trợ lý.
Hình 3. Thực hiện cuộc trò chuyện khi sử dụng Dialogflow

Xây dựng hành động trò chuyện

Hầu hết việc tạo Hành động trò chuyện là thiết kế cuộc trò chuyện và xây dựng phương thức thực hiện cuộc trò chuyện. Hãy coi cuộc trò chuyện là giao diện người dùng của Hành động trò chuyện. Bạn cần suy nghĩ về cách người dùng gọi dự án Hành động, những điều hợp lệ họ có thể nói trong một cuộc trò chuyện và cách dự án Hành động phản hồi các dự án đó.

Trong dự án Actions, bạn cung cấp siêu dữ liệu để phát hành dự án và chỉ định một phương thức thực hiện cuộc trò chuyện. Các nhà phát triển sử dụng Dialogflow liên kết nhân viên hỗ trợ Dialogflow của họ với dự án, sau đó tạo phương thức thực hiện thông qua Dialogflow. Đối với các nhà phát triển sử dụng SDK Hành động, việc xây dựng phương thức thực hiện cuộc trò chuyện bao gồm việc lập trình và triển khai ở định dạng webhook của cuộc trò chuyện.

Khi thiết kế cuộc trò chuyện, bạn nên sử dụng các quy trình và nguyên tắc thiết kế của chúng tôi. Giao diện trò chuyện vẫn là một công nghệ tương đối mới và việc tìm hiểu về các phương pháp hay nhất có thể giúp bạn tiết kiệm thời gian trong tương lai.

Thực hiện đơn hàng bằng Dialogflow

Khi tích hợp với nhân viên hỗ trợ Dialogflow, nhân viên hỗ trợ này sẽ xử lý NLU cho các truy vấn của người dùng trong Hành động trò chuyện của bạn. Nhân viên hỗ trợ dự án Dialogflow của bạn sẽ thực hiện những việc sau cho bạn trong bước này:

  1. Phân tích cú pháp từng yêu cầu đến từ Trợ lý dựa trên các cụm từ huấn luyện mà bạn cung cấp và ngữ cảnh trò chuyện.
  2. So khớp từng yêu cầu với một ý định trong Dialogflow (còn gọi là sự kiện).
  3. Trích xuất thông số vào các thực thể Dialogflow.

Sau đó, nhân viên hỗ trợ Dialogflow của bạn có thể gọi phương thức thực hiện của riêng mình (được triển khai dưới dạng webhook) để thực hiện một số logic như gọi API REST hoặc dịch vụ phụ trợ khác tạo ra phản hồi để quay lại Trợ lý. Webhook này còn được gọi là phương thức thực hiện dự án Dialogflow của bạn và sử dụng định dạng webhook củaDialogflow.

Dialogflow chấp nhận lời nói của người dùng để so khớp ý định, cung cấp
            các tham số được trích xuất cho phương thức thực hiện Dialogflow. Phương thức thực hiện sẽ trả về một phản hồi cho người dùng.
Hình 4. Một nhân viên hỗ trợ dự án Dialogflow phân tích cú pháp truy vấn của người dùng thành dữ liệu có cấu trúc để thực hiện dự án Dialogflow

Khi sử dụng Dialogflow, bạn chủ yếu cần tạo phương thức thực hiện cuộc trò chuyện bằng cách phát triển webhook thực hiện cuộc trò chuyện bằng Dialogflow. Trong tài liệu về Actions on Google, bạn sẽ thấy các tài nguyên giúp bạn thiết kế, xây dựng và kiểm thử webhook của phương thức thực hiệnDialogflow. Đáng chú ý nhất là các tài nguyên đó bao gồm thư viện ứng dụng Node.jsthư viện ứng dụng Java.

Khi tạo bằng Dialogflow, bạn sẽ sử dụng Bảng điều khiển Dialogflow để tạo ý định, thực thể và cụm từ đào tạo trongDialogflow.

Để biết thêm thông tin chung về Dialogflow, bạn có thể đọc về tích hợp Actions on Google trong tài liệu về Dialogflow.

Phương thức thực hiện bằng cách sử dụng SDK Hành động

Việc xây dựng phương thức thực hiện cuộc trò chuyện bằng SDK Hành động chủ yếu bao gồm việc tạo và triển khai Gói Hành động. Gói hành động được tạo ở định dạng ActionPackage và sử dụng định dạng webhook cuộc trò chuyện. Gói Hành động chứa tất cả Hành động cho một dự án Actions cụ thể.

Trợ lý cung cấp truy vấn của người dùng để thực hiện cuộc trò chuyện bằng cách sử dụng ý định Actions on Google. Đối với mỗi ý định, webhook thực hiện của bạn phải phân tích cú pháp ý định, xử lý ý định và trả về phản hồi JSON cho Trợ lý cho người dùng.

Phản hồi

Khi tạo một Hành động cho Trợ lý, bạn sẽ thiết kế cuộc trò chuyện cho nhiều nền tảng, chẳng hạn như cuộc trò chuyện tập trung vào giọng nói cho loa kích hoạt bằng giọng nói hoặc cuộc trò chuyện bằng hình ảnh trên nền tảng mà Trợ lý hỗ trợ. Phương pháp này cho phép người dùng hoàn tất công việc nhanh chóng thông qua khả năng thoại hoặc hình ảnh.

Khi tạo phương thức thực hiện, bạn có thể chọn trong số nhiều loại phản hồi hấp dẫn để Trợ lý hiển thị với người dùng. Các kiểu kết hợp này đa dạng từ bong bóng trò chuyện chứa văn bản đơn giản đến phản hồi nội dung đa phương tiện, băng chuyền và thậm chí là HTML sử dụng Canvas tương tác.

Các bước tiếp theo

Tham gia lớp học lập trình Tạo hành động cho Trợ lý Google (Cấp 1) để được hướng dẫn chi tiết từng bước về cách bắt đầu tạo Hành động trò chuyện đầu tiên.

Sau đó, bạn có thể tiếp tục làm theo hướng dẫn của chúng tôi để tạo phương thức thực hiện cuộc trò chuyện của riêng bạn bằng Dialogflow hoặc bằng SDK Hành động. Bạn cũng có thể khám phá các tài nguyên bổ sung sau đây để xây dựng tính năng Hành động trò chuyện: