Hành động giao tiếp

Hành động trò chuyện giúp mở rộng chức năng của Trợ lý Google bằng cách cho phép bạn tạo trải nghiệm hoặc cuộc trò chuyện tuỳ chỉnh cho người dùng Trợ lý Google. Trong một cuộc trò chuyện, Hành động trò chuyện sẽ xử lý yêu cầu từ Trợ lý và trả về phản hồi bằng các thành phần âm thanh và hình ảnh. Hành động trò chuyện cũng có thể giao tiếp với các dịch vụ web bên ngoài bằng webhook để bổ sung thêm logic trò chuyện hoặc kinh doanh trước khi trả về câu trả lời.

Trong cuộc trò chuyện qua lại với Trợ lý Google, người dùng đặt câu hỏi và nhận được câu trả lời khi một phiên hội nghị truyền hình đang diễn ra.
Hình 1. Ví dụ về một Hành động trò chuyện

Lý do tạo

Các giao diện máy tính thông thường yêu cầu dữ liệu đầu vào có cấu trúc và có thể dự đoán để hoạt động đúng cách. Điều này khiến việc sử dụng các giao diện này không tự nhiên và đôi khi khó khăn. Nếu người dùng không thể dễ dàng tìm ra thông tin đầu vào có cấu trúc này, thì họ sẽ rất khó khăn trong việc tìm ra việc cần làm.

Ví dụ: hãy xem xét một yêu cầu đơn giản của người dùng như "Dự báo thời tiết hôm nay như thế nào?" Những người dùng khác cũng có thể hỏi "Thời tiết hiện giờ thế nào?" hoặc "Nhiệt độ ở San Francisco ngày mai thế nào?" Ngay cả với câu hỏi đơn giản này, bạn có thể thấy rằng trải nghiệm trò chuyện cũng khó thực hiện được, vì việc diễn giải và xử lý ngôn ngữ tự nhiên đòi hỏi một trình phân tích cú pháp ngôn ngữ rất mạnh mẽ có khả năng hiểu sắc thái của ngôn ngữ. Mã của bạn sẽ phải xử lý tất cả các loại yêu cầu này (và có thể còn nhiều loại yêu cầu khác) để thực hiện cùng một logic: tìm kiếm một số thông tin dự báo cho một thời gian và vị trí. Vì lý do này, giao diện máy tính truyền thống yêu cầu các yêu cầu đầu vào chuẩn, phổ biến để gây ảnh hưởng xấu đến trải nghiệm người dùng, vì giao diện đầu vào có cấu trúc cao sẽ dễ xử lý hơn.

Tuy nhiên, khi bạn tạo Hành động trò chuyện, Trợ lý sẽ xử lý việc hiểu ngôn ngữ tự nhiên (NLU) cho bạn để bạn có thể dễ dàng xây dựng giao diện trò chuyện mở. Các công cụ giao diện này giúp bạn hiểu được sự tàn phá và đa dạng của ngôn ngữ của con người và chuyển chúng sang ý nghĩa chuẩn và có cấu trúc mà các ứng dụng và dịch vụ của bạn có thể hiểu được. Hãy cùng xem cách một Hành động có thể xử lý các ví dụ trước đó về các yêu cầu dự báo thời tiết.

Hình 1. So khớp ý định NLU

Để tra cứu thông tin dự báo thời tiết, có thể bạn sẽ cần một vài thông tin, chẳng hạn như thời gian người dùng muốn có thông tin dự báo đó và vị trí của họ. Tuy nhiên, như chúng tôi đã đề cập trước đó, mỗi người dùng có thể yêu cầu thông tin dự đoán theo cách khác nhau. Trợ lý có thể hiểu những khác biệt này và chuyển chúng sang ý định chuẩn của người dùng để nhận thông tin dự đoán. Sau đó, trình phân tích cú pháp yêu cầu của người dùng về dữ liệu thích hợp mà bạn cần để thực hiện yêu cầu đó. Trong trường hợp này, đó là thời gian và vị trí mong muốn của người dùng cho thông tin dự báo thời tiết. Cuối cùng, bạn có thể sử dụng dữ liệu này để tra cứu thông tin thời tiết bằng một API REST công khai và trả về thông tin thời tiết cho người dùng dưới dạng lời nhắc.

Thời điểm tạo

Hành động trò chuyện hoạt động hiệu quả nhất trong các trường hợp sử dụng đơn giản giúp người dùng hoàn thành công việc nhanh chóng cũng như cho các trường hợp sử dụng sống động có tính năng chuyển tiếp bằng giọng nói. Hành động trò chuyện hiệu quả thường thuộc các loại sau:

  • Những thông tin mà mọi người có thể dễ dàng trả lời. Các hành động có thể thực hiện bằng cách nhập thông tin quen thuộc như thời gian hoặc ngày tháng, chẳng hạn như đặt chuyến bay.
  • Thao tác nhanh chóng mà hữu ích. Những tính năng này thường mang lại cho người dùng lợi ích ngay lập tức mà rất ít thời gian sử dụng, chẳng hạn như tìm hiểu thời điểm đội thể thao yêu thích của họ sẽ thi đấu tiếp theo.
  • Hành động vốn phù hợp hơn với giọng nói. Đây thường là những việc mà bạn muốn làm mà không cần dùng tay, chẳng hạn như nhận huấn luyện trong khi yoga hoặc tập thể dục nhẹ hay một trò chơi được thiết kế cho tương tác ưu tiên bằng giọng nói.

Cách xây dựng

Actions on Google cho phép bạn tạo Hành động trò chuyện bằng SDK Hành động, Trình tạo hành động hoặc cả hai có thể thay thế cho nhau. Tính năng này cho phép bạn chọn quy trình phát triển phù hợp nhất với nhu cầu của mình, đồng thời giúp bạn linh hoạt chuyển đổi qua lại khi cần.

SDK Hành động cung cấp một giản đồ dựa trên tệp được chuẩn hoá để xây dựng Hành động, thư viện để tương tác với Trợ lý, cũng như một CLI để triển khai và quản lý dự án Hành động của bạn. Trình tạo hành động được xây dựng dựa trên công nghệ tương tự như SDK Hành động và cho phép bạn tạo bằng một IDE mạnh mẽ và dễ sử dụng.

Hãy xem bài viết Tổng quan về bản dựng để biết thêm thông tin.

Các bước tiếp theo

Hãy xem các tài nguyên sau đây để bắt đầu xây dựng ngay bây giờ:

  • Hướng dẫn bắt đầu nhanh – Xem giới thiệu nhanh về cách thiết lập môi trường và bắt đầu phát triển bằng SDK Hành động và Trình tạo.
  • Lớp học lập trình – Các lớp học lập trình cung cấp hướng dẫn từng bước chi tiết và chuyên sâu về cách xây dựng Actions cho Trợ lý Google.
  • Mẫu – Tải tất cả các mẫu của chúng tôi trên GitHub để bắt đầu thử nghiệm ngay bây giờ.