Tìm hiểu về cuộc trò chuyện

Bạn mới sử dụng thiết kế cuộc trò chuyện? Dưới đây là một số nguyên tắc và khái niệm cấp cao để bạn bắt đầu trước khi viết hộp thoại mẫu đầu tiên.
Xem video này để tìm hiểu khóa học về cách viết hộp thoại thoải mái, dễ dàng và tập trung vào người dùng bằng cách áp dụng Nguyên tắc cộng tác.

Theo Nguyên tắc cộng tác, hoạt động giao tiếp hiệu quả dựa trên giả định rằng sự hợp tác chưa hiệu quả giữa những người tham gia trò chuyện.

Nguyên tắc hợp tác có thể được hiểu theo bốn quy tắc, được gọi là Grice's Maxims.

Chúng tôi hợp tác theo bản năng... Maxim (hoặc quy tắc)
...sự thật những gì chúng tôi nói Chất lượng tối đa
...số lượng thông tin mà chúng tôi cung cấp Giới hạn tối đa
...mức độ liên quan của những gì chúng tôi đóng góp Mức độ liên quan tối đa
...cách chúng tôi cố gắng giao tiếp rõ ràng, không mơ hồ hay mơ hồ Maxim of Manner
Nghiên cứu đã chỉ ra rằng mọi người phản hồi với công nghệ giống như đối với con người khác. Điều này có nghĩa là người dùng dựa vào mô hình trò chuyện giữa người với người hiện có của họ và tuân theo Nguyên tắc cộng tác ngay cả khi tương tác với cá tính trong giao diện mà người dùng có thể trò chuyện và họ cũng mong đợi cá tính của bạn cũng tuân theo.
Vì người dùng mang tính hợp tác, họ thường cung cấp nhiều thông tin hơn so với yêu cầu thực sự của họ.

Nên.

Người dùng này không chỉ trả lời câu hỏi về loại giày, họ còn chỉ định kích thước, để nhanh chóng tìm được những gì họ muốn. Chúng tôi mong muốn hành vi này của người dùng lặp lại và họ biết họ sẽ hỏi những câu hỏi nào khác.

Không nên.

Ở đây, cá tính đó chỉ mong chờ câu trả lời cho câu hỏi về loại giày. Người dùng hợp tác sẽ rất thất vọng khi phải lặp lại kích thước giày lần nữa.

Cá tính của bạn không phải lúc nào cũng có thể xử lý được các phản ứng phối hợp. Trong những trường hợp này, hãy dựa vào khả năng xử lý lỗi nhẹ và dễ tương tác để đưa hộp thoại trở lại đúng hướng mà không gây chú ý đến lỗi.

Nên.

Nếu cá tính của bạn đang mong đợi một câu trả lời bằng số, thì những câu trả lời mang tính hợp tác/thông tin như vậy sẽ không được hiểu. Vì vậy, hãy xử lý lỗi Không khớp này bằng cách lặp lại nhanh.

Không nên.

Tránh lặp lại câu trả lời dài khi có thể. Trong trường hợp này, thời gian nhắc lại ngắn hơn cũng sẽ phục vụ cùng mục đích mà không làm cho người dùng phải chờ lâu.

Giống như người dùng, cá tính của bạn cũng phải mang tính hợp tác và cung cấp nhiều thông tin, cung cấp đủ thông tin cần thiết để thúc đẩy cuộc trò chuyện.

Nên.

Cá tính này luôn nỗ lực tìm các phương án thay thế phù hợp hơn, thỏa mãn ý định của người dùng – một cử chỉ phối hợp để đưa cuộc trò chuyện về phía trước.

Không nên.

Cá tính này không cố gắng thỏa mãn ý định của người dùng và sau khi trình bày một số tin xấu, chỉ cần kết thúc tương tác.

Trong cuộc trò chuyện, nói quá nhiều cũng không hợp tác như nói quá ít. Tạo điều kiện dễ hiểu bằng cách giữ các lượt chuyển đổi ngắn gọn và có liên quan một cách tối ưu từ quan điểm của người dùng.

Nên.

Thiết kế này được tối ưu hóa về mức độ liên quan. Cá tính không bao gồm các chi tiết không liên quan đến quyết định hiện tại.

Không nên.

Từ quan điểm của người dùng, hầu hết thông tin này không có liên quan và lặp lại. Tất cả chi tiết này đặt ra gánh nặng lên bộ nhớ ngắn hạn của người dùng khi họ kiên nhẫn chờ đến lượt.

Nên.

Thiết kế này được tối ưu hóa về mức độ liên quan. Chỉ rất ít người dùng không nói mã vùng được yêu cầu rõ ràng.

Không nên.

Thiết kế này buộc mọi người dùng phải nghe hướng dẫn về cách nói số điện thoại sao cho dễ dàng nhất cho cá tính, chứ không phải cho người dùng. Phương pháp này cũng giả định không chính xác rằng người dùng sẽ không thể làm như vậy nếu không được hướng dẫn, dẫn đến cảm giác như một lời nhắc lỗi.

Biết được điều ai đó nói không giống như biết họ có ý gì. Mọi người thường đề xuất mọi thứ thay vì nói rõ chúng. Khả năng "nghe giữa các tuyến" của chúng tôi được gọi là "hầm khẩu đàm".

Ngụ ý và ngụ ý. Theo ngụ ý trong cuộc trò chuyện, "Đêm qua tôi đã gặp John tại một nhà hàng với một người phụ nữ" cho thấy John đã ở cùng một người phụ nữ khác với vợ mình, bởi vì nếu người phụ nữ đó là vợ của người đó, người nói sẽ nói như vậy. Tuy nhiên, nếu suy luận ra thì người phụ nữ đó có thể là vợ của John, vì tất cả các bà vợ đều là phụ nữ.

Nên.

Hãy nhớ thêm xử lý cho các cụm từ như "Đó là tất cả," "Tất cả," "Cảm ơn," hoặc "Tôi đã xong", với ý nghĩa ngụ ý thường là "Tôi đã có được mọi thứ cần thiết từ cuộc trò chuyện này và tôi đã nói xong. Tạm biệt".

Không nên.

Ở đây, "Đó là tất cả" không được thêm vào ngữ pháp, vì vậy gây ra lỗi Không khớp.

Mọi người đương nhiên tránh sự mơ hồ và ngôn từ tục tĩu trong cuộc trò chuyện. Sử dụng các từ và cụm từ quen thuộc giúp giảm nhận thức. Nói đến lựa chọn từ ngữ, nếu bạn không nói điều đó, thì cá tính của bạn cũng vậy.

Khi bạn không thể quyết định giữa một vài cụm từ tương tự, hãy sử dụng Google Xu hướng để tìm hiểu cụm từ nào mọi người tìm kiếm nhiều nhất và Trình xem Ngram của Google Sách để tìm hiểu xem cụm từ nào được xuất bản nhiều nhất.

Nên.

Người dùng có thể mắc lỗi đánh máy hoặc tự sửa nhanh khi nói. Vì vậy, cá tính này giải thích vấn đề bằng tiếng Anh đơn giản và hỏi lại.

Không nên.

"Không hợp lệ" có tính chất kỹ thuật quá mức và không giúp người dùng quay trở lại đúng hướng.

Nên.

Giữ xác nhận đơn giản. Bạn cũng có thể chọn "Xong!".

Không nên.

"Giao dịch", "được yêu cầu" và "hoàn tất" mang tính hình thức, không mang tính trò chuyện. Ngoài ra, thông báo này không liên quan: Không có giá trị nào khi nhắc người dùng rằng họ vừa yêu cầu giao dịch.

Nên.

Xác nhận rằng yêu cầu của người dùng đã được hiểu và trỏ đến kết quả.

Không nên.

"Sự kiện phù hợp" là một biểu hiện kỹ thuật. "Điểm phù hợp" là mối tương quan giữa những gì người dùng đã nói với các buổi hòa nhạc. Hằng ngày, người dùng không biết đến, chưa nói đến thách thức của việc so khớp truy vấn với kết quả. Ngoài ra, "sự kiện phù hợp" là không rõ ràng—điều này cũng có nghĩa là các sự kiện phù hợp với nhau, như "tất phù hợp".


Ngữ cảnh

Những tiến bộ trong công nghệ tự động nhận dạng giọng nói (ASR) giúp chúng tôi hầu như luôn biết chính xác nội dung người dùng nói. Tuy nhiên, việc xác định ý nghĩa của người dùng vẫn là một thách thức.

Thông thường, bạn sẽ khó hiểu được sự trùng lặp mà chỉ hiểu được trong ngữ cảnh cụ thể.

Cá tính của bạn cần theo dõi ngữ cảnh để hiểu cách đọc của người dùng.

Nếu bạn đang sử dụng Dialogflow, hãy truy cập vào đây để đọc thêm về thêm ngữ cảnh.

Nên.

Kiến thức về ngã rẽ trước đó cần phải biết rằng "anh" đề cập đến NotARealDJ. Và kiến thức về vị trí địa lý của người dùng là cần thiết để biết rằng "thành phố" đề cập đến "San Francisco."

Không nên.

Ở đây, hệ thống sẽ không hiểu câu hỏi của người dùng và xảy ra lỗi Không khớp.

Cá tính của bạn cần theo dõi ngữ cảnh để hiểu mục đích tiếp theo.

Trừ khi người dùng thay đổi chủ đề, chúng tôi có thể coi như chuỗi trò chuyện vẫn tiếp tục. Do đó, có khả năng vấn đề không rõ ràng trong cách phát âm hiện tại có thể được giải quyết bằng cách tham chiếu đến các cách phát âm trước.

Nếu bạn đang sử dụng Dialogflow, hãy đọc phần về ý định tiếp theo để biết chi tiết.

Nên.

Sử dụng mục đích tiếp theo, cá tính này có thể hiểu rằng "Còn nửa tá thì sao?" là câu trả lời tiếp theo cho câu nói trước của người dùng, và hiểu đó là "Một bó hoa gồm 6 bông có giá bao nhiêu".

Không nên.

Nếu Hành động của bạn không giải thích được cách phát âm trong ngữ cảnh trò chuyện lớn hơn, Hành động sẽ hiểu sai truy vấn của người dùng hoặc kết thúc lỗi.

Đối với tương tác đa phương thức, mọi thứ trên màn hình là một phần của ngữ cảnh của cuộc trò chuyện. Nếu người dùng có thể nhìn thấy nó, họ sẽ cho rằng họ có thể tham khảo nó.

Nên.

Dự đoán tham chiếu đến vị trí của một mục trên màn hình, ví dụ: "địa chỉ đầu tiên" hoặc hình thức, chẳng hạn như "cái màu đỏ".

Không nên.

Vấn đề xảy ra khi nhân vật của bạn có vẻ như không nhận biết được nội dung nào đang hiển thị trên màn hình.


Biến thể

Sự đa dạng là gia vị của cuộc sống. Người dùng chú ý nhiều hơn khi có thêm. Sự đa dạng cũng có thể giữ cho tương tác không gây đơn điệu hoặc rô bốt.

Vì vậy, hãy ngẫu nhiên. Đối với bất kỳ lời nhắc nhất định nào, thường có một vài phương án thay thế phù hợp sẽ hoạt động. Tập trung nỗ lực vào lời nhắc mà người dùng thường xuyên nghe, để các cụm từ này không nhàm chán.

Nếu đang sử dụng Dialogflow, bạn có thể dễ dàng thêm nhiều biến thể phản hồi.

Hãy xem xét tất cả các cách trả lời câu hỏi "lúc này là mấy giờ?"

Nếu Hành động của bạn cho người dùng biết thời gian, bạn sẽ muốn thêm tất cả các biến thể ở trên và phát ngẫu nhiên chúng cho người dùng trong các điều kiện áp dụng.


Quay đầu xe

Bằng cách thay phiên nhau, chúng ta sẽ không làm gián đoạn lẫn nhau và đồng bộ hóa cuộc hội thoại. Câu hỏi xoay quanh vấn đề "người nào có micrô": cầm micrô, cầm micrô và giao micrô cho một người nói khác. Để giải quyết quá trình phức tạp này, chúng tôi dựa vào kho thông tin phong phú về các tín hiệu được nhúng trong cấu trúc câu, ngữ điệu, ánh nhìn và ngôn ngữ cơ thể. Mặc dù Hành động của bạn sẽ bị giới hạn trong việc diễn đạt và phát hiện những dấu hiệu này, bạn vẫn có thể viết lời nhắc theo cách giúp người dùng biết khi nào đến lượt họ.
Cá tính của bạn phải đưa ra tín hiệu rõ ràng khi đến lượt người dùng.

Nên.

Trình bày rõ lời kêu gọi hành động bằng cách đặt câu hỏi.

Không nên.

Khi giới thiệu thiết kế này, nhiều người dùng sẽ không thay phiên nhau sử dụng.

Cá tính của bạn không được độc quyền cuộc trò chuyện hoặc cố gắng trình bày tất cả các phương án/câu hỏi trong một lượt.

Nên.

Nhắc người dùng chỉ bằng một câu hỏi tại một thời điểm.

Không nên.

Đừng tiếp tục nói sau khi đặt câu hỏi. Đừng cho người dùng thấy quá nhiều lựa chọn và câu hỏi.


Tài nguyên khác

  • Tạo cho VUI của bạn một cá tính
  • Đưa cuộc trò chuyện về phía trước
  • Hãy ngắn gọn, phù hợp
  • Khai thác ngữ cảnh
  • Hướng người dùng tập trung thông qua thứ tự từ và trạng thái căng thẳng
  • Không dạy "lệnh" – nói là trực quan
Phương thức Podcast, Tập 8, Margaret Urban, Nhà thiết kế tương tác cấp cao tại Google, về khoa học ngôn ngữ và thiết kế giao diện người dùng giọng nói cho Trợ lý Google

Một số điểm nổi bật:

  • Sự kỳ diệu của ngôn ngữ, 3:13
  • "Tôi say mê ngôn ngữ trong suốt cuộc đời. Tôi nghĩ điều đó thật kỳ diệu. Nó giống như thần giao cách cảm — đơn giản chỉ bằng sự rung động của sóng âm thanh, tôi có thể gợi ý trong đầu bạn."
  • Để máy tính có vẻ như là con người, 2:37
  • "Cách sử dụng ngôn ngữ trong bối cảnh xã hội thực sự đóng vai trò quan trọng trong việc tạo ra thứ gì đó có vẻ tự nhiên. Bởi vì chúng ta muốn máy tính nói chuyện như con người. Chúng ta không muốn bắt mọi người phải nói chuyện như máy tính".
Điều đáng kinh ngạc mà chúng tôi thực hiện trong cuộc trò chuyện của Ed Yong. Đại Tây Dương. Ngày 4 tháng 1 năm 2016
"Khi trò chuyện, chúng tôi thay phiên nhau, trong đó "quyền" để nói qua lại giữa các đối tác. Người ủng hộ trò chuyện này quá quen thuộc và dường như không có gì nổi bật nên chúng tôi hiếm khi nhắc đến điều này. Nhưng hãy xem xét thời gian: Trung bình, mỗi lượt kéo dài khoảng 2 giây và khoảng cách thông thường giữa chúng chỉ là 200 mili giây - chỉ đủ thời gian để nói ra một âm tiết. Con số đó khá phổ biến. Tồn tại ở nhiều nền văn hóa, chỉ có một chút khác biệt. Điều đó thậm chí còn có sẵn trong các cuộc trò chuyện bằng ngôn ngữ ký hiệu."
"Khi một người đặt câu hỏi cho người khác, họ phải mất trung bình 200 mili giây để trả lời. Tốc độ này nhanh đến mức chúng tôi không thể nghe thấy. Thực tế, tốc độ này nhanh hơn bộ não của chúng ta. Não bộ mất khoảng nửa giây để lấy ra các từ để nói điều gì đó, nghĩa là trong khi trò chuyện, một người đang chuẩn bị nói chuyện trước khi người kia hoàn tất. Bằng cách nghe giọng điệu, ngữ pháp và nội dung trong lời nói của người khác, chúng tôi có thể dự đoán khi nào họ sẽ hoàn tất."
Tầm quan trọng của việc tạm dừng trò chuyện của Johnson. Nhà kinh tế học. Ngày 14 tháng 12 năm 2017
"Hóa ra cuộc trò chuyện là một cỗ máy được tinh chỉnh, như Nick Enfield, một nhà ngôn ngữ học tại Đại học Sydney, gợi ý trong phần "Cách chúng ta nói chuyện". Con người chủ yếu tuân theo một quy tắc gọi là "không có khoảng cách, không có sự trùng lặp", phản ứng với điều kiện kết thúc một cuộc trò chuyện bằng cách bắt đầu cuộc trò chuyện của riêng mình trong khoảng 200 mili giây—khoảng thời gian để một vận động viên chạy nước rút phản ứng với khẩu súng xuất phát. Điều này càng đáng chú ý hơn khi mất khoảng 600 mili giây để ai đó có thể hiểu được họ sẽ nói gì bằng cách suy ngẫm về những từ đó và sắp xếp cách diễn đạt chúng".