ดูข้อมูลเกี่ยวกับการสนทนา

หากเพิ่งเคยใช้การออกแบบการสนทนา ต่อไปนี้เป็นหลักการและแนวคิดระดับสูงบางส่วนสําหรับเริ่มต้นใช้งานก่อนที่คุณจะเขียนกล่องโต้ตอบตัวอย่างแรก
ดูวิดีโอนี้เพื่อดูหลักสูตรเร่งรัดเกี่ยวกับวิธีเขียนกล่องโต้ตอบที่สะดวกสบาย ลื่นไหล และคํานึงถึงผู้ใช้ด้วยการใช้หลักการสหกรณ์

ตามหลักการสหกรณ์ การสื่อสารที่มีประสิทธิภาพอาศัยสมมติฐานที่ว่าผู้เข้าร่วมสนทนาสนทนากันไม่หยุดนิ่ง

หลักการของสหกรณ์เข้าใจได้จากกฎ 4 ข้อที่ชื่อว่า Grice's Maxims

เราสามารถทํางานร่วมกันในด้านต่างๆ... สูงสุด (หรือกฎ)
...ความจริงของสิ่งที่เราพูด คุณภาพสูงสุด
...ปริมาณที่เราให้ จํานวนสูงสุดของปริมาณ
...ความเกี่ยวข้องของสิ่งที่เราสนับสนุน ความเกี่ยวข้องสูงสุด
...วิธีที่เราพยายามสื่อสารให้ชัดเจนโดยไม่มีความชัดเจนหรือกํากวม Maxim of Manner
ผลการวิจัยได้แสดงให้เห็นว่าผู้คนตอบรับต่อเทคโนโลยีเหมือนกับที่โต้ตอบกับมนุษย์อีกคนหนึ่ง ซึ่งหมายความว่าผู้ใช้จะยึดตามรูปแบบการสนทนาระหว่างมนุษย์กับมนุษย์ที่มีอยู่ และยังคงปฏิบัติตามหลักสหกรณ์แม้ว่าจะโต้ตอบกับลักษณะตัวตนของอินเทอร์เฟซผู้ใช้ในการสนทนา และยังคาดหวังว่าลักษณะตัวตนจะเป็นไปตามนั้นด้วย
เนื่องจากผู้ใช้สามารถทํางานร่วมกันได้ จึงมักให้ข้อมูลมากกว่าที่ผู้ใช้ต้องการ

ควรทํา

ไม่เพียงแต่ผู้ใช้จะต้องตอบคําถามเกี่ยวกับประเภทรองเท้าเท่านั้น แต่ยังระบุขนาดด้วย เพื่อที่จะค้นหาสิ่งที่ต้องการได้อย่างรวดเร็ว คุณคาดหวังลักษณะแบบนี้จากผู้ใช้ซ้ําๆ ที่รู้ว่ามีอะไรจะถามอะไรอีกบ้าง

สิ่งที่ไม่ควรทํา

ลักษณะตัวตนนี้คาดหวังคําตอบสําหรับคําถามประเภทรองเท้าเท่านั้น ผู้ใช้สหกรณ์จะหงุดหงิดเพราะต้องใส่รองเท้าซ้ําอีก

ลักษณะตัวตนอาจไม่สามารถรับมือกับการทํางานร่วมกัน ในกรณีเหล่านี้ ให้ใช้การจัดการข้อผิดพลาดแบบน้อยและเน้นบทสนทนาเพื่อให้บทสนทนากลับมาเป็นปกติและไม่ดึงดูดความสนใจไปยังข้อผิดพลาดนั้น

ควรทํา

หากลักษณะตัวตนของคุณต้องการคําตอบแบบตัวเลข ระบบจะไม่เข้าใจคําตอบที่อาศัยความร่วมมือ/กับผู้อื่นอย่างสอดคล้องกัน ดังนั้น ให้จัดการกับข้อผิดพลาด "ไม่ตรงกัน" ด้วยการรีบส่งอย่างรวดเร็ว

สิ่งที่ไม่ควรทํา

โปรดหลีกเลี่ยงการตอบโต้ที่ยืดยาวเมื่อเป็นไปได้ ในกรณีนี้ การแสดงข้อความแจ้งที่สั้นลงจะมีจุดประสงค์เดียวกันนี้โดยไม่ทําให้ผู้ใช้ต้องรอนาน

นอกจากนี้ ลักษณะตัวตนของผู้ใช้ควรส่งเสริมความร่วมมือและให้ข้อมูล พร้อมทั้งให้ข้อมูลเท่าที่จําเป็นแก่การสนทนาล่วงหน้า

ควรทํา

ลักษณะตัวตนนี้พยายามค้นหาตัวเลือกการแสดงโฆษณาทางเลือกที่จะตอบสนองความตั้งใจของผู้ใช้ ซึ่งเป็นท่าทางสัมผัสแบบร่วมมือเพื่อก้าวไปข้างหน้า

สิ่งที่ไม่ควรทํา

ลักษณะตัวตนนี้จะไม่พยายามให้ตอบสนองเจตนาของผู้ใช้ และหลังจากนําเสนอข่าวดีบางเหตุการณ์แล้ว การกระทําดังกล่าวก็สิ้นสุดการโต้ตอบไป

ในการสนทนา การบอกว่าไม่ให้ความร่วมมือมากเกินไปก็เหมือนการพูดว่าน้อยเกินไป ช่วยให้เข้าใจได้ง่ายขึ้นโดยการผลัดกันเล่นให้สั้นกระชับและตรงประเด็นจากมุมมองของผู้ใช้

ควรทํา

การออกแบบนี้ได้รับการเพิ่มประสิทธิภาพเพื่อความเกี่ยวข้อง ลักษณะตัวตนไม่มีรายละเอียดที่ไม่เกี่ยวข้องกับการตัดสินใจในปัจจุบัน

สิ่งที่ไม่ควรทํา

จากมุมมองของผู้ใช้ ข้อมูลนี้ส่วนใหญ่ไม่เกี่ยวข้องและซ้ํากัน รายละเอียดทั้งหมดนี้เป็นการเพิ่มภาระให้กับหน่วยความจําระยะสั้นของผู้ใช้ เนื่องจากผู้ใช้กําลังรอที่จะเปิดใช้งานอยู่

ควรทํา

การออกแบบนี้ได้รับการเพิ่มประสิทธิภาพเพื่อความเกี่ยวข้อง เฉพาะผู้ใช้จํานวนน้อยมากที่ไม่ได้พูดรหัสพื้นที่ซึ่งจะถูกถามอย่างชัดเจน

สิ่งที่ไม่ควรทํา

ดีไซน์นี้จะบังคับให้ผู้ใช้ทุกคนฟังคําแนะนําวิธีพูดหมายเลขโทรศัพท์ในรูปแบบที่เข้าใจง่ายที่สุดสําหรับลักษณะตัวตน แต่ไม่คํานึงถึงผู้ใช้ นอกจากนี้ ยังสันนิษฐานว่าผู้ใช้อาจทําอย่างผิดพลาดไม่ได้โดยมิได้ให้คําแนะนํา ทําให้ดูเหมือนว่ามีข้อความแจ้งข้อผิดพลาด

การทราบว่าคนอื่นพูดอะไรไม่เหมือนกับการทราบว่าพวกเขาหมายถึงอะไร ผู้คนมักจะแนะนําสิ่งเหล่านั้นมากกว่าที่จะระบุไว้อย่างชัดเจน ความสามารถในการ "ฟังระหว่างบรรทัด" ของเราเรียกว่า "สิ่งที่เกี่ยวข้องกับการสนทนา"

ความแตกต่างโดยนัยและผลกระทบ โดยนัยของการสนทนาว่า "เมื่อคืนฉันเห็น John ที่ร้านอาหารกับผู้หญิง" บอกเป็นนัยว่า John อยู่กับผู้หญิงนอกเหนือจากภรรยา เพราะถ้าผู้หญิงเป็นภรรยาของเขา ผู้บรรยายก็คงจะพูดแบบนั้น อย่างไรก็ตาม สําหรับนัยยะเชิงตรรกะ ผู้หญิงอาจเป็นภรรยาของ John ก็ได้ เพราะภรรยาทั้งหมดเป็นผู้หญิง

ควรทํา

อย่าลืมเพิ่มการจัดการสําหรับวลี เช่น "เรียบร้อยแล้ว" "ทั้งหมด" หรือ "ขอบคุณ" โดยความหมายโดยนัยมักจะเป็น "ฉันมีทุกอย่างที่ต้องการจากการสนทนานี้ และการพูดคุยเสร็จสิ้นแล้ว สวัสดีครับ"

สิ่งที่ไม่ควรทํา

ในที่นี่ เพียงเท่านี้ก็เรียบร้อยแล้ว ข้อผิดพลาด "ไม่มีรายการที่ตรงกัน"

โดยปกติแล้ว บทสนทนาจะไม่คลุมเครือและคลุมเครือของการแสดงออกในการสนทนา การใช้คําและวลีที่คุ้นเคยจะช่วยลดการรับรู้ ถ้าเป็นการเลือกพูด ก็คงไม่ต้องระบุตัวตนของคุณเอง

เมื่อคุณตัดสินใจด้วยคําที่คล้ายกันไม่ได้เพียงไม่กี่คํา ให้ใช้ Google เทรนด์ เพื่อค้นหาว่าคําใดที่ผู้คนค้นหามากที่สุด และ Google Books Ngram Viewer เพื่อดูว่าข้อความใดมีการใช้กันโดยทั่วไปมากกว่า

ควรทํา

ผู้ใช้อาจพิมพ์ผิดหรือแก้ไขเองอย่างรวดเร็วเมื่อพูด ดังนั้นลักษณะตัวตนจะอธิบายปัญหานี้เป็นภาษาอังกฤษง่ายๆ แล้วถามอีกครั้ง

สิ่งที่ไม่ควรทํา

"ไม่ถูกต้อง" เทคนิคซับซ้อนเกินไป และไม่ช่วยให้ผู้ใช้กลับมาเป็นปกติ

ควรทํา

ทําให้การยืนยันเป็นเรื่องง่าย "เสร็จสิ้น" เป็นตัวเลือกที่ดี

สิ่งที่ไม่ควรทํา

"ธุรกรรม" "ส่งคําขอแล้ว" และ "เสร็จสมบูรณ์" เป็นทางการ ไม่ใช่การสนทนา นอกจากนี้ ข้อความนี้อาจไม่มีความเกี่ยวข้อง: จะไม่มีค่าในการเตือนผู้ใช้ว่าคุณเพิ่งได้ส่งคําขอธุรกรรม

ควรทํา

ยืนยันว่าเข้าใจคําขอของผู้ใช้และชี้ไปที่ผลลัพธ์

สิ่งที่ไม่ควรทํา

"เหตุการณ์ที่ตรงกัน" เป็นนิพจน์ทางเทคนิค การจับคู่ที่ตรงกันจะเทียบกันระหว่างสิ่งที่ผู้ใช้พูดและคอนเสิร์ตที่มี ผู้ใช้ทุกวันไม่ทราบ ไม่รู้ว่าอะไรคือความท้าทายในการถามคําถามกับผลการค้นหา นอกจากนี้ "เหตุการณ์ที่ตรงกัน" ไม่ชัดเจน อาจหมายถึงเหตุการณ์ที่ตรงกัน เช่น "ถุงเท้าที่ตรงกัน"


บริบท

ความก้าวหน้าของการจดจําคําพูดอัตโนมัติ (ASR) ขั้นสูงหมายความว่าเราทราบแทบทุกครั้งเลยว่าผู้ใช้พูดอะไร อย่างไรก็ตาม การพิจารณาว่าผู้ใช้หมายถึงอะไรนั้นยังคงเป็นเรื่องที่ท้าทาย

ไม่เข้าใจคําสอนที่เข้าใจได้ในตัวเอง แต่ไม่เข้าใจบริบท

ลักษณะตัวตนต้องติดตามบริบทเพื่อทําความเข้าใจถ้อยคําของผู้ใช้

หากคุณใช้ Dialogflow อยู่ ให้อ่านข้อมูลเพิ่มเติมเกี่ยวกับการเพิ่มบริบทที่นี่

ควรทํา

คุณจําเป็นต้องทราบข้อมูลของรอบก่อนหน้าเพื่อให้ทราบว่า "เขา" คือ NotARealDJ และจําเป็นต้องทราบสถานที่ตั้งทางภูมิศาสตร์ของผู้ใช้ในกรณีที่ทราบว่า "เมือง" หมายถึง "ซานฟรานซิสโก"

สิ่งที่ไม่ควรทํา

ระบบไม่เข้าใจคําถามของผู้ใช้ และเกิดข้อผิดพลาดในการจับคู่

ลักษณะตัวตนต้องติดตามบริบทเพื่อทําความเข้าใจจุดประสงค์ในการติดตาม

เราอาจสรุปได้ว่าชุดข้อความการสนทนาจะยังดําเนินต่อไป เว้นแต่ผู้ใช้เปลี่ยนเรื่อง ดังนั้น จึงเป็นไปได้ว่าความกํากวมในบทสนทนาปัจจุบันอาจแก้ได้ด้วยการอ้างถึงคําพูดก่อนหน้า

หากคุณใช้ Dialogflow อยู่ ให้อ่านส่วนที่ตั้งใจติดตามผลเพื่อดูรายละเอียด

ควรทํา

เมื่อใช้ความตั้งใจติดตามผล ลักษณะตัวตนจะเข้าใจว่า "แล้วประมาณ 12 โหล" เป็นคําพูดที่ตามมาของผู้ใช้คนก่อนหน้านี้และตีความว่า "ช่อกุหลาบ 6 ดอกมีค่าใช้จ่ายเท่าใด"

สิ่งที่ไม่ควรทํา

หากการดําเนินการของคุณตีความการพูดในบริบทบทสนทนาที่ใหญ่กว่าไม่ได้ ก็จะตีความข้อความค้นหาของผู้ใช้ผิดหรือถูกแก้แบบมีข้อผิดพลาด ในกรณีนี้คือข้อผิดพลาด "ไม่ตรงกัน"

สําหรับการโต้ตอบแบบหลายโมดัล ทุกอย่างบนหน้าจอจะเป็นส่วนหนึ่งของบริบทของการสนทนา หากผู้ใช้มองเห็น ก็จะสันนิษฐานได้ว่าเป็นการอ้างอิง

ควรทํา

คาดการณ์การอ้างอิงถึงตําแหน่งที่จะวางรายการบนหน้าจอ เช่น "ตัวเลือกแรก" หรือลักษณะของโฆษณา เช่น "สีแดง"

สิ่งที่ไม่ควรทํา

การพบปัญหาเมื่อลักษณะตัวตนของคุณไม่รับรู้ถึงสิ่งที่แสดงบนหน้าจอเป็นปัญหา


รูปแบบ

ความหลากหลายคือสีสันของชีวิต ผู้ใช้จะให้ความสนใจมากขึ้นเมื่อมีมากขึ้น ความหลากหลายจะทําให้ผู้ใช้ไม่รู้สึกว่ามีการกระทําที่จําเจหรือเกิดจากหุ่นยนต์แทน

สุ่มได้เลย สําหรับข้อความแจ้งที่ระบุ โดยปกติแล้วจะมีทางเลือกทางการสนทนาที่ใช้ได้ 2-3 ตัวเลือก ให้ความสําคัญในข้อความที่แจ้งให้ผู้ใช้ได้ยินบ่อยๆ เพื่อให้วลีเหล่านี้ไม่เหนื่อยหน่าย

หากใช้ Dialogflow อยู่ คุณจะเพิ่มรูปแบบคําตอบที่หลากหลายได้อย่างง่ายดาย

ลองพิจารณาวิธีต่างๆ ในการตอบคําถามว่า "กี่โมงแล้ว"

ถ้าการดําเนินการของคุณแจ้งให้ผู้ใช้ทราบ คุณต้องเพิ่มรูปแบบข้างต้นทั้งหมด และสุ่มเล่นให้กับผู้ใช้ในเงื่อนไขที่ใช้


การเทค

การสลับกันจะทําให้เราไม่รบกวนกันและกัน และทําให้การสนทนาตรงกัน การจับตาหมายถึงว่าผู้ใดมี "ไมโครโฟน" นั่นคือรับไมค์ ถือไมค์ และส่งต่อให้ผู้พูดคนอื่น ในการจัดการกระบวนการที่ซับซ้อนนี้ เราอาศัยข้อมูลจุดเริ่มโฆษณาที่มีอยู่มากมายซึ่งฝังอยู่ในโครงสร้างประโยค ทํานองเสียง การเพ่งมอง และภาษากาย แม้ว่าการดําเนินการของคุณจะถูกจํากัดในการแสดงและตรวจจับสัญญาณเหล่านี้ แต่คุณยังสามารถเขียนข้อความแจ้งในลักษณะที่จะช่วยให้ผู้ใช้ทราบว่าจะต้องเลี้ยวเมื่อไหร่
ลักษณะตัวตนควรส่งสัญญาณที่ชัดเจนเมื่อถึงคิวของผู้ใช้

ควรทํา

แสดงคํากระตุ้นการตัดสินใจให้ชัดเจนโดยการถามคําถาม

สิ่งที่ไม่ควรทํา

เมื่อใช้การออกแบบนี้ ผู้ใช้มากมายจะไม่หันไปสนใจ

ลักษณะตัวตนไม่ควรเป็นการผูกขาดการสนทนาหรือพยายามนําเสนอตัวเลือก/คําถามทั้งหมดในคราวเดียว

ควรทํา

แจ้งผู้ใช้ด้วยคําถามเดียวในแต่ละครั้ง

สิ่งที่ไม่ควรทํา

ไม่ต้องพูดต่อหลังจากถามคําถาม อย่าแสดงตัวเลือกและคําถามมากเกินไปแก่ผู้ใช้


แหล่งข้อมูลเพิ่มเติม

  • แสดงบุคลิกภาพของ VUI
  • ย้ายการสนทนาไปข้างหน้า
  • เขียนให้กระชับ เกี่ยวข้อง
  • ใช้ประโยชน์จากบริบท
  • มุ่งเน้นความสนใจของผู้ใช้ผ่านลําดับคําและความเครียด
  • ไม่ต้องสอน "การสั่งการ" การพูดเป็นเรื่องง่าย
Method Podcast, ตอนที่ 8, Margaret Urban, Senior Interactive Designer @ Google ศึกษาศาสตร์แห่งคําพูดและการออกแบบอินเทอร์เฟซผู้ใช้ด้วยเสียงสําหรับ Google Assistant

โดยไฮไลต์บางส่วนมีดังนี้

  • เวทมนตร์แห่งภาษา 3:13
  • "ผมหลงใหลภาษานี้มาตลอดชีวิต ฉันว่าเวทมนตร์ค่ะ เหมือนกับกระแสจิต แค่เพียงการสั่นของคลื่นเสียง ก็ทําให้ผมคิดอะไรขึ้นมาได้"
  • การทําให้คอมพิวเตอร์ฟังดูง่ายเหมือนมนุษย์ 2:37
  • "ภาษาที่ใช้ในบริบททางสังคมนั้นสําคัญอย่างยิ่งต่อการสร้างเนื้อหาที่เป็นธรรมชาติ เพราะเราอยากให้คอมพิวเตอร์ พูดคุยเหมือนมนุษย์ เราไม่อยากบังคับให้คนพูดเหมือนคอมพิวเตอร์"
สิ่งที่น่าเหลือเชื่อเราทําระหว่างการสนทนาโดย Ed Yong มหาสมุทรแอตแลนติก 4 มกราคม 2016
"เวลาที่เราพูดกันจะผลัดกันเล่น โดยที่คู่สนทนา "ขวา" จะต้องสลับกันไปมา ผู้พิทักษ์ความอดทนในการสนทนานี้เป็นที่คุ้นเคยและดูเหมือนจะไม่มีใครเทียบได้ เราแทบจะไม่รู้สึกแบบนี้เลย แต่ให้คํานึงถึงจังหวะเวลา: โดยเฉลี่ย แต่ละครั้งจะมีระยะเวลาประมาณ 2 วินาที และช่องว่างทั่วไประหว่างช่วงดังกล่าวอยู่ที่ 200 มิลลิวินาที ทําให้มีเวลาน้อยมากที่จะบอกพยางค์ได้ ตัวเลขนี้ก็มีทั่วโลกนะคะ กลุ่มนี้อยู่ในหลายวัฒนธรรมโดยมีความแตกต่างเพียงเล็กน้อยเท่านั้น นอกจากนี้ยังมีการสนทนาภาษามือด้วย"
"เมื่อมีคนถามคําถามอื่น ใช้เวลาตอบประมาณ 200 มิลลิวินาที เร็วเกินไปจนเราไม่ได้ยินเสียงหยุดชั่วคราว ซึ่งจริงๆ แล้วเร็วกว่าคอมพิวเตอร์ที่ใช้กันอยู่เลย สมองใช้เวลาประมาณครึ่งวินาทีเพื่อดึงคําออกมาเพื่อพูด นั่นหมายความว่าในในการสนทนา คนหนึ่งต้องเตรียมใจให้พูดก่อนที่อีกคนจะพูดจบ การฟังเสียง ไวยากรณ์ และเนื้อหาของคําพูดของคนอื่นจะทําให้เรารู้ได้ว่าเมื่อไหร่ที่สิ่งเหล่านี้จะเสร็จสมบูรณ์"
ความสําคัญของการหยุดชั่วคราวในการสนทนา โดย Johnson นักเศรษฐศาสตร์ 14 ธันวาคม 2017
"การสนทนากลายเป็นเครื่องปรับแต่งอย่างดีเยี่ยม ตามที่ Nick Enfield นักภาษาศาสตร์ของมหาวิทยาลัยซิดนีย์แนะนําไว้ว่า "How Talk Talk" มนุษย์ส่วนใหญ่จะทําตามกฎที่ว่า "อย่าให้มีช่องว่าง ไม่ซ้อนทับกัน" ปฏิกิริยาเมื่อจบการสนทนา 1 รอบ โดยเริ่มต้นภายในเวลาประมาณ 200 มิลลิวินาที ซึ่งก็คือเวลาที่สไปรท์ตอบสนองกับปืนกระสุนเริ่มต้น ทั้งหมดนี้คือสิ่งที่น่าทึ่งมาก เพราะใช้เวลาประมาณ 600 มิลลิวินาทีให้ใครบางคนรู้ว่าพวกเขากําลังจะพูดอะไร โดยดึงข้อมูลความคิดและจัดระเบียบการแสดงออกของพวกเขา"