बातचीत के बारे में जानें

बातचीत डिज़ाइन के लिए नया है? यहां अपना पहला सैंपल डायलॉग लिखने से पहले, शुरू करने से जुड़े कुछ अहम सिद्धांत और सिद्धांत दिए गए हैं.
आसान, बिना रुकावट, और उपयोगकर्ता पर आधारित डायलॉग लिखने का तरीका जानने के लिए, इस वीडियो को देखें. इसके लिए, को-ऑपरेटिव प्रिंसिपल लागू करें.

को-ऑपरेटिव प्रिंसिपल के मुताबिक, बेहतर तरीके से बातचीत करने का मतलब है कि बातचीत में हिस्सा लेने वाले लोगों के बीच किसी तरह का सहयोग कम होता है.

सहकारी सिद्धांत को चार नियमों के रूप में समझा जा सकता है, जिन्हें ग्रिस का मैक्सिम्स कहा जाता है.

हम इन स्थितियों में आसान सहयोग करते हैं... ज़्यादा से ज़्यादा (या नियम)
...सच्चाई सबसे अच्छी क्वालिटी
...जानकारी की मात्रा जो हम उपलब्ध कराते हैं ज़्यादा से ज़्यादा संख्या
...हम जो योगदान देते हैं उसकी प्रासंगिकता ज़्यादा से ज़्यादा काम का हो
...वह तरीका जो साफ़ तौर पर या अस्पष्टता के बिना, लोगों तक पहुंचाने की कोशिश करता है मैक्सिमर ऑफ़ मैनर
रिसर्च से पता चला है कि लोग टेक्नोलॉजी का उसी तरह से जवाब देते हैं, जैसा वे दूसरों को देते हैं. इसका मतलब है कि उपयोगकर्ता, इंसान और इंसानों जैसी बातचीत के अपने मौजूदा मॉडल पर भरोसा करते हैं और बातचीत वाले यूज़र इंटरफ़ेस के पर्सोना से इंटरैक्ट करते समय भी को-ऑपरेटिव प्रिंसिपल का पालन करते हैं. साथ ही, वे उम्मीद करते हैं कि आपका पर्सोना भी उसे फ़ॉलो करे.
उपयोगकर्ता मिलकर काम करते हैं. इसलिए, वे अक्सर ज़रूरत से ज़्यादा जानकारी देते हैं.

करें.

इस उपयोगकर्ता ने न सिर्फ़ जूता टाइप के बारे में सवाल का जवाब दिया, बल्कि उसका साइज़ भी बताया, ताकि वह आसानी से खोज सके कि उसे क्या चाहिए. आपको ऐसे उपयोगकर्ताओं से इस तरह का व्यवहार करना चाहिए जो जानते हैं कि दूसरे किस तरह के सवाल पूछे जाएंगे.

यह न करें.

यहां पर्सोना को सिर्फ़ जूते के टाइप से जुड़े सवाल का जवाब चाहिए था. सहकारी उपयोगकर्ता परेशान हो जाएंगे कि उन्हें जूते का साइज़ दोबारा दोहराना होगा.

आपके पर्सोना के साथ हमेशा सहयोग करने से मिले जवाब हैंडल नहीं हो पाएंगे. ऐसे मामलों में, डायलॉग पर वापस जाने के लिए लाइटवेट और बातचीत से जुड़ी गड़बड़ी पर भरोसा करें. ऐसा करने से गड़बड़ी ठीक नहीं होगी.

करें.

अगर आपके पर्सोना को किसी खास जवाब की उम्मीद है, तो सहकारी/जानकारी से जुड़े जवाबों को नहीं समझा जा सकेगा. इसलिए, इस 'कोई मिलान नहीं' गड़बड़ी को जल्द से जल्द होने वाली गड़बड़ी से ठीक करें.

यह न करें.

जवाब देने से पहले, जवाब देने से बचें. इस मामले में, छोटे प्रतिनिधि के लिए भी ऐसा ही किया जाएगा, क्योंकि उपयोगकर्ता को ज़्यादा देर तक इंतज़ार नहीं करना पड़ेगा.

आपके उपयोगकर्ताओं की तरह, पर्सोना भी सहयोग करने और जानकारी देने वाला होना चाहिए. साथ ही, बातचीत को आगे बढ़ाने के लिए ज़्यादा से ज़्यादा जानकारी देना भी ज़रूरी है.

करें.

यह पर्सोना, डिलीवरी के दूसरे विकल्पों को ढूंढने की कोशिश करता है. उपयोगकर्ता के मकसद को पूरा करने के लिए, यह उसे सहयोग देने का एक तरीका है.

यह न करें.

इस पर्सोना से उपयोगकर्ता के मकसद को पूरा करने की कोशिश नहीं की जाती. इसके अलावा, कोई बुरी खबर देने के बाद, इंटरैक्शन खत्म हो जाता है.

बातचीत में, बहुत ज़्यादा कहना उतना ही मुश्किल होता है जितना कि बहुत कम कहना. कॉन्टेंट को समझने में आसान बनाने के लिए, यह लोगों के नज़रिये से बहुत ही छोटा और काम का होता है.

करें.

यह डिज़ाइन इस आधार पर ऑप्टिमाइज़ किया गया है कि वह कितने काम का है. पर्सोना में ऐसी जानकारी शामिल नहीं की गई है जो मौजूदा फ़ैसले के लिए सही नहीं है.

यह न करें.

उपयोगकर्ता के नज़रिए से, ज़्यादातर जानकारी बार-बार दिखाई जाती है और बार-बार दोहराई जाती है. यह पूरी जानकारी, उपयोगकर्ता की कम समय वाली मेमोरी पर बहुत ज़्यादा दबाव डालती है, क्योंकि वह धैर्य के साथ अपनी बारी का इंतज़ार करती है.

करें.

यह डिज़ाइन इस आधार पर ऑप्टिमाइज़ किया गया है कि वह कितने काम का है. बहुत कम संख्या में ही ऐसे उपयोगकर्ताओं से अनुरोध किया जाएगा जो इस इलाके के कोड के बारे में नहीं बताते हैं.

यह न करें.

इस डिज़ाइन की मदद से, हर उपयोगकर्ता को किसी नंबर को पर्सोना कहने के तरीके के बारे में निर्देश चाहिए, ताकि वह पर्सोना के लिए आसानी से बातचीत कर सके. इससे यह भी गलती से मान ली जाती है कि उपयोगकर्ता, बिना निर्देश के ऐसा नहीं कर पाएगा. इससे, ऐसा लगता है कि साइन इन करने पर गड़बड़ी का संकेत मिल रहा है.

किसी की कही गई बात का मतलब यह नहीं है कि उसे समझना उसका मतलब क्या है. लोग अक्सर चीज़ों के बारे में बताने के बजाय सुझाव देते हैं. "लाइन के बीच में सुनने" की हमारी क्षमता को "बातचीत की वजह से होने वाली उलझन" के तौर पर जाना जाता है.

असरदार तरीके से असर डालना. बातचीत के संदर्भ में, "कल रात मैं एक रेस्टोरेंट में महिला को देखता हूं" देखकर पता चलता है कि जॉन अपनी पत्नी के अलावा किसी और महिला के साथ था, क्योंकि अगर वह औरत थी, तो बोलने वाले ने भी ऐसा ही किया होगा. हालांकि, तर्क के हिसाब से, हो सकता है कि महिला जॉन पत्नी हो, क्योंकि सभी पत्नियां महिलाएं हैं.

करें.

"यह पूरा हो गया है", "यह बस हो गया है", "धन्यवाद" या "मेरा काम हो गया" जैसे वाक्यांशों के लिए हैंडलिंग ज़रूर जोड़ें. आम तौर पर, इसका मतलब सिर्फ़ यह होता है कि मुझे इस बातचीत से वह सब कुछ मिल गया है जिसकी मुझे ज़रूरत है और मैं बात कर चुका हूँ. अलविदा."

यह न करें.

यहां, "बस हो गया" को व्याकरण में नहीं जोड़ा गया. इसलिए, यह मैच नहीं करने की गड़बड़ी को ट्रिगर करता है.

लोग स्वाभाविक रूप से किसी बातचीत में भावनाओं की दुविधा और अस्पष्टता से बचते हैं. जाने-पहचाने शब्दों और वाक्यांशों का इस्तेमाल करने से, याददाश्त कम होने में मदद मिलती है. अगर बात शब्द के चुनाव की हो, तो आप ऐसा नहीं कह सकते, न ही आपका पर्सोना.

जब आप एक जैसे मिलते-जुलते शब्दों का फ़ैसला न कर पाएं, तो Google Trends का इस्तेमाल करके पता लगाएं कि लोग किस शब्द को सबसे ज़्यादा खोजते हैं. साथ ही, Google Books Ngram व्यूअर का इस्तेमाल करके यह पता लगाया जाता है कि आम तौर पर कौनसा शब्द पब्लिश किया गया है.

करें.

हो सकता है कि उपयोगकर्ता ने बोलते समय टाइप करने में कोई गड़बड़ी की हो या उसे तुरंत ठीक किया हो. तो, पर्सोना समस्या को समझाता है और सादे अंग्रेज़ी में पूछता है, और फिर से कहता है.

यह न करें.

"अमान्य" बहुत ज़्यादा तकनीकी है और उपयोगकर्ता को ट्रैक पर वापस लाने में मदद नहीं करता है.

करें.

पुष्टि करना आसान बनाएं. "हो गया!" भी एक अच्छा विकल्प है.

यह न करें.

"लेन-देन", "अनुरोध किया गया", और "पूरा हुआ" औपचारिक है, बातचीत के लायक नहीं. साथ ही, यह मैसेज काम का नहीं है: उपयोगकर्ता को यह याद दिलाने की कोई ज़रूरत नहीं है कि उन्होंने हाल ही में लेन-देन का अनुरोध किया है.

करें.

पुष्टि करें कि उपयोगकर्ता का अनुरोध समझ लिया गया है. इसके बाद, नतीजों पर जाएं.

यह न करें.

"मैच करने वाले इवेंट" एक तकनीकी एक्सप्रेशन हैं. "मिलता-जुलता शब्द", उपयोगकर्ता के बोले गए कॉल और उपलब्ध कॉन्सर्ट के बीच संबंध दिखाता है. हर दिन उपयोगकर्ताओं को यह नहीं पता होता है कि क्वेरी और नतीजों से मिलते-जुलते होने की चुनौती की परवाह करें. इसके अलावा, "मैच करने वाले इवेंट" साफ़ नहीं होते—इसका मतलब ऐसे इवेंट से भी हो सकता है जो एक-दूसरे से मेल खाते हों, जैसे कि "मैच करने वाले मोज़े".


संदर्भ

अपने-आप बोली पहचानने की सुविधा (एएसआर) में प्रगति करने का मतलब है कि हम करीब-करीब हर बार जानते हैं कि उपयोगकर्ताओं ने क्या कहा. हालांकि, उपयोगकर्ताओं को क्या जानकारी देनी है, यह तय करना अब भी चुनौती है.

शब्दों को अक्सर आइसोलेशन के ज़रिए नहीं समझा जा सकता, बल्कि सिर्फ़ संदर्भ के हिसाब से समझा जा सकता है.

उपयोगकर्ता की बात को समझने के लिए, आपके पर्सोना को संदर्भ पर नज़र रखना ज़रूरी है.

अगर Dialogflow का इस्तेमाल किया जा रहा है, तो संदर्भ जोड़ने के बारे में ज़्यादा जानने के लिए यहां जाएं.

करें.

यह जानने के लिए पिछले मोड़ की जानकारी होना ज़रूरी है कि "ही" का मतलब NOTARealDJ से है. "शहर" का मतलब "सैन फ़्रांसिस्को" है. इसलिए, उपयोगकर्ता की भौगोलिक जगह की जानकारी होना ज़रूरी है.

यह न करें.

यहां, उपयोगकर्ता का सवाल समझ में नहीं आता है और कोई मैच नहीं होता है.

फ़ॉलो-अप इंटेंट को समझने के लिए पर्सोना को आपके संदर्भ का ट्रैक रखना होता है.

जब तक उपयोगकर्ता उस विषय में बदलाव नहीं करता, तब तक हम यह मान सकते हैं कि बातचीत की थ्रेड जारी रहेगी. इसलिए, यह हो सकता है कि वर्तमान उच्चारणों की अस्पष्टता को पिछले कथनों से हल किया जा सके.

अगर Dialogflow का इस्तेमाल किया जा रहा है, तो फ़ॉलो-अप इंटेंट से जुड़ा सेक्शन पढ़ें.

करें.

फ़ॉलो-अप इंटेंट का इस्तेमाल करके, पर्सोना को यह समझ आता है कि "आधे दर्ज़न से ज़्यादा क्या होता है?" उपयोगकर्ता के पिछले उच्चारण के बारे में फ़ॉलो-ऑन है और इसे "6 गुलाब के गुलदस्ते की कीमत कितनी है?" के तौर पर समझें.

यह न करें.

अगर आपकी कार्रवाई बातचीत के बड़े संदर्भ में कथनों की व्याख्या नहीं कर पाती है, तो यह या तो उपयोगकर्ता की क्वेरी को गलत समझेगा या किसी गड़बड़ी में बदल जाएगा—इस मामले में, कोई मिलान नहीं गड़बड़ी.

मल्टीमोडल इंटरैक्शन के लिए, स्क्रीन पर मौजूद हर चीज़, बातचीत के संदर्भ का हिस्सा होती है. अगर उपयोगकर्ता इसे देख सकते हैं, तो वे यह मान लेंगे कि वे इसे देख सकते हैं.

करें.

स्क्रीन पर जहां कहीं भी कोई आइटम हो, उस जानकारी का अनुमान लगाएं, जैसे कि "पहला" या यह कैसा दिखता है, जैसे, "लाल रंग का."

यह न करें.

यह तब परेशान होता है, जब आपके पर्सोना को स्क्रीन पर दिखने वाले कॉन्टेंट के बारे में कुछ पता न हो.


भिन्नरूप

तरह-तरह के जीवन से आनंद आता है. जब ज़्यादा विज्ञापन होते हैं, तो उपयोगकर्ता ज़्यादा ध्यान देते हैं. अलग-अलग लोगों को बातचीत में एक जैसा या रोबोटिक महसूस होने से बचा जा सकता है.

इसलिए, किसी भी क्रम में लगाएं. किसी भी दिए गए संकेत के लिए, आम तौर पर कुछ ऐसे बातचीत के विकल्प होते हैं जो काम करेंगे. उपयोगकर्ताओं की ओर से अक्सर सुने जाने वाले संकेतों पर अपनी कोशिशों पर ध्यान दें, ताकि ये वाक्यांश ज़्यादा थकाने वाले न बन जाएं.

Dialogflow का इस्तेमाल करने पर, जवाब के अलग-अलग वर्शन आसानी से जोड़े जा सकेंगे.

इस सवाल का जवाब देने के लिए, सभी अलग-अलग तरीके आज़माएं: "अभी कितने बजे हैं?"

अगर आपकी कार्रवाई उपयोगकर्ताओं को समय बताती है, तो हो सकता है कि आप ऊपर दिए गए सभी वैरिएशन जोड़ना चाहें. साथ ही, उन्हें उपयोगकर्ताओं को किसी भी स्थिति में चलाना चाहें.


लेने के लिए

बारी-बारी से, हम एक-दूसरे को परेशान नहीं करते और बातचीत को सिंक में ही रखते हैं. CANNOT TRANSLATE इस मुश्किल प्रोसेस को मैनेज करने के लिए, हम वाक्य के स्ट्रक्चर, लहजे, आंखों से देखने, और बॉडी लैंग्वेज में एम्बेड किए गए संकेतों की एक बेहतर इन्वेंट्री पर भरोसा करते हैं. हालांकि, आपकी कार्रवाई सीमित होगी. इससे, इन संकेतों को पहचानने और पहचानने में मदद मिलती है. हालांकि, संकेत इस तरह से लिखे जा सकते हैं कि उपयोगकर्ता को पता चल सके कि उसकी बारी कब है.
आपकी बारी आने पर, पर्सोना को सही संकेत मिलने चाहिए.

करें.

कोई सवाल पूछकर, कॉल-टू-ऐक्शन को साफ़ तौर पर बताएं.

यह न करें.

इस डिज़ाइन के साथ पेश किए जाने पर, कई उपयोगकर्ता अपनी बारी नहीं निभाएंगे.

आपके पर्सोना को बातचीत को मोनोपॉल नहीं करना चाहिए या सभी विकल्पों/सवालों को एक ही बार में पेश करने की कोशिश नहीं करनी चाहिए.

करें.

उपयोगकर्ता से एक बार में सिर्फ़ एक सवाल पूछें.

यह न करें.

सवाल पूछने के बाद भी न बोलें. उपयोगकर्ता को बहुत ज़्यादा विकल्प और सवाल न लिखें.


दूसरे स्रोत

  • अपने VUI को व्यक्तित्व के मुताबिक बनाना
  • बातचीत को आगे ले जाना
  • कम से कम और काम के शब्दों का इस्तेमाल करना
  • संदर्भ का इस्तेमाल करना
  • उपयोगकर्ताओं को फ़ोकस करने के लिए, वर्ड ऑर्डर और तनाव की ज़रूरत होती है
  • "निर्देश" न बोलें—बोलना आसान है
मेथड पॉडकास्ट, एपिसोड 8, मार्गरेट अर्बन, सीनियर इंटरैक्शन डिज़ाइनर, @ Google, विज्ञान के क्षेत्र में और Google Assistant के लिए वॉइस यूज़र इंटरफ़ेस की डिज़ाइनिंग

कुछ हाइलाइट:

  • भाषा के जादू की दुनिया में, 3:13
  • मैं अपनी ज़िंदगी में भाषा को बेहद पसंद करता हूं. मुझे लगता है कि यह जादुई है. यह टेलीपैथी की तरह है—बस एक साउंड वेव के वाइब्रेशन से, मैं आपके दिमाग में एक आइडिया डाल सकती हूं."
  • कंप्यूटर को इंसानों की आवाज़ जैसा बनाने पर, 2:37
  • "सामाजिक संदर्भ में भाषा का उपयोग किस तरह किया जाता है, यह देखना स्वाभाविक है. क्योंकि हम चाहते हैं कि कंप्यूटर लोगों की तरह बात करें. हम लोगों को कंप्यूटर की तरह बात करने के लिए मजबूर नहीं करना चाहते."
एड यॉन्ग की बातचीत के दौरान हम जो भी करते हैं. The Atlantic. 4 जनवरी, 2016
"जब हम बात करते हैं, तो हम मोड़ लेते हैं, क्योंकि बोलने वाले "दाएं", पार्टनर के बीच आपस में पलटते हैं. यह आवाज़ उन लोगों के बीच बहुत साफ़ और आसान है. समय पर विचार करें: औसतन, हर मोड़ करीब दो सेकंड तक रहता है और उनके बीच का अंतराल 200 मिलीसेकंड होता है. यह एक ऐसा शब्द है जो शब्दावली को बोलने से काफ़ी कम है. यह संख्या करीब-करीब बराबर है. यह सभी संस्कृतियों में मौजूद है, जिसमें बस कुछ मामूली अंतर हैं. यह सुविधा साइन-इन बातचीत के माहौल में भी काम करती है."
जब कोई व्यक्ति दूसरा सवाल पूछता है, तो उसे जवाब देने में औसतन 200 मिलीसेकंड लगते हैं. इतनी तेज़ी से हम रोक भी नहीं सुन सकते हैं. असल में, यह हमारे दिमाग के काम करने की रफ़्तार से ज़्यादा तेज़ है. कुछ शब्द बोलने के लिए दिमाग को आधे सेकंड लगते हैं. इसका मतलब है कि बातचीत में एक व्यक्ति दूसरा बोलने से पहले ही तैयार हो जाता है. लहजे, व्याकरण, और किसी व्यक्ति की बात बोलने वाले कॉन्टेंट को सुनकर, हम यह अंदाज़ा लगा सकते हैं कि वे कब बोलने वाले हैं."
एक बातचीत के बाद, यह साफ़ हो गया है कि एक बेहतरीन मशीन तैयार की गई है. निक एनफ़ील्ड, सिडनी यूनिवर्सिटी के एक शिक्षक हैं. हमारा सुझाव है कि "हम कैसे बात करें". इंसान आम तौर पर "कोई गैप नहीं, ओवरलैप नहीं करता" जैसे नियम का पालन करता है और बातचीत वाली बारी के आखिर में अपनी प्रतिक्रिया देता है. 200 मिलीसेकंड की यह शुरुआत, बंदूक की शुरुआती स्थिति में जवाब देने वाले व्यक्ति को होती है. ये सबसे खास बात है कि कोई व्यक्ति अपने शब्दों का इस्तेमाल करके यह समझ पाता है और उनकी बात करने के तरीके को व्यवस्थित करता है. ऐसा करके, करीब 600 मिलीसेकंड तक यह तय किया जाता है कि वे क्या बोलने वाले हैं."