Więcej informacji o rozmowie

Dopiero zaczynasz projektować rozmowę? Oto kilka ogólnych zasad i koncepcji, które ułatwią Ci napisanie pierwszego przykładowego okna.
Obejrzyj ten film, aby dowiedzieć się, jak tworzyć wygodne, sprawne i ukierunkowane na użytkownika okno dialogowe z zastosowaniem zasady kooperacyjnej.

Zgodnie z zasadą współpracy, wydajna komunikacja opiera się na założeniu, że istnieje niewystarczająca współpraca między uczestnikami rozmowy.

Zasady kooperacyjne można rozumieć jako 4 reguły nazywane Maksymalizmem Grace'a.

Instytucjonalnie współpracujemy, jeśli chodzi o... Maksymalizacja (lub reguła)
...prawdziwość naszych wypowiedzi Najwyższa jakość
...ilość podanych przez nas informacji Maksymalna ilość
...Trafność publikowanych treści Maksymalizacja trafności
...staramy się utrzymywać jasny, przejrzysty i niejednoznaczny sposób komunikowania się. Maksimum marki Manner
Badania pokazują, że ludzie reagują na technologię tak samo jak ludzie. Oznacza to, że użytkownicy polegają na swoim modelu komunikacji międzyludzkiej i ludzkiej, nawet jeśli wchodzą w interakcję z klientami i oczekują, że dany klient także będzie przestrzegał ich.
Użytkownicy współpracują ze sobą, więc często podają więcej informacji, niż jest to konieczne.

Tak.

Ten użytkownik nie tylko odpowiedział na pytanie dotyczące typu butów, ale także opisał ich rozmiar, starając się szybko znaleźć potrzebne informacje. Podobne zachowanie oczekuje się od użytkowników, którzy wiedzą, jakie inne pytania zadają.

Nie.

W tym przypadku klient spodziewał się tylko odpowiedzi na pytanie o rodzaj obuwia. Współpracownicy będą się irytować tym, że powtarzają rozmiar buta.

Profil klienta nie zawsze będzie w stanie odpowiadać na odpowiedzi kooperacyjne. W takim przypadku należy zadbać o to, aby okno dialogowe było łatwe w obsłudze i nie zwracało uwagi na błąd.

Tak.

Jeśli Twój profil klienta oczekuje odpowiedzi liczbowej, odpowiedzi kooperacyjne lub informacyjne nie będą zrozumiałe. Rozwiąż ten błąd braku dopasowania za pomocą szybkiego ponownego przesyłania.

Nie.

Jeśli to możliwe, unikaj powtarzających się ponownych próśb. W takim przypadku krótsze ponowne wysłanie będzie służyć do tego samego celu, bez konieczności oczekiwania przez użytkownika.

Podobnie jak Twoi użytkownicy, w Twoim profilu klienta warto też dobrze się orientować w potrzebach współpracy i zawierać jak najwięcej informacji potrzebnych do prowadzenia rozmowy.

Tak.

Ten profil klienta stara się znaleźć alternatywne opcje, które będą odpowiadać zamiarowi użytkownika – to gest, który pozwala kontynuować rozmowę.

Nie.

Ta prezentacja nie służy do zaspokojenia zamiaru użytkownika, a po przedstawieniu zła wiadomości, kończy interakcję.

Zbyt wątpliwe powiedzenie, że nic się nie dzieje, jest równie proste jak brak odpowiedzi. Ułatwiają zrozumienie treści, starając się, aby były krótkie i optymalne z perspektywy użytkownika.

Tak.

Ten projekt jest zoptymalizowany pod kątem trafności. Profil klienta nie zawiera szczegółów, które nie są związane z bieżącą decyzją.

Nie.

Z punktu widzenia użytkownika większość tych informacji jest nieistotna i powtarzająca się. Wszystkie te szczegóły powodują duże obciążenie dla pamięci krótkotrwałej użytkownika, który cierpliwie czeka na swoją kolej.

Tak.

Ten projekt jest zoptymalizowany pod kątem trafności. Tylko niewielu użytkowników, którzy nie wypowiedzą konkretnego numeru kierunkowego, poprosi o jego podanie.

Nie.

Ta funkcja zmusza każdego użytkownika do wysłuchania instrukcji wymowy numeru telefonu w prosty sposób, ale nie dla użytkownika. Poza tym błędnie zakłada, że użytkownik nie byłby w stanie tego zrobić bez instrukcji, przez co wywołuje wrażenie błędu.

To, że ktoś powiedział to samo, to nie to samo. Użytkownicy często sugerują coś zamiast mówić wprost. Nasza umiejętność „słuchania między wierszami” jest nazywana „implantami rozmów”.

Skutki i konsekwencje Dzięki imponującej rozmowie: „Wczoraj wieczorem zobaczyłem Jana w restauracji z kobietą”. sugerowano, że Jan był z kobietą inną niż żona, bo gdyby była to jego żona, mówca to powiedział. Jednak z powodu logicznych implikacji mogła to być żona Jana, bo wszystkie żony to kobiety.

Tak.

Pamiętaj, aby dodawać frazy takie jak „To wszystko”, „To wszystko”, „Dziękuję” czy „Gotowe”, co oznacza, że zwykle udało mi się wyjaśnić wszystkie kwestie z tego wątku. Do widzenia.

Nie.

Komunikat „To wszystko” nie został dodany do gramatyki, więc jego błąd nie powoduje dopasowania.

Ludzie naturalnie unikają dwuznacznych i niewyraźnych wypowiedzi w rozmowie. Używanie dobrze znanych słów i wyrażeń pomaga zmniejszyć obciążenie poznawcze. Jeśli chodzi o wybór słów, z pewnością nie daj się wypowiedzieć.

Jeśli nie możesz zdecydować się na kilka podobnych terminów, skorzystaj z Trendów Google, aby dowiedzieć się, które hasła wyszukują użytkownicy, i Przeglądaj Ngram w Książkach Google, aby dowiedzieć się, które są najczęściej publikowane.

Tak.

Użytkownik mógł popełnić błąd podczas pisania lub szybko się poprawić. Opisujesz ją więc zwykłym językiem i pytasz jeszcze raz.

Nie.

Komunikat „Nieprawidłowy” jest zbyt techniczny i nie pomaga użytkownikowi w przywróceniu pozycji.

Tak.

Proste potwierdzenia. Dobrym rozwiązaniem jest też „Gotowe!”.

Nie.

„Transakcje”, „Żądane” i „Zakończone” mają charakter formalny, a nie konwersacyjny. Komunikat jest też nietrafny: nie ma znaczenia dla przypomnienia użytkownika, że właśnie poprosił o transakcję.

Tak.

Sprawdź, czy żądanie użytkownika zostało zrozumiane i wskaż wyniki.

Nie.

„Dopasowanie zdarzeń” to wyrażenie techniczne. „Dopasowanie” określa korelację między tym, co mówił użytkownik, a dostępnymi koncertami. Każdego dnia użytkownicy nie wiedzą, dlaczego wyzwanie polega na dopasowaniu zapytań do wyników. Określenie „pasujące wydarzenia” jest niejednoznaczne – może także oznaczać wydarzenia, które do siebie pasują, np. „pasujące skarpetki”.


Kontekst

Dzięki zaawansowanemu rozpoznawaniu mowy (ASR) niemal zawsze wiemy dokładnie, co mówią użytkownicy. Jednak ustalenie, co mieli na myśli użytkownicy, nadal jest wyzwaniem.

Wypowiedzi często są niezrozumiałe, ale można je zrozumieć tylko w kontekście.

Profil klienta musi śledzić kontekst, aby rozumieć wypowiedzi użytkowników.

Jeśli używasz Dialogflow, przejdź tutaj, aby dowiedzieć się więcej o dodawaniu kontekstu.

Tak.

Wymaganie wiedzy o poprzednim zakręcie jest wymagane, aby wiedzieć, że „on” odnosi się do NotARealDJ. Znając lokalizację geograficzną użytkownika, musisz wiedzieć, że „miasto” odnosi się do „San Francisco”.

Nie.

Pytanie użytkownika nie zostało zrozumiane – wystąpił błąd dopasowania.

Profil klienta musi śledzić kontekst, aby zrozumieć dalsze działania.

Jeśli użytkownik nie zmieni tematu, przyjmujemy, że wątek jest kontynuowany. Dlatego też niejasności w bieżącej wypowiedzi można rozwiązać, odwołując się do poprzednich wyrażeń.

Jeśli używasz Dialogflow, więcej informacji znajdziesz w sekcji dotyczącej dalszych działań.

Tak.

Dzięki zamiarowi dalszego kontaktu klient może zrozumieć, że „Co około półtora?” jest kontynuacją poprzedniej wypowiedzi użytkownika i zinterpretować ten komunikat jako „Ile kosztuje bukiet 6 róż?”.

Nie.

Jeśli akcja nie zinterpretuje Twoich wyrażeń w kontekście konwersacji, spowoduje to błędną interpretację zapytania użytkownika lub zakończy się błędem, w tym przypadku z powodu braku dopasowania.

W przypadku interakcji multimodalnych wszystko, co znajduje się na ekranie, jest częścią kontekstu rozmowy. Jeśli użytkownicy go widzą, zakładają, że mogą to robić.

Tak.

Przewiduj, gdzie znajduje się element na ekranie, np. „pierwsze” lub podobne, np. „czerwony”.

Nie.

Problem występuje, gdy wydaje się, że Twój profil klienta nie wie, co jest na ekranie.


Zmiany

Różnorodność jest ożywieniem. Użytkownicy przykuwają większą uwagę, gdy jest ich więcej. Różnorodność sprawia, że interakcja nie jest monotonna ani roboty.

Losowo. W przypadku każdego komunikatu dostępnych jest kilka alternatywnych rozwiązań. Skup się na podpowiedziach, które użytkownicy często słyszą, aby wyrażenia te nie były męczące.

Jeśli używasz Dialogflow, możesz łatwo dodać wiele odmian odpowiedzi.

Weź pod uwagę różne sposoby uzyskania odpowiedzi na pytanie „Która jest godzina?”.

Jeśli akcja informuje użytkownika o godzinie, warto dodać wszystkie powyższe odmiany i odtworzyć je losowo w określonych warunkach.


Na zmianę

Robiąc to na zmianę, unikamy przerywania sobie nawzajem i chcemy utrzymywać synchronizację rozmowy. Tak naprawdę tu chodzi o to, kto „ma mikrofon”: przekazanie mikrofonu, przytrzymanie go i przekazanie go do innego rozmówcy. Do zarządzania tym złożonym procesem bazujemy na bogatym sygnale wbudowanym w strukturę zdania, intonację, spojrzenie i język ciała. Akcja będzie ograniczona do wyrażenia i wykrywania tych wskazówek, ale możesz pisać o tym tak, aby użytkownicy wiedzieli, kiedy mogą się wykonać.
W profilu klienta należy podać jasne sygnały, gdy będzie to ruch użytkownika.

Tak.

Zadaj wezwanie do działania, zadając pytanie.

Nie.

Wielu użytkowników nie będzie się im martwić.

W swoim profilu klienta nie należy monopolować rozmowy ani próbować prezentować wszystkich opcji i pytań za jednym razem.

Tak.

Pytaj użytkownika tylko o jedno pytanie.

Nie.

Nie zadawaj pytań po pytaniu. Nie przytłaczaj użytkownika nadmiarowymi opcjami i pytaniami.


Dodatkowe zasoby

  • Nadaj osobowości VUI
  • Przesuwanie wątku do przodu
  • Zachowaj zwięzłość.
  • Wykorzystaj kontekst
  • Skup się na użytkowniku dzięki kolejności słów i stresowi
  • Nie uczy „polecenia” – mówienie jest intuicyjne.
Method Podcast, odcinek 8, Margaret Urban, starszy projektant interakcji w Google, nauka o mowie i projektowaniu interfejsów głosowych Asystenta Google

Najważniejsze informacje:

  • Do świata magii języka: 3:13
  • „Do końca życia fascynowała mnie język. To niesamowite. To jak telepatia. Właśnie dzięki wibracji fali dźwiękowej mogę w Twoim głowie myśleć”.
  • Jak sprawić, by komputery wyglądały naturalnie? 2:37
  • „Wybór języka w kontekście społecznym jest niezwykle ważny przy tworzeniu treści, które brzmią naturalnie. Chcemy, aby komputery rozmawiały jak ludzie. Nie chcemy zmuszać ludzi do rozmawiania jak komputery”.
Ed Yong – Niesamowite rzeczy, które robimy podczas rozmów. Atlantyk. 4 stycznia 2016 r.
„Mówimy na przemian, gdy prawa do wypowiadania się przewracają między partnerami. Ten przypominający rozmowę konwersatorium jest tak znajomy i wyjątkowy, że rzadko go zauważamy. Pamiętaj jednak o wybranym czasie: każdy skręt trwa około 2 sekund, a typowa przerwa między nimi to tylko 200 milisekund, czyli wystarczająco mało czasu, aby wymówić sylabę. Ta osoba jest uniwersalna. Ta kultura występuje w różnych kulturach z niewielkimi różnicami. Tacy nawet są w rozmowach w języku migowym”.
„Odpowiadanie na pytania użytkowników zajmuje średnio 200 milisekund. Tak szybko, że nie słyszymy nawet przerwy. To działa szybciej niż mózg. Pozyskanie słowa zajmuje około pół sekundy, a przedstawienie go tak, aby rozmówca był gotowy do rozmowy. Słuchając tonu, gramatyki i treści mowy, możemy przewidzieć, kiedy to się uda”.
Znaczenie przerw w rozmowie: Johnson. Ekonomista. 14 grudnia 2017 r.
„Okazuje się, że rozmowa jest dość precyzyjna, jak Nick Enfield, językoznawca Uniwersytetu w Sydney, sugeruje w artykule „How We Talk”. Ludzie zazwyczaj przestrzegają reguły nazywanej „brakiem odstępów, bez nakładania się”, która reaguje na koniec rozmowy konwersacyjnej, rozpoczynając się w ciągu ok. 200 milisekund, czyli zareagowania na początek broni. Jeszcze bardziej istotne jest to, że ludzie potrzebują około 600 milisekund, aby zastanowić się nad tym, co zamierzają powiedzieć, mentalnie pobierając słowa i organizując sposób ich wyrażania”.