Package google.assistant.embedded.v1alpha2

সূচক

এমবেডেড অ্যাসিস্ট্যান্ট

পরিষেবা যা Google সহকারী API প্রয়োগ করে।

সহায়তা করুন

rpc Assist( AssistRequest ) returns ( AssistResponse )

এমবেড করা সহকারী পরিষেবার সাথে কথোপকথন শুরু করে বা চালিয়ে যায়। প্রতিটি কল একটি রাউন্ড-ট্রিপ সঞ্চালন করে, পরিষেবাতে একটি অডিও অনুরোধ পাঠায় এবং অডিও প্রতিক্রিয়া গ্রহণ করে। অডিও পাঠানোর সময় END_OF_UTTERANCE ইভেন্টের মতো ফলাফল পেতে দ্বিমুখী স্ট্রিমিং ব্যবহার করে৷

একটি কথোপকথন হল এক বা একাধিক জিআরপিসি সংযোগ, প্রতিটিতে একাধিক স্ট্রিম করা অনুরোধ এবং প্রতিক্রিয়া থাকে। উদাহরণস্বরূপ, ব্যবহারকারী বলে আমার কেনাকাটার তালিকায় যোগ করুন এবং সহকারী উত্তর দেয় আপনি কী যোগ করতে চান? . প্রথম gRPC বার্তায় স্ট্রিম করা অনুরোধ এবং প্রতিক্রিয়াগুলির ক্রম হতে পারে:

  • AssistRequest.config
  • AssistRequest.audio_in
  • AssistRequest.audio_in
  • AssistRequest.audio_in
  • AssistRequest.audio_in
  • AssistResponse.event_type.END_OF_UTTERANCE
  • AssistResponse.speech_results.transcript "আমার কেনাকাটার তালিকায় যোগ করুন"
  • AssistResponse.dialog_state_out.microphone_mode.DIALOG_FOLLOW_ON
  • AssistResponse.audio_out
  • AssistResponse.audio_out
  • AssistResponse.audio_out

ব্যবহারকারী তখন ব্যাগেল বলেন এবং সহকারী উত্তর দেয় ঠিক আছে, আমি আপনার কেনাকাটার তালিকায় ব্যাগেল যোগ করেছি । এটিকে Assist পদ্ধতিতে আরেকটি জিআরপিসি সংযোগ কল হিসাবে পাঠানো হয়, আবার স্ট্রিম করা অনুরোধ এবং প্রতিক্রিয়া সহ, যেমন:

  • AssistRequest.config
  • AssistRequest.audio_in
  • AssistRequest.audio_in
  • AssistRequest.audio_in
  • AssistResponse.event_type.END_OF_UTTERANCE
  • AssistResponse.dialog_state_out.microphone_mode.CLOSE_MICROPHONE
  • AssistResponse.audio_out
  • AssistResponse.audio_out
  • AssistResponse.audio_out
  • AssistResponse.audio_out

যদিও প্রতিক্রিয়াগুলির সুনির্দিষ্ট ক্রম নিশ্চিত করা হয় না, অনুক্রমিক AssistResponse.audio_out বার্তাগুলিতে সর্বদা অডিওর অনুক্রমিক অংশ থাকবে৷

অনুমোদনের সুযোগ

নিম্নলিখিত OAuth সুযোগ প্রয়োজন:

  • https://www.googleapis.com/auth/assistant-sdk-prototype

আরও তথ্যের জন্য, প্রমাণীকরণ নির্দেশিকা দেখুন।

AssistConfig

কিভাবে AssistRequest বার্তাগুলি প্রক্রিয়া করতে হয় তা নির্দিষ্ট করে।

ক্ষেত্র
audio_out_config

AudioOutConfig

প্রয়োজনীয় অডিওটি কীভাবে ফরম্যাট করতে হবে তা নির্দিষ্ট করে যা ফেরত দেওয়া হবে।

screen_out_config

ScreenOutConfig

ঐচ্ছিক যখন সার্ভার একটি ভিজ্যুয়াল স্ক্রীন প্রতিক্রিয়া প্রদান করে তখন ব্যবহার করার জন্য পছন্দসই বিন্যাসটি নির্দিষ্ট করে৷

dialog_state_in

DialogStateIn

প্রয়োজনীয় বর্তমান ডায়ালগ অবস্থার প্রতিনিধিত্ব করে।

device_config

DeviceConfig

ডিভাইস কনফিগারেশন যা একটি নির্দিষ্ট ডিভাইসকে স্বতন্ত্রভাবে সনাক্ত করে।

debug_config

DebugConfig

সম্পূর্ণ Assist RPC-এর জন্য ঐচ্ছিক ডিবাগিং প্যারামিটার।

ইউনিয়ন ক্ষেত্রের type

type নিম্নলিখিতগুলির মধ্যে একটি হতে পারে:

audio_in_config

AudioInConfig

পরবর্তী ইনকামিং অডিও কিভাবে প্রক্রিয়া করতে হবে তা নির্দিষ্ট করে। পরবর্তী অনুরোধে AssistRequest.audio_in বাইট প্রদান করা হলে প্রয়োজনীয়।

text_query

string

সহকারীকে পাঠানোর জন্য টেক্সট ইনপুট। অডিও ইনপুট উপলব্ধ না হলে এটি একটি পাঠ্য ইন্টারফেস থেকে পপুলেট করা যেতে পারে।

সহায়তার অনুরোধ

ক্লায়েন্ট কর্তৃক প্রেরিত শীর্ষ-স্তরের বার্তা। ক্লায়েন্টদের অবশ্যই কমপক্ষে দুটি এবং সাধারণত অসংখ্য AssistRequest বার্তা পাঠাতে হবে। প্রথম বার্তাটিতে অবশ্যই একটি config বার্তা থাকতে হবে এবং এতে audio_in ডেটা থাকা উচিত নয়৷ সমস্ত পরবর্তী বার্তাগুলিতে audio_in ডেটা থাকতে হবে এবং একটি config বার্তা থাকা উচিত নয়৷

ক্ষেত্র
ইউনিয়ন ক্ষেত্রের type । প্রতিটি AssistRequest এ এই ক্ষেত্রগুলির মধ্যে একটি নির্দিষ্ট করা আবশ্যক। type নিম্নলিখিতগুলির মধ্যে একটি হতে পারে:
config

AssistConfig

config বার্তা সনাক্তকারীকে তথ্য প্রদান করে যেটি কীভাবে অনুরোধটি প্রক্রিয়া করতে হবে তা নির্দিষ্ট করে। প্রথম AssistRequest বার্তাটিতে একটি config বার্তা থাকতে হবে।

audio_in

bytes

অডিও তথ্য স্বীকৃত হবে. অডিও ডেটার অনুক্রমিক অংশগুলি অনুক্রমিক AssistRequest বার্তাগুলিতে পাঠানো হয়। প্রথম AssistRequest বার্তায় audio_in ডেটা থাকতে হবে না এবং পরবর্তী সমস্ত AssistRequest বার্তাগুলিতে audio_in ডেটা থাকতে হবে। AudioInConfig এ উল্লিখিত হিসাবে অডিও বাইট এনকোড করা আবশ্যক। অডিও প্রায় রিয়েল-টাইমে পাঠাতে হবে (প্রতি সেকেন্ডে 16000 নমুনা)। অডিও উল্লেখযোগ্যভাবে দ্রুত বা ধীর পাঠানো হলে একটি ত্রুটি ফেরত দেওয়া হবে।

সহায়তার প্রতিক্রিয়া

ক্লায়েন্ট দ্বারা প্রাপ্ত শীর্ষ-স্তরের বার্তা। এক বা একাধিক AssistResponse বার্তার একটি সিরিজ ক্লায়েন্টের কাছে ফেরত পাঠানো হয়।

ক্ষেত্র
event_type

EventType

শুধুমাত্র আউটপুট ইভেন্টের ধরন নির্দেশ করে।

audio_out

AudioOut

আউটপুট-শুধুমাত্র অডিও যেটিতে সহকারীর প্রশ্নের উত্তর রয়েছে।

screen_out

ScreenOut

আউটপুট-এ কেবলমাত্র কোয়েরিতে সহকারীর ভিজ্যুয়াল প্রতিক্রিয়া রয়েছে।

device_action

DeviceAction

আউটপুট শুধুমাত্র উপযুক্ত পেলোড এবং শব্দার্থিক পার্সিং সহ ক্যোয়ারী দ্বারা ট্রিগার করা ক্রিয়া ধারণ করে।

speech_results[]

SpeechRecognitionResult

শুধুমাত্র আউটপুট এই পুনরাবৃত্ত তালিকায় শূন্য বা তার বেশি স্পিচ রিকগনিশন ফলাফল রয়েছে যা বর্তমানে প্রক্রিয়া করা হচ্ছে এমন অডিওর ধারাবাহিক অংশের সাথে মিলে যায়, যা সবচেয়ে সাম্প্রতিক অডিওর সাথে সম্পর্কিত অংশের সাথে প্রারম্ভিক অডিও (এবং সবচেয়ে স্থিতিশীল অংশ) এর সাথে সম্পর্কিত অংশ থেকে শুরু করে। সম্পূর্ণ ইন-প্রোগ্রেস প্রতিক্রিয়া দেখতে স্ট্রিংগুলিকে সংযুক্ত করা যেতে পারে। বক্তৃতা শনাক্তকরণ সম্পূর্ণ হলে, এই তালিকায় 1.0 এর stability সাথে একটি আইটেম থাকবে।

dialog_state_out

DialogStateOut

শুধুমাত্র-আউটপুট ব্যবহারকারীর প্রশ্নের সাথে সম্পর্কিত আউটপুট ধারণ করে।

debug_info

DebugInfo

ডেভেলপারের জন্য শুধুমাত্র আউটপুট ডিবাগিং তথ্য। return_debug_info সত্যে সেট করলেই কেবল ফেরত দেওয়া হয়।

ইভেন্টের ধরণ

ইভেন্টের ধরন নির্দেশ করে।

এনামস
EVENT_TYPE_UNSPECIFIED কোনো ইভেন্ট উল্লেখ করা হয়নি।
END_OF_UTTERANCE এই ইভেন্টটি নির্দেশ করে যে সার্ভার ব্যবহারকারীর বক্তৃতা উচ্চারণের সমাপ্তি সনাক্ত করেছে এবং কোন অতিরিক্ত বক্তৃতা আশা করে না। অতএব, সার্ভার অতিরিক্ত অডিও প্রক্রিয়া করবে না (যদিও এটি পরবর্তীতে অতিরিক্ত ফলাফল দিতে পারে)। ক্লায়েন্টের অতিরিক্ত অডিও ডেটা পাঠানো বন্ধ করা উচিত, gRPC সংযোগ অর্ধেক বন্ধ করা উচিত, এবং সার্ভার gRPC সংযোগ বন্ধ না করা পর্যন্ত কোনো অতিরিক্ত ফলাফলের জন্য অপেক্ষা করুন।

AudioInConfig

পরবর্তী অনুরোধে সরবরাহ করা audio_in ডেটা কীভাবে প্রক্রিয়া করবেন তা নির্দিষ্ট করে। প্রস্তাবিত সেটিংসের জন্য, Google সহকারী SDK সেরা অনুশীলনগুলি দেখুন।

ক্ষেত্র
encoding

Encoding

সমস্ত audio_in বার্তাগুলিতে পাঠানো অডিও ডেটার প্রয়োজনীয় এনকোডিং৷

sample_rate_hertz

int32

সমস্ত audio_in বার্তাগুলিতে পাঠানো অডিও ডেটার প্রয়োজনীয় নমুনা হার (হার্টজে)। বৈধ মান 16000-24000 থেকে, কিন্তু 16000 সর্বোত্তম। সেরা ফলাফলের জন্য, অডিও উৎসের স্যাম্পলিং রেট 16000 Hz এ সেট করুন। যদি তা সম্ভব না হয়, তাহলে অডিও উৎসের স্থানীয় নমুনা হার ব্যবহার করুন (পুনরায় নমুনা নেওয়ার পরিবর্তে)।

এনকোডিং

অডিও বার্তায় পাঠানো ডেটার অডিও এনকোডিং। অডিও অবশ্যই এক-চ্যানেল (মনো) হতে হবে।

এনামস
ENCODING_UNSPECIFIED উল্লিখিত না. google.rpc.Code.INVALID_ARGUMENT ফলাফল প্রদান করবে।
LINEAR16 আনকম্প্রেসড 16-বিট স্বাক্ষরিত লিটল-এন্ডিয়ান নমুনা (লিনিয়ার পিসিএম)। এই এনকোডিং কোন শিরোনাম, শুধুমাত্র কাঁচা অডিও বাইট অন্তর্ভুক্ত.
FLAC FLAC (ফ্রি লসলেস অডিও কোডেক) হল প্রস্তাবিত এনকোডিং কারণ এটি ক্ষতিহীন--অতএব স্বীকৃতি আপস করা হয় না--এবং LINEAR16 এর প্রায় অর্ধেক ব্যান্ডউইথের প্রয়োজন। এই এনকোডিংয়ে অডিও ডেটার পরে FLAC স্ট্রিম হেডার অন্তর্ভুক্ত রয়েছে। এটি 16-বিট এবং 24-বিট নমুনা সমর্থন করে, তবে, STREAMINFO এর সমস্ত ক্ষেত্র সমর্থিত নয়।

অডিওআউট

কোয়েরিতে সহকারীর প্রতিক্রিয়া ধারণকারী অডিও। অডিও ডেটার ক্রমিক খণ্ডগুলি অনুক্রমিক AssistResponse বার্তাগুলিতে প্রাপ্ত হয়।

ক্ষেত্র
audio_data

bytes

আউটপুট-শুধুমাত্র অডিও ডেটা যেখানে সহকারীর প্রশ্নের উত্তর রয়েছে৷ অডিও ডেটার ক্রমিক খণ্ডগুলি অনুক্রমিক AssistResponse বার্তাগুলিতে প্রাপ্ত হয়।

AudioOutConfig

যখন এটি audio_out বার্তা ফেরত দেয় তখন সার্ভার ব্যবহার করার জন্য পছন্দসই বিন্যাসটি নির্দিষ্ট করে।

ক্ষেত্র
encoding

Encoding

প্রয়োজনীয় অডিও ডেটার এনকোডিং সমস্ত audio_out বার্তাগুলিতে ফেরত দেওয়া।

sample_rate_hertz

int32

প্রয়োজনীয় audio_out বার্তাগুলিতে ফিরে আসা অডিও ডেটার হার্টজে নমুনা হার৷ বৈধ মানগুলি হল: 16000-24000৷

volume_percentage

int32

ডিভাইসের অডিও আউটপুটের বর্তমান ভলিউম সেটিং প্রয়োজন । বৈধ মান হল 1 থেকে 100 (1% থেকে 100% অনুরূপ)।

এনকোডিং

অডিও বার্তায় ডেটার অডিও এনকোডিং ফিরে এসেছে। সমস্ত এনকোডিং হল কাঁচা অডিও বাইট যার কোনো শিরোনাম নেই, নীচে নির্দেশিত ছাড়া।

এনামস
ENCODING_UNSPECIFIED উল্লিখিত না. google.rpc.Code.INVALID_ARGUMENT ফলাফল প্রদান করবে।
LINEAR16 আনকম্প্রেসড 16-বিট স্বাক্ষরিত লিটল-এন্ডিয়ান নমুনা (লিনিয়ার পিসিএম)।
MP3 MP3 অডিও এনকোডিং। নমুনা হার পেলোডে এনকোড করা হয়।
OPUS_IN_OGG ওপাস-এনকোডেড অডিও একটি ogg পাত্রে মোড়ানো। ফলাফলটি হবে একটি ফাইল যা নেটিভভাবে অ্যান্ড্রয়েডে এবং কিছু ব্রাউজারে (যেমন ক্রোম) চালানো যেতে পারে। একই বিটরেট ব্যবহার করার সময় এনকোডিংয়ের গুণমান MP3 এর তুলনায় যথেষ্ট বেশি। নমুনা হার পেলোডে এনকোড করা হয়।

DebugConfig

বর্তমান অনুরোধের জন্য ডিবাগিং পরামিতি।

ক্ষেত্র
return_debug_info

bool

এই ক্ষেত্রটি সত্য হিসাবে সেট করা হলে, AssistResponsedebug_info ক্ষেত্রটি পপুলেট হতে পারে। যাইহোক, এটি উল্লেখযোগ্যভাবে প্রতিক্রিয়াগুলির বিলম্বিতা বৃদ্ধি করবে।

ডিবাগ তথ্য

বিকাশকারীর জন্য ডিবাগ তথ্য। return_debug_info সত্যে সেট করলেই কেবল ফেরত দেওয়া হয়।

ক্ষেত্র
aog_agent_to_assistant_json

string

Google সার্ভারে অ্যাকশন-অন-গুগল এজেন্ট থেকে আসল JSON প্রতিক্রিয়া। AppResponse দেখুন। অনুরোধ প্রস্তুতকারী AoG প্রকল্পের মালিক হলে এবং AoG প্রকল্পটি প্রিভিউ মোডে থাকলেই এটি পপুলেট করা হবে।

ডিভাইস অ্যাকশন

ব্যবহারকারী যদি একটি ডিভাইস অ্যাকশন ট্রিগার করে থাকে তবে প্রতিক্রিয়াটি ডিভাইসে ফিরে আসে। উদাহরণ স্বরূপ, একটি ডিভাইস যা ক্যোয়ারীটিকে সমর্থন করে আলো চালু করুন অনুরোধের শব্দার্থক সহ একটি JSON পেলোড সহ একটি DeviceAction পাবে৷

ক্ষেত্র
device_request_json

string

ট্রিগার করা ডিভাইস অ্যাকশন ব্যাকরণ থেকে জেনারেট করা ডিভাইস কমান্ডের প্রতিক্রিয়া ধারণকারী JSON। একটি প্রদত্ত বৈশিষ্ট্যের জন্য action.devices.EXECUTE অভিপ্রায় দ্বারা বিন্যাস দেওয়া হয়।

ডিভাইস কনফিগারেশন

প্রয়োজনীয় ক্ষেত্রগুলি যা সহকারীকে ডিভাইস সনাক্ত করে।

আরো দেখুন:

ক্ষেত্র
device_id

string

ডিভাইসের জন্য প্রয়োজনীয় অনন্য শনাক্তকারী। আইডি দৈর্ঘ্য 128 অক্ষর বা তার কম হতে হবে। উদাহরণ: DBCDW098234। এটি অবশ্যই ডিভাইস রেজিস্ট্রেশন থেকে প্রত্যাবর্তিত device_id এর সাথে মেলে। এই ডিভাইস_আইডিটি ব্যবহারকারীর নিবন্ধিত ডিভাইসের সাথে মেলে এই ডিভাইসের সমর্থিত বৈশিষ্ট্য এবং ক্ষমতাগুলি সন্ধান করতে ব্যবহার করা হয়৷ ডিভাইস রিবুট জুড়ে এই তথ্য পরিবর্তন করা উচিত নয়। যাইহোক, এটি ফ্যাক্টরি-ডিফল্ট রিসেট জুড়ে সংরক্ষণ করা উচিত নয়।

device_model_id

string

ডিভাইস মডেলের জন্য প্রয়োজনীয় অনন্য শনাক্তকারী। device_model_id এবং device_id এর সংমিশ্রণ অবশ্যই আগে ডিভাইস নিবন্ধনের মাধ্যমে যুক্ত থাকতে হবে।

ডিভাইসের অবস্থান

অবস্থানের তিনটি উৎস আছে। তারা এই অগ্রাধিকার সঙ্গে ব্যবহার করা হয়:

  1. এই DeviceLocation , যা প্রাথমিকভাবে জিপিএস সহ মোবাইল ডিভাইসের জন্য ব্যবহৃত হয়।
  2. ডিভাইস সেটআপের সময় ব্যবহারকারীর দ্বারা নির্দিষ্ট অবস্থান; এটি প্রতি ব্যবহারকারী, প্রতি ডিভাইস। DeviceLocation নির্দিষ্ট না থাকলে এই অবস্থানটি ব্যবহার করা হয়৷
  3. IP ঠিকানার উপর ভিত্তি করে অনুমানকৃত অবস্থান। উপরের কোনটি নির্দিষ্ট না থাকলেই এটি ব্যবহার করা হয়।
ক্ষেত্র
coordinates

LatLng

ডিভাইসের অক্ষাংশ এবং দ্রাঘিমাংশ।

ডায়ালগ স্টেটইন

বর্তমান ডায়ালগ অবস্থা সম্পর্কে তথ্য প্রদান করে।

ক্ষেত্র
conversation_state

bytes

প্রয়োজনীয় এই ক্ষেত্রটিকে সর্বদা DialogStateOut.conversation_state মানতে সেট করতে হবে যা পূর্বের Assist RPC তে ফেরত দেওয়া হয়েছিল। এটি শুধুমাত্র বাদ দেওয়া উচিত (ক্ষেত্র সেট করা নেই) যদি পূর্বে কোনো Assist RPC না থাকে কারণ এটি প্রথম সেটআপ এবং/অথবা ফ্যাক্টরি-ডিফল্ট রিসেট হওয়ার পরে এই ডিভাইসের দ্বারা তৈরি করা প্রথম Assist RPC।

language_code

string

IETF BCP 47 সিনট্যাক্সে অনুরোধের প্রয়োজনীয় ভাষা (উদাহরণস্বরূপ, "en-US")। আরও তথ্যের জন্য ভাষা সমর্থন দেখুন। আপনি যদি আপনার ফোনের Google অ্যাসিস্ট্যান্ট অ্যাপের সেটিংস মেনু ব্যবহার করে এই device_id এর জন্য একটি ভাষা নির্বাচন করেন, তাহলে সেই নির্বাচনটি এই মানটিকে ওভাররাইড করবে।

device_location

DeviceLocation

ডিভাইসের ঐচ্ছিক অবস্থান যেখানে কোয়েরিটি শুরু হয়েছে।

is_new_conversation

bool

ঐচ্ছিক যদি সত্য হয়, সার্ভার অনুরোধটিকে একটি নতুন কথোপকথন হিসাবে বিবেচনা করবে এবং পূর্বের অনুরোধ থেকে রাজ্য ব্যবহার করবে না। যখন কথোপকথন পুনরায় আরম্ভ করা উচিত তখন এই ক্ষেত্রটিকে সত্য হিসাবে সেট করুন, যেমন একটি ডিভাইস রিবুট করার পরে, বা পূর্বের ক্যোয়ারী থেকে উল্লেখযোগ্য সময়ের পরে।

ডায়ালগস্টেটআউট

ব্যবহারকারীর প্রশ্নের ফলে ডায়ালগ অবস্থা। এই বার্তা একাধিক প্রাপ্ত হতে পারে.

ক্ষেত্র
supplemental_display_text

string

সহকারী থেকে শুধুমাত্র আউটপুট পরিপূরক প্রদর্শন পাঠ্য। এটি AssistResponse.audio_out এ বলা বক্তৃতার মতোই হতে পারে বা এটি কিছু অতিরিক্ত তথ্য হতে পারে যা ব্যবহারকারীর বোঝার ক্ষেত্রে সহায়তা করে৷

conversation_state

bytes

পরবর্তী Assist RPC-এর জন্য শুধুমাত্র আউটপুট স্টেট তথ্য। এই মানটি ক্লায়েন্টে সংরক্ষণ করা উচিত এবং পরবর্তী Assist RPC-এর সাথে DialogStateIn.conversation_state ফিল্ডে ফেরত দেওয়া উচিত। (ক্লায়েন্টকে এই মানটি ব্যাখ্যা করার বা অন্যথায় ব্যবহার করার প্রয়োজন নেই।) এই তথ্যটি ডিভাইস রিবুট জুড়ে সংরক্ষণ করা উচিত। যাইহোক, ফ্যাক্টরি-ডিফল্ট রিসেটের সময় এই মানটি সাফ করা উচিত (ক্লায়েন্টে সংরক্ষিত নয়)।

microphone_mode

MicrophoneMode

এই Assist RPC প্রসেস করার পরে শুধুমাত্র আউটপুট মাইক্রোফোনের মোড নির্দিষ্ট করে।

volume_percentage

int32

শুধুমাত্র আউটপুট আপডেট ভলিউম স্তর. মানটি 0 বা বাদ দেওয়া হবে (কোনও পরিবর্তন নির্দেশ করে না) যদি না একটি ভয়েস কমান্ড যেমন ভলিউম বৃদ্ধি বা সেট ভলিউম স্তর 4 স্বীকৃত না হয়, সেক্ষেত্রে মানটি 1 থেকে 100 এর মধ্যে হবে (1% এর নতুন ভলিউম স্তরের সাথে সম্পর্কিত 100% পর্যন্ত)। সাধারণত, audio_out ডেটা চালানোর সময় একজন ক্লায়েন্টের এই ভলিউম স্তরটি ব্যবহার করা উচিত এবং এই মানটিকে বর্তমান ভলিউম স্তর হিসাবে ধরে রাখা উচিত এবং পরবর্তী AssistRequest এর AudioOutConfig এ সরবরাহ করা উচিত। (কিছু ক্লায়েন্ট বর্তমান ভলিউম স্তর পরিবর্তন করার অনুমতি দেওয়ার জন্য অন্যান্য উপায়গুলিও প্রয়োগ করতে পারে, উদাহরণস্বরূপ, একটি নব প্রদান করে যা ব্যবহারকারী ঘুরতে পারে।)

মাইক্রোফোন মোড

Assist RPC সম্পূর্ণ হওয়ার পর মাইক্রোফোনের সম্ভাব্য অবস্থা।

এনামস
MICROPHONE_MODE_UNSPECIFIED কোন মোড নির্দিষ্ট করা নেই.
CLOSE_MICROPHONE পরিষেবাটি ব্যবহারকারীর কাছ থেকে একটি ফলো-অন প্রশ্ন আশা করছে না। ব্যবহারকারী এটিকে পুনরায় সক্রিয় না করা পর্যন্ত মাইক্রোফোনটি বন্ধ থাকা উচিত।
DIALOG_FOLLOW_ON পরিষেবাটি ব্যবহারকারীর কাছ থেকে একটি ফলো-অন প্রশ্ন আশা করছে। AudioOut প্লেব্যাক সম্পূর্ণ হলে মাইক্রোফোনটি পুনরায় খোলা উচিত (নতুন অডিও পাঠানোর জন্য একটি নতুন Assist RPC কল শুরু করে)।

স্ক্রিন আউট

কোয়েরির জন্য সহকারীর ভিজ্যুয়াল আউটপুট প্রতিক্রিয়া। screen_out_config দ্বারা সক্ষম।

ক্ষেত্র
format

Format

আউটপুট-শুধুমাত্র প্রদত্ত স্ক্রীন ডেটার বিন্যাস।

data

bytes

শুধুমাত্র-আউটপুট সহকারী কোয়েরির ফলাফল হিসাবে প্রদর্শিত কাঁচা স্ক্রীন ডেটা।

বিন্যাস

স্ক্রীন ডেটার সম্ভাব্য বিন্যাস।

এনামস
FORMAT_UNSPECIFIED কোন বিন্যাস নির্দিষ্ট করা নেই.
HTML ডেটাতে UTF-8 এ এনকোড করা একটি সম্পূর্ণরূপে গঠিত HTML5 লেআউট থাকবে, যেমন <html><body><div>...</div></body></html> । এটি অডিও প্রতিক্রিয়া সহ রেন্ডার করার উদ্দেশ্যে করা হয়েছে৷ মনে রাখবেন যে HTML5 ডকটাইপ প্রকৃত HTML ডেটাতে অন্তর্ভুক্ত করা উচিত।

ScreenOutConfig

যখন এটি screen_out প্রতিক্রিয়া প্রদান করে তখন সার্ভার ব্যবহার করার জন্য পছন্দসই বিন্যাসটি নির্দিষ্ট করে।

ক্ষেত্র
screen_mode

ScreenMode

ক্যোয়ারী ইস্যু করার সময় ডিভাইসের জন্য বর্তমান ভিজ্যুয়াল স্ক্রীন-মোড।

স্ক্রীন মোডে

ডিভাইসে ভিজ্যুয়াল স্ক্রীন-আউটপুটের জন্য সম্ভাব্য মোড।

এনামস
SCREEN_MODE_UNSPECIFIED কোনো ভিডিও মোড নির্দিষ্ট করা নেই। সহকারী OFF মোডে সাড়া দিতে পারে।
OFF স্ক্রীন বন্ধ (বা উজ্জ্বলতা বা অন্যান্য সেটিংস এত কম সেট করা আছে যে এটি দৃশ্যমান নয়)। সহকারী সাধারণত এই মোডে একটি স্ক্রীন প্রতিক্রিয়া ফেরত দেবে না।
PLAYING সহায়ক সাধারণত এই মোডে একটি আংশিক-স্ক্রীন প্রতিক্রিয়া প্রদান করবে।

বক্তৃতা স্বীকৃতির ফলাফল

ব্যবহারকারীর দ্বারা বলা একটি বাক্যাংশের আনুমানিক প্রতিলিপি। এটি একটি একক অংশ বা ব্যবহারকারীর কথ্য প্রশ্নের সম্পূর্ণ অনুমান হতে পারে৷

ক্ষেত্র
transcript

string

আউটপুট-শুধু ট্রান্সক্রিপ্ট টেক্সট ব্যবহারকারী যে শব্দগুলি বলেছেন তা প্রতিনিধিত্ব করে৷

stability

float

শুধুমাত্র আউটপুট এই ফলাফল সম্পর্কে সহায়ক তার অনুমান পরিবর্তন করবে না এমন সম্ভাবনার একটি অনুমান। মান 0.0 (সম্পূর্ণভাবে অস্থির) থেকে 1.0 (সম্পূর্ণ স্থিতিশীল এবং চূড়ান্ত) পর্যন্ত। 0.0 এর ডিফল্ট হল একটি সেন্টিনেল মান যা নির্দেশ করে যে stability সেট করা হয়নি।