সূচক
-
EmbeddedAssistant
(ইন্টারফেস) -
AssistConfig
(বার্তা) -
AssistRequest
(বার্তা) -
AssistResponse
(বার্তা) -
AssistResponse.EventType
(enum) -
AudioInConfig
(বার্তা) -
AudioInConfig.Encoding
(enum) -
AudioOut
(বার্তা) -
AudioOutConfig
(বার্তা) -
AudioOutConfig.Encoding
(enum) -
DebugConfig
(বার্তা) -
DebugInfo
(বার্তা) -
DeviceAction
(বার্তা) -
DeviceConfig
(বার্তা) -
DeviceLocation
(বার্তা) -
DialogStateIn
(বার্তা) -
DialogStateOut
(বার্তা) -
DialogStateOut.MicrophoneMode
(enum) -
ScreenOut
(বার্তা) -
ScreenOut.Format
(enum) -
ScreenOutConfig
(বার্তা) -
ScreenOutConfig.ScreenMode
(enum) -
SpeechRecognitionResult
(বার্তা)
এমবেডেড অ্যাসিস্ট্যান্ট
পরিষেবা যা Google সহকারী API প্রয়োগ করে।
সহায়তা করুন | |
---|---|
এমবেড করা সহকারী পরিষেবার সাথে কথোপকথন শুরু করে বা চালিয়ে যায়। প্রতিটি কল একটি রাউন্ড-ট্রিপ সঞ্চালন করে, পরিষেবাতে একটি অডিও অনুরোধ পাঠায় এবং অডিও প্রতিক্রিয়া গ্রহণ করে। অডিও পাঠানোর সময় একটি কথোপকথন হল এক বা একাধিক জিআরপিসি সংযোগ, প্রতিটিতে একাধিক স্ট্রিম করা অনুরোধ এবং প্রতিক্রিয়া থাকে। উদাহরণস্বরূপ, ব্যবহারকারী বলে আমার কেনাকাটার তালিকায় যোগ করুন এবং সহকারী উত্তর দেয় আপনি কী যোগ করতে চান? . প্রথম gRPC বার্তায় স্ট্রিম করা অনুরোধ এবং প্রতিক্রিয়াগুলির ক্রম হতে পারে:
ব্যবহারকারী তখন ব্যাগেল বলেন এবং সহকারী উত্তর দেয় ঠিক আছে, আমি আপনার কেনাকাটার তালিকায় ব্যাগেল যোগ করেছি । এটিকে
যদিও প্রতিক্রিয়াগুলির সুনির্দিষ্ট ক্রম নিশ্চিত করা হয় না, অনুক্রমিক
|
AssistConfig
কিভাবে AssistRequest
বার্তাগুলি প্রক্রিয়া করতে হয় তা নির্দিষ্ট করে।
ক্ষেত্র | ||
---|---|---|
audio_out_config | প্রয়োজনীয় অডিওটি কীভাবে ফরম্যাট করতে হবে তা নির্দিষ্ট করে যা ফেরত দেওয়া হবে। | |
screen_out_config | ঐচ্ছিক যখন সার্ভার একটি ভিজ্যুয়াল স্ক্রীন প্রতিক্রিয়া প্রদান করে তখন ব্যবহার করার জন্য পছন্দসই বিন্যাসটি নির্দিষ্ট করে৷ | |
dialog_state_in | প্রয়োজনীয় বর্তমান ডায়ালগ অবস্থার প্রতিনিধিত্ব করে। | |
device_config | ডিভাইস কনফিগারেশন যা একটি নির্দিষ্ট ডিভাইসকে স্বতন্ত্রভাবে সনাক্ত করে। | |
debug_config | সম্পূর্ণ | |
ইউনিয়ন ক্ষেত্রের | ||
audio_in_config | পরবর্তী ইনকামিং অডিও কিভাবে প্রক্রিয়া করতে হবে তা নির্দিষ্ট করে। পরবর্তী অনুরোধে | |
text_query | সহকারীকে পাঠানোর জন্য টেক্সট ইনপুট। অডিও ইনপুট উপলব্ধ না হলে এটি একটি পাঠ্য ইন্টারফেস থেকে পপুলেট করা যেতে পারে। |
সহায়তার অনুরোধ
ক্লায়েন্ট কর্তৃক প্রেরিত শীর্ষ-স্তরের বার্তা। ক্লায়েন্টদের অবশ্যই কমপক্ষে দুটি এবং সাধারণত অসংখ্য AssistRequest
বার্তা পাঠাতে হবে। প্রথম বার্তাটিতে অবশ্যই একটি config
বার্তা থাকতে হবে এবং এতে audio_in
ডেটা থাকা উচিত নয়৷ সমস্ত পরবর্তী বার্তাগুলিতে audio_in
ডেটা থাকতে হবে এবং একটি config
বার্তা থাকা উচিত নয়৷
ক্ষেত্র | ||
---|---|---|
ইউনিয়ন ক্ষেত্রের type । প্রতিটি AssistRequest এ এই ক্ষেত্রগুলির মধ্যে একটি নির্দিষ্ট করা আবশ্যক। type নিম্নলিখিতগুলির মধ্যে একটি হতে পারে: | ||
config | | |
audio_in | অডিও তথ্য স্বীকৃত হবে. অডিও ডেটার অনুক্রমিক অংশগুলি অনুক্রমিক |
সহায়তার প্রতিক্রিয়া
ক্লায়েন্ট দ্বারা প্রাপ্ত শীর্ষ-স্তরের বার্তা। এক বা একাধিক AssistResponse
বার্তার একটি সিরিজ ক্লায়েন্টের কাছে ফেরত পাঠানো হয়।
ক্ষেত্র | |
---|---|
event_type | শুধুমাত্র আউটপুট ইভেন্টের ধরন নির্দেশ করে। |
audio_out | আউটপুট-শুধুমাত্র অডিও যেটিতে সহকারীর প্রশ্নের উত্তর রয়েছে। |
screen_out | আউটপুট-এ কেবলমাত্র কোয়েরিতে সহকারীর ভিজ্যুয়াল প্রতিক্রিয়া রয়েছে। |
device_action | আউটপুট শুধুমাত্র উপযুক্ত পেলোড এবং শব্দার্থিক পার্সিং সহ ক্যোয়ারী দ্বারা ট্রিগার করা ক্রিয়া ধারণ করে। |
speech_results[] | শুধুমাত্র আউটপুট এই পুনরাবৃত্ত তালিকায় শূন্য বা তার বেশি স্পিচ রিকগনিশন ফলাফল রয়েছে যা বর্তমানে প্রক্রিয়া করা হচ্ছে এমন অডিওর ধারাবাহিক অংশের সাথে মিলে যায়, যা সবচেয়ে সাম্প্রতিক অডিওর সাথে সম্পর্কিত অংশের সাথে প্রারম্ভিক অডিও (এবং সবচেয়ে স্থিতিশীল অংশ) এর সাথে সম্পর্কিত অংশ থেকে শুরু করে। সম্পূর্ণ ইন-প্রোগ্রেস প্রতিক্রিয়া দেখতে স্ট্রিংগুলিকে সংযুক্ত করা যেতে পারে। বক্তৃতা শনাক্তকরণ সম্পূর্ণ হলে, এই তালিকায় |
dialog_state_out | শুধুমাত্র-আউটপুট ব্যবহারকারীর প্রশ্নের সাথে সম্পর্কিত আউটপুট ধারণ করে। |
debug_info | ডেভেলপারের জন্য শুধুমাত্র আউটপুট ডিবাগিং তথ্য। |
ইভেন্টের ধরণ
ইভেন্টের ধরন নির্দেশ করে।
এনামস | |
---|---|
EVENT_TYPE_UNSPECIFIED | কোনো ইভেন্ট উল্লেখ করা হয়নি। |
END_OF_UTTERANCE | এই ইভেন্টটি নির্দেশ করে যে সার্ভার ব্যবহারকারীর বক্তৃতা উচ্চারণের সমাপ্তি সনাক্ত করেছে এবং কোন অতিরিক্ত বক্তৃতা আশা করে না। অতএব, সার্ভার অতিরিক্ত অডিও প্রক্রিয়া করবে না (যদিও এটি পরবর্তীতে অতিরিক্ত ফলাফল দিতে পারে)। ক্লায়েন্টের অতিরিক্ত অডিও ডেটা পাঠানো বন্ধ করা উচিত, gRPC সংযোগ অর্ধেক বন্ধ করা উচিত, এবং সার্ভার gRPC সংযোগ বন্ধ না করা পর্যন্ত কোনো অতিরিক্ত ফলাফলের জন্য অপেক্ষা করুন। |
AudioInConfig
পরবর্তী অনুরোধে সরবরাহ করা audio_in
ডেটা কীভাবে প্রক্রিয়া করবেন তা নির্দিষ্ট করে। প্রস্তাবিত সেটিংসের জন্য, Google সহকারী SDK সেরা অনুশীলনগুলি দেখুন।
ক্ষেত্র | |
---|---|
encoding | সমস্ত |
sample_rate_hertz | সমস্ত |
এনকোডিং
অডিও বার্তায় পাঠানো ডেটার অডিও এনকোডিং। অডিও অবশ্যই এক-চ্যানেল (মনো) হতে হবে।
এনামস | |
---|---|
ENCODING_UNSPECIFIED | উল্লিখিত না. google.rpc.Code.INVALID_ARGUMENT ফলাফল প্রদান করবে। |
LINEAR16 | আনকম্প্রেসড 16-বিট স্বাক্ষরিত লিটল-এন্ডিয়ান নমুনা (লিনিয়ার পিসিএম)। এই এনকোডিং কোন শিরোনাম, শুধুমাত্র কাঁচা অডিও বাইট অন্তর্ভুক্ত. |
FLAC | FLAC (ফ্রি লসলেস অডিও কোডেক) হল প্রস্তাবিত এনকোডিং কারণ এটি ক্ষতিহীন--অতএব স্বীকৃতি আপস করা হয় না--এবং LINEAR16 এর প্রায় অর্ধেক ব্যান্ডউইথের প্রয়োজন। এই এনকোডিংয়ে অডিও ডেটার পরে FLAC স্ট্রিম হেডার অন্তর্ভুক্ত রয়েছে। এটি 16-বিট এবং 24-বিট নমুনা সমর্থন করে, তবে, STREAMINFO এর সমস্ত ক্ষেত্র সমর্থিত নয়। |
অডিওআউট
কোয়েরিতে সহকারীর প্রতিক্রিয়া ধারণকারী অডিও। অডিও ডেটার ক্রমিক খণ্ডগুলি অনুক্রমিক AssistResponse
বার্তাগুলিতে প্রাপ্ত হয়।
ক্ষেত্র | |
---|---|
audio_data | আউটপুট-শুধুমাত্র অডিও ডেটা যেখানে সহকারীর প্রশ্নের উত্তর রয়েছে৷ অডিও ডেটার ক্রমিক খণ্ডগুলি অনুক্রমিক |
AudioOutConfig
যখন এটি audio_out
বার্তা ফেরত দেয় তখন সার্ভার ব্যবহার করার জন্য পছন্দসই বিন্যাসটি নির্দিষ্ট করে।
ক্ষেত্র | |
---|---|
encoding | প্রয়োজনীয় অডিও ডেটার এনকোডিং সমস্ত |
sample_rate_hertz | প্রয়োজনীয় |
volume_percentage | ডিভাইসের অডিও আউটপুটের বর্তমান ভলিউম সেটিং প্রয়োজন । বৈধ মান হল 1 থেকে 100 (1% থেকে 100% অনুরূপ)। |
এনকোডিং
অডিও বার্তায় ডেটার অডিও এনকোডিং ফিরে এসেছে। সমস্ত এনকোডিং হল কাঁচা অডিও বাইট যার কোনো শিরোনাম নেই, নীচে নির্দেশিত ছাড়া।
এনামস | |
---|---|
ENCODING_UNSPECIFIED | উল্লিখিত না. google.rpc.Code.INVALID_ARGUMENT ফলাফল প্রদান করবে। |
LINEAR16 | আনকম্প্রেসড 16-বিট স্বাক্ষরিত লিটল-এন্ডিয়ান নমুনা (লিনিয়ার পিসিএম)। |
MP3 | MP3 অডিও এনকোডিং। নমুনা হার পেলোডে এনকোড করা হয়। |
OPUS_IN_OGG | ওপাস-এনকোডেড অডিও একটি ogg পাত্রে মোড়ানো। ফলাফলটি হবে একটি ফাইল যা নেটিভভাবে অ্যান্ড্রয়েডে এবং কিছু ব্রাউজারে (যেমন ক্রোম) চালানো যেতে পারে। একই বিটরেট ব্যবহার করার সময় এনকোডিংয়ের গুণমান MP3 এর তুলনায় যথেষ্ট বেশি। নমুনা হার পেলোডে এনকোড করা হয়। |
DebugConfig
বর্তমান অনুরোধের জন্য ডিবাগিং পরামিতি।
ক্ষেত্র | |
---|---|
return_debug_info | এই ক্ষেত্রটি সত্য হিসাবে সেট করা হলে, |
ডিবাগ তথ্য
বিকাশকারীর জন্য ডিবাগ তথ্য। return_debug_info
সত্যে সেট করলেই কেবল ফেরত দেওয়া হয়।
ক্ষেত্র | |
---|---|
aog_agent_to_assistant_json | Google সার্ভারে অ্যাকশন-অন-গুগল এজেন্ট থেকে আসল JSON প্রতিক্রিয়া। AppResponse দেখুন। অনুরোধ প্রস্তুতকারী AoG প্রকল্পের মালিক হলে এবং AoG প্রকল্পটি প্রিভিউ মোডে থাকলেই এটি পপুলেট করা হবে। |
ডিভাইস অ্যাকশন
ব্যবহারকারী যদি একটি ডিভাইস অ্যাকশন ট্রিগার করে থাকে তবে প্রতিক্রিয়াটি ডিভাইসে ফিরে আসে। উদাহরণ স্বরূপ, একটি ডিভাইস যা ক্যোয়ারীটিকে সমর্থন করে আলো চালু করুন অনুরোধের শব্দার্থক সহ একটি JSON পেলোড সহ একটি DeviceAction
পাবে৷
ক্ষেত্র | |
---|---|
device_request_json | ট্রিগার করা ডিভাইস অ্যাকশন ব্যাকরণ থেকে জেনারেট করা ডিভাইস কমান্ডের প্রতিক্রিয়া ধারণকারী JSON। একটি প্রদত্ত বৈশিষ্ট্যের জন্য |
ডিভাইস কনফিগারেশন
প্রয়োজনীয় ক্ষেত্রগুলি যা সহকারীকে ডিভাইস সনাক্ত করে।
আরো দেখুন:
ক্ষেত্র | |
---|---|
device_id | ডিভাইসের জন্য প্রয়োজনীয় অনন্য শনাক্তকারী। আইডি দৈর্ঘ্য 128 অক্ষর বা তার কম হতে হবে। উদাহরণ: DBCDW098234। এটি অবশ্যই ডিভাইস রেজিস্ট্রেশন থেকে প্রত্যাবর্তিত device_id এর সাথে মেলে। এই ডিভাইস_আইডিটি ব্যবহারকারীর নিবন্ধিত ডিভাইসের সাথে মেলে এই ডিভাইসের সমর্থিত বৈশিষ্ট্য এবং ক্ষমতাগুলি সন্ধান করতে ব্যবহার করা হয়৷ ডিভাইস রিবুট জুড়ে এই তথ্য পরিবর্তন করা উচিত নয়। যাইহোক, এটি ফ্যাক্টরি-ডিফল্ট রিসেট জুড়ে সংরক্ষণ করা উচিত নয়। |
device_model_id | ডিভাইস মডেলের জন্য প্রয়োজনীয় অনন্য শনাক্তকারী। device_model_id এবং device_id এর সংমিশ্রণ অবশ্যই আগে ডিভাইস নিবন্ধনের মাধ্যমে যুক্ত থাকতে হবে। |
ডিভাইসের অবস্থান
অবস্থানের তিনটি উৎস আছে। তারা এই অগ্রাধিকার সঙ্গে ব্যবহার করা হয়:
- এই
DeviceLocation
, যা প্রাথমিকভাবে জিপিএস সহ মোবাইল ডিভাইসের জন্য ব্যবহৃত হয়। - ডিভাইস সেটআপের সময় ব্যবহারকারীর দ্বারা নির্দিষ্ট অবস্থান; এটি প্রতি ব্যবহারকারী, প্রতি ডিভাইস।
DeviceLocation
নির্দিষ্ট না থাকলে এই অবস্থানটি ব্যবহার করা হয়৷ - IP ঠিকানার উপর ভিত্তি করে অনুমানকৃত অবস্থান। উপরের কোনটি নির্দিষ্ট না থাকলেই এটি ব্যবহার করা হয়।
ক্ষেত্র | |
---|---|
coordinates | ডিভাইসের অক্ষাংশ এবং দ্রাঘিমাংশ। |
ডায়ালগ স্টেটইন
বর্তমান ডায়ালগ অবস্থা সম্পর্কে তথ্য প্রদান করে।
ক্ষেত্র | |
---|---|
conversation_state | প্রয়োজনীয় এই ক্ষেত্রটিকে সর্বদা |
language_code | IETF BCP 47 সিনট্যাক্সে অনুরোধের প্রয়োজনীয় ভাষা (উদাহরণস্বরূপ, "en-US")। আরও তথ্যের জন্য ভাষা সমর্থন দেখুন। আপনি যদি আপনার ফোনের Google অ্যাসিস্ট্যান্ট অ্যাপের সেটিংস মেনু ব্যবহার করে এই |
device_location | ডিভাইসের ঐচ্ছিক অবস্থান যেখানে কোয়েরিটি শুরু হয়েছে। |
is_new_conversation | ঐচ্ছিক যদি সত্য হয়, সার্ভার অনুরোধটিকে একটি নতুন কথোপকথন হিসাবে বিবেচনা করবে এবং পূর্বের অনুরোধ থেকে রাজ্য ব্যবহার করবে না। যখন কথোপকথন পুনরায় আরম্ভ করা উচিত তখন এই ক্ষেত্রটিকে সত্য হিসাবে সেট করুন, যেমন একটি ডিভাইস রিবুট করার পরে, বা পূর্বের ক্যোয়ারী থেকে উল্লেখযোগ্য সময়ের পরে। |
ডায়ালগস্টেটআউট
ব্যবহারকারীর প্রশ্নের ফলে ডায়ালগ অবস্থা। এই বার্তা একাধিক প্রাপ্ত হতে পারে.
ক্ষেত্র | |
---|---|
supplemental_display_text | সহকারী থেকে শুধুমাত্র আউটপুট পরিপূরক প্রদর্শন পাঠ্য। এটি |
conversation_state | পরবর্তী |
microphone_mode | এই |
volume_percentage | শুধুমাত্র আউটপুট আপডেট ভলিউম স্তর. মানটি 0 বা বাদ দেওয়া হবে (কোনও পরিবর্তন নির্দেশ করে না) যদি না একটি ভয়েস কমান্ড যেমন ভলিউম বৃদ্ধি বা সেট ভলিউম স্তর 4 স্বীকৃত না হয়, সেক্ষেত্রে মানটি 1 থেকে 100 এর মধ্যে হবে (1% এর নতুন ভলিউম স্তরের সাথে সম্পর্কিত 100% পর্যন্ত)। সাধারণত, |
মাইক্রোফোন মোড
Assist
RPC সম্পূর্ণ হওয়ার পর মাইক্রোফোনের সম্ভাব্য অবস্থা।
এনামস | |
---|---|
MICROPHONE_MODE_UNSPECIFIED | কোন মোড নির্দিষ্ট করা নেই. |
CLOSE_MICROPHONE | পরিষেবাটি ব্যবহারকারীর কাছ থেকে একটি ফলো-অন প্রশ্ন আশা করছে না। ব্যবহারকারী এটিকে পুনরায় সক্রিয় না করা পর্যন্ত মাইক্রোফোনটি বন্ধ থাকা উচিত। |
DIALOG_FOLLOW_ON | পরিষেবাটি ব্যবহারকারীর কাছ থেকে একটি ফলো-অন প্রশ্ন আশা করছে। AudioOut প্লেব্যাক সম্পূর্ণ হলে মাইক্রোফোনটি পুনরায় খোলা উচিত (নতুন অডিও পাঠানোর জন্য একটি নতুন Assist RPC কল শুরু করে)। |
স্ক্রিন আউট
কোয়েরির জন্য সহকারীর ভিজ্যুয়াল আউটপুট প্রতিক্রিয়া। screen_out_config
দ্বারা সক্ষম।
ক্ষেত্র | |
---|---|
format | আউটপুট-শুধুমাত্র প্রদত্ত স্ক্রীন ডেটার বিন্যাস। |
data | শুধুমাত্র-আউটপুট সহকারী কোয়েরির ফলাফল হিসাবে প্রদর্শিত কাঁচা স্ক্রীন ডেটা। |
বিন্যাস
স্ক্রীন ডেটার সম্ভাব্য বিন্যাস।
এনামস | |
---|---|
FORMAT_UNSPECIFIED | কোন বিন্যাস নির্দিষ্ট করা নেই. |
HTML | ডেটাতে UTF-8 এ এনকোড করা একটি সম্পূর্ণরূপে গঠিত HTML5 লেআউট থাকবে, যেমন <html><body><div>...</div></body></html> । এটি অডিও প্রতিক্রিয়া সহ রেন্ডার করার উদ্দেশ্যে করা হয়েছে৷ মনে রাখবেন যে HTML5 ডকটাইপ প্রকৃত HTML ডেটাতে অন্তর্ভুক্ত করা উচিত। |
ScreenOutConfig
যখন এটি screen_out
প্রতিক্রিয়া প্রদান করে তখন সার্ভার ব্যবহার করার জন্য পছন্দসই বিন্যাসটি নির্দিষ্ট করে।
ক্ষেত্র | |
---|---|
screen_mode | ক্যোয়ারী ইস্যু করার সময় ডিভাইসের জন্য বর্তমান ভিজ্যুয়াল স্ক্রীন-মোড। |
স্ক্রীন মোডে
ডিভাইসে ভিজ্যুয়াল স্ক্রীন-আউটপুটের জন্য সম্ভাব্য মোড।
এনামস | |
---|---|
SCREEN_MODE_UNSPECIFIED | কোনো ভিডিও মোড নির্দিষ্ট করা নেই। সহকারী OFF মোডে সাড়া দিতে পারে। |
OFF | স্ক্রীন বন্ধ (বা উজ্জ্বলতা বা অন্যান্য সেটিংস এত কম সেট করা আছে যে এটি দৃশ্যমান নয়)। সহকারী সাধারণত এই মোডে একটি স্ক্রীন প্রতিক্রিয়া ফেরত দেবে না। |
PLAYING | সহায়ক সাধারণত এই মোডে একটি আংশিক-স্ক্রীন প্রতিক্রিয়া প্রদান করবে। |
বক্তৃতা স্বীকৃতির ফলাফল
ব্যবহারকারীর দ্বারা বলা একটি বাক্যাংশের আনুমানিক প্রতিলিপি। এটি একটি একক অংশ বা ব্যবহারকারীর কথ্য প্রশ্নের সম্পূর্ণ অনুমান হতে পারে৷
ক্ষেত্র | |
---|---|
transcript | আউটপুট-শুধু ট্রান্সক্রিপ্ট টেক্সট ব্যবহারকারী যে শব্দগুলি বলেছেন তা প্রতিনিধিত্ব করে৷ |
stability | শুধুমাত্র আউটপুট এই ফলাফল সম্পর্কে সহায়ক তার অনুমান পরিবর্তন করবে না এমন সম্ভাবনার একটি অনুমান। মান 0.0 (সম্পূর্ণভাবে অস্থির) থেকে 1.0 (সম্পূর্ণ স্থিতিশীল এবং চূড়ান্ত) পর্যন্ত। 0.0 এর ডিফল্ট হল একটি সেন্টিনেল মান যা নির্দেশ করে যে |