אינדקס
EmbeddedAssistant
(ממשק)AssistConfig
(מֶסֶר)AssistRequest
(מֶסֶר)AssistResponse
(מֶסֶר)AssistResponse.EventType
(טיפוסים בני מנייה)AudioInConfig
(מֶסֶר)AudioInConfig.Encoding
(טיפוסים בני מנייה)AudioOut
(מֶסֶר)AudioOutConfig
(מֶסֶר)AudioOutConfig.Encoding
(טיפוסים בני מנייה)DebugConfig
(מֶסֶר)DebugInfo
(מֶסֶר)DeviceAction
(מֶסֶר)DeviceConfig
(מֶסֶר)DeviceLocation
(מֶסֶר)DialogStateIn
(מֶסֶר)DialogStateOut
(מֶסֶר)DialogStateOut.MicrophoneMode
(טיפוסים בני מנייה)ScreenOut
(מֶסֶר)ScreenOut.Format
(טיפוסים בני מנייה)ScreenOutConfig
(מֶסֶר)ScreenOutConfig.ScreenMode
(טיפוסים בני מנייה)SpeechRecognitionResult
(מֶסֶר)
EmbeddedAssistant
שירות שמטמיע את Google Assistant API.
אסיסט | |
---|---|
מתחיל או ממשיך שיחה עם שירות Assistant המוטמע. כל שיחה מבצעת "הלוך ושוב" אחת, שולחת בקשת אודיו לשירות ומקבלת את תגובת האודיו. נעשה שימוש בסטרימינג דו-כיווני כדי לקבל תוצאות, כמו האירוע שיחה היא חיבור אחד או יותר ל-gRPC, שכל אחד מהם מכיל כמה בקשות ותגובות שמשודרות בסטרימינג. לדוגמה, המשתמש אומר Add to my shopping list (הוספה לרשימת הקניות) ו-Assistant משיב מה אתם רוצים להוסיף?. הרצף של הבקשות והתגובות שהועברו בסטרימינג בהודעת ה-gRPC הראשונה יכול להיות:
המשתמש אומר בייגלים ו-Assistant עונה אוקיי, הוספתי בייגלים לרשימת הקניות שלכם. ההודעה הזו נשלחת כקריאה נוספת לחיבור gRPC ל-method
למרות שהסדר המדויק של התשובות אינו מובטח, הודעות
|
AssistConfig
ההגדרה קובעת איך לעבד את ההודעות שנשלחו דרך AssistRequest
.
שדות | ||
---|---|---|
audio_out_config |
חובה מציין את הפורמט של האודיו שיוחזר. |
|
screen_out_config |
אופציונלי מציין את הפורמט הרצוי לשימוש כאשר השרת מחזיר תגובה חזותית של המסך. |
|
dialog_state_in |
חובה מייצג את המצב הנוכחי של תיבת הדו-שיח. |
|
device_config |
תצורת מכשיר שמאפשרת לזהות מכשיר ספציפי באופן ייחודי. |
|
debug_config |
אופציונלי פרמטרים של ניפוי באגים לכל ה-RPC |
|
שדה איחוד הערך של |
||
audio_in_config |
ההגדרה קובעת איך לעבד את הקלטות האודיו הנכנסות הבאות. נדרש אם הבקשות הבאות יסופקו |
|
text_query |
קלט הטקסט שיישלח אל Assistant. אפשר לאכלס אותו בממשק טקסט אם קלט אודיו לא זמין. |
AssistRequest
ההודעה ברמה העליונה שנשלחה על ידי הלקוח. לקוחות חייבים לשלוח לפחות שתיים, ולרוב מספר הודעות AssistRequest
. ההודעה הראשונה חייבת להכיל הודעת config
ולא יכולה להכיל נתונים מסוג audio_in
. כל ההודעות הבאות חייבות להכיל נתונים מסוג audio_in
ולא יכולות להכיל הודעת config
.
שדות | ||
---|---|---|
שדה איחוד type . בכל שדה AssistRequest יש לציין בדיוק אחד מהשדות האלה. הערך של type יכול להיות רק אחת מהאפשרויות הבאות: |
||
config |
ההודעה |
|
audio_in |
נתוני האודיו שיש לזהות. קטעים רציפים של נתוני אודיו נשלחים בהודעות |
AssistResponse
ההודעה ברמה העליונה שהתקבלה על ידי הלקוח. סדרה של הודעת AssistResponse
אחת או יותר משודרות בחזרה ללקוח.
שדות | |
---|---|
event_type |
פלט בלבד מציין את סוג האירוע. |
audio_out |
פלט בלבד: האודיו שמכיל את התשובה של Assistant לשאילתה. |
screen_out |
פלט בלבד מכיל את התגובה החזותית של ה-Assistant לשאילתה. |
device_action |
פלט בלבד מכיל את הפעולה שהופעלה על ידי השאילתה עם מטענים ייעודיים (payloads) וניתוח סמנטי מתאימים. |
speech_results[] |
פלט בלבד: רשימה חוזרת זו מכילה אפס תוצאות של זיהוי דיבור או יותר. תוצאות אלה תואמות לחלקים רצופים של האודיו שמעובדים כרגע, החל מהקטע התואם לאודיו המוקדם ביותר (והחלק היציב ביותר) לחלק שמתאים לאודיו העדכני ביותר. אפשר לשרשר את המחרוזות כדי להציג את התגובה המלאה שמתקבלת. כשזיהוי הדיבור יושלם, הרשימה תכיל פריט אחד עם |
dialog_state_out |
פלט בלבד מכיל פלט שקשור לשאילתת המשתמש. |
debug_info |
מידע על ניפוי באגים בפלט בלבד למפתחים. מוחזר רק אם הבקשה הגדירה את |
EventType
מציין את סוג האירוע.
טיפוסים בני מנייה (enums) | |
---|---|
EVENT_TYPE_UNSPECIFIED |
לא צוין אירוע. |
END_OF_UTTERANCE |
אירוע זה מציין שהשרת זיהה את סוף הדיבור של המשתמש ואינו מצפה לדיבור נוסף. לכן השרת לא יעבד אודיו נוסף (למרות שהוא עשוי להחזיר לאחר מכן תוצאות נוספות). הלקוח צריך להפסיק לשלוח נתוני אודיו נוספים, לסגור חלקית את חיבור ה-gRPC ולהמתין לתוצאות נוספות עד שהשרת סוגר את חיבור ה-gRPC. |
AudioInConfig
המדיניות קובעת איך לעבד את נתוני audio_in
שיסופקו בבקשות הבאות. ההגדרות המומלצות מופיעות בשיטות המומלצות של Google Assistant SDK.
שדות | |
---|---|
encoding |
נדרש קידוד של נתוני אודיו שנשלחים בכל ההודעות מסוג |
sample_rate_hertz |
קצב הדגימה הנדרש (בהרץ) של נתוני האודיו שנשלחו בכל ההודעות מסוג |
קידוד
קידוד האודיו של הנתונים שנשלחים בהודעת האודיו. האודיו חייב להיות בערוץ אחד (מונו).
טיפוסים בני מנייה (enums) | |
---|---|
ENCODING_UNSPECIFIED |
לא צוין. תחזיר את התוצאה google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
דגימות קטנות אנדיאניות חתומות של 16 ביט לא דחוסות (PPCM לינארי). הקידוד הזה לא כולל כותרת, אלא רק בייטים של אודיו גולמי. |
FLAC |
FLAC (קודק אודיו ללא אובדן נתונים) הוא הקידוד המומלץ כי הוא חסר אובדן--ולכן הזיהוי לא נפגע--מצריך רק כחצי מרוחב הפס של LINEAR16 . הקידוד הזה כולל את כותרת השידור FLAC ואחריה נתוני אודיו. הוא תומך בדוגמאות של 16 ביט ו-24 ביט, אבל לא כל השדות ב-STREAMINFO נתמכים. |
AudioOut
קטע האודיו שמכיל את התשובה של Assistant לשאילתה. קטעים רציפים של נתוני אודיו מתקבלים בהודעות AssistResponse
ברצף.
שדות | |
---|---|
audio_data |
פלט בלבד: נתוני האודיו שמכילים את התשובה של Assistant לשאילתה. קטעים רציפים של נתוני אודיו מתקבלים בהודעות |
AudioOutConfig
מפרט את הפורמט הרצוי שהשרת ישתמש בו כשמחזירים הודעות audio_out
.
שדות | |
---|---|
encoding |
חובה הקידוד של נתוני האודיו שיש להחזיר בכל ההודעות |
sample_rate_hertz |
חובה: תדירות הדגימה בהרץ של נתוני האודיו שהוחזרו בהודעות |
volume_percentage |
חובה: ההגדרה הנוכחית של עוצמת הקול לפלט האודיו של המכשיר. הערכים החוקיים הם 1 עד 100 (תואמים ל-1% עד 100%). |
קידוד
קידוד האודיו של הנתונים שהוחזרו בהודעת האודיו. כל הקידודים הם בייטים של אודיו גולמי ללא כותרת, למעט כפי שמצוין בהמשך.
טיפוסים בני מנייה (enums) | |
---|---|
ENCODING_UNSPECIFIED |
לא צוין. תחזיר את התוצאה google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
דגימות קטנות אנדיאניות חתומות של 16 ביט לא דחוסות (PPCM לינארי). |
MP3 |
קידוד אודיו MP3. קצב הדגימה מקודד במטען הייעודי (payload). |
OPUS_IN_OGG |
אודיו בקידוד אופוס ארוז בקונטיינר ogg. התוצאה תהיה קובץ שאפשר להפעיל באופן מקומי ב-Android ובדפדפנים מסוימים (כמו Chrome). איכות הקידוד גבוהה משמעותית מ-MP3 תוך שימוש באותו קצב העברת נתונים. קצב הדגימה מקודד במטען הייעודי (payload). |
DebugConfig
פרמטרים של ניפוי באגים לבקשה הנוכחית.
שדות | |
---|---|
return_debug_info |
אם השדה הזה מוגדר כ-True, ניתן לאכלס את השדה |
DebugInfo
מידע על תוצאות ניפוי הבאגים עבור המפתח. מוחזר רק אם הבקשה הגדירה את return_debug_info
כ-True.
שדות | |
---|---|
aog_agent_to_assistant_json |
תגובת ה-JSON המקורית מסוכן Action-on-Google לשרת של Google. למידע נוסף, ניתן לעיין בקטע AppResponse. השדה הזה יאוכלס רק אם יוצר הבקשות הוא הבעלים של פרויקט AoG ופרויקט AoG נמצא במצב תצוגה מקדימה. |
DeviceAction
התגובה הוחזרה למכשיר אם המשתמש הפעיל פעולה במכשיר. לדוגמה, מכשיר שתומך בשאילתה Turn on the light (הפעלת התאורה) יקבל DeviceAction
עם מטען ייעודי (payload) של JSON שמכיל את הסמנטיקה של הבקשה.
שדות | |
---|---|
device_request_json |
קובץ JSON שמכיל את תגובת הפקודה במכשיר שנוצרה מהדקדוק של פעולת המכשיר שהופעל. הפורמט נקבע על ידי ה-Intent |
DeviceConfig
חובה: שדות שמאפשרים ל-Assistant לזהות את המכשיר.
לעיונך:
שדות | |
---|---|
device_id |
חובה מזהה ייחודי למכשיר. המזהה יכול לכלול 128 תווים לכל היותר. דוגמה: DBCDW098234. הערך הזה חייב להיות זהה ל-device_id שהוחזר מרישום המכשיר. ה-device_id הזה משמש להתאמה עם המכשירים הרשומים של המשתמש, כדי לחפש את התכונות והיכולות הנתמכות של המכשיר הזה. המידע הזה לא אמור להשתנות בין הפעלות מחדש של המכשירים. עם זאת, לא כדאי לשמור את הנתונים באיפוס להגדרות המקוריות. |
device_model_id |
חובה מזהה ייחודי לדגם המכשיר. השילוב של device_model_id ו-device_id היה צריך להיות משויך בעבר באמצעות רישום המכשיר. |
DeviceLocation
יש שלושה מקורות של מיקומים. נעשה בהם שימוש עם הקדימות הבאה:
- המכשיר
DeviceLocation
, שמשמש בעיקר מכשירים ניידים עם GPS . - המיקום שצוין על ידי המשתמש במהלך הגדרת המכשיר, הוא לפי משתמש ולפי מכשיר. המיקום הזה יהיה בשימוש אם לא צוין
DeviceLocation
. - המיקום המשוער מבוסס על כתובת ה-IP. האפשרות הזו משמשת רק אם אף אחת מהאפשרויות שלמעלה לא צוינה.
שדות | |
---|---|
coordinates |
קווי האורך והרוחב של המכשיר. |
DialogStateIn
מספק מידע על המצב הנוכחי של תיבת הדו-שיח.
שדות | |
---|---|
conversation_state |
חובה תמיד צריך להגדיר בשדה הזה את הערך |
language_code |
חובה שפה של הבקשה בתחביר IETF BCP 47 (לדוגמה, 'en-US'). מידע נוסף זמין בתמיכה בשפות. אם בחרת שפה ל |
device_location |
אופציונלי: מיקום המכשיר שבו בוצעה השאילתה. |
is_new_conversation |
אופציונלי אם הערך הוא True, השרת יתייחס לבקשה כשיחה חדשה ולא ישתמש במצב מהבקשה הקודמת. יש להגדיר את השדה הזה כ-true כשצריך להפעיל מחדש את השיחה, למשל לאחר הפעלה מחדש של המכשיר או לאחר פרק זמן משמעותי מאז השאילתה הקודמת. |
DialogStateOut
המצב של תיבת הדו-שיח שנובעת משאילתת המשתמש. ייתכן שיתקבלו מספר רב של הודעות כאלה.
שדות | |
---|---|
supplemental_display_text |
פלט בלבד טקסט משלים לתצוגה מ-Assistant. השם יכול להיות זהה לדיבור שנאמר ב- |
conversation_state |
פרטי מצב פלט בלבד עבור ה-RPC הבא מסוג |
microphone_mode |
פלט בלבד ההגדרה קובעת את מצב המיקרופון אחרי עיבוד ה-RPC הזה מסוג |
volume_percentage |
פלט בלבד עודכנה עוצמת הקול. הערך יהיה 0 או יושמט (כלומר, ללא שינוי), אלא אם זוהתה פקודה קולית כמו הגברת עוצמת הקול או הגדרת עוצמת קול 4. במקרה כזה הערך יהיה בין 1 ל-100 (בהתאם לרמה החדשה של עוצמת הקול, בין 1% ל-100%). בדרך כלל, לקוח צריך להשתמש בעוצמת הקול הזו בעת הפעלת הנתונים של |
MicrophoneMode
מצבים אפשריים של המיקרופון לאחר סיום RPC של Assist
.
טיפוסים בני מנייה (enums) | |
---|---|
MICROPHONE_MODE_UNSPECIFIED |
לא צוין מצב. |
CLOSE_MICROPHONE |
השירות לא מצפה לשאלת המשך מהמשתמש. המיקרופון צריך להישאר כבוי עד שהמשתמש יפעיל אותו מחדש. |
DIALOG_FOLLOW_ON |
השירות מצפה לשאלת המשך מהמשתמש. צריך לפתוח מחדש את המיקרופון כשההפעלה של AudioOut תסתיים (כדי לשלוח את האודיו החדש ב-Assist צריך להתחיל קריאה חדשה ל-RPC). |
ScreenOut
תגובת הפלט החזותי של Assistant לשאילתה. הופעל על ידי screen_out_config
.
שדות | |
---|---|
format |
פלט בלבד: הפורמט של נתוני המסך שסופקו. |
data |
פלט בלבד: נתוני המסך הגולמיים שיוצגו כתוצאה מהשאילתה של Assistant. |
פורמט
פורמטים אפשריים של נתוני המסך.
טיפוסים בני מנייה (enums) | |
---|---|
FORMAT_UNSPECIFIED |
לא צוין פורמט. |
HTML |
הנתונים יכללו פריסת HTML5 בפורמט מלא ומקודדת ב-UTF-8, לדוגמה: <html><body><div>...</div></body></html> . הוא מיועד לעיבוד יחד עם תגובת האודיו. הערה: ה-doctype של HTML5 צריך להיכלל בנתוני ה-HTML בפועל. |
ScreenOutConfig
מפרט את הפורמט הרצוי שהשרת ישתמש בו כשמחזירים את התגובה screen_out
.
שדות | |
---|---|
screen_mode |
מצב המסך החזותי הנוכחי של המכשיר בזמן הרצת השאילתה. |
ScreenMode
מצבים אפשריים של פלט מסך חזותי במכשיר.
טיפוסים בני מנייה (enums) | |
---|---|
SCREEN_MODE_UNSPECIFIED |
לא צוין מצב וידאו. Assistant עשויה להגיב כאילו היא במצב OFF . |
OFF |
המסך כבוי (או שהבהירות שלו או הגדרות אחרות שנקבעו כה נמוכה עד שאי אפשר לראות אותו). לרוב, Assistant לא תחזיר תגובה מהמסך במצב הזה. |
PLAYING |
לרוב, Assistant תחזיר תגובה במסך חלקי במצב הזה. |
SpeechRecognitionResult
התמלול המשוער של ביטוי שהמשתמש נאמר. זה יכול להיות קטע יחיד או הניחוש המלא של השאילתה המדוברת של המשתמש.
שדות | |
---|---|
transcript |
פלט בלבד טקסט תמליל שמייצג את המילים שהמשתמש אמר. |
stability |
פלט בלבד: הערכה של הסבירות ש-Assistant לא תשנה את הניחוש שלה לגבי התוצאה הזו. הערכים נעים בין 0.0 (לא יציב לגמרי) ל-1.0 (יציב וסופי לחלוטין). ערך ברירת המחדל של 0.0 הוא ערך סנטינל שמציין ש- |