Índice
EmbeddedAssistant
(interface)AssistConfig
(mensagem)AssistRequest
(mensagem)AssistResponse
(mensagem)AssistResponse.EventType
(enum)AudioInConfig
(mensagem)AudioInConfig.Encoding
(enum)AudioOut
(mensagem)AudioOutConfig
(mensagem)AudioOutConfig.Encoding
(enum)DebugConfig
(mensagem)DebugInfo
(mensagem)DeviceAction
(mensagem)DeviceConfig
(mensagem)DeviceLocation
(mensagem)DialogStateIn
(mensagem)DialogStateOut
(mensagem)DialogStateOut.MicrophoneMode
(enum)ScreenOut
(mensagem)ScreenOut.Format
(enum)ScreenOutConfig
(mensagem)ScreenOutConfig.ScreenMode
(enum)SpeechRecognitionResult
(mensagem)
EmbeddedAssistant
Serviço que implementa a API Google Assistant.
Assistência | |
---|---|
Inicia ou continua uma conversa com o serviço do Google Assistente incorporado. Cada chamada realiza uma viagem de ida e volta, enviando uma solicitação de áudio ao serviço e recebendo a resposta de áudio. Usa streaming bidirecional para receber resultados, como o evento Uma conversa é uma ou mais conexões gRPC, cada uma consistindo em várias solicitações e respostas transmitidas. Por exemplo, o usuário diz Adicionar à minha lista de compras, e o Google Assistente responde O que você quer adicionar?. A sequência das solicitações e respostas transmitidas na primeira mensagem gRPC pode ser:
O usuário diz bagels, e o Google Assistente responde Ok, adicionei bagels à sua lista de compras. Isso é enviado como outra chamada de conexão gRPC para o método
Ainda que a ordem precisa das respostas não seja garantida, as mensagens
|
AssistConfig
Especifica como processar as mensagens AssistRequest
.
Campos | ||
---|---|---|
audio_out_config |
Obrigatório Especifica como formatar o áudio que será retornado. |
|
screen_out_config |
Opcional Especifica o formato desejado a ser usado quando o servidor retornar uma resposta visual da tela. |
|
dialog_state_in |
Obrigatório representa o estado atual da caixa de diálogo. |
|
device_config |
Configuração que identifica exclusivamente um dispositivo específico. |
|
debug_config |
Opcional Parâmetros de depuração para toda a RPC |
|
Campo de união
|
||
audio_in_config |
Especifica como processar o áudio de entrada seguinte. Obrigatório se |
|
text_query |
A entrada de texto que será enviada ao Google Assistente. que poderá ser preenchido em uma interface de texto se a entrada de áudio não estiver disponível; |
AssistRequest
A mensagem de nível superior enviada pelo cliente. Os clientes precisam enviar pelo menos duas e, normalmente, várias mensagens AssistRequest
. A primeira mensagem precisa conter uma mensagem config
e não pode conter dados audio_in
. Todas as mensagens subsequentes precisam conter dados audio_in
e não podem conter uma mensagem config
.
Campos | ||
---|---|---|
Campo de união type . Exatamente um desses campos precisa ser especificado em cada AssistRequest . type pode ser apenas de um dos tipos a seguir: |
||
config |
A mensagem |
|
audio_in |
Dados de áudio a serem reconhecidos. Os blocos sequenciais de dados de áudio são enviados em mensagens |
AssistResponse
A mensagem de nível superior recebida pelo cliente. É feito streaming de uma ou mais mensagens AssistResponse
de volta para o cliente.
Campos | |
---|---|
event_type |
Somente saída Indica o tipo de evento. |
audio_out |
Somente saída: o áudio que contém a resposta do Google Assistente à consulta. |
screen_out |
Somente saída: contém a resposta visual do Google Assistente à consulta. |
device_action |
Somente saída: contém a ação acionada pela consulta com os payloads e a análise semântica adequados. |
speech_results[] |
Somente saída Esta lista repetida contém zero ou mais resultados de reconhecimento de fala que correspondem a porções consecutivas do áudio sendo processadas no momento, começando com a parte correspondente ao áudio mais antigo (e mais estável) até a parte correspondente ao áudio mais recente. As strings podem ser concatenadas para mostrar a resposta completa em andamento. Quando o reconhecimento de fala for concluído, a lista conterá um item com |
dialog_state_out |
Somente saída: contém a saída relacionada à consulta do usuário. |
debug_info |
Somente saída Informações de depuração para o desenvolvedor. Retornará somente se a solicitação definir |
EventType
Indica o tipo de evento.
Enums | |
---|---|
EVENT_TYPE_UNSPECIFIED |
Nenhum evento especificado. |
END_OF_UTTERANCE |
Esse evento indica que o servidor detectou o fim da fala do usuário e não espera nenhuma fala adicional. Portanto, o servidor não processará áudio adicional, ainda que possa retornar resultados adicionais posteriormente. O cliente deve parar de enviar dados de áudio adicionais, fechar a metade da conexão gRPC e aguardar quaisquer resultados adicionais até o servidor fechar a conexão gRPC. |
AudioInConfig
Especifica como processar os dados do audio_in
que serão fornecidos nas próximas solicitações. Para acessar as configurações recomendadas, consulte as práticas recomendadas do SDK do Google Assistente.
Campos | |
---|---|
encoding |
Obrigatório Codificação de dados de áudio enviados em todas as mensagens |
sample_rate_hertz |
Obrigatório Taxa de amostragem (em Hertz) dos dados de áudio enviados em todas as mensagens |
Codificação
Codificação de áudio dos dados enviados na mensagem de áudio. O áudio precisa ser de um canal (mono).
Enums | |
---|---|
ENCODING_UNSPECIFIED |
Não especificado. Retorna o resultado google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
Amostras pouco elaboradas de 16 bits sem compactação (PCM Linear). Essa codificação não inclui cabeçalho, somente os bytes brutos de áudio. |
FLAC |
FLAC (Free Lossless Audio Codec) é a codificação recomendada porque não tem perdas. Portanto, o reconhecimento não é comprometido e requer apenas cerca de metade da largura de banda do LINEAR16 . Essa codificação inclui o cabeçalho de stream FLAC seguido pelos dados de áudio. Ele oferece suporte a amostras de 16 e 24 bits, mas nem todos os campos em STREAMINFO são compatíveis. |
AudioOut
O áudio que contém a resposta do Google Assistente à consulta. Os blocos sequenciais de dados de áudio são recebidos em mensagens AssistResponse
sequenciais.
Campos | |
---|---|
audio_data |
Somente saída: os dados de áudio que contêm a resposta do Google Assistente à consulta. Os blocos sequenciais de dados de áudio são recebidos em mensagens |
AudioOutConfig
Especifica o formato desejado que o servidor usará quando retornar mensagens audio_out
.
Campos | |
---|---|
encoding |
Obrigatório A codificação dos dados de áudio a ser retornada em todas as mensagens |
sample_rate_hertz |
Obrigatório A taxa de amostragem em Hertz dos dados de áudio retornados em mensagens |
volume_percentage |
Obrigatório Configuração de volume atual da saída de áudio do dispositivo. Os valores válidos são de 1 a 100 (correspondente a 1% a 100%). |
Codificação
Codificação dos dados retornados na mensagem de áudio. Todas as codificações são bytes de áudio brutos sem cabeçalho, exceto conforme indicado abaixo.
Enums | |
---|---|
ENCODING_UNSPECIFIED |
Não especificado. Retorna o resultado google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
Amostras pouco elaboradas de 16 bits sem compactação (PCM Linear). |
MP3 |
Codificação de áudio MP3. A taxa de amostragem é codificada no payload. |
OPUS_IN_OGG |
Áudio codificado em Opus unido em um contêiner ogg. O resultado será um arquivo que pode ser reproduzido de forma nativa no Android e em alguns navegadores, como o Chrome. A qualidade da codificação é consideravelmente maior do que a do MP3 e usa a mesma taxa de bits. A taxa de amostragem é codificada no payload. |
DebugConfig
Parâmetros de depuração para a solicitação atual.
Campos | |
---|---|
return_debug_info |
Quando esse campo é definido como verdadeiro, o campo |
DebugInfo
Informações de depuração para o desenvolvedor. Retornará somente se a solicitação definir return_debug_info
como "true".
Campos | |
---|---|
aog_agent_to_assistant_json |
A resposta JSON original de um agente do Action-on-Google para o servidor do Google. Consulte AppResponse. Ele só será preenchido se o criador da solicitação for proprietário do projeto AoG e se ele estiver no modo de visualização. |
DeviceAction
A resposta retornada ao dispositivo se o usuário tiver acionado uma ação do dispositivo. Por exemplo, um dispositivo compatível com a consulta Turn on the light receberia um DeviceAction
com um payload JSON que contém a semântica da solicitação.
Campos | |
---|---|
device_request_json |
JSON que contém a resposta ao comando do dispositivo gerada com base na gramática de ações do dispositivo acionadas. O formato é fornecido pela intent |
DeviceConfig
Campos obrigatórios que identificam o dispositivo para o Google Assistente.
Consulte também:
Campos | |
---|---|
device_id |
Obrigatório Identificador exclusivo do dispositivo. O ID precisa ter até 128 caracteres. Exemplo: DBCDW098234. Ele PRECISA corresponder ao device_id retornado do registro do dispositivo. Esse device_id é usado para corresponder aos dispositivos registrados do usuário e pesquisar as características e os recursos compatíveis com o dispositivo. Essas informações não devem mudar após a reinicialização do dispositivo. No entanto, ele não deve ser salvo após as redefinições para a configuração original. |
device_model_id |
Obrigatório Identificador exclusivo do modelo do dispositivo. A combinação de device_model_id e device_id precisa ter sido associada anteriormente ao registro do dispositivo. |
DeviceLocation
Existem três origens de locais. Eles são usados com esta precedência:
- Esse
DeviceLocation
, que é usado principalmente para dispositivos móveis com GPS . - Local especificado pelo usuário durante a configuração do dispositivo, por usuário e por dispositivo. Esse local será usado se
DeviceLocation
não for especificado. - Local inferido com base no endereço IP. Isso será usado somente se nenhuma das opções acima for especificada.
Campos | |
---|---|
coordinates |
Latitude e longitude do dispositivo. |
DialogStateIn
Fornece informações sobre o estado atual da caixa de diálogo.
Campos | |
---|---|
conversation_state |
Obrigatório Esse campo sempre precisa ser definido como o valor |
language_code |
Obrigatório Idioma da solicitação na sintaxe IETF BCP 47 (por exemplo, "en-US"). Consulte Suporte a idiomas para mais informações. Se você tiver selecionado um idioma para o |
device_location |
Opcional: local do dispositivo em que a consulta foi originada. |
is_new_conversation |
Opcional: se verdadeiro, o servidor vai tratar a solicitação como uma nova conversa e não usar o estado da solicitação anterior. Defina este campo como verdadeiro quando a conversa precisar ser reiniciada, por exemplo, após a reinicialização do dispositivo ou após um intervalo de tempo significativo desde a consulta anterior. |
DialogStateOut
O estado da caixa de diálogo resultante da consulta do usuário. Várias destas mensagens podem ser recebidas.
Campos | |
---|---|
supplemental_display_text |
Somente saída Texto de exibição complementar do Google Assistente. Pode ser a mesma fala falada em |
conversation_state |
Informações de estado somente saída para a RPC |
microphone_mode |
Somente saída Especifica o modo do microfone depois que essa RPC |
volume_percentage |
Somente saída nível de volume atualizado. O valor será 0 ou omitido (indicando nenhuma mudança), a menos que um comando de voz como Aumentar o volume ou Definir nível de volume 4 seja reconhecido. Nesse caso, o valor vai estar entre 1 e 100 (correspondente ao novo nível de volume de 1% a 100%). Normalmente, um cliente precisa usar esse nível de volume ao reproduzir os dados do |
MicrophoneMode
Estados possíveis do microfone após a conclusão de uma RPC Assist
.
Enums | |
---|---|
MICROPHONE_MODE_UNSPECIFIED |
Nenhum modo especificado. |
CLOSE_MICROPHONE |
O serviço não espera uma pergunta seguinte do usuário. O microfone precisa permanecer desativado até ser reativado. |
DIALOG_FOLLOW_ON |
O serviço espera uma pergunta complementar do usuário. O microfone precisa ser aberto novamente quando a reprodução de AudioOut for concluída, iniciando uma nova chamada de RPC Assist para enviar o novo áudio. |
ScreenOut
A resposta da saída visual do Google Assistente à consulta. Ativado por screen_out_config
.
Campos | |
---|---|
format |
Somente saída Formato dos dados da tela fornecidos. |
data |
Somente saída: os dados brutos da tela a serem mostrados como resultado da consulta do Google Assistente. |
Formato
Formatos possíveis dos dados da tela.
Enums | |
---|---|
FORMAT_UNSPECIFIED |
Nenhum formato especificado. |
HTML |
Os dados contêm um layout HTML5 completo codificado em UTF-8, por exemplo, <html><body><div>...</div></body></html> . Ele precisa ser renderizado junto com a resposta de áudio. O doctype HTML5 precisa ser incluído nos dados HTML reais. |
ScreenOutConfig
Especifica o formato desejado para o servidor usar quando ele retornar uma resposta screen_out
.
Campos | |
---|---|
screen_mode |
Modo de tela visual atual do dispositivo durante a emissão da consulta. |
ScreenMode
Modos possíveis para saída visual da tela no dispositivo.
Enums | |
---|---|
SCREEN_MODE_UNSPECIFIED |
Nenhum modo de vídeo especificado. O Google Assistente pode responder como se estivesse no modo OFF . |
OFF |
A tela está desligada (ou tem o brilho ou outras configurações tão baixas que não são visíveis). O Google Assistente normalmente não retorna uma resposta de tela nesse modo. |
PLAYING |
Nesse modo, o Google Assistente normalmente retorna uma resposta de tela parcial. |
SpeechRecognitionResult
A transcrição estimada de uma frase que o usuário falou. Pode ser um único segmento ou o palpite completo da consulta falada do usuário.
Campos | |
---|---|
transcript |
Somente saída Texto de transcrição que representa as palavras que o usuário falou. |
stability |
Somente saída: estimativa da probabilidade de o Google Assistente não mudar o palpite sobre esse resultado. Os valores variam de 0,0 (completamente instável) a 1,0 (completamente estável e final). O padrão de 0,0 é um valor de sentinela indicando que |