O SDK do Google Assistente permite adicionar controle de voz, processamento
de linguagem natural e a tecnologia do Google às suas ideias. Seu projeto captura
uma fala (uma solicitação de áudio falada, como O que tem na minha agenda?), envia
para o Google Assistente e recebe uma resposta falada, além do
texto bruto.
Serviço do Google Assistente
O serviço do Google Assistente expõe uma API de baixo nível que permite manipular diretamente os
bytes de áudio de uma solicitação e uma resposta do Assistente. As vinculações para essa API podem ser geradas para linguagens como Node.js, Go, C++ e Java para todas as plataformas compatíveis com gRPC.
O código de referência é fornecido em Python para captura de áudio, reprodução de áudio e
gerenciamento do estado da conversa.
Compatibilidade e suporte a recursos
A tabela a seguir resume os requisitos de compatibilidade de plataforma do
serviço do Google Assistente:
Saída visual (HTML5) das respostas do Google Assistente
Sim
Etapas para começar a criar seus projetos
O SDK permite criar projetos rapidamente incorporando o Google Assistente
e permitindo que você adicione funcionalidades exclusivas com o Actions on Google:
[null,null,["Última atualização 2023-12-02 UTC."],[[["The Google Assistant SDK enables the integration of voice control, natural language processing, and Google's intelligence into projects, primarily for experimental and non-commercial purposes."],["It offers a low-level API for manipulating audio, accessible through various programming languages, along with Python reference code for audio handling and conversation management."],["While supporting audio input/output and visual HTML5 responses, it lacks hands-free activation, timers/alarms, podcast/news playback, and broadcast messaging capabilities."],["Developers can build projects by leveraging the gRPC APIs, customizing functionality with Actions on Google, and adhering to best practices for privacy, security, and audio configuration."]]],["The Google Assistant SDK facilitates voice control and natural language understanding in projects, using spoken audio requests and responses. It provides a low-level API via gRPC, supporting multiple languages and platforms. Reference code in Python handles audio capture, playback, and conversation state. Key features include visual output of responses, but exclude hands-free activation, timers, alarms, and media playback. Project development involves building with gRPC APIs, customizing, and then refining using privacy and audio best practices. The SDK can only be used for experimental and non-commercial projects.\n"]]