Criar e registrar um esquema

Um esquema do Google Cloud Search é uma estrutura JSON que define os objetos, as propriedades e as opções a serem usados na indexação e na consulta de dados. O conector de conteúdo lê os dados do repositório e, com base no esquema registrado, estrutura e indexa os dados.

Para criar um esquema, forneça um objeto de esquema JSON à API e registre-o. É necessário registrar um objeto de esquema para cada repositório antes de indexar os dados.

Este documento aborda os conceitos básicos sobre criação de esquemas. Para mais informações sobre como ajustar um esquema para melhorar a experiência de pesquisa, consulte Melhorar a qualidade da pesquisa.

Criar um esquema

Veja a seguir a lista de etapas para criar um esquema do Cloud Search:

  1. Identificar o comportamento esperado do usuário
  2. Inicializar uma fonte de dados
  3. Criar um esquema
  4. Exemplo de esquema completo
  5. Registrar o esquema
  6. Indexar seus dados
  7. Testar o esquema
  8. Ajustar seu esquema
.

Identificar o comportamento esperado do usuário

Prever os tipos de consultas que os usuários farão ajudará você a determinar a direção da sua estratégia para criar o esquema.

Por exemplo, com relação a um banco de dados de filmes, é provável que um usuário faça uma consulta como "Mostre todos os filmes estrelados por Robert Redford". Portanto, seu esquema precisa aceitar resultados de consultas com base em "todos os filmes com um ator específico".

Para definir o esquema de modo que ele reflita os padrões comportamentais dos usuários, realize as seguintes tarefas:

  1. Avalie um conjunto diversificado de consultas desejadas de usuários diferentes.
  2. Identifique os objetos que talvez sejam usados nas consultas. Objetos são conjuntos lógicos de dados relacionados, como um filme em um banco de dados de filmes.
  3. Identifique as propriedades e os valores que compõem o objeto e talvez sejam usados nas consultas. Propriedades são os atributos indexáveis do objeto e podem incluir valores primitivos ou outros objetos. Por exemplo, um objeto filme pode ter propriedades como o título do filme e a data de lançamento como valores primitivos. O objeto filme também pode conter outros objetos, como membros do elenco, que têm as próprias propriedades, como nome ou papel.
  4. Identifique exemplos de valores válidos de propriedades. Valores são os dados reais indexados de uma propriedade. Por exemplo, o título de um filme no banco de dados pode ser "Os Caçadores da Arca Perdida".
  5. Determine as opções de ordenação e classificação que os usuários querem. Por exemplo, ao consultar filmes, talvez os usuários queiram classificá-los por ordem cronológica e nota de avaliação do público, sem a necessidade de listá-los em ordem alfabética do título.
  6. (opcional) Considere se uma de suas propriedades representa uma em que as pesquisas podem ser feitas, como cargo ou departamento, para que as sugestões de preenchimento automático possam ser fornecidas com base no contexto. Por exemplo, para pessoas que pesquisam um banco de dados de filmes, os usuários podem me interessam apenas por um determinado gênero de filme. Os usuários definiriam o que gênero que desejam que suas pesquisas retornem, possivelmente como parte de seu perfil. Então, quando um usuário começar a digitar uma consulta de filmes, apenas filmes do gênero preferido, como "filmes de ação", são sugeridas como das sugestões de preenchimento automático.
  7. Faça uma lista desses objetos, propriedades e valores de exemplo que podem ser usados nas pesquisas. Para mais detalhes sobre como essa lista é usada, consulte a seção Definir opções do operador.

Inicializar uma origem de dados

Uma fonte de dados representa os dados de um repositório que foi indexado e armazenado no Google Cloud. Para instruções sobre como inicializar uma fonte de dados, consulte Gerenciar fontes de dados de terceiros.

Os resultados das pesquisas de usuários são retornados da fonte de dados. Quando um usuário clica em um resultado de pesquisa, o Cloud Search o direciona para o item real usando o URL fornecido na solicitação de indexação.

Definir os objetos

A unidade fundamental de dados em um esquema é o objeto, também chamado de "objeto do esquema", que é uma estrutura lógica de dados. Em um banco de dados de filmes, mais lógica dos dados é "filme". Outro objeto pode ser "pessoa", para representam o elenco e a equipe envolvidas no filme.

Cada objeto em um esquema tem uma série de propriedades ou atributos que descrevem esse objeto, como o título e a duração de um filme ou o nome e a data de nascimento de uma pessoa. As propriedades de um objeto podem incluir valores primitivos ou outros objetos.

A Figura 1 mostra os objetos filme e pessoa e as propriedades associadas a eles.

Desenho das conexões do esquema entre entidades
Figura 1. Um esquema de amostra que mostra dois objetos e um subobjeto.

Um esquema do Cloud Search é essencialmente uma lista de instruções de definição de objetos definidas nas tag objectDefinitions. O snippet de esquema a seguir mostra as instruções objectDefinitions para os objetos de esquema "filme" e "pessoa".

{
  "objectDefinitions": [
    {
      "name": "movie",
      ...
    },
    {
      "name": "person",
      ...
    }
  ]
}

Ao definir um objeto de esquema, você fornece um name para o objeto que precisa ser único entre todos os outros objetos no esquema. Normalmente, você usa um name valor que descreve o objeto, como movie para um objeto "filme". O esquema usa o campo name como um identificador de chave para objetos indexáveis. Para mais informações sobre o campo name, consulte a Definição de objeto.

Definir propriedades de objetos

Conforme especificado na referência para ObjectDefinition. o nome do objeto é seguido por um conjunto de options, e uma lista de propertyDefinitions A options pode ainda consistem em freshnessOptions e displayOptions. A freshnessOptions são usadas para ajustar a classificação da pesquisa com base na atualização de um item. A displayOptions são usados para definir se propriedades e rótulos específicos serão exibidos em os resultados da pesquisa de um objeto.

A propertyDefinitions é onde você define as propriedades de um objeto, como título do filme e data de lançamento.

O snippet a seguir mostra o objeto movie com duas propriedades: movieTitle e releaseDate.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isWildcardSearchable": true,
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" },
            "operatorOptions": {
              "operatorName": "title"
            }
          },
          "displayOptions": {
            "displayLabel": "Title"
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isSortable": true,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          },
          "displayOptions": {
            "displayLabel": "Release date"
          }
      ...
      ]
    }
  ]
}

A PropertyDefinition consiste nos seguintes itens:

  • uma string name.
  • Uma lista de opções independentes de tipo, como isReturnable na snippet.
  • Um tipo e as opções específicas associadas a ele como textPropertyOptions e retrievalImportance no snippet anterior.
  • Um operatorOptions que descreve como a propriedade é usada como operador de pesquisa.
  • Um ou mais displayOptions, como displayLabel no snippet anterior.

O name de uma propriedade precisa ser exclusivo no objeto que a contém. mas o mesmo nome pode ser usado em outros objetos e subobjetos. Na Figura 1, o título e a data de lançamento do filme foram definidos duas vezes: no objeto movie e novamente no subobjeto filmography do objeto person. Este esquema reutiliza o campo movieTitle para que o esquema seja compatível com dois tipos de comportamentos de pesquisa:

  • Mostrar resultados de filmes quando os usuários pesquisam o título de um filme.
  • Mostrar resultados de pessoas quando os usuários pesquisam o título de um filme em que um ator atuou.

Da mesma forma, o esquema reutiliza o campo releaseDate porque ele tem a mesma significado para os dois campos movieTitle.

Ao desenvolver seu próprio esquema, pense em como seu repositório pode ter campos relacionados contendo dados que você queira declarar mais de uma vez no esquema.

Adicionar opções independentes de tipo

PropertyDefinition lista opções gerais de funcionalidade de pesquisa comuns a todas as propriedades, independentemente do tipo de dados.

  • isReturnable: indica se a propriedade identifica os dados que devem ser retornados nos resultados de pesquisa por meio da API de consulta. Todos os filmes de exemplo são retornáveis. É possível usar propriedades não retornáveis para pesquisar ou classificar resultados sem que sejam retornados ao usuário.
  • isRepeatable: indica se vários valores são permitidos para a propriedade. Por exemplo, um filme tem apenas uma data de lançamento, mas pode ter vários atores.
  • isSortable: indica que a propriedade pode ser usada para classificação. Essa opção não pode ser verdadeira para propriedades que são repetíveis. Por exemplo, os resultados de filmes podem ser classificados por data de lançamento ou nota do público.
  • isFacetable: indica que a propriedade pode ser usada para gerar atributos. Um atributo é usado para refinar os resultados da pesquisa, o usuário vê os resultados iniciais e depois adiciona critérios ou atributos para refinar ainda mais os resultados. Essa opção não pode ser verdadeira para propriedades com o tipo objeto e isReturnable precisa ser verdadeiro para definir essa opção. Por fim, essa opção é compatível apenas com propriedades booleanas, de enumeração e de texto. Por exemplo, em nosso esquema de amostra, podemos fazer tabela de atributos genre, actorName, userRating e mpaaRating para permitir ser usado para refinamento interativo dos resultados de pesquisa.
  • isWildcardSearchable indica que os usuários podem realizar a pesquisa de caracteres curinga em para essa propriedade. Essa opção está disponível apenas em propriedades de texto. Como caractere curinga funciona no campo de texto depende do valor definido no exactMatchWithOperator. Se exactMatchWithOperator for definido como true, o valor de texto é tokenizado como um valor atômico e uma pesquisa de caractere curinga é realizado nele. Por exemplo, se o valor do texto for science-fiction, uma consulta curinga science-* corresponderá a ela. Se exactMatchWithOperator for definido como false, o valor de texto é tokenizado e uma pesquisa de caracteres curinga é executada para cada token. Por exemplo, se o valor do texto for "ficção científica", o caractere curinga consultas sci* ou fi* correspondem ao item, mas science-* não correspondem.

Esses parâmetros gerais de funcionalidade de pesquisa são todos valores booleanos. elas Todos têm um valor padrão de false e precisam ser definidos como true que serão usadas.

A tabela a seguir mostra os parâmetros booleanos definidos como true. para todas as propriedades do objeto movie:

Propriedade isReturnable isRepeatable isSortable isFacetable isWildcardSearchable
movieTitle true verdadeiro
releaseDate verdadeiro verdadeiro
genre verdadeiro verdadeiro verdadeiro
duration verdadeiro
actorName verdadeiro verdadeiro verdadeiro verdadeiro
userRating verdadeiro verdadeiro
mpaaRating verdadeiro verdadeiro

Tanto genre quanto actorName têm isRepeatable definido como true porque um filme pode pertencer a mais de um gênero e normalmente tem mais de um ator. Uma propriedade não pode ser classificada se for repetível ou estiver contida em um subobjeto repetível.

Definir tipo

A PropertyDefinition seção de referência lista várias xxPropertyOptions em que xx é um tipo específico, como boolean. Para definir o tipo de dados da propriedade, é necessário definir o objeto de tipo de dados apropriado. Definir um objeto de tipo de dados para uma propriedade estabelece o tipo de dados dessa propriedade. Por exemplo, definir textPropertyOptions para a propriedade movieTitle indica que o filme título é do tipo texto. O snippet a seguir mostra a propriedade movieTitle. com textPropertyOptions definindo o tipo de dados.

{
  "name": "movieTitle",
  "isReturnable": true,
  "isWildcardSearchable": true,
  "textPropertyOptions": {
    ...
  },
  ...
},

Uma propriedade pode ter apenas um tipo de dados associado. Por exemplo, no nosso filme esquema, releaseDate só pode ser uma data (por exemplo, 2016-01-13) ou uma string (por exemplo, January 13, 2016), mas não os dois.

Veja a seguir os objetos de tipo de dados usados para especificar os tipos de dados para as propriedades na amostra de esquema de filmes:

Propriedade Objeto de tipo de dados
movieTitle textPropertyOptions
releaseDate datePropertyOptions
genre enumPropertyOptions
duration textPropertyOptions
actorName textPropertyOptions
userRating integerPropertyOptions
mpaaRating textPropertyOptions

O tipo de dados escolhido para propriedade depende dos casos de uso esperados. No cenário imaginado do esquema de filmes, espera-se que os usuários quer ordenar os resultados cronologicamente, então releaseDate é um objeto de data. Se, por exemplo, houvesse um caso de uso esperado de comparação entre lançamentos de dezembro ao longo dos anos com lançamentos de janeiro, um formato de string seria útil.

Configurar opções específicas de tipo

A seção de referência PropertyDefinition contém links para as opções de cada tipo. Mais específico do tipo são opcionais, exceto a lista de possibleValues no enumPropertyOptions. Além disso, a opção orderedRanking permite os valores de classificação em relação uns aos outros. A o snippet a seguir mostra a propriedade movieTitle com textPropertyOptions definindo o tipo de dados e com a opção específica do tipo retrievalImportance.

{
  "name": "movieTitle",
  "isReturnable": true,
  "isWildcardSearchable": true,
  "textPropertyOptions": {
    "retrievalImportance": { "importance": "HIGHEST" },
    ...
  },
  ...
}

Veja a seguir outras opções específicas de tipo usadas na amostra de esquema:

Propriedade Tipo Opções específicas de tipo
movieTitle textPropertyOptions retrievalImportance
releaseDate datePropertyOptions
genre enumPropertyOptions
duration textPropertyOptions
actorName textPropertyOptions
userRating integerPropertyOptions orderedRanking, maximumValue
mpaaRating textPropertyOptions

Definir opções do operador

Além das opções específicas, cada tipo possui um conjunto de operatorOptions Essas opções descrevem como a propriedade é usada como operador de pesquisa. O snippet a seguir mostra a propriedade movieTitle com textPropertyOptions definindo o tipo de dados e com o Opções específicas dos tipos retrievalImportance e operatorOptions.

{
  "name": "movieTitle",
  "isReturnable": true,
  "isWildcardSearchable": true,
  "textPropertyOptions": {
    "retrievalImportance": { "importance": "HIGHEST" },
    "operatorOptions": {
      "operatorName": "title"
    }
  },
  ...
}

Cada operatorOptions tem um operatorName, como title para um movieTitle. O nome do operador é o operador de pesquisa da propriedade. Um operador de pesquisa é o parâmetro real que você espera que os usuários usem ao restringir uma pesquisa. Por exemplo, para pesquisar filmes com base no título, os o usuário digitaria title:movieName, em que movieName é o nome de um filme.

Os nomes de operador não precisam ser iguais ao nome da propriedade. Em vez disso, use nomes de operadores que reflitam as palavras mais comuns usadas pelos usuários na sua organização. Por exemplo, se os usuários preferirem o termo "name" em vez de "title" como título do filme, defina o nome do operador como "name".

É possível usar o mesmo nome de operador em várias propriedades, contanto que todas elas sejam resolvidas para o mesmo tipo. Ao usar um nome de operador compartilhado durante uma consulta, todas as propriedades que usam esse nome de operador são recuperadas. Por exemplo: suponha que o objeto "filme" tivesse plotSummary e plotSynopsis e cada uma delas teve um operatorName de plot. Conforme desde que as duas propriedades sejam de texto (textPropertyOptions), uma única consulta usando o operador de pesquisa plot recupera ambos.

Além de operatorName, as propriedades classificáveis podem ter Campos lessThanOperatorName e greaterThanOperatorName em operatorOptions. Os usuários podem usar essas opções para criar consultas baseadas em comparações com um valor enviado.

Por fim, o textOperatorOptions tem um campo exactMatchWithOperator em operatorOptions Se você exactMatchWithOperator como true, a string de consulta precisa correspondem a todo o valor da propriedade, não apenas no texto. O valor do texto é tratado como um valor atômico nas pesquisas do operador e nas correspondências com atributos.

Por exemplo, pense em indexar objetos livro ou filme com propriedades de gênero. Os gêneros podem incluir "Science-Fiction", "Science" e "Fiction". Com exactMatchWithOperator definido como false ou omitido, pesquisar um gênero ou selecione "Ciências" ou "Ficção" atributo também retornar resultados para "ficção científica" já que o texto é tokenizado "Ciência" e "Ficção" os tokens existem em "Ficção científica". Quando exactMatchWithOperator for true, o texto é tratado como um único token, "Ciência" nem "Ficção" corresponde a "ficção científica".

(Opcional) Adicionar a seção displayOptions

Há uma seção displayOptions opcional no final de qualquer propertyDefinition. Esta seção contém uma string displayLabel. displayLabel é um rótulo de texto fácil de usar e recomendado da propriedade. Se a propriedade estiver configurada para ser exibida usando ObjectDisplayOptions, esse rótulo será exibido na frente da propriedade. Se a propriedade estiver configurada para display e displayLabel não estiver definido, somente o valor da propriedade será exibidos.

O snippet a seguir mostra a propriedade movieTitle com displayLabel. definido como "Título".

{
  "name": "movieTitle",
  "isReturnable": true,
  "isWildcardSearchable": true,
  "textPropertyOptions": {
    "retrievalImportance": { "importance": "HIGHEST" },
    "operatorOptions": {
       "operatorName": "title"
    }
},
  "displayOptions": {
    "displayLabel": "Title"
  }
},

Veja a seguir os valores displayLabel para todas as propriedades de movie. no esquema de amostra:

Propriedade displayLabel
movieTitle Title
releaseDate Release date
genre Genre
duration Run length
actorName Actor
userRating Audience score
mpaaRating MPAA rating

(Opcional) Adicionar a seção suggestionFilteringOperators[]

Há um campo opcional suggestionFilteringOperators[] ao final de qualquer seção propertyDefinition. Use esta seção para define uma propriedade usada para filtrar sugestões de preenchimento automático. Por exemplo, pode definir o operador de genre para filtrar sugestões com base no gênero de filme preferido. Então, quando o usuário digitar sua consulta de pesquisa, apenas aqueles filmes que correspondem ao gênero preferido são mostrados como parte do preenchimento automático sugestões.

Registrar o esquema

Para que dados estruturados sejam retornados nas consultas do Cloud Search, é necessário registrar seu esquema com o serviço de esquema do Cloud Search. Para registrar um esquema, você precisa usar o código da fonte de dados conseguido durante a etapa Inicializar uma fonte de dados.

Use o código da fonte de dados para emitir uma solicitação UpdateSchema e registrar seu esquema.

Conforme detalhado na página de referência UpdateSchema, emita a seguinte solicitação HTTP para registrar seu esquema:

PUT https://cloudsearch.googleapis.com/v1/indexing/{name=datasources/*}/schema

O corpo da solicitação precisa conter o seguinte:

{
  "validateOnly": // true or false,
  "schema": {
    // ... Your complete schema object ...
  }
}

Use a opção validateOnly para testar a validade do esquema sem registrá-la de fato.

Indexar os dados

Depois de registrar seu esquema, preencha a fonte de dados usando chamadas de indexação. Normalmente, a indexação é feita no conector de conteúdo.

Usando o esquema de filmes, uma solicitação de indexação à API REST para um único filme teria a seguinte aparência:

{
  "name": "datasource/<data_source_id>/items/titanic",
  "acl": {
    "readers": [
      {
        "gsuitePrincipal": {
          "gsuiteDomain": true
        }
      }
    ]
  },
  "metadata": {
    "title": "Titanic",
    "sourceRepositoryUrl": "http://www.imdb.com/title/tt2234155/?ref_=nv_sr_1",
    "objectType": "movie"
  },
  "structuredData": {
    "object": {
      "properties": [
        {
          "name": "movieTitle",
          "textValues": {
            "values": [
              "Titanic"
            ]
          }
        },
        {
          "name": "releaseDate",
          "dateValues": {
            "values": [
              {
                "year": 1997,
                "month": 12,
                "day": 19
              }
            ]
          }
        },
        {
          "name": "actorName",
          "textValues": {
            "values": [
              "Leonardo DiCaprio",
              "Kate Winslet",
              "Billy Zane"
            ]
          }
        },
        {
          "name": "genre",
          "enumValues": {
            "values": [
              "Drama",
              "Action"
            ]
          }
        },
        {
          "name": "userRating",
          "integerValues": {
            "values": [
              8
            ]
          }
        },
        {
          "name": "mpaaRating",
          "textValues": {
            "values": [
              "PG-13"
            ]
          }
        },
        {
          "name": "duration",
          "textValues": {
            "values": [
              "3 h 14 min"
            ]
          }
        }
      ]
    }
  },
  "content": {
    "inlineContent": "A seventeen-year-old aristocrat falls in love with a kind but poor artist aboard the luxurious, ill-fated R.M.S. Titanic.",
    "contentFormat": "TEXT"
  },
  "version": "01",
  "itemType": "CONTENT_ITEM"
}

Observe como o valor de movie no campo objectType corresponde ao objeto da definição de código no esquema. Ao combinar esses dois valores, o Cloud Search sabe qual objeto de esquema usar durante a indexação.

Observe também como a indexação da propriedade de esquema releaseDate usa subpropriedades de year, month e day, que ele herda porque é definido como um tipo de dados date usando datePropertyOptions para defini-lo. No entanto, como year, month e day não estão definidos no esquema, não podem consultar uma dessas propriedades (por exemplo, year) individualmente.

Por fim, observe também como a propriedade repetível actorName é indexada usando uma lista. de valores.

Como identificar possíveis problemas de indexação

Os dois problemas mais comuns relacionados a esquemas e indexação são os seguintes:

  • A solicitação de indexação contém um objeto de esquema ou nome de propriedade que não foi registrado com o serviço de esquema. Esse problema faz com que a propriedade ou objeto seja ignorado.

  • A solicitação de indexação tem uma propriedade com um valor de tipo diferente do tipo registrado no esquema. Esse problema faz com que o Cloud Search retorne um erro no momento da indexação.

Testar o esquema com vários tipos de consulta

Antes de registrar seu esquema para um grande repositório de dados de produção, teste-o com um repositório de dados de teste menor. Isso ajudará você a fazer ajustes rapidamente no esquema e excluir os dados indexados, sem afetar um índice maior ou o índice em produção atual. Para o repositório de dados de teste, crie uma lista de controle de acesso (ACL, na sigla em inglês) que autorize apenas um usuário de teste para que outros usuários não vejam esses dados nos resultados da pesquisa.

Para criar uma interface de pesquisa para validar tais consultas, leia A interface de pesquisa.

Essa seção contém vários exemplos de consulta para você testar um esquema de filmes.

Testar com uma consulta genérica

Uma consulta genérica retorna todos os itens na fonte de dados que contêm uma string específica. Em uma interface de pesquisa, execute uma consulta genérica em uma fonte de dados de filmes digitando a palavra titanic e pressionando Return. Todos os filmes com a palavra "titanic" serão retornados nos resultados da pesquisa.

Testar com um operador

Adicionar um operador à consulta limita os resultados aos itens que correspondem ao valor do operador. Por exemplo, use o operador actor para encontrar todos os filmes estrelados por um ator específico. Usando uma interface de pesquisa, você pode realizar a essa consulta de operador simplesmente digitando um par operator=value, como &quot;actor:Zane&quot; e pressione &quot;actor:Zane&quot;. Todos os filmes com o ator chamado Zane serão retornados nos resultados da pesquisa.

Ajustar o esquema

Depois que o esquema e os dados estiverem em uso, continue a monitorar o que está dando certo ou não para os usuários. Ajuste seu esquema nas seguintes situações:

  • Indexação de um campo que não havia sido indexado anteriormente. Por exemplo, os usuários talvez pesquisem repetidamente filmes com base no nome do diretor. Portanto, ajuste seu esquema para aceitar "directorname" como um operador.
  • Alteração dos nomes de operadores de pesquisa como base no feedback de usuários. Os nomes dos operadores precisam ser fáceis de usar. Se os usuários frequentemente usam um nome de operador incorreto, pense em alterá-lo.
.

Como indexar novamente após a alteração do esquema

Alterar qualquer um dos valores a seguir no esquema não exigirá uma nova indexação dos dados. Basta enviar um novo UpdateSchema e o índice continuará funcionando:

  • Nomes de operador
  • Valores inteiros mínimos e máximos
  • Classificação ordenada de valores inteiro e de enumeração
  • Opções de frequência
  • Opções de exibição

No caso das alterações a seguir, os dados indexados anteriormente continuarão a funcionar de acordo com o esquema já registrado. No entanto, será necessário indexar novamente as entradas atuais para ver as alterações com base no esquema atualizado, se as seguintes alterações tiverem sido realizadas:

  • Inclusão ou remoção de uma propriedade ou um objeto novo
  • Alterando isReturnable, isFacetable ou isSortable de false para true.

Defina isFacetable ou isSortable como true somente se você tiver um caso de uso e necessidade claros.

Por fim, quando você atualiza seu esquema marcando uma propriedade isSuggestable, você precisa reindexar seus dados, o que causa um atraso no uso do preenchimento automático para essa propriedade.

Alterações de propriedade não permitidas

Algumas alterações de esquema não são permitidas, mesmo se você indexar novamente os dados. O motivo disso é que elas podem corromper o índice ou produzir resultados de pesquisa insatisfatórios ou inconsistentes. Dentre as alterações proibidas incluem-se mudanças nos:

  • tipos de dados de propriedades;
  • nomes de propriedades.
  • Configuração exactMatchWithOperator.
  • Configuração retrievalImportance.

No entanto, há uma maneira de contornar essa limitação.

Fazer uma alteração complexa no esquema

Para evitar alterações que geram resultados de pesquisa insatisfatórios ou corrompem o índice, o Cloud Search impede certos tipos de mudanças nas solicitações UpdateSchema após a indexação do repositório. Por exemplo, não é possível alterar o tipo de dados ou o nome de uma propriedade depois de definidos. Essas mudanças não pode ser alcançado com uma simples UpdateSchema mesmo que reindexe os dados.

Em situações em que é necessário fazer uma alteração não permitida no seu esquema, costuma ser possível fazer uma série de alterações permitidas que terão o mesmo efeito. Em geral, isso envolve primeiro migrar as propriedades indexadas de uma definição de objeto mais antiga para uma mais recente e, depois, enviar uma solicitação de indexação que usa apenas a propriedade mais nova.

As etapas a seguir mostram como mudar o tipo de dados ou o nome de uma propriedade:

  1. Adicione uma propriedade nova à definição de objeto no esquema. Use um nome diferente da propriedade que você quer alterar.
  2. Emita a solicitação UpdateSchema com a definição nova. Lembre-se de enviar o esquema inteiro, incluindo a propriedade nova e a antiga, na solicitação.
  3. Preencha o índice do repositório de dados. Para fazer isso, envie todas as solicitações de indexação usando a propriedade nova, mas não a propriedade antiga. Isso resultaria em uma contagem duplicada de consultas correspondentes.

    1. Durante o preenchimento da indexação, verifique a propriedade nova e defina como padrão a propriedade antiga para evitar um comportamento inconsistente.
    2. Após a conclusão do preenchimento, execute consultas de teste para verificar.
  4. Exclua a propriedade antiga. Emita outra solicitação UpdateSchema sem o nome da propriedade antiga e interrompa o uso dele nas futuras solicitações de indexação.

  5. Migre todos os usos da propriedade antiga para a propriedade nova. Por exemplo, se você alterar o nome da propriedade de "creator" para "author", atualize o código de consulta para usar "author" onde anteriormente ele fazia referência a "creator".

O Cloud Search mantém um registro de todas as propriedades ou objetos excluídos por 30 dias para impedir qualquer reutilização que cause resultados de indexação inesperados. Dentro desse período de 30 dias, é necessário migrar todos os usos da propriedade ou objeto excluído, além de omiti-los de futuras solicitações de indexação. Assim, se posteriormente você decidir restabelecer a propriedade ou o objeto, será possível fazê-lo de modo a manter a exatidão do índice.

Conhecer as limitações de tamanho

O Cloud Search impõe limites no tamanho de esquemas e objetos de dados estruturados. Esses limites são os seguintes:

  • O número máximo de objetos de nível superior é de 10 objetos.
  • A profundidade máxima de uma hierarquia de dados estruturados é de 10 níveis.
  • O número total de campos em um objeto é limitado a 1.000, o que inclui o total de campos primitivos mais a soma do número de campos em cada objeto aninhado.

Próximas etapas

Estas são algumas das próximas etapas que podem ser seguidas:

  1. Crie uma interface de pesquisa para testar o esquema.

  2. Ajuste o esquema para melhorar a qualidade da pesquisa.

  3. Estrutura de um esquema para a interpretação ideal de consultas.

  4. Saiba como aproveitar Esquema _dictionaryEntry a ser definido sinônimos para termos usados com frequência em sua empresa. Para usar o _dictionaryEntry esquema, consulte Definir sinônimos.

  5. Crie um conector.