Um esquema do Google Cloud Search é uma estrutura JSON que define os objetos, as propriedades e as opções a serem usados na indexação e na consulta de dados. O conector de conteúdo lê os dados do repositório e, com base no esquema registrado, estrutura e indexa os dados.
Para criar um esquema, forneça um objeto de esquema JSON à API e registre-o. É necessário registrar um objeto de esquema para cada repositório antes de indexar os dados.
Este documento aborda os conceitos básicos sobre criação de esquemas. Para mais informações sobre como ajustar um esquema para melhorar a experiência de pesquisa, consulte Melhorar a qualidade da pesquisa.
Criar um esquema
Veja a seguir a lista de etapas para criar um esquema do Cloud Search:
- Identificar o comportamento esperado do usuário
- Inicializar uma fonte de dados
- Criar um esquema
- Exemplo de esquema completo
- Registrar o esquema
- Indexar seus dados
- Testar o esquema
- Ajustar seu esquema
Identificar o comportamento esperado do usuário
Prever os tipos de consultas que os usuários farão ajudará você a determinar a direção da sua estratégia para criar o esquema.
Por exemplo, com relação a um banco de dados de filmes, é provável que um usuário faça uma consulta como "Mostre todos os filmes estrelados por Robert Redford". Portanto, seu esquema precisa aceitar resultados de consultas com base em "todos os filmes com um ator específico".
Para definir o esquema de modo que ele reflita os padrões comportamentais dos usuários, realize as seguintes tarefas:
- Avalie um conjunto diversificado de consultas desejadas de usuários diferentes.
- Identifique os objetos que talvez sejam usados nas consultas. Objetos são conjuntos lógicos de dados relacionados, como um filme em um banco de dados de filmes.
- Identifique as propriedades e os valores que compõem o objeto e talvez sejam usados nas consultas. Propriedades são os atributos indexáveis do objeto e podem incluir valores primitivos ou outros objetos. Por exemplo, um objeto filme pode ter propriedades como o título do filme e a data de lançamento como valores primitivos. O objeto filme também pode conter outros objetos, como membros do elenco, que têm as próprias propriedades, como nome ou papel.
- Identifique exemplos de valores válidos de propriedades. Valores são os dados reais indexados de uma propriedade. Por exemplo, o título de um filme no banco de dados pode ser "Os Caçadores da Arca Perdida".
- Determine as opções de ordenação e classificação que os usuários querem. Por exemplo, ao consultar filmes, talvez os usuários queiram classificá-los por ordem cronológica e nota de avaliação do público, sem a necessidade de listá-los em ordem alfabética do título.
- (opcional) Considere se uma de suas propriedades representa uma em que as pesquisas podem ser feitas, como cargo ou departamento, para que as sugestões de preenchimento automático possam ser fornecidas com base no contexto. Por exemplo, para pessoas que pesquisam um banco de dados de filmes, os usuários podem me interessam apenas por um determinado gênero de filme. Os usuários definiriam o que gênero que desejam que suas pesquisas retornem, possivelmente como parte de seu perfil. Então, quando um usuário começar a digitar uma consulta de filmes, apenas filmes do gênero preferido, como "filmes de ação", são sugeridas como das sugestões de preenchimento automático.
- Faça uma lista desses objetos, propriedades e valores de exemplo que podem ser usados nas pesquisas. Para mais detalhes sobre como essa lista é usada, consulte a seção Definir opções do operador.
Inicializar uma origem de dados
Uma fonte de dados representa os dados de um repositório que foi indexado e armazenado no Google Cloud. Para instruções sobre como inicializar uma fonte de dados, consulte Gerenciar fontes de dados de terceiros.
Os resultados das pesquisas de usuários são retornados da fonte de dados. Quando um usuário clica em um resultado de pesquisa, o Cloud Search o direciona para o item real usando o URL fornecido na solicitação de indexação.
Definir os objetos
A unidade fundamental de dados em um esquema é o objeto, também chamado de "objeto do esquema", que é uma estrutura lógica de dados. Em um banco de dados de filmes, mais lógica dos dados é "filme". Outro objeto pode ser "pessoa", para representam o elenco e a equipe envolvidas no filme.
Cada objeto em um esquema tem uma série de propriedades ou atributos que descrevem esse objeto, como o título e a duração de um filme ou o nome e a data de nascimento de uma pessoa. As propriedades de um objeto podem incluir valores primitivos ou outros objetos.
A Figura 1 mostra os objetos filme e pessoa e as propriedades associadas a eles.
Um esquema do Cloud Search é
essencialmente uma lista de instruções de definição de objetos definidas nas
tag objectDefinitions
. O snippet de esquema a seguir mostra
as instruções objectDefinitions
para os objetos de esquema "filme" e "pessoa".
{
"objectDefinitions": [
{
"name": "movie",
...
},
{
"name": "person",
...
}
]
}
Ao definir um objeto de esquema, você fornece um name
para o objeto que precisa
ser único entre todos os outros objetos no esquema. Normalmente, você usa um name
valor que descreve o objeto, como movie
para um objeto "filme". O esquema
usa o campo name
como um identificador de chave para objetos indexáveis. Para
mais informações sobre o campo name
, consulte a
Definição de objeto.
Definir propriedades de objetos
Conforme especificado na referência para
ObjectDefinition.
o nome do objeto é seguido por um conjunto de
options
,
e uma lista de
propertyDefinitions
A
options
pode
ainda consistem em
freshnessOptions
e
displayOptions
.
A
freshnessOptions
são usadas para ajustar a classificação da pesquisa com base na atualização de um item. A
displayOptions
são usados para definir se propriedades e rótulos específicos serão exibidos em
os resultados da pesquisa de um objeto.
A
propertyDefinitions
é onde você define as propriedades de um objeto, como título do filme
e data de lançamento.
O snippet a seguir mostra o objeto movie
com duas propriedades: movieTitle
e releaseDate
.
{
"objectDefinitions": [
{
"name": "movie",
"propertyDefinitions": [
{
"name": "movieTitle",
"isReturnable": true,
"isWildcardSearchable": true,
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" },
"operatorOptions": {
"operatorName": "title"
}
},
"displayOptions": {
"displayLabel": "Title"
}
},
{
"name": "releaseDate",
"isReturnable": true,
"isSortable": true,
"datePropertyOptions": {
"operatorOptions": {
"operatorName": "released",
"lessThanOperatorName": "releasedbefore",
"greaterThanOperatorName": "releasedafter"
}
},
"displayOptions": {
"displayLabel": "Release date"
}
...
]
}
]
}
A PropertyDefinition consiste nos seguintes itens:
- uma string
name
. - Uma lista de opções independentes de tipo, como
isReturnable
na snippet. - Um tipo e as opções específicas associadas a ele
como
textPropertyOptions
eretrievalImportance
no snippet anterior. - Um
operatorOptions
que descreve como a propriedade é usada como operador de pesquisa. - Um ou mais
displayOptions
, comodisplayLabel
no snippet anterior.
O name
de uma propriedade precisa ser exclusivo no objeto que a contém.
mas o mesmo nome pode ser usado em outros objetos e subobjetos.
Na Figura 1, o título e a data de lançamento do filme foram definidos duas vezes:
no objeto movie
e novamente no subobjeto filmography
do
objeto person
. Este esquema reutiliza o campo movieTitle
para que o esquema seja compatível com dois tipos de comportamentos de pesquisa:
- Mostrar resultados de filmes quando os usuários pesquisam o título de um filme.
- Mostrar resultados de pessoas quando os usuários pesquisam o título de um filme em que um ator atuou.
Da mesma forma, o esquema reutiliza o campo releaseDate
porque ele tem a mesma
significado para os dois campos movieTitle
.
Ao desenvolver seu próprio esquema, pense em como seu repositório pode ter campos relacionados contendo dados que você queira declarar mais de uma vez no esquema.
Adicionar opções independentes de tipo
PropertyDefinition lista opções gerais de funcionalidade de pesquisa comuns a todas as propriedades, independentemente do tipo de dados.
isReturnable
: indica se a propriedade identifica os dados que devem ser retornados nos resultados de pesquisa por meio da API de consulta. Todos os filmes de exemplo são retornáveis. É possível usar propriedades não retornáveis para pesquisar ou classificar resultados sem que sejam retornados ao usuário.isRepeatable
: indica se vários valores são permitidos para a propriedade. Por exemplo, um filme tem apenas uma data de lançamento, mas pode ter vários atores.isSortable
: indica que a propriedade pode ser usada para classificação. Essa opção não pode ser verdadeira para propriedades que são repetíveis. Por exemplo, os resultados de filmes podem ser classificados por data de lançamento ou nota do público.isFacetable
: indica que a propriedade pode ser usada para gerar atributos. Um atributo é usado para refinar os resultados da pesquisa, o usuário vê os resultados iniciais e depois adiciona critérios ou atributos para refinar ainda mais os resultados. Essa opção não pode ser verdadeira para propriedades com o tipo objeto eisReturnable
precisa ser verdadeiro para definir essa opção. Por fim, essa opção é compatível apenas com propriedades booleanas, de enumeração e de texto. Por exemplo, em nosso esquema de amostra, podemos fazer tabela de atributosgenre
,actorName
,userRating
empaaRating
para permitir ser usado para refinamento interativo dos resultados de pesquisa.isWildcardSearchable
indica que os usuários podem realizar a pesquisa de caracteres curinga em para essa propriedade. Essa opção está disponível apenas em propriedades de texto. Como caractere curinga funciona no campo de texto depende do valor definido no exactMatchWithOperator. SeexactMatchWithOperator
for definido comotrue
, o valor de texto é tokenizado como um valor atômico e uma pesquisa de caractere curinga é realizado nele. Por exemplo, se o valor do texto forscience-fiction
, uma consulta curingascience-*
corresponderá a ela. SeexactMatchWithOperator
for definido comofalse
, o valor de texto é tokenizado e uma pesquisa de caracteres curinga é executada para cada token. Por exemplo, se o valor do texto for "ficção científica", o caractere curinga consultassci*
oufi*
correspondem ao item, masscience-*
não correspondem.
Esses parâmetros gerais de funcionalidade de pesquisa são todos valores booleanos. elas
Todos têm um valor padrão de false
e precisam ser definidos como true
que serão usadas.
A tabela a seguir mostra os parâmetros booleanos definidos como true
.
para todas as propriedades do objeto movie
:
Propriedade | isReturnable |
isRepeatable |
isSortable |
isFacetable |
isWildcardSearchable |
---|---|---|---|---|---|
movieTitle |
true | verdadeiro | |||
releaseDate |
verdadeiro | verdadeiro | |||
genre |
verdadeiro | verdadeiro | verdadeiro | ||
duration |
verdadeiro | ||||
actorName |
verdadeiro | verdadeiro | verdadeiro | verdadeiro | |
userRating |
verdadeiro | verdadeiro | |||
mpaaRating |
verdadeiro | verdadeiro |
Tanto genre
quanto actorName
têm isRepeatable
definido como true
porque um filme pode pertencer a mais de um gênero e normalmente tem
mais de um ator. Uma propriedade não pode ser classificada se for repetível ou estiver contida em um subobjeto repetível.
Definir tipo
A
PropertyDefinition
seção de referência lista várias xxPropertyOptions
em que xx
é um tipo específico,
como boolean
. Para definir o tipo de dados da propriedade, é necessário definir o objeto de tipo de dados apropriado. Definir um objeto de tipo de dados para uma propriedade estabelece o tipo de dados dessa propriedade. Por exemplo, definir
textPropertyOptions
para a propriedade movieTitle
indica que o filme
título é do tipo texto. O snippet a seguir mostra a propriedade movieTitle
.
com textPropertyOptions
definindo o tipo de dados.
{
"name": "movieTitle",
"isReturnable": true,
"isWildcardSearchable": true,
"textPropertyOptions": {
...
},
...
},
Uma propriedade pode ter apenas um tipo de dados associado. Por exemplo, no nosso filme
esquema, releaseDate
só pode ser uma data (por exemplo, 2016-01-13
) ou uma string
(por exemplo, January 13, 2016
), mas não os dois.
Veja a seguir os objetos de tipo de dados usados para especificar os tipos de dados para as propriedades na amostra de esquema de filmes:
Propriedade | Objeto de tipo de dados |
---|---|
movieTitle |
textPropertyOptions |
releaseDate |
datePropertyOptions |
genre |
enumPropertyOptions |
duration |
textPropertyOptions |
actorName |
textPropertyOptions |
userRating |
integerPropertyOptions |
mpaaRating |
textPropertyOptions |
O tipo de dados escolhido para propriedade depende dos casos de uso esperados.
No cenário imaginado do esquema de filmes, espera-se que os usuários
quer ordenar os resultados cronologicamente, então releaseDate
é um objeto de data.
Se, por exemplo, houvesse um caso de uso esperado de comparação entre lançamentos de dezembro ao longo dos anos com lançamentos de janeiro, um formato de string seria útil.
Configurar opções específicas de tipo
A seção de referência PropertyDefinition contém links para as opções de cada tipo. Mais específico do tipo
são opcionais, exceto a lista de possibleValues
no
enumPropertyOptions
. Além disso, a opção orderedRanking
permite
os valores de classificação em relação uns aos outros. A
o snippet a seguir mostra a propriedade movieTitle
com textPropertyOptions
definindo o tipo de dados e com a opção específica do tipo retrievalImportance
.
{
"name": "movieTitle",
"isReturnable": true,
"isWildcardSearchable": true,
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" },
...
},
...
}
Veja a seguir outras opções específicas de tipo usadas na amostra de esquema:
Propriedade | Tipo | Opções específicas de tipo |
---|---|---|
movieTitle |
textPropertyOptions |
retrievalImportance |
releaseDate |
datePropertyOptions |
|
genre |
enumPropertyOptions |
|
duration |
textPropertyOptions |
|
actorName |
textPropertyOptions |
|
userRating |
integerPropertyOptions |
orderedRanking , maximumValue |
mpaaRating |
textPropertyOptions |
Definir opções do operador
Além das opções específicas, cada tipo possui um conjunto de
operatorOptions
Essas opções descrevem como a propriedade é usada como
operador de pesquisa. O snippet a seguir mostra a propriedade movieTitle
com
textPropertyOptions
definindo o tipo de dados e com o
Opções específicas dos tipos retrievalImportance
e operatorOptions
.
{
"name": "movieTitle",
"isReturnable": true,
"isWildcardSearchable": true,
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" },
"operatorOptions": {
"operatorName": "title"
}
},
...
}
Cada operatorOptions
tem um operatorName
, como title
para um
movieTitle
. O nome do operador é o operador de pesquisa da propriedade. Um operador de pesquisa é o parâmetro real que você espera que os usuários usem ao restringir uma pesquisa. Por exemplo, para pesquisar filmes com base no título, os
o usuário digitaria title:movieName
, em que movieName
é o nome de um filme.
Os nomes de operador não precisam ser iguais ao nome da propriedade. Em vez disso, use nomes de operadores que reflitam as palavras mais comuns usadas pelos usuários na sua organização. Por exemplo, se os usuários preferirem o termo "name" em vez de "title" como título do filme, defina o nome do operador como "name".
É possível usar o mesmo nome de operador em várias propriedades, contanto que todas elas sejam resolvidas para o mesmo tipo. Ao usar um nome de operador compartilhado durante uma consulta, todas as propriedades que usam esse nome de operador são recuperadas. Por exemplo:
suponha que o objeto "filme" tivesse plotSummary
e plotSynopsis
e cada uma delas teve um operatorName
de plot
. Conforme
desde que as duas propriedades sejam de texto (textPropertyOptions
), uma única
consulta usando o operador de pesquisa plot
recupera ambos.
Além de operatorName
, as propriedades classificáveis podem ter
Campos lessThanOperatorName
e greaterThanOperatorName
em operatorOptions
.
Os usuários podem usar essas opções para criar consultas baseadas em comparações com um valor enviado.
Por fim, o textOperatorOptions
tem um campo exactMatchWithOperator
em
operatorOptions
Se você
exactMatchWithOperator
como true
, a string de consulta precisa
correspondem a todo o valor da propriedade, não apenas no texto.
O valor do texto é tratado como um valor atômico nas pesquisas do operador e nas correspondências com atributos.
Por exemplo, pense em indexar objetos livro ou filme com propriedades de gênero.
Os gêneros podem incluir "Science-Fiction", "Science" e "Fiction". Com
exactMatchWithOperator
definido como false
ou omitido,
pesquisar um gênero ou
selecione "Ciências" ou "Ficção" atributo também
retornar resultados para "ficção científica" já que o texto é tokenizado
"Ciência" e "Ficção" os tokens existem em "Ficção científica".
Quando exactMatchWithOperator
for true
,
o texto é tratado como um único token,
"Ciência" nem "Ficção" corresponde a "ficção científica".
(Opcional) Adicionar a seção displayOptions
Há uma seção displayOptions
opcional no final de qualquer
propertyDefinition
. Esta seção contém uma string displayLabel
.
displayLabel
é um rótulo de texto fácil de usar e recomendado
da propriedade. Se a propriedade estiver configurada para ser exibida usando
ObjectDisplayOptions,
esse rótulo será exibido na frente da propriedade. Se a propriedade estiver configurada
para display e displayLabel
não estiver definido, somente o valor da propriedade será
exibidos.
O snippet a seguir mostra a propriedade movieTitle
com displayLabel
.
definido como "Título".
{
"name": "movieTitle",
"isReturnable": true,
"isWildcardSearchable": true,
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" },
"operatorOptions": {
"operatorName": "title"
}
},
"displayOptions": {
"displayLabel": "Title"
}
},
Veja a seguir os valores displayLabel
para todas as propriedades de movie
.
no esquema de amostra:
Propriedade | displayLabel |
---|---|
movieTitle |
Title |
releaseDate |
Release date |
genre |
Genre |
duration |
Run length |
actorName |
Actor |
userRating |
Audience score |
mpaaRating |
MPAA rating |
(Opcional) Adicionar a seção suggestionFilteringOperators[]
Há um campo opcional
suggestionFilteringOperators[]
ao final de qualquer seção propertyDefinition
. Use esta seção para
define uma propriedade usada para filtrar sugestões de preenchimento automático. Por exemplo,
pode definir o operador de genre
para filtrar sugestões com base no
gênero de filme preferido. Então, quando o usuário digitar sua consulta de pesquisa, apenas aqueles
filmes que correspondem ao gênero preferido são mostrados como parte do preenchimento automático
sugestões.
Registrar o esquema
Para que dados estruturados sejam retornados nas consultas do Cloud Search, é necessário registrar seu esquema com o serviço de esquema do Cloud Search. Para registrar um esquema, você precisa usar o código da fonte de dados conseguido durante a etapa Inicializar uma fonte de dados.
Use o código da fonte de dados para emitir uma solicitação UpdateSchema e registrar seu esquema.
Conforme detalhado na página de referência UpdateSchema, emita a seguinte solicitação HTTP para registrar seu esquema:
PUT https://cloudsearch.googleapis.com/v1/indexing/{name=datasources/*}/schema
O corpo da solicitação precisa conter o seguinte:
{ "validateOnly": // true or false, "schema": { // ... Your complete schema object ... } }
Use a opção validateOnly
para testar a validade do esquema sem
registrá-la de fato.
Indexar os dados
Depois de registrar seu esquema, preencha a fonte de dados usando chamadas de indexação. Normalmente, a indexação é feita no conector de conteúdo.
Usando o esquema de filmes, uma solicitação de indexação à API REST para um único filme teria a seguinte aparência:
{
"name": "datasource/<data_source_id>/items/titanic",
"acl": {
"readers": [
{
"gsuitePrincipal": {
"gsuiteDomain": true
}
}
]
},
"metadata": {
"title": "Titanic",
"sourceRepositoryUrl": "http://www.imdb.com/title/tt2234155/?ref_=nv_sr_1",
"objectType": "movie"
},
"structuredData": {
"object": {
"properties": [
{
"name": "movieTitle",
"textValues": {
"values": [
"Titanic"
]
}
},
{
"name": "releaseDate",
"dateValues": {
"values": [
{
"year": 1997,
"month": 12,
"day": 19
}
]
}
},
{
"name": "actorName",
"textValues": {
"values": [
"Leonardo DiCaprio",
"Kate Winslet",
"Billy Zane"
]
}
},
{
"name": "genre",
"enumValues": {
"values": [
"Drama",
"Action"
]
}
},
{
"name": "userRating",
"integerValues": {
"values": [
8
]
}
},
{
"name": "mpaaRating",
"textValues": {
"values": [
"PG-13"
]
}
},
{
"name": "duration",
"textValues": {
"values": [
"3 h 14 min"
]
}
}
]
}
},
"content": {
"inlineContent": "A seventeen-year-old aristocrat falls in love with a kind but poor artist aboard the luxurious, ill-fated R.M.S. Titanic.",
"contentFormat": "TEXT"
},
"version": "01",
"itemType": "CONTENT_ITEM"
}
Observe como o valor de movie
no campo objectType
corresponde ao objeto
da definição de código no esquema. Ao combinar esses dois valores, o Cloud Search sabe qual objeto de esquema usar durante a indexação.
Observe também como a indexação da propriedade de esquema releaseDate
usa
subpropriedades de year
, month
e day
, que ele herda porque é
definido como um tipo de dados date
usando datePropertyOptions
para defini-lo.
No entanto, como year
, month
e day
não estão definidos no esquema,
não podem consultar uma dessas propriedades (por exemplo, year
) individualmente.
Por fim, observe também como a propriedade repetível actorName
é indexada usando uma lista.
de valores.
Como identificar possíveis problemas de indexação
Os dois problemas mais comuns relacionados a esquemas e indexação são os seguintes:
A solicitação de indexação contém um objeto de esquema ou nome de propriedade que não foi registrado com o serviço de esquema. Esse problema faz com que a propriedade ou objeto seja ignorado.
A solicitação de indexação tem uma propriedade com um valor de tipo diferente do tipo registrado no esquema. Esse problema faz com que o Cloud Search retorne um erro no momento da indexação.
Testar o esquema com vários tipos de consulta
Antes de registrar seu esquema para um grande repositório de dados de produção, teste-o com um repositório de dados de teste menor. Isso ajudará você a fazer ajustes rapidamente no esquema e excluir os dados indexados, sem afetar um índice maior ou o índice em produção atual. Para o repositório de dados de teste, crie uma lista de controle de acesso (ACL, na sigla em inglês) que autorize apenas um usuário de teste para que outros usuários não vejam esses dados nos resultados da pesquisa.
Para criar uma interface de pesquisa para validar tais consultas, leia A interface de pesquisa.
Essa seção contém vários exemplos de consulta para você testar um esquema de filmes.
Testar com uma consulta genérica
Uma consulta genérica retorna todos os itens na fonte de dados que contêm uma string específica. Em uma interface de pesquisa, execute uma consulta genérica em uma fonte de dados de filmes digitando a palavra titanic e pressionando Return. Todos os filmes com a palavra "titanic" serão retornados nos resultados da pesquisa.
Testar com um operador
Adicionar um operador à consulta limita os resultados aos itens que correspondem ao valor do operador. Por exemplo, use o operador actor
para encontrar
todos os filmes estrelados por um ator específico. Usando uma interface de pesquisa, você pode realizar
a essa consulta de operador simplesmente digitando um par operator=value, como
"actor:Zane" e pressione "actor:Zane". Todos os filmes com o ator chamado Zane serão retornados nos resultados da pesquisa.
Ajustar o esquema
Depois que o esquema e os dados estiverem em uso, continue a monitorar o que está dando certo ou não para os usuários. Ajuste seu esquema nas seguintes situações:
- Indexação de um campo que não havia sido indexado anteriormente. Por exemplo, os usuários talvez pesquisem repetidamente filmes com base no nome do diretor. Portanto, ajuste seu esquema para aceitar "directorname" como um operador.
- Alteração dos nomes de operadores de pesquisa como base no feedback de usuários. Os nomes dos operadores precisam ser fáceis de usar. Se os usuários frequentemente usam um nome de operador incorreto, pense em alterá-lo.
Como indexar novamente após a alteração do esquema
Alterar qualquer um dos valores a seguir no esquema não exigirá uma nova indexação dos dados. Basta enviar um novo UpdateSchema e o índice continuará funcionando:
- Nomes de operador
- Valores inteiros mínimos e máximos
- Classificação ordenada de valores inteiro e de enumeração
- Opções de frequência
- Opções de exibição
No caso das alterações a seguir, os dados indexados anteriormente continuarão a funcionar de acordo com o esquema já registrado. No entanto, será necessário indexar novamente as entradas atuais para ver as alterações com base no esquema atualizado, se as seguintes alterações tiverem sido realizadas:
- Inclusão ou remoção de uma propriedade ou um objeto novo
- Alterando
isReturnable
,isFacetable
ouisSortable
defalse
paratrue
.
Defina isFacetable
ou isSortable
como true
somente se você tiver um
caso de uso e necessidade claros.
Por fim, quando você atualiza seu esquema marcando uma propriedade isSuggestable
,
você precisa reindexar seus dados, o que causa um atraso no uso do preenchimento automático para
essa propriedade.
Alterações de propriedade não permitidas
Algumas alterações de esquema não são permitidas, mesmo se você indexar novamente os dados. O motivo disso é que elas podem corromper o índice ou produzir resultados de pesquisa insatisfatórios ou inconsistentes. Dentre as alterações proibidas incluem-se mudanças nos:
- tipos de dados de propriedades;
- nomes de propriedades.
- Configuração
exactMatchWithOperator
. - Configuração
retrievalImportance
.
No entanto, há uma maneira de contornar essa limitação.
Fazer uma alteração complexa no esquema
Para evitar alterações que geram resultados de pesquisa insatisfatórios ou corrompem o índice, o Cloud Search impede certos tipos de mudanças nas solicitações UpdateSchema após a indexação do repositório. Por exemplo, não é possível alterar o tipo de dados ou o nome de uma propriedade depois de definidos. Essas mudanças não pode ser alcançado com uma simples UpdateSchema mesmo que reindexe os dados.
Em situações em que é necessário fazer uma alteração não permitida no seu esquema, costuma ser possível fazer uma série de alterações permitidas que terão o mesmo efeito. Em geral, isso envolve primeiro migrar as propriedades indexadas de uma definição de objeto mais antiga para uma mais recente e, depois, enviar uma solicitação de indexação que usa apenas a propriedade mais nova.
As etapas a seguir mostram como mudar o tipo de dados ou o nome de uma propriedade:
- Adicione uma propriedade nova à definição de objeto no esquema. Use um nome diferente da propriedade que você quer alterar.
- Emita a solicitação UpdateSchema com a definição nova. Lembre-se de enviar o esquema inteiro, incluindo a propriedade nova e a antiga, na solicitação.
Preencha o índice do repositório de dados. Para fazer isso, envie todas as solicitações de indexação usando a propriedade nova, mas não a propriedade antiga. Isso resultaria em uma contagem duplicada de consultas correspondentes.
- Durante o preenchimento da indexação, verifique a propriedade nova e defina como padrão a propriedade antiga para evitar um comportamento inconsistente.
- Após a conclusão do preenchimento, execute consultas de teste para verificar.
Exclua a propriedade antiga. Emita outra solicitação UpdateSchema sem o nome da propriedade antiga e interrompa o uso dele nas futuras solicitações de indexação.
Migre todos os usos da propriedade antiga para a propriedade nova. Por exemplo, se você alterar o nome da propriedade de "creator" para "author", atualize o código de consulta para usar "author" onde anteriormente ele fazia referência a "creator".
O Cloud Search mantém um registro de todas as propriedades ou objetos excluídos por 30 dias para impedir qualquer reutilização que cause resultados de indexação inesperados. Dentro desse período de 30 dias, é necessário migrar todos os usos da propriedade ou objeto excluído, além de omiti-los de futuras solicitações de indexação. Assim, se posteriormente você decidir restabelecer a propriedade ou o objeto, será possível fazê-lo de modo a manter a exatidão do índice.
Conhecer as limitações de tamanho
O Cloud Search impõe limites no tamanho de esquemas e objetos de dados estruturados. Esses limites são os seguintes:
- O número máximo de objetos de nível superior é de 10 objetos.
- A profundidade máxima de uma hierarquia de dados estruturados é de 10 níveis.
- O número total de campos em um objeto é limitado a 1.000, o que inclui o total de campos primitivos mais a soma do número de campos em cada objeto aninhado.
Próximas etapas
Estas são algumas das próximas etapas que podem ser seguidas:
Crie uma interface de pesquisa para testar o esquema.
Ajuste o esquema para melhorar a qualidade da pesquisa.
Estrutura de um esquema para a interpretação ideal de consultas.
Saiba como aproveitar Esquema
_dictionaryEntry
a ser definido sinônimos para termos usados com frequência em sua empresa. Para usar o_dictionaryEntry
esquema, consulte Definir sinônimos.Crie um conector.