Como criar um Mecanismo de Pesquisa Programável com arquivos de configuração

Nesta página, apresentamos os conceitos básicos dos arquivos de configuração do Mecanismo de Pesquisa Programável.

  1. Visão geral
  2. O que há em um Mecanismo de Pesquisa Programável
  3. Como os componentes funcionam juntos
  4. Como criar um mecanismo de pesquisa
  5. Como editar os arquivos do Mecanismo de Pesquisa Programável
  6. Como escolher o formato certo

Visão geral

Se o painel de controle não oferecer o nível de personalização que você precisa, use o formato XML da Pesquisa programável, que oferece mais controle, flexibilidade e acesso a recursos mais eficientes.

Para usar os arquivos de configuração do Mecanismo de Pesquisa Programável, comece criando um mecanismo básico no painel de controle do Mecanismo de Pesquisa Programável. Depois de criar o mecanismo de pesquisa, você pode fazer o download das anotações e dos arquivos XML de contexto na página Visão geral do painel de controle.

Noções básicas de XML

A linguagem de marcação extensível, ou XML, é uma linguagem de marcação para fins gerais. É um texto com tags que você pode ler. Por exemplo, o formato XML da Pesquisa programável inclui as seguintes tags: <Context> </Context> e <LookAndFeel> </LookAndFeel>.

Como acontece com qualquer arquivo XML, as especificações do Mecanismo de Pesquisa Programável precisam seguir a sintaxe XML (<element attribute="value">content</element>) e ser bem formadas. O XML tem as seguintes regras:

  • O XML exige que você inclua uma declaração XML antes das tags de nível superior (<?xml version="1.0"?>), mas o arquivo de configuração do Mecanismo de Pesquisa Programável não exige isso.
  • Todos os elementos precisam ter uma tag de abertura (<tag>) e uma tag de fechamento (</tag>).
  • Todas as suas tags devem ser devidamente aninhadas. Não é possível ter um código XML semelhante a: <sandwich><filling> peanut butter</sandwich></filling>. Em vez disso, ele deve ficar assim: <sandwich><filling> peanut butter</filling></sandwich>.
  • O XML diferencia maiúsculas de minúsculas. Por isso, siga com atenção a capitalização e a ortografia das tags nas instruções.
  • Todos os valores de atributo precisam estar entre aspas duplas (<element attribute="value">).
  • Todos os atributos precisam ser definidos na tag de abertura (<element attribute="value">), não na tag de fechamento ( </element>).

É possível escrever anotações por conta própria usando tags de comentário (<!-- your comment here -->). Assim, o Mecanismo de Pesquisa Programável não analisará essa linha de texto como código XML. Além de escrever lembretes ou descrever descrições, você pode usar os comentários para colocar temporariamente um código XML fora de serviço (talvez porque você queira testar certos efeitos ou quer resolver problemas). No entanto, esses comentários não são preservados nos arquivos que você baixa do Painel de Controle. Se quiser manter os comentários, mantenha uma cópia dos arquivos XML comentados mesmo depois de enviá-los ao Painel de controle.

Você pode usar um editor de texto simples para criar e editar arquivos XML. Basta salvar o arquivo de texto com a extensão de arquivo .xml (por exemplo, cse_badminton.xml).

Voltar ao início

O que um Mecanismo de Pesquisa Programável inclui

O Mecanismo de Pesquisa Programável tem dois componentes principais, e cada um deles é controlado por um arquivo XML:

  • Contexto: o arquivo XML de contexto descreve os recursos básicos de um mecanismo de pesquisa. Ela especifica as configurações globais do mecanismo de pesquisa, como a ativação da pesquisa de imagens ou das promoções. Cada mecanismo de pesquisa tem seu próprio arquivo de contexto. Mais informações sobre o arquivo XML de contexto. Para mais informações sobre como selecionar o formato de arquivo mais adequado para seu mecanismo de pesquisa, consulte Como escolher o formato certo para seu mecanismo de pesquisa.
  • Anotações: o arquivo XML de anotações lista as páginas da Web ou sites que você quer que o mecanismo de pesquisa cubra e indica suas preferências sobre como esses sites devem ser classificados nos resultados da pesquisa. Cada site e as informações associadas a ele são chamados de anotação. Mais informações sobre o arquivo XML de anotações.

Não recomendamos que você crie esses arquivos do zero. Em vez disso, faça o download deles na página Visão geral do painel de controle.

Além desses componentes principais, um mecanismo de pesquisa também pode ter os seguintes arquivos auxiliares:

  • Promoções: o arquivo XML de promoções lista uma série de resultados personalizados que são acionados por um conjunto predefinido de termos de consulta. Quando um usuário digita uma pesquisa que corresponde exatamente a um dos seus termos de consulta, a promoção aparece na parte de cima da página. Você pode usar as promoções para responder diretamente às consultas de seus usuários, levá-los a informações importantes ou direcioná-los para páginas da web que não estão no topo da página de resultados, mas são especialmente relevantes. No painel de controle, as promoções são definidas na guia Promoções. Mais informações sobre promoções.
  • Sinônimos: o arquivo XML de sinônimos expande as consultas dos usuários para incluir variantes do termo de pesquisa. Por exemplo, se seu usuário pesquisar por "símio", o mecanismo de pesquisa também procura por "macaco" e "ape". No painel de controle, os sinônimos são definidos na guia Sinônimos. Mais informações sobre sinônimos.

Como os componentes funcionam juntos

O arquivo XML de contexto não especifica o arquivo de anotações a ser usado e o XML de anotações não faz referência ao arquivo de contexto. O Mecanismo de Pesquisa Programável usa marcadores para associar contexto e anotações. O arquivo XML de contexto inclui marcadores que identificam o mecanismo de pesquisa e cada anotação listada nas anotações XML é marcada com um ou mais marcadores identificando os mecanismos de pesquisa aos quais pertence.Se você alterar o nome do marcador no arquivo de contexto, terá que alterar todas as anotações que foram marcadas com esse marcador.

Embora seja possível fazer upload de vários arquivos de anotações, quando você faz o download usando o Painel de Controle, o Mecanismo de Pesquisa Programável mescla todos os arquivos de anotações em um único arquivo de anotações. Os arquivos de anotações oferecem a flexibilidade de personalizar o mesmo site para vários mecanismos de pesquisa. Por exemplo, um mecanismo de pesquisa pode restringir sua pesquisa a alguns sites, outro pode eliminar esses sites e outro pode promover esses sites.

context.xml

Veja um exemplo de arquivo context.xml com marcadores que identificam o mecanismo de pesquisa ao qual ele se aplica:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

Aqui está um exemplo de um arquivo de anotações que mostra como cada site (anotação) está associado a um marcador:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Voltar ao início

Como criar Mecanismos de Pesquisa Programável avançados

A criação de mecanismos avançados envolve as seguintes etapas:

  1. Determine o formato apropriado para suas necessidades.
  2. Defina as especificações do seu mecanismo de pesquisa.
  3. Informar ao Mecanismo de Pesquisa Programável quais sites pesquisar.
  4. Informe o Mecanismo de Pesquisa Programável como classificar os resultados.

Como editar os arquivos do Mecanismo de Pesquisa Programável

Para trabalhar em um arquivo XML, faça o download da especificação XML na página Visão geral do painel de controle. Não inicie um arquivo do zero. Faça o seguinte:

  1. Faça o download do arquivo de contexto ou do arquivo de anotações na página Visão geral do painel de controle. Clique no botão Download na seção Recursos de pesquisa.
  2. Use um editor de texto que possa processar finais de linha no estilo UNIX. O WordPad, Emacs e TextMate funcionam, mas o Bloco de Notas não. Não importa o nome do arquivo, desde que ele seja salvo com a extensão .xml (por exemplo, cx_global.xml)
  3. Faça uma cópia de backup do arquivo baixado caso a versão editada não funcione como esperado e você precise reverter para a versão anterior.

    Se você não fizer uma cópia e a versão editada não funcionar corretamente, será necessário depurar o arquivo ou recriar o mecanismo de pesquisa novamente. Nada divertido.

  4. Edite o arquivo XML e salve-o. Verifique se o editor de texto está salvando o arquivo como um documento de texto Unicode e não em outro formato de arquivo.
  5. Faça upload do arquivo na seção Recursos de pesquisa da página Visão geral.

Como escolher o formato certo

Antes de começar a criar seu Mecanismo de Pesquisa Programável, determine qual formato atende melhor às suas necessidades. Você não quer selecionar um formato mais eficiente e complexo do que precisa, nem quer usar um formato que superará rapidamente.

Use a tabela a seguir para escolher o formato apropriado.

Para criar Usar Devido Limitações Mais informações
Um ou mais mecanismos de pesquisa com um pequeno número de sites. Painel de controle Você pode criar rapidamente seu Mecanismo de Pesquisa Programável preenchendo caixas de texto em vez de criar arquivos com um editor de texto e fazer upload dos arquivos. O painel de controle é útil principalmente para você se familiarizar com o Mecanismo de Pesquisa Programável e criar mecanismos com poucos sites. Primeiros passos
Mecanismos de pesquisa complexos que usam muitos sites e utilizam feeds Arquivo de contexto e arquivos de anotações

Os arquivos do Mecanismo de Pesquisa Programável oferecem um nível maior de controle sobre seus mecanismos de pesquisa e facilitam muito as tarefas de definição e gerenciamento de sites.

Mesmo que você planeje criar seu mecanismo de pesquisa usando arquivos de contexto e anotações, ainda é uma boa ideia se familiarizar com o Painel de controle.

Quanto mais você personaliza o mecanismo de pesquisa, mais complexo ele se torna. Você precisa aprender sobre os elementos e atributos da Pesquisa programável, que não são difíceis de entender, mas exigem que você invista algum tempo.

Você terá que ler o restante do guia do desenvolvedor, que não é o material de leitura mais empolgante, infelizmente.

Contexto: como definir as especificações de um mecanismo de pesquisa e Anotações: seleção de sites

Voltar ao início