Creare un Motore di ricerca programmabile con i file di configurazione

Questa pagina introduce i concetti di base alla base dei file di configurazione di Motore di ricerca programmabile.

  1. Panoramica
  2. Cosa comprende un Motore di ricerca programmabile
  3. Come funzionano insieme i componenti
  4. Creazione di un motore di ricerca
  5. Modificare i file del Motore di ricerca programmabile
  6. Scegliere il formato giusto

Panoramica

Se il pannello di controllo non ti offre il livello di personalizzazione necessario, puoi utilizzare il formato XML Ricerca programmabile, che ti offre controllo e flessibilità maggiori e l'accesso a funzionalità più potenti.

Per utilizzare i file di configurazione di Motore di ricerca programmabile, inizia creando un motore di ricerca di base utilizzando il Pannello di controllo di Motore di ricerca programmabile. Una volta creato il tuo motore di ricerca, puoi scaricare le annotazioni e i file XML di contesto dalla pagina Panoramica del pannello di controllo.

Nozioni di base su XML

XML, o Extensible Markup Language, è un linguaggio di markup per uso generico. Si tratta di testo con tag che puoi leggere. Ad esempio, il formato XML di Ricerca programmabile include i seguenti tag: <Context> </Context> e <LookAndFeel> </LookAndFeel>.

Come per qualsiasi file XML, le specifiche di Motore di ricerca programmabile devono seguire la sintassi XML (<element attribute="value">content</element>) ed essere strutturate correttamente. Il formato XML prevede le seguenti regole:

  • Il formato XML richiede di anteporre ai tag di primo livello una dichiarazione XML (<?xml version="1.0"?>), che però non è obbligatoria per il file di configurazione Motore di ricerca programmabile.
  • Tutti gli elementi devono avere un tag di apertura (<tag>) e un tag di chiusura (</tag>).
  • Tutti i tag devono essere nidificati correttamente. Non puoi avere un codice XML simile al seguente: <sandwich><filling> peanut butter</sandwich></filling>. Invece, dovrebbe essere: <sandwich><filling> peanut butter</filling></sandwich>.
  • XML è sensibile alle maiuscole, quindi segui attentamente le lettere maiuscole e l'ortografia dei tag nelle istruzioni.
  • Tutti i valori degli attributi devono essere racchiusi tra virgolette doppie (<element attribute="value">).
  • Tutti gli attributi devono essere definiti nel tag di apertura (<element attribute="value">), non nel tag di chiusura ( </element>).

Puoi scrivere note personali utilizzando i tag di commento (<!-- your comment here -->) e Motore di ricerca programmabile non analizzerà quella riga di testo come codice XML. Oltre a scrivere promemoria o descrizioni, puoi utilizzare i commenti per mettere temporaneamente fuori servizio del codice XML (ad esempio perché vuoi provare alcuni effetti o risolvere dei problemi). Tuttavia, questi commenti non vengono conservati nei file scaricati dal pannello di controllo. Se vuoi conservare i commenti, devi conservare una copia dei file XML commentati anche dopo averli caricati nel pannello di controllo.

Puoi utilizzare un semplice editor di testo per creare e modificare i file XML. È sufficiente salvare il file di testo con l'estensione .xml (ad esempio, cse_badminton.xml).

Torna all'inizio

Che cosa c'è in un Motore di ricerca programmabile

Un Motore di ricerca programmabile ha due componenti principali, ciascuno dei quali è controllato da un file XML:

  • Contesto: il file XML di contesto descrive le funzionalità di base di un motore di ricerca. Specifica le impostazioni globali del motore di ricerca, ad esempio se la ricerca di immagini o le promozioni sono attive. Ogni motore di ricerca ha il proprio file di contesto. Scopri di più sul file XML di contesto. Per ulteriori informazioni sulla selezione del formato file più appropriato per il tuo motore di ricerca, consulta Scelta del formato giusto per il tuo motore di ricerca.
  • Annotazioni. Il file XML delle annotazioni elenca le pagine web o i siti web che il tuo motore di ricerca deve trattare e indica le tue preferenze sul ranking di questi siti nei tuoi risultati di ricerca. Ogni sito e le relative informazioni associate costituiscono un'annotazione. Scopri di più sul file XML delle annotazioni.

Non è consigliabile creare uno di questi file da zero. Puoi invece scaricarli dalla pagina Panoramica del pannello di controllo.

Oltre a questi componenti principali, un motore di ricerca può avere anche i seguenti file ausiliari:

  • Promozioni: il file XML delle promozioni elenca una serie di risultati personalizzati che vengono attivati da un insieme predefinito di termini di query. Quando un utente digita una ricerca che corrisponde esattamente a uno dei tuoi termini di query, nella parte superiore della pagina viene visualizzata la promozione. Puoi utilizzare le promozioni per rispondere direttamente alle query dei tuoi utenti, indirizzarli verso informazioni importanti o indirizzarli a pagine web che non si trovano in cima alla pagina dei risultati ma che sono particolarmente pertinenti. Nel pannello di controllo, le promozioni sono definite nella scheda Promozioni. Scopri di più sulle promozioni.
  • Sinonimi: il file XML dei sinonimi espande le query degli utenti in modo da includere varianti del termine di ricerca. Ad esempio, se l'utente cerca "scimmia", il motore di ricerca cerca anche "scimmia" e "scimmia". Nel pannello di controllo, i sinonimi sono definiti nella scheda Sinonimi. Scopri di più sui sinonimi.

Come funzionano insieme i componenti

Il file XML di contesto non specifica il file di annotazioni da utilizzare, mentre il file XML delle annotazioni non fa riferimento al file di contesto. Motore di ricerca programmabile utilizza le etichette per associare contesto e annotazioni. Il file XML di contesto include etichette che identificano il motore di ricerca e ogni annotazione elencata nel file XML delle annotazioni è codificata con una o più etichette che identificano il motore o i motori di ricerca a cui appartiene.Se modifichi il nome dell'etichetta nel file di contesto, devi modificare tutte le annotazioni contrassegnate con quella etichetta.

Anche se puoi caricare più file di annotazioni, quando li scarichi tramite il Pannello di controllo, Motore di ricerca programmabile unisce tutti i file delle annotazioni in un unico file di annotazioni. I file di annotazioni offrono la flessibilità di personalizzare lo stesso sito per vari motori di ricerca. Ad esempio, un motore di ricerca potrebbe limitare la ricerca ad alcuni siti, un altro potrebbe eliminare quei siti e un altro ancora potrebbe promuovere questi siti.

context.xml

Ecco un esempio di file context.xml contenente le etichette che identificano il motore di ricerca a cui si applica:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

Ecco un esempio di file di annotazioni che mostra in che modo ogni sito (annotazione) è associato a un'etichetta:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Torna all'inizio

Creare motori di ricerca programmabili avanzati

La creazione di motori avanzati prevede i seguenti passaggi:

  1. Determina il formato più adatto alle tue esigenze.
  2. Definisci le specifiche per il tuo motore di ricerca.
  3. Indicare al Motore di ricerca programmabile su quali siti cercare.
  4. Indicare a Motore di ricerca programmabile come classificare i risultati di ricerca.

Modificare i file del Motore di ricerca programmabile

Per lavorare su un file XML, scarica la specifica XML dalla pagina Panoramica del pannello di controllo. Non creare un file da zero. Procedi nel seguente modo:

  1. Scarica il file di contesto o il file delle annotazioni dalla pagina Panoramica del pannello di controllo. Fai clic sul pulsante Scarica nella sezione Funzioni di ricerca.
  2. Utilizza un editor di testo in grado di gestire le terminazioni di riga in stile UNIX (WordPad, Emacs e TextMate funzionano, ma non NotePad). Il nome del file non è importante, purché tu lo salvi con l'estensione del file .xml (ad esempio, cx_global.xml)
  3. Crea una copia di backup del file scaricato nel caso in cui la versione modificata non funzioni come previsto e tu debba ripristinare la versione precedente.

    Se non fai una copia e la versione che hai modificato non funziona correttamente, dovrai eseguire il debug del file o ricreare di nuovo il tuo motore di ricerca. Non divertente.

  4. Modifica il file XML e salvalo. Assicurati che l'editor di testo salvi il file come documento di testo Unicode e non come altro formato file.
  5. Carica il file nella sezione Funzioni di ricerca della pagina Panoramica.

Scelta del formato giusto

Prima di iniziare a creare il tuo Motore di ricerca programmabile, determina il formato più adatto alle tue esigenze. Ti consigliamo di non selezionare un formato più efficace e complesso di quello che ti serve né di utilizzarne uno che si rischia di superare rapidamente.

Utilizza la seguente tabella per scegliere il formato appropriato.

Per creare Utilizzo Poiché Limitazioni Maggiori informazioni
Uno o pochi motori di ricerca con un numero ridotto di siti Pannello di controllo Puoi creare rapidamente il tuo Motore di ricerca programmabile compilando caselle di testo anziché creare file con un editor di testo e caricarli. Il pannello di controllo è utile soprattutto per familiarizzare con Motore di ricerca programmabile e creare motori di ricerca con pochi siti. Per iniziare
I motori di ricerca complessi che utilizzano molti siti utilizzano i feed File di contesto e file di annotazioni

I file del Motore di ricerca programmabile ti offrono un maggiore livello di controllo sui motori di ricerca e molto più semplici le attività di definizione e gestione dei siti.

Anche se prevedi di creare il tuo motore di ricerca utilizzando file di contesto e annotazioni, è buona norma acquisire dimestichezza con il pannello di controllo.

Più personalizzi il motore di ricerca, più diventa complesso. Devi imparare gli elementi e gli attributi di Ricerca programmabile, che non sono difficili da acquisire, ma richiedono un investimento di tempo.

Purtroppo devi leggere il resto della guida per gli sviluppatori, che non è il materiale di lettura più interessante.

Contesto: definizione delle specifiche di un motore di ricerca e Annotazioni: selezione di siti

Torna all'inizio