Создание программируемой поисковой системы с помощью файлов конфигурации

На этой странице представлены основные понятия, лежащие в основе файлов конфигурации программируемой поисковой системы.

  1. Обзор
  2. Что такое программируемая поисковая система
  3. Как компоненты работают вместе
  4. Создание поисковой системы
  5. Редактирование файлов программируемой поисковой системы
  6. Выбор правильного формата

Обзор

Если панель управления не обеспечивает необходимый уровень настройки, рассмотрите возможность использования XML-формата программируемого поиска, который дает вам больше контроля, гибкости и доступа к более мощным функциям.

Чтобы использовать файлы конфигурации программируемой поисковой системы, начните с создания базовой поисковой системы с помощью панели управления программируемой поисковой системы . После создания поисковой системы вы можете загрузить аннотации и контекстные XML-файлы со страницы «Обзор» панели управления.

Основы XML

Расширяемый язык разметки или XML — это язык разметки общего назначения. Это текст с тегами, который вы можете прочитать. Например, формат XML программируемого поиска включает следующие теги: <Context> </Context> и <LookAndFeel> </LookAndFeel> .

Как и в случае с любым файлом XML, спецификации вашей программируемой поисковой системы должны соответствовать синтаксису XML ( <element attribute="value">content</element> ) и быть правильно сформированными. XML имеет следующие правила:

  • XML требует, чтобы перед тегами верхнего уровня было объявление XML ( <?xml version="1.0"?> ), но файл конфигурации программируемой поисковой системы этого не требует.
  • Все ваши элементы должны иметь открывающий тег ( <tag> ) и закрывающий тег ( </tag> ).
  • Все ваши теги должны быть правильно вложены. У вас не может быть XML-кода, который выглядит так: <sandwich><filling> peanut butter</sandwich></filling> . Вместо этого должно быть что-то вроде: <sandwich><filling> peanut butter</filling></sandwich> .
  • XML чувствителен к регистру, поэтому внимательно следите за регистром и написанием тегов в инструкциях.
  • Все значения атрибутов должны быть заключены в двойные кавычки ( <element attribute="value"> ).
  • Все атрибуты должны быть определены в открывающем теге ( <element attribute="value"> ), а не в закрывающем теге ( </element> ).

Вы можете писать для себя заметки, используя теги комментариев ( <!-- your comment here --> ), и Программируемая поисковая система не будет анализировать эту строку текста как XML-код. Помимо написания напоминаний или описаний, вы можете использовать комментарии, чтобы временно вывести из строя некоторый XML-код (возможно, потому, что вы хотите поэкспериментировать с определенными эффектами или устранить проблемы). Однако эти комментарии не сохраняются в файлах, которые вы загружаете из Панели управления. Если вы хотите сохранить комментарии, вам следует сохранять копии прокомментированных XML-файлов даже после их загрузки на панель управления.

Вы можете использовать простой текстовый редактор для создания и редактирования файлов XML. Просто сохраните текстовый файл с расширением .xml (например, cse_badminton.xml ).

Вернуться наверх

Что такое программируемая поисковая система

Программируемая поисковая система состоит из двух основных компонентов, каждый из которых управляется XML-файлом:

  • Контекст : XML-файл контекста описывает основные функции поисковой системы. Он определяет глобальные настройки поисковой системы, например, включен ли поиск изображений или рекламные акции. Каждая поисковая система имеет свой собственный файл контекста. Дополнительная информация о контекстном XML-файле. Дополнительную информацию о выборе наиболее подходящего формата файла для вашей поисковой системы см. в разделе «Выбор правильного формата для вашей поисковой системы» .
  • Аннотации : XML-файл аннотаций перечисляет веб-страницы или веб-сайты, которые должна охватить ваша поисковая система, и указывает любые ваши предпочтения относительно того, как эти сайты должны ранжироваться в результатах поиска. Каждый сайт и связанная с ним информация называется аннотацией . Дополнительная информация о XML-файле аннотаций.

Мы не рекомендуем создавать ни один из этих файлов с нуля. Вместо этого загрузите их со страницы «Обзор» панели управления.

Помимо этих основных компонентов поисковая система может также иметь следующие вспомогательные файлы:

  • Рекламные акции : XML-файл рекламных акций содержит ряд пользовательских результатов, которые инициируются заранее определенным набором условий запроса. Когда пользователь вводит поисковый запрос, который точно соответствует одному из условий вашего запроса, рекламное объявление появляется в верхней части страницы. Вы можете использовать рекламные акции, чтобы напрямую отвечать на запросы ваших пользователей, направлять их к важной информации или направлять их на веб-страницы, которые не находятся в верхней части страницы результатов, но особенно релевантны. В Панели управления акции определяются во вкладке «Акции» . Подробная информация об акциях.
  • Синонимы : XML-файл синонимов расширяет запросы ваших пользователей, включая варианты поискового запроса. Например, если ваш пользователь ищет «обезьяна», поисковая система также ищет «обезьяну» и «обезьяну». В Панели управления синонимы определяются на вкладке Синонимы . Дополнительная информация о синонимах.

Как компоненты работают вместе

XML-файл контекста не определяет используемый файл аннотаций, а XML-аннотации не ссылаются на файл контекста. Программируемая поисковая система использует метки для связывания контекста и аннотаций. Контекстный XML-файл включает метки, идентифицирующие поисковую систему, и каждая аннотация, указанная в XML-аннотациях, помечена одной или несколькими метками, идентифицирующими поисковую систему(и), которой она принадлежит. Если вы измените имя метки в контексте файл, вам придется изменить все аннотации, помеченные этой меткой.

Хотя вы можете загрузить несколько файлов аннотаций, когда вы загружаете их через панель управления, Программируемая поисковая система объединяет все ваши файлы аннотаций в один файл аннотаций. Файлы аннотаций обеспечивают гибкость настройки одного и того же сайта для различных поисковых систем. Например, одна поисковая система может ограничить поиск некоторыми сайтами, другая может исключить эти сайты, а третья может продвигать эти сайты.

контекст.xml

Вот пример файла context.xml, содержащего метки, идентифицирующие поисковую систему, к которой он применяется:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

аннотации.xml

Ниже приведен пример файла аннотаций, показывающий, как каждый сайт (аннотация) связан с меткой:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

Вернуться наверх

Создание продвинутых программируемых поисковых систем

Создание усовершенствованных двигателей включает в себя следующие шаги:

  1. Определите формат , который соответствует вашим потребностям.
  2. Определите характеристики вашей поисковой системы.
  3. Сообщите Программируемой поисковой системе, на каких сайтах выполнять поиск .
  4. Расскажите Программируемой поисковой системе, как ранжировать результаты поиска .

Редактирование файлов программируемой поисковой системы

Чтобы работать с XML-файлом, загрузите спецификацию XML со страницы «Обзор» панели управления. Не начинайте файл с нуля. Сделайте следующее:

  1. Загрузите файл контекста или файл аннотаций со страницы «Обзор» панели управления. Нажмите кнопку «Загрузить» в разделе «Функции поиска» .
  2. Используйте текстовый редактор, который может обрабатывать окончания строк в стиле UNIX (WordPad, Emacs и TextMate работают, а NotePad — нет). Не имеет значения, как вы назовете файл, главное, чтобы вы сохранили его с расширением .xml (например, cx_global.xml ).
  3. Сделайте резервную копию загруженного файла на случай, если отредактированная версия не будет работать должным образом и вам придется вернуться к предыдущей версии.

    Если вы не сделаете копию и отредактированная вами версия не будет работать должным образом, вам придется отладить файл или заново создать поисковую систему. Не весело.

  4. Отредактируйте XML-файл и сохраните его. Убедитесь, что ваш текстовый редактор сохраняет файл как текстовый документ Unicode, а не какой-либо другой формат файла.
  5. Загрузите файл в раздел «Функции поиска» на странице «Обзор» .

Выбор правильного формата

Прежде чем приступить к созданию программируемой поисковой системы, определите, какой формат лучше всего соответствует вашим потребностям. Вы не хотите выбирать более мощный и сложный формат, чем тот, который вам нужен, и не хотите использовать тот, который вы быстро перерастете.

Используйте следующую таблицу, чтобы выбрать подходящий формат.

Создавать Использовать Потому что Ограничения Больше информации
Одна или несколько поисковых систем с небольшим количеством сайтов Панель управления Вы можете быстро создать свою программируемую поисковую систему, заполнив текстовые поля вместо того, чтобы создавать файлы в текстовом редакторе и загружать их. Панель управления в основном полезна для ознакомления с программируемой поисковой системой и создания поисковых систем с небольшим количеством сайтов. Начиная
Сложные поисковые системы, использующие множество сайтов, используют каналы Контекстный файл и файлы аннотаций

Файлы программируемой поисковой системы дают вам более высокий уровень контроля над вашими поисковыми системами и значительно упрощают задачи по определению сайтов и управлению ими.

Даже если вы планируете создать свою поисковую систему с использованием файлов контекста и аннотаций, все равно рекомендуется ознакомиться с панелью управления.

Чем больше вы настраиваете свою поисковую систему, тем сложнее она становится. Вам необходимо изучить элементы и атрибуты программируемого поиска, которые нетрудно освоить, но они требуют от вас некоторого времени.

Вам придется прочитать остальную часть руководства для разработчиков, которое, к сожалению, не является самым интересным материалом для чтения.

Контекст: определение характеристик поисковой системы и аннотаций: выбор сайтов

Вернуться наверх