יצירת Programmable Search Engine עם קובצי תצורה

בדף הזה נלמד על המושגים הבסיסיים של קובצי תצורה ב-Programmable Search Engine.

  1. סקירה כללית
  2. מה נכלל ב-Programmable Search Engine
  3. איך הרכיבים פועלים יחד
  4. יצירת מנוע חיפוש
  5. עריכת הקבצים של Programmable Search Engine
  6. בחירת הפורמט הנכון

סקירה

אם לוח הבקרה לא מספק את רמת ההתאמה האישית הנדרשת, כדאי להשתמש בפורמט XML של Programmable Search, שמעניק יותר שליטה, גמישות וגישה לתכונות מתקדמות יותר.

כדי להשתמש בקובצי התצורה של Programmable Search Engine, צריך קודם ליצור מנוע חיפוש בסיסי באמצעות לוח הבקרה של Programmable Search Engine. לאחר יצירת מנוע החיפוש, תוכל להוריד את ההערות וקובצי ה-XML של ההקשר מהדף סקירה כללית בלוח הבקרה.

יסודות ה-XML

שפת סימון ניתנת להרחבה או XML היא שפת סימון לשימוש כללי. זהו טקסט עם תגים שניתן לקרוא. לדוגמה, פורמט XML של Programmable Search כולל את התגים הבאים: <Context> </Context> ו-<LookAndFeel> </LookAndFeel>.

כמו בכל קובץ XML, המפרטים של Programmable Search Engine חייבים להתאים לתחביר XML (<element attribute="value">content</element>) ולהיות בפורמט תקין. ב-XML יש את הכללים הבאים:

  • ב-XML נדרש הצהרת XML לפני התגים ברמה העליונה (<?xml version="1.0"?>), אבל קובץ התצורה של Programmable Search Engine לא מחייב זאת.
  • כל הרכיבים חייבים לכלול תג פותח (<tag>) ותג סוגר (</tag>).
  • כל התגים צריכים להיות מקוננים כראוי. אין לך אפשרות להשתמש בקוד XML שנראה כך: <sandwich><filling> peanut butter</sandwich></filling>. במקום זאת, הוא אמור להיראות כך: <sandwich><filling> peanut butter</filling></sandwich>.
  • XML הוא תלוי אותיות רישיות, לכן חשוב להקפיד על אותיות רישיות ואיות של התגים שבהוראות.
  • כל ערכי המאפיינים צריכים להיות מוקפים במירכאות כפולות (<element attribute="value">).
  • יש להגדיר את כל המאפיינים בתג הפותח (<element attribute="value">), ולא בתג הסוגר ( </element>).

אתם יכולים לכתוב הערות בעצמכם באמצעות תגי תגובות (<!-- your comment here -->), ו-Programmable Search Engine לא ינתח את שורת הטקסט הזו כקוד XML. מלבד כתיבת תזכורות או תיאורים, אתם יכולים להשתמש בתגובות כדי להוציא באופן זמני קוד XML מהעמלה (למשל, כי אתם רוצים לנסות אפקטים מסוימים או לפתור בעיות). עם זאת, הערות אלה לא יישמרו בקבצים שהורדת מלוח הבקרה. אם ברצונך לשמור את התגובות, מומלץ לשמור עותק של קובצי ה-XML שהגיבו לך, גם אחרי שמעלים אותם ללוח הבקרה.

ניתן להשתמש בעורך טקסט פשוט כדי ליצור ולערוך קובצי XML. פשוט שומרים את קובץ הטקסט עם סיומת הקובץ .xml (לדוגמה, cse_badminton.xml).

חזרה למעלה

מה כלול ב-Programmable Search Engine

ל-Programmable Search Engine יש שני רכיבים עיקריים, שכל אחד מהם נשלט באמצעות קובץ XML:

  • הקשר: קובץ ה-XML של ההקשר מתאר את התכונות הבסיסיות של מנוע חיפוש. המדיניות מציינת את ההגדרות הגלובליות של מנוע החיפוש, למשל אם חיפוש תמונות או קידומי מכירות מופעלים. לכל מנוע חיפוש יש קובץ הקשר משלו. מידע נוסף על קובץ ה-XML להקשר. למידע נוסף על בחירת פורמט הקובץ המתאים ביותר למנוע החיפוש שלך, ראה בחירת הפורמט המתאים למנוע החיפוש שלך.
  • הערות: קובץ ה-XML של ההערות מציין את דפי האינטרנט או האתרים שברצונך שמנוע החיפוש שלך יכסה, ומציין את ההעדפות שלך לגבי אופן הדירוג של אתרים אלה בתוצאות החיפוש שלך. כל אתר והמידע שמשויך אליו נקראים הערה. מידע נוסף על קובץ ה-XML של ההערות.

לא מומלץ ליצור אחד מהקבצים האלה מאפס. במקום זאת, אפשר להוריד אותם מהדף סקירה כללית בלוח הבקרה.

בנוסף לרכיבים העיקריים האלו, מנוע החיפוש יכול לכלול גם את קובצי העזר הבאים:

  • קידומי מכירות: קובץ ה-XML של הקידומים כולל סדרה של תוצאות מותאמות אישית שמופעלות על ידי קבוצה מוגדרת מראש של מונחי שאילתה. כאשר משתמש מקליד חיפוש שתואם במדויק לאחד ממונחי השאילתה שלך, הקידום מופיע בראש הדף. אתם יכולים להשתמש בקידומים כדי לענות ישירות על שאילתות של המשתמשים, להוביל אותם למידע חשוב או להפנות אותם לדפי אינטרנט שלא נמצאים בחלק העליון של דף התוצאות, אבל הם רלוונטיים במיוחד. בלוח הבקרה, קידומים מוגדרים בכרטיסייה קידומי מכירות. מידע נוסף על מבצעים
  • מילים נרדפות: קובץ ה-XML של המילים הנרדפות מרחיב את שאילתות המשתמשים כך שיכלול וריאציות של מונח החיפוש. לדוגמה, אם המשתמש מחפש את המילים "קוף", מנוע החיפוש יחפש גם את המילים "קוף" ו "קוף". בלוח הבקרה, מילים נרדפות מוגדרות בכרטיסייה מילים נרדפות. מידע נוסף על מילים נרדפות.

כיצד הרכיבים פועלים יחד

קובץ ה-XML של ההקשר אינו מציין את קובץ ההערות שבו יש להשתמש, וה-XML של ההערות אינו מפנה לקובץ ההקשר. Programmable Search Engine משתמש בתוויות כדי לשייך הקשר והערות. קובץ ה-XML של ההקשר כולל תוויות שמזהות את מנוע החיפוש, וכל הערה שמופיעה ב-XML של ההערות מתויגת בתווית אחת או יותר המזהה את מנועי החיפוש שאליהם היא שייכת.אם משנים את שם התווית בקובץ ההקשר, צריך לשנות את כל ההערות שתויגו באותה תווית.

על אף שניתן להעלות קובצי הסברים מרובים, כאשר מורידים אותם דרך לוח הבקרה, Programmable Search Engine ממזג את כל קובצי ההערות לקובץ הערות יחיד. קובצי ההערות מספקים גמישות להתאמה אישית של אותו אתר עבור מנועי חיפוש שונים. לדוגמה, מנוע חיפוש אחד יכול להגביל את החיפוש שלו לאתרים מסוימים, מנוע חיפוש אחר יכול להסיר את האתרים האלה ועוד מנוע חיפוש אחר יכול לקדם את האתרים האלה.

context.xml

הנה דוגמה לקובץcontext.xml שמכיל תוויות שמזהות את מנוע החיפוש שעליו הוא חל:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

הנה דוגמה לקובץ רישומים שמראה איך כל אתר (הערה) משויך לתווית:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

חזרה למעלה

יצירת מנועי חיפוש מתקדמים (Programmable Search Engine)

כדי ליצור מנועים מתקדמים, צריך לבצע את השלבים הבאים:

  1. קובעים את הפורמט שמתאים לצרכים שלכם.
  2. מגדירים את המפרטים של מנוע החיפוש.
  3. איך מורים ל-Programmable Search Engine באילו אתרים לחפש.
  4. Tell Programmable Search Engine איך לדרג את תוצאות החיפוש.

עריכת הקבצים ב-Programmable Search Engine

כדי לעבוד על קובץ XML, הורד את מפרט ה-XML מהדף סקירה כללית בלוח הבקרה. אין ליצור קובץ מאפס. בצע את הפעולות הבאות:

  1. הורד את קובץ ההקשר או את קובץ ההערות מהדף סקירה כללית בלוח הבקרה. לוחצים על הלחצן הורדה בקטע תכונות חיפוש.
  2. משתמשים בעורך טקסט שיכול להתמודד עם סיומות שורות בסגנון UNIX (WordPad, Emacs ו-TextMate פועל, אבל ב-NotePad לא פועלים). לא משנה מה שם הקובץ, כל עוד שומרים אותו עם סיומת הקובץ .xml (לדוגמה, cx_global.xml)
  3. מומלץ ליצור עותק גיבוי של הקובץ שהורדתם למקרה שהגרסה הערוכה לא תפעל כצפוי, ותצטרכו לחזור לגרסה הקודמת.

    אם לא תיצור עותק והגרסה שערכת לא תפעל כראוי, יהיה עליך לנפות באגים בקובץ או ליצור מחדש את מנוע החיפוש. לא נהניתי.

  4. צריך לערוך את קובץ ה-XML ולשמור אותו. ודא שעורך הטקסט שומר את הקובץ כמסמך טקסט בפורמט Unicode ולא בפורמט קובץ אחר.
  5. מעלים את הקובץ בקטע תכונות חיפוש שבדף סקירה כללית.

בחירת הפורמט הנכון

לפני שאתם מתחילים ליצור את Programmable Search Engine, עליכם לבדוק איזה פורמט הכי מתאים לצרכים שלכם. אתם לא רוצים לבחור בפורמט שהוא יותר חזק ומורכב ממה שאתם צריכים, וגם לא להשתמש בפורמט שיגדיל את השטח שלכם במהירות.

היעזרו בטבלה הבאה כדי לבחור את הפורמט המתאים.

ליצירה שימוש כי מגבלות מידע נוסף
מנוע חיפוש אחד או כמה מנועי חיפוש עם מספר קטן של אתרים לוח הבקרה אפשר ליצור במהירות Programmable Search Engine באמצעות מילוי תיבות טקסט, במקום יצירת קבצים באמצעות עורך טקסט והעלאת הקבצים. לוח הבקרה שימושי בעיקר כדי להכיר את Programmable Search Engine וליצור מנועי חיפוש באתרים מעטים. איך מתחילים
מנועי חיפוש מורכבים שמשתמשים באתרים רבים, משתמשים בעדכונים קובצי הקשר והערות

קובצי Programmable Search Engine מעניקים לך שליטה רבה יותר על מנועי החיפוש, והופכים את משימות ההגדרה והניהול של אתרים לפשוטות יותר.

למרות שבכוונתך ליצור את מנוע החיפוש באמצעות קובצי הקשר והערות, עדיין מומלץ להכיר את לוח הבקרה.

ככל שתבצעו התאמה אישית של מנוע החיפוש, כך הוא יהיה מורכב יותר. צריך ללמוד על הרכיבים והמאפיינים של Programmable Search, שקשה להבין אותם, אבל כן צריך להשקיע בהם זמן.

לצערי, יהיה עליך לקרוא את שאר המדריך למפתחים, שאינו חומר הקריאה המלהיב ביותר.

הקשר: הגדרת מפרטים של מנוע חיפוש והערות: בחירת אתרים

חזרה למעלה