פיצוי על הרחבות, פרשנויות ואופטימיזציות ברירת מחדל

ל-Google Cloud Search יש כמה הרחבות, פרשנויות ואופטימיזציות שמוגדרות כברירת מחדל ומשפיעות על תוצאות החיפוש. אם אתם רואים תוצאות חיפוש לא צפויות, כדאי לעיין במדריך הזה לפני שפונים לתמיכה של Cloud Search.

במסמך הזה, שאילתות של משתמשים מופיעות בסוגריים (כמו [query]), ופרשנויות של המערכת מופיעות במירכאות (כמו "interpretation").

תוצאות השאילתה במסמך הזה הן דוגמאות להמחשת התנהגות המערכת, והן מספקות תובנות לגבי אופן הפעולה של הרחבות, פרשנויות ואופטימיזציות. התוצאות בפועל עשויות להיות שונות.

הרחבות שמוגדרות כברירת מחדל

נניח שמשתמש מחפש את המונח [Joe’s PDFs], אבל חלק מהתוצאות מכילות מילים מודגשות כמו "documents" במקום "PDFs". זה קורה כי Cloud Search מרחיב את השאילתה כך שתכלול מילים נרדפות וצורות בסיסיות של מילים, בדומה לחיפוש Google. ההרחבה הזו עוזרת לאחזר מסמכים שתואמים לרעיון ולכוונה של השאילתה. לאחר מכן, אלגוריתמים של דירוג מוודאים שההתאמות הטובות ביותר יופיעו בראש הרשימה.

כשמשתמש מחפש את [Joe’s PDFs], יכול להיות ש-Cloud Search יציע את המילים הנוספות האלה:

  • למשל, [Joe’s] יכול להתאים ל-"joe" (הרחבת גזע) ול-"joes" (מילה נרדפת שמבוססת על פיסוק).
  • לדוגמה, אם מזינים את מילת המפתח [PDFs], יכול להיות שהמערכת תתאים אותה למונחים "documents" (הרחבה באמצעות מילים נרדפות) ו-"pdf" (הרחבה באמצעות גזרון).

מילים נרדפות שמוגדרות כברירת מחדל לא תמיד פועלות בשני הכיוונים. לדוגמה, חיפוש של [phishing] עשוי להתאים ל-"phish", אבל חיפוש של [phish] לא בהכרח יתאים ל-"phishing".

הרחבות למילים עם מקף או קו תחתון

ב-Cloud Search, מילים עם מקף ומילים בלי מקף נחשבות למילים שונות, למשל [walk-in closet] ו-[walk in closet]. הוא גם מבצע אופטימיזציות שונות למילים עם מקף ולמילים עם קו תחתון, כמו [walk-in] ו-[walk_in].

פיצוי על הרחבות ברירת המחדל

מערכת Cloud Search לא מבטיחה הרחבה ספציפית. כדי לוודא שהמערכת תשתמש במילים נרדפות דו-כיווניות או בהרחבות ספציפיות לדומיין, צריך ליצור מילים נרדפות משלכם. מידע נוסף מופיע במאמר בנושא הגדרת מילים נרדפות.

פרשנויות ברירת מחדל

‫Cloud Search מספק פרשנות של שפה טבעית על סמך הסכימה של מקור הנתונים. מידע נוסף מופיע במאמר איך מבנים את הסכימה כדי לקבל פירוש אופטימלי של השאילתות.

השבתת פרשנויות של שפה טבעית

כדי להשבית את הפרשנויות של שפה טבעית לשאילתה ספציפית, צריך להגדיר את הפרמטר QueryInterpretationOptions.disableNlInterpretation לערך true בבקשת החיפוש.

אופטימיזציות ברירת מחדל

אלה האופטימיזציות שמוגדרות כברירת מחדל ב-Cloud Search:

  • שילוב של תיקון איות: בשאילתה [corpoate benefits],‏ Cloud Search מתאים ל-"corpoate" ולאיות הנכון, "corporate".

  • תוצאות משלימות: בשאילתות עם מעט תוצאות או ללא תוצאות, Cloud Search משתמש בקבוצה מותרת של מונחים קשורים. מידע נוסף זמין במאמר בנושא טיפול בתוצאות משניות.

נרמול מסמכים ושאילתות

נרמול הוא תהליך שבו מילים או צירופי מילים עוברים סטנדרטיזציה לפני או אחרי שאילתה. כדי להבטיח תגובות עקביות, כדאי לבצע את שלבי הנורמליזציה הבאים:

  • כדי לנרמל מסמכים:

    1. בוחרים איות קנוני למילים חשובות במאגרי המידע.
    2. לתקן את האיות במסמכי המקור או במהלך הוספה לאינדקס כדי להתאים לטופס הקנוני.
  • כדי לנרמל שאילתות:

    1. חסימת שאילתות של משתמשים לפני שהן נשלחות ל-Cloud Search.
    2. לשכתב מילים בשאילתות כדי להתאים לאיות הנפוץ ביותר במקור הנתונים המאונדקס.
    3. שולחים את השאילתה שנכתבה מחדש אל Cloud Search.

השבתה של הרחבות, פרשנויות ואופטימיזציות

כדי להשבית את התכונות האלה בשאילתה ספציפית, צריך להגדיר את QueryInterpretationOptions.enableVerbatimMode לערך true בבקשת החיפוש.