ב-Google Cloud Search יש כמה פעולות אופטימיזציה, פרשנות והרחבות שמוגדרות כברירת מחדל ומשפיעות על תוצאות החיפוש. אם מופיעות תוצאות לא צפויות משאילתות חיפוש, כדאי לעיין במדריך הזה לפני שפונים לתמיכה של Cloud Search.
הרחבות ברירת מחדל
נניח שמשתמש מחפש באמצעות מחרוזת, כמו [קובצי ה-PDF של יוסי], אבל חלק מהתוצאות שהתקבלו מכילות מילים מודגשות, כמו 'מסמכים' במקום 'קובצי PDF'. למה התוצאות מכילות את המילים המודגשות שלא היו בשאילתת החיפוש?
כברירת מחדל, Google Cloud Search, בדומה לחיפוש האינטרנט של Google, לא מחפש רק את המילים המדויקות בשאילתה. במקום זאת, Cloud Search מרחיב את השאילתה כך שתכלול מילים נרדפות ושורשי מילים (גם אם לא הטמעתם מילים נרדפות משלכם). ההרחבה הזו נועדה לאחזר מסמכים שתואמים באופן כללי לרעיון ולכוונת השאילתה. אחרי שבוחרים את קבוצת המסמכים הרחבה הזו, אלגוריתמי הדירוג פועלים כדי לוודא שההתאמות הטובות ביותר יוצגו בחלק העליון של קבוצת התוצאות.
כשהמשתמש חיפש את [PDFs של יוסי], Cloud Search סיפק את המילים הבאות כמילים נוספות קבילות:
- עבור [Joe's], יכול להיות שמערכת החיפוש ב-Cloud תתאים גם ל-'joe' (הרחבה של תחילית) ול-'joes' (ת synonym שמבוסס על סימני פיסוק).
- עבור [קובצי PDF], יכול להיות שמערכת Cloud Search תתאים גם למונחים 'מסמכים' (הרחבה של שם נרדף) ו-'pdf' (הרחבה של שורש).
כברירת מחדל, מונחים נרדפים לא חייבים להיות דו-כיווניים. לדוגמה, אם משתמש מחפש את המונח 'פישינג', יכול להיות שמערכת Cloud Search תתאים את המונח 'פיש' כהרחבה של שם נרדף. עם זאת, אם המשתמש יחפש את המונח 'פישינג', יכול להיות ש-Google לא תתאים את 'פישינג' כהתאמה מורחבת.
הרחבות למילים עם מקף לעומת מילים ללא מקף
כשהמשתמש מחפש מילים עם מקף לעומת המילים המקבילות ללא מקף, כמו [חדר ארונות] ו-[חדר ארונות], Cloud Search מתייחס לשאילתות האלה באופן שונה.
בנוסף, נעשה שימוש באופטימיזציות שונות למילים עם מקף ובמילים עם קו תחתון, כמו [walk-in] ו-[walk_in].
פיצוי על התרחבות שמוגדרות כברירת מחדל
אין ערובה להרחבה כלשהי כברירת מחדל. אם אתם רוצים לוודא שאפשר להשתמש בביטויים נרדפים בשני הכיוונים או להרחיב אותם לדומיינים ספציפיים, תוכלו ליצור קבוצה משלכם של ביטויים נרדפים לדומיינים ספציפיים. מידע נוסף על הטמעת מילים נרדפות זמין במאמר הגדרת מילים נרדפות.
פרשנויות ברירת מחדל
ב-Cloud Search יש גם תרגום לשפה טבעית, שמפרש את האובייקטים, המאפיינים וערכות השדות שמשמשים בשאילתה בהתאם להסכימה שהועלו למקור נתונים מסוים. למידע נוסף על הפרשנות בשפה טבעית, אפשר לעיין במאמר מבנה הסכימה לצורך פרשנות אופטימלית של שאילתות.
השבתת פרשנויות בשפה טבעית
כדי להשבית את הפרשנות בשפה טבעית לשאילתה ספציפית, צריך להגדיר את הערך true
לפרמטר QueryInterpretationOptions.disableNlInterpretation
בבקשת החיפוש.
אופטימיזציות ברירת מחדל
ב-Cloud Search יש גם את האופטימיזציות הבאות כברירת מחדל:
שילוב של תוצאות שמתקבלות מתיקון איות. לדוגמה, אם מחרוזת השאילתה היא [corpoate benefits], חיפוש Cloud יתאים ל-corporate ולכתיב הנכון של corporate.
בשאילתות שלא מניבות אף תוצאה או מעט תוצאות, כשמתבצעת התאמה של תוצאות, Cloud Search משתמש בקבוצה רחבה יותר של מונחים קשורים, רחבה יותר ממונחים נרדפים ישירים. מידע נוסף זמין במאמר טיפול בתוצאות משלימות.
נירמול מסמכים ושאילתות
'נורמליזציה' היא תהליך של סטנדרטיזציה של מילים או ביטויים מסוימים לפני או אחרי שליחת שאילתה. כדי להבטיח תגובות עקביות יותר לשאילתות, מומלץ לבצע נורמליזציה של המסמכים (לפני ההוספה לאינדקס או במהלכה) ושל השאילתות (אחרי שהמשתמש הפעיל את השאילתה) בדרכים הבאות:
כדי לנרמל מסמכים:
- כדאי לבחור איות קנוני למילים קריטיות שמופיעות במסמכים במאגרים שלכם.
- מתקנים את האיות במסמכים במאגר המקור, או כשמוסיפים תוכן לאינדקס, כך שיתאים לאיות הקנוני.
כדי לנרמל שאילתות:
- ליירט שאילתות של משתמשים לפני שליחתן אל Cloud Search.
- שכתוב מילים בשאילתות של משתמשים כך שיתאימו לאיות הנפוץ ביותר במקור הנתונים שנוסף לאינדקס.
- שולחים את השאילתה אל Cloud Search.
השבתת הרחבות, פרשנויות ואופטימיזציות לכל השאילתות
כדי להשבית את התכונות 'הרחבות', 'פרשנויות' ו'אופטימיזציות' בשאילתה ספציפית, צריך להגדיר את הערך true
במקום QueryInterpretationOptions.enableVerbatim Mode
בבקשת החיפוש.