Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

פיצוי על הרחבות, פרשנויות ואופטימיזציות ברירת מחדל

ל-Google Cloud Search יש כמה הרחבות, פרשנויות ואופטימיזציות שמוגדרות כברירת מחדל ומשפיעות על תוצאות החיפוש. אם אתם רואים תוצאות חיפוש לא צפויות, כדאי לעיין במדריך הזה לפני שפונים לתמיכה של Cloud Search.

במסמך הזה, שאילתות של משתמשים מופיעות בסוגריים (כמו [query]), ופרשנויות של המערכת מופיעות במירכאות (כמו "interpretation").

תוצאות השאילתה במסמך הזה הן דוגמאות להמחשת התנהגות, והן מספקות תובנות לגבי אופן הפעולה של הרחבות, פרשנויות ואופטימיזציות. התוצאות בפועל עשויות להיות שונות.

הרחבות שמוגדרות כברירת מחדל

נניח שמשתמש מחפש את המונח [Joe’s PDFs], אבל חלק מהתוצאות מכילות מילים מודגשות כמו "documents" במקום "PDFs". זה קורה כי Cloud Search מרחיב את השאילתה כך שתכלול מילים נרדפות וצורות בסיסיות של מילים, בדומה לחיפוש Google. ההרחבה הזו עוזרת לאחזר מסמכים שתואמים לרעיון ולכוונה של השאילתה. לאחר מכן, אלגוריתמים של דירוג מוודאים שההתאמות הטובות ביותר יופיעו בראש הרשימה.

כשמשתמש מחפש את [Joe’s PDFs], יכול להיות ש-Cloud Search יציע את המילים הנוספות האלה:

למשל, [Joe’s] יכול להתאים ל-"joe" (הרחבת השורש) ול-"joes" (מילה נרדפת על סמך סימני פיסוק).
למשל, אם מילת המפתח היא [PDFs], יכול להיות שהיא תתאים ל-"documents" (הרחבה באמצעות מילים נרדפות) ול-"pdf" (הרחבה באמצעות שורש).

מילים נרדפות שמוגדרות כברירת מחדל לא תמיד פועלות בשני הכיוונים. לדוגמה, חיפוש של [phishing] עשוי להתאים ל-"phish", אבל חיפוש של [phish] לא בהכרח יתאים ל-"phishing".

הרחבות למילים עם מקף או קו תחתון

ב-Cloud Search, מילים עם מקף ומילים בלי מקף נחשבות לשונות, למשל [walk-in closet] ו-[walk in closet]. בנוסף, המערכת מבצעת אופטימיזציות שונות למילים עם מקף ולמילים עם קו תחתון, כמו [walk-in] ו-[walk_in].

פיצוי על הרחבות ברירת מחדל

מערכת Cloud Search לא מבטיחה הרחבה ספציפית. כדי לוודא שהמערכת תשתמש במילים נרדפות דו-כיווניות או בהרחבות ספציפיות לדומיין, צריך ליצור מילים נרדפות משלכם. מידע נוסף מופיע במאמר בנושא הגדרת מילים נרדפות.

פרשנויות ברירת מחדל

‫Cloud Search מספק פרשנות של שפה טבעית על סמך הסכימה של מקור הנתונים. מידע נוסף מופיע במאמר איך מבנים את הסכימה כדי שהשאילתות יפורשו בצורה אופטימלית.

השבתת פרשנויות של שפה טבעית

כדי להשבית את הפרשנויות של שפה טבעית לשאילתה ספציפית, צריך להגדיר את הפרמטר QueryInterpretationOptions.disableNlInterpretation לערך true בבקשת החיפוש.

אופטימיזציות ברירת מחדל

אלה האופטימיזציות שמוגדרות כברירת מחדל ב-Cloud Search:

שילוב של תיקון איות: בשאילתה [corpoate benefits],‏ Cloud Search מתאים ל-"corpoate" ולאיות הנכון, "corporate".

הערה: יכול להיות שהתשובה לשאילתה תכיל הצעה לאיות בשדה SpellResult. מערכות הכתיב והמילים הנרדפות הן נפרדות, אבל יכול להיות שמערכת המילים הנרדפות תספק איות נכון כמילה נרדפת. השדה SpellResult מאוכלס רק בתיקונים בפועל של שגיאות איות.
תוצאות משלימות: בשאילתות עם מעט תוצאות או ללא תוצאות, Cloud Search משתמש בקבוצה מותרת של מונחים קשורים. מידע נוסף זמין במאמר בנושא טיפול בתוצאות משניות.

נרמול מסמכים ושאילתות

נרמול הוא תהליך שבו מילים או צירופי מילים עוברים סטנדרטיזציה לפני או אחרי שאילתה. כדי להבטיח תגובות עקביות, כדאי לבצע את שלבי הנורמליזציה הבאים:

כדי לנרמל מסמכים:
1. בוחרים איות קנוני למילים חשובות במאגרי המידע.
2. לתקן את האיות במסמכי המקור או במהלך הוספה לאינדקס כדי להתאים לצורה הקנונית.
כדי לנרמל שאילתות:
1. ליירט שאילתות של משתמשים לפני שהן נשלחות ל-Cloud Search.
2. לשכתב מילים בשאילתות כדי להתאים לאיות הנפוץ ביותר במקור הנתונים המאונדקס.
3. שליחת השאילתה שנכתבה מחדש אל Cloud Search.

השבתה של הרחבות, פרשנויות ואופטימיזציות

כדי להשבית את התכונות האלה בשאילתה ספציפית, צריך להגדיר את QueryInterpretationOptions.enableVerbatimMode לערך true בבקשת החיפוש.