שיפור איכות החיפוש

איכות החיפוש מתייחסת לאיכות של תוצאות החיפוש מבחינת הדירוג ולהיזכר כפי שנתפס על ידי המשתמש שהריץ את שאילתת החיפוש.

דירוג מתייחס לסדר הפריטים, וריקול מתייחס למספר הפריטים אוחזרו פריטים רלוונטיים. פריט (נקרא גם מסמך) הוא כל של תוכן דיגיטלי ש-Google Cloud Search יכול להוסיף לאינדקס. סוגי פריטים כוללים מסמכי Microsoft Office, קובצי PDF, שורה במסד נתונים, כתובות URL וכו'. פריט מורכב מ:

  • מטא-נתונים מובְנים
  • תוכן שניתן להוסיף לאינדקס
  • ACLs (רשימות בקרת גישה)

Cloud Search משתמש במגוון אותות כדי לאחזר ולדרג את שאילתות החיפוש תוצאות; של הפריטים שנובעים משאילתת החיפוש. אפשר להשפיע האותות של Cloud Search דרך ההגדרות בסכימה, תוכן הפריט מטא-נתונים (במהלך ההוספה לאינדקס), ואפליקציית החיפוש. מטרת התהליך היא לעזור לכם לשפר את איכות החיפוש על ידי שינוי מובילי דעה.

לסיכום של הגדרות מומלצות ואופציונליות, אפשר לעיין ב סיכום ההגדרות המומלצות והאופציונליות של איכות החיפוש

השפעה על ציון נושאים

הנושא מתייחס לרלוונטיות של תוצאת חיפוש לשאילתה המקורית תנאים. הפופולריות של פריט מסוים מחושבת לפי הקריטריונים הבאים:

  • החשיבות של כל מונח שאילתה.
  • מספר ההיטים (מספר הפעמים שמונח שאילתה הופיע תוכן או מטא-נתונים).
  • סוג ההתאמות למונח השאילתה, והגרסאות שלהן, שיש להן פריט שנוספו לאינדקס ב-Cloud Search.

כדי להשפיע על ציון הנושא של נכס טקסט: מגדירים את RetrievalImportance במאפיין הטקסט בסכימה. התאמה לנכס עם רמת התאמה גבוהה RetrievalImportance מניב ציון גבוה יותר בהשוואה למשחק נכס עם רמה נמוכה של RetrievalImportance.

לדוגמה, נניח שיש לכם מקור נתונים עם המאפיינים הבאים:

  • מקור הנתונים משמש לאחסון ההיסטוריה של באגים בתוכנה.
  • לכל באג יש שם, תיאור ועדיפות.

רוב המשתמשים שולחים שאילתה לגבי מקור הנתונים הזה באמצעות שם הבאג, להגדיר את RetrievalImportance בשם כ-HIGHEST בסכימה.

לעומת זאת, רוב המשתמשים לא יכולים לשלוח שאילתות על מקור הנתונים הזה באמצעות התיאור של הבאג, לכן צריך להגדיר את RetrievalImportance בתיאור כ-DEFAULT. בהמשך מוצגת סכימה לדוגמה שמכילה הגדרות של RetrievalImportance.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

במקרה של מסמכי HTML, תגים כמו <title> ו-<h1>, יחד עם הגדרות פורמט כגון גודל הגופן וגופן מודגש, משמשות כדי לקבוע החשיבות של מונחים שונים. אם ContentFormat היא TEXT, ItemContent יש חשיבות אחזור של DEFAULT ואם הוא HTML, חשיבות האחזור שלו נקבעת על סמך מאפייני ה-HTML.

השפעה על עדכניות

עדכניות מדידת המועד שבו פריט השתנה ומועד קביעה לפי הנכסים createTime ו-updateTime ItemMetadata. פריטים ישנים יותר יורדים בדרגה בתוצאות החיפוש.

אפשר להשפיע על האופן שבו מחושבת עדכניות של אובייקט על ידי שינוי freshnessProperty ו-freshnessDuration של FreshnessOptions בסכימה.

freshnessProperty מאפשר להשתמש במאפיינים של תאריך או חותמת זמן עדכניות המחשוב במקום ברירת המחדל updateTime.

בדוגמה הקודמת שלנו למערכת למעקב אחר באגים בתוכנה, תאריך היעד היה לשמש כ-freshnessProperty, כך שפריטים עם תאריך היעד הקרוב ביותר אל התאריך הנוכחי נחשב "רענן" ומעלה את הדירוג. מעקב אחר הוא סכימה לדוגמה שמכילה הגדרות של freshnessProperty:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

אפשר להשתמש ב-freshnessDuration כדי לזהות מתי פריט נחשב ללא עדכני. לדוגמה, יכול להיות שיש לכם מקור נתונים שלא נוסף לאינדקס באופן קבוע או שאינך רוצה שהעדכניות שלו תשפיע על הדירוג. אפשר להשיג יעד באמצעות ציון ערך גבוה עבור freshnessDuration.

נניח שיש לכם מקור נתונים עם פרטי פרופיל של עובד. כאן תרחיש גבוה, אולי כדאי להגדיל את המדד 'freshnessDuration' כי שינויים בעובד לרוב, הוא לא רלוונטי לדירוג של העובד. מעקב אחר הוא סכימה לדוגמה שמכילה הגדרה של freshnessDuration:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

אפשר גם להגדיר ל-freshnessDuration ערך קטן מאוד עבור מקורות נתונים שהתוכן שלהם משתנה במהירות, למשל מקור נתונים שמכיל כתבות. בתרחיש הזה, המסמכים שנוצרו או נערכו לאחרונה הם הרלוונטיים ביותר. בהמשך מוצגת סכימה לדוגמה שכוללת הגדרה של freshnessDuration לנתונים מקור שמכיל תוכן שמשתנה במהירות:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

השפעה על האיכות

איכות היא מדד לדיוק ולשימושיות של פריט. מקור נתונים יכול להכיל כמה מסמכים דומים מבחינה סמנטית, כל אחד מהם עם רמת איכות שונה. אפשר לציין ערך איכות בין 0 ל- 1 באמצעות SearchQualityMetadata. פריטים עם ערכים גבוהים יותר מקבלים עלייה בדירוג ביחס לפריטים עם ערך נמוך יותר ערכים. השתמשו בהגדרה הזו רק אם אתם צריכים להשפיע על האיכות של שלא קשור למידע שסופק ל-Cloud Search.

לדוגמה, נניח שיש לך מקור נתונים שמכיל הטבות לעובדים מסמכים. כדאי להשתמש בSearchQualityMetadata כדי לשפר את הדירוג של מסמכים שנכתבו על ידי עובדי משאבי אנוש על פני מסמכים שנכתבו על ידי אחרים עובדים.

בהמשך מוצגת סכימה לדוגמה שמכילה הגדרות של SearchQualityMetadata עבור במערכת למעקב אחר באגים:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

על סמך הסכימה הזו, כשמשתמש מבצע חיפוש באמצעות מונח החיפוש "בעיה", בעיה 3 בסכימה (איכות של 1) מדורגת גבוה יותר מבעיה 2 (איכות של 0 .5) ובעיה 1 (אם לא צוין דבר, איכות ברירת המחדל היא 0).

השפעה באמצעות סוג השדה

Cloud Search מאפשר לך להשפיע על הדירוג על סמך הערך של enum או של מספרים שלמים. לכל מאפיין של מספר שלם או enum, הפונקציה OrderedRanking . הגדרה זו כוללת את הערכים הבאים:

  • NO_ORDER (ברירת מחדל): הנכס לא משפיע על הדירוג.
  • ASCENDING: פריטים עם ערכים גבוהים יותר במאפיין המספר השלם או במאפיין 'טיפוסים בני מנייה (enum)' מקבלים עלייה בדירוג בהשוואה לפריטים עם ערכים נמוכים יותר.
  • DESCENDING: פריטים עם ערכים נמוכים יותר במאפיין המספר השלם או במאפיין enum מקבלים עלייה בדירוג בהשוואה לפריטים עם ערכים גבוהים יותר.

לדוגמה, נניח שלכל באג במערכת למעקב אחר באגים יש מאפיין enum עבור שמירת העדיפות של הבאג בתור HIGH (1), MEDIUM (2) או LOW (3). בתרחיש הזה, הגדרה של OrderedRanking של DESCENDING מספקת עלייה בדירוג ל-HIGH באגים בעדיפות גבוהה בהשוואה ל-LOW באגים בעדיפות גבוהה. בהמשך מוצגת סכימה לדוגמה שמכילה הגדרות של OrderedRanking לבעיות ב מערכת למעקב אחרי באגים:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

מערכת למעקב אחר באגים יכולה להשתמש גם בנכס מסוג מספר שלם בשם votes כדי לקבל משוב ממשתמשים לגבי החשיבות היחסית של באג. אפשר להשתמש את הנכס votes כדי להשפיע על הדירוג באמצעות חשיבות גבוהה יותר באגים עם הכי הרבה הצבעות. במקרה הזה, אפשר לציין OrderedRanking בתור ASCENDING לנכס votes כך שיהיו בעיות עם הכי הרבה הצבעות מקבלים עלייה בדירוג. בהמשך מוצגת סכימה לדוגמה שמכילה OrderedRanking עבור בעיות במערכת למעקב אחר באגים:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

השפעה על הדירוג באמצעות הרחבת שאילתה

הרחבת שאילתות מתייחסת להרחבת המונחים בשאילתה, באמצעות מילים נרדפות איות, כדי לאחזר תוצאות טובות יותר.

שימוש במילים נרדפות כדי להשפיע על תוצאות החיפוש

Cloud Search משתמש במילים נרדפות שנגזרות מתוכן אינטרנט ציבורי כדי להרחיב מונחי השאילתה. תוכלו גם להגדיר מילים נרדפות מותאמות אישית מונחים ספציפיים לארגון, כמו ראשי תיבות נפוצים או מונחים ספציפיים לתעשייה.

ניתן להגדיר מילים נרדפות בהתאמה אישית במקור נתונים או כנתונים נפרדים מקור. כברירת מחדל, מילים נרדפות מוחלות על כל מקורות הנתונים בכל החיפושים תרגום מכונה. עם זאת, ניתן לקבץ מילים נרדפות לפי מקור נתונים של אפליקציית החיפוש. למידע על הגדרת מילים נרדפות מותאמות אישית, כולל קיבוץ לפי אפליקציית חיפוש, להגדיר מילים נרדפות.

שימוש באיות כדי להשפיע על תוצאות החיפוש

Cloud Search מספק הצעות איות המבוססות על מודלים שפותחו באמצעות הנתונים הציבוריים של חיפוש Google. אם Cloud Search מזהה שגיאת איות בהקשר של שאילתה, היא מחזירה את השאילתה המוצעת SpellResult אפשר להציג למשתמש את האיות שהוצע כהצעה. עבור לדוגמה, המשתמש עשוי לאיית בצורה שגויה את מונח השאילתה "employe" ולקבל את הפונקציה הצעה "האם התכוונת לעובד?"

Cloud Search משתמש גם בתיקוני איות כמילים נרדפות כדי לעזור באחזור מסמכים אחרת, עלולים להתעלם בגלל שגיאת איות.

השפעה על הדירוג דרך ההגדרות של אפליקציית החיפוש

כפי שצוין מבוא ל-Google Cloud Search, אפליקציה היא קבוצה של הגדרות שכאשר הן משויכות לחיפוש מספקים מידע הקשרי על חיפושים. הבאים הגדרות אישיות מאפשרות לכם להשפיע על הדירוג באמצעות אפליקציית החיפוש:

  • הגדרות הניקוד
  • הגדרת המקור

שני הקטעים הבאים מסבירים איך ההגדרות האישיות האלה שימושיות השפעה על הדירוג.

שינוי הגדרות הציון

לכל אפליקציית חיפוש אפשר לציין ScoringConfig משמש לשליטה על היישום של אותות מסוימים במהלך הדירוג. נכון לעכשיו, אפשר להשבית את העדכניות וההתאמה האישית.

אם עדכניות מושבתת, היא מושבתת לכל מקורות הנתונים שרשומים של Google, ללא קשר לאפשרויות העדכניות שצוינו בסכימה. של מקור הנתונים. באופן דומה, אם ההתאמה האישית מושבתת, הבעלים של העסק ההגדלה אינטראקציה לא משפיעה על הדירוג.

להוראות מפורטות לגבי קביעת ההגדרה הזו, עיינו במאמר התאמה אישית של חוויית החיפוש ב-Cloud Search

שינוי של הגדרת המקור

הגדרת המקור מאפשרת לך לציין הגדרות ברמת מקור הנתונים של אפליקציית החיפוש. ההגדרות הבאות נתמכות:

  • חשיבות המקור
  • קיבוץ באשכולות

הגדרת חשיבות למקור

חשיבות המקור מתייחסת לחשיבות היחסית של מקור נתונים בתוך של אפליקציית החיפוש. אפשר לציין את ההגדרה הזו בשדה SourceImportance בתוך SourceScoringConfig. פריטים ממקור נתונים עם חשיבות למקור של HIGH מקבלים עלייה בדירוג בהשוואה לפריטים ממקור נתונים עם מקור הנתונים DEFAULT או LOW בחשיבותו. ההגדרה הזו יכולה להשפיע על הדירוג במקרים שבהם לדעתך המשתמשים להעדיף תוצאות ממקורות נתונים מסוימים.

לדוגמה, נניח שיש לך פורטל תמיכה של מוצרים שמכיל נתונים של נתונים פנימיים לפתרון בעיות. בתרחיש הזה, יכול להיות שתרצו להגדיר כדי לתעדף תוצאות ממקור הנתונים הפנימי.

להוראות מפורטות לגבי קביעת ההגדרה הזו, עיינו במאמר התאמה אישית של חוויית החיפוש ב-Cloud Search

הגדרת צפיפות

צפיפות היא המספר המקסימלי של תוצאות שאפשר להחזיר מקור נתונים באפליקציית חיפוש. הערך הזה אפשר לשנות את ההגדרות האלה באמצעות השדה numResults ב- SourceCrowdingConfig. ערך ברירת המחדל של הערך הזה הוא 3, כלומר אם הצגנו 3 תוצאות מנתונים המקור ב-Cloud Search מתחיל להציג תוצאות ממקורות נתונים אחרים. פריטים ממקור הנתונים הראשון אנחנו שוקלים מחדש רק אם כל מקורות הנתונים הגיעו למגבלת הדחיסה או שאין יותר תוצאות מנתונים אחרים מקורות.

ההגדרה הזו עוזרת להבטיח את המגוון של תוצאות החיפוש למנוע ממקור נתונים אחד לשלוט בדף תוצאות החיפוש.

להוראות מפורטות לגבי קביעת ההגדרה הזו, עיינו במאמר התאמה אישית של חוויית החיפוש ב-Cloud Search

השפעה על הדירוג באמצעות התאמה אישית

התאמה אישית: הצגה של תוצאות חיפוש בהתאמה אישית על סמך המשתמש המסוים שניגש לתוצאה. אפשר להשפיע על הדירוג על ידי תעדוף פריטים על סמך הקריטריונים הבאים:

  • בעלות על פריט
  • אינטראקציה עם הפריט
  • קליקים של משתמשים
  • שפת הפריט

שלושת הקטעים הבאים מתארים איך להשפיע על איכות החיפוש קריטריונים אלה.

השפעה על הדירוג לפי בעלות על פריט

בעלות על פריטים מתייחסת להעלאת הדירוג של פריטים שנמצאים בבעלות המשתמש. ביצוע שאילתת החיפוש. לכל פריט יש ItemAcl עם השדה owners. אם המשתמש ששולח שאילתה הוא הבעלים של פריט, ואז, כברירת מחדל, הפריט מקבל עלייה בדירוג. אפשר להפוך את ההתאמה האישית באפליקציית החיפוש.

ניתן להעלות את הדירוג על סמך אינטראקציה עם הפריט

אינטראקציה עם פריטים מתייחסת לשיפור הדירוג של פריטים שהחיפוש שאילתה שהמשתמש יצר איתה אינטראקציה (צפה, הגיב, נערך וכן הלאה).

אותות אינטראקציה של פריטים מתקבלים באופן אוטומטי עבור Google Workspace כגון Drive ו-Gmail. עבור מוצרים אחרים, אפשר לציין ברמת הפריט אינטראקציה כולל סוג האינטראקציה (צפייה, עריכה), חותמת הזמן אינטראקציה, וחשבון המשתמש (המשתמש שהייתה לו אינטראקציה עם הפריט). שימו לב פריטים עם אינטראקציות אחרונות מקבלים דירוג גבוה יותר.

הגדלת הדירוג בהתאם לקליקים של המשתמשים

מערכת Cloud Search אוספת את הקליקים על תוצאות החיפוש הנוכחיות ומשתמשת בהם כדי לשפר את הדירוג בחיפושים עתידיים על ידי הגדלת הפריטים שעליהם לחץ המשתמש בעבר אותו משתמש.

השפעה על הדירוג באמצעות פרשנות שאילתה

התכונה פרשנות שאילתה של Cloud Search מפרשת באופן אוטומטי את ומסננים בשאילתת החיפוש של המשתמש, וממירים את הרכיבים האלה שאילתה מובנית ומבוססת-אופרטורים. פרשנות השאילתה משתמשת באופרטורים מוגדרים בסכימה, יחד עם המסמכים שנוספו לאינדקס, כדי להסיק פירוש השאילתה. התכונה הזו מאפשרת למשתמש לחפש עם מילות מפתח, אבל עדיין להשיג תוצאות מדויקות. לקבלת מידע נוסף, אפשר לעיין במאמר בנושא בניית סכימה לפירוש שאילתות אופטימלי.

הגדלת הדירוג על סמך שפת הפריט

שפה מתייחסת להורדה בדרגה של פריטים שהשפה שלהם לא תואמים לשפת השאילתה. הגורמים הבאים משפיעים על הדירוג של פריטים על סמך שפה:

  • שפת השאילתה. השפה של שאילתת החיפוש שזוהתה באופן אוטומטי, או languageCode שצוין RequestOptions.

    אם אתם יוצרים ממשק חיפוש מותאם אישית, עליכם להגדיר את languageCode כך: שפת הממשק או העדפת השפה של המשתמש (לדוגמה, השפה של דפדפן האינטרנט או דף ממשק החיפוש). השאילתה שזוהתה באופן אוטומטי השפה מקבלת עדיפות על פני languageCode, כך שאיכות החיפוש נפגע כשמשתמש מקליד שאילתה בשפה ששונה מזו גרפי.

  • שפת הפריט. הערך contentLanguage מוגדר ב-ItemMetadata בזמן האינדקס, או שפת התוכן שזוהתה באופן אוטומטי על ידי Cloud Search.

    אם השדה contentLanguage של המסמך נשאר ריק בזמן האינדקס, וגם השדה ItemContent מאוכלס, Cloud Search מנסה לזהות את השפה שנמצא בשימוש ב-ItemContent ומאחסן אותו באופן פנימי. הערכים שזוהה באופן אוטומטי השפה לא נוספה לשדה contentLanguage.

אם שפת השאילתה והפריט תואמים, לא תחול הורדת שפה. אם המיקום הגדרות אלה אינן תואמות, לאחר מכן הפריט יורד בדרגה. הורדת השפה בדרגה היא לא הוחלו על מסמכים שבהם הקובץ contentLanguage ריק ולא ניתן היה להשתמש ב-Cloud Search לזהות את השפה באופן אוטומטי. כתוצאה מכך, הדירוג של מסמך לא מושפעת אם Cloud Search לא יוכל לזהות את השפה שלו.

ניתן לשפר את הדירוג על סמך ההקשר של הפריט

אפשר לשפר את הדירוג של פריטים שרלוונטיים יותר להקשר. של שאילתת החיפוש. ההקשר (contextAttributes) היא קבוצה של מאפיינים בעלי שם שניתן לציין במהלך ההוספה לאינדקס, בקשה לחיפוש, כדי לספק הקשר לשאילתת חיפוש ספציפית.

לדוגמה, נניח שפריט, כגון מסמך הטבות לעובד, רלוונטי יותר רלוונטיות בהקשר של Location וDepartment, כמו עיר (San Francisco), מדינה (California), מדינה (USA) וגם Department (Engineering). במקרה כזה, ניתן להוסיף את הפריט לאינדקס עם ההגדרות הבאות מאפיינים בעלי שם:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

כשהמשתמש יזין את שאילתת החיפוש "הטבות". בממשק החיפוש, עשוי לכלול את פרטי המיקום של המשתמש ואת המחלקה שלו בחיפוש בקשה. לדוגמה, הנה בקשת חיפוש שמכילה מיקום ומחלקה מידע למהנדסים בשיקגו:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

כי גם הפריט שנוסף לאינדקס וגם בקשת החיפוש מכילים את המאפיינים של &quot;Department=Engineering&quot; ו-"Location=USA," הפריט שנוסף לאינדקס (עובד מופיע במיקום גבוה יותר בתוצאות החיפוש.

עכשיו נניח שמשתמש אחר, מהנדס בהודו, מזין שאילתת חיפוש של "יתרונות" לממשק החיפוש. לפניכם בקשת חיפוש שמכילה מיקום ומידע על מחלקה:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

כי גם הפריט שנוסף לאינדקס וגם בקשת החיפוש רק מכילים את של "מחלקה=Engineering", הפריט שנוסף לאינדקס מופיע רק במעט גבוה יותר בתוצאות החיפוש (בהשוואה לשאילתת החיפוש הראשונה של "יתרונות" שהוזנו על ידי מהנדס משיקגו, אילינוי ארה"ב).

הנה כמה הקשרים לדוגמה שכדאי להשתמש בהם כדי לשפר את הדירוג:

  • מיקום: הפריטים יכולים להיות רלוונטיים יותר למשתמשים במיקום מסוים, כמו בניין, עיר, מדינה או אזור.
  • תפקיד מסוים: הפריטים יכולים להיות רלוונטיים יותר למשתמשים בתפקיד מסוים, כמו כותבים טכניים או מהנדסי תוכנה.
  • מחלקה: הפריטים יכולים להיות רלוונטיים יותר למחלקות מסוימות, כמו 'מכירות' או 'שיווק'.
  • רמת התפקיד: הפריטים יכולים להיות רלוונטיים יותר לתפקידים מסוימים, כמו דירקטור או מנכ"ל.
  • סוג העובדים: הפריטים יכולים להיות רלוונטיים יותר לסוגים מסוימים של עובדים, כמו עובדים במשרה חלקית ועובדים במשרה מלאה.
  • ותק: הפריטים עשויים להיות רלוונטיים יותר למותק של העובד, כמו העסקת עובדים חדשים.

השפעה על הדירוג באמצעות הפופולריות של פריטים

Cloud Search משפר את הדירוג של פריטים פופולריים; כלומר, הוא מגדיל את הפריטים שקיבלו קליקים בשאילתות חיפוש אחרונות.

השפעה על הדירוג באמצעות clickboost

ב-Cloud Search נאספים נתוני קליקים על תוצאות חיפוש קיימות, והמערכת משתמשת בהם כדי לשפר את הדירוג בחיפושים עתידיים על ידי הגדלת הפריטים הפופולריים בתגובה לשאילתת חיפוש מסוימת.

סיכום של הגדרות מומלצות ואופציונליות של איכות החיפוש

הטבלה הבאה מפרטת את כל איכות החיפוש המומלצת והאופציונלית הגדרות. ההמלצות האלה אמורות לעזור לך להפיק את המקסימום המודלים של הדירוג ב-Cloud Search.

הגדרהמיקוםמומלץ/אופציונליפרטים
הגדרות סכימה
השדה ItemContentItemContentמומלץכשיוצרים או מעדכנים את הסכימה, צריך לאכלס את התוכן הלא מובנה של פריט. השדה הזה משמש ליצירת נכסי מידע מובנה.
השדה RetrievalImportanceRetrievalImportanceמומלץכשיוצרים או מעדכנים סכימה, חשוב להגדיר מאפייני טקסט שיש להם בבירור חשיבות או נושאים מרכזיים.
FreshnessOptionsFreshnessOptionsאופציונליכשיוצרים או מעדכנים סכימה, חשוב לוודא שפריטים לא יורדים בדרגה בגלל נתונים שגויים או במקרים שבהם חסרים נתונים.
הגדרות הוספה לאינדקס
createTime/updateTimeItemMetadataמומלץאכלוס פריט בזמן ההוספה לאינדקס.
contentLanguageItemMetadataמומלץאכלוס פריט בזמן ההוספה לאינדקס. אם השדה חסר, Cloud Search ינסה לזהות את השפה שבה נעשה שימוש בItemContent.
השדה ownersItemAcl()מומלץאכלוס פריט בזמן ההוספה לאינדקס.
מילים נרדפות בהתאמה אישיתסכימה אחת (_dictionaryEntry)מומלץניתן להגדיר ברמת מקור הנתונים או כמקור נתונים נפרד במהלך ההוספה לאינדקס.
השדה qualitySearchQualityMetadataאופציונליכדי לשפר את האיכות הבסיסית בהשוואה לפריטים דומים מבחינה סמנטית, כדאי להגדיר את האיכות במהלך ההוספה לאינדקס. אם מגדירים את השדה הזה לכל הפריטים במקור נתונים, ההשפעה שלו תתבטל.
נתוני אינטראקציות ברמת הפריטinteractionאופציונליאם מקור הנתונים מתעד את האינטראקציות של המשתמש ומספק גישה, צריך לאכלס את האינטראקציות עבור כל פריט במהלך ההוספה לאינדקס.
מאפייני מספר שלם/טיפוסים בני מנייה (enum)OrderedRankingאופציונליאם סדר הפריטים רלוונטי, צריך לציין את הדירוג הסדיר של מאפייני מספר שלם ו-enum במהלך ההוספה לאינדקס.
הגדרות של אפליקציית חיפוש
Personalization=falseScoringConfig או באמצעות ממשק המשתמש לניהול של CloudSearchמומלץכשיוצרים או מעדכנים את אפליקציית החיפוש. יש לספק את פרטי הבעלים הנכונים כפי שמתואר בנושא השפעה על הדירוג באמצעות התאמה אישית
השדה SourceImportanceSourceCrowdingConfigאופציונליכדי להטות את התוצאות ממקורות נתונים מסוימים, צריך להגדיר את השדה הזה.
השדה numResultsSourceCrowdingConfigאופציונליכדי לשלוט במגוון התוצאות, צריך להגדיר את השדה הזה.

השלבים הבאים

אפשר לנסות את הפתרונות הבאים:

  1. בניית סכימה לפירוש שאילתות אופטימלי.

  2. ללמוד איך להשתמש סכימה _dictionaryEntry להגדרה מילים נרדפות למונחים נפוצים בחברה שלכם. כדי להשתמש _dictionaryEntry מתייחסים הגדרת מילים נרדפות.