بهبود کیفیت جستجو

کیفیت جستجو به کیفیت نتایج جستجو از نظر رتبه‌بندی و میزان یادآوری، آنطور که توسط کاربرِ جستجوکننده درک می‌شود، اشاره دارد.

رتبه‌بندی به ترتیب آیتم‌ها و فراخوانی به تعداد آیتم‌های مرتبط بازیابی شده اشاره دارد. یک آیتم (که به آن سند نیز گفته می‌شود) هر قطعه‌ای از محتوای دیجیتالی است که جستجوی ابری گوگل می‌تواند آن را فهرست‌بندی کند. انواع آیتم‌ها شامل اسناد مایکروسافت آفیس، فایل‌های PDF، یک ردیف در پایگاه داده، URL های منحصر به فرد و غیره است. یک آیتم شامل موارد زیر است:

  • فراداده‌های ساختاریافته
  • محتوای قابل فهرست بندی
  • ACL ها

جستجوی ابری از سیگنال‌های متنوعی برای بازیابی و رتبه‌بندی نتایج جستجوی جستجو استفاده می‌کند؛ مواردی که از یک جستجوی جستجو حاصل می‌شوند. شما می‌توانید سیگنال‌های جستجوی ابری را از طریق تنظیمات در طرحواره، محتوای آیتم و فراداده (در طول فهرست‌بندی) و برنامه جستجو تحت تأثیر قرار دهید. هدف این سند کمک به شما در بهبود کیفیت جستجو از طریق اصلاح این عوامل تأثیرگذار بر سیگنال است.

برای خلاصه‌ای از تنظیمات پیشنهادی و اختیاری، به خلاصه‌ای از تنظیمات کیفیت جستجوی پیشنهادی و اختیاری مراجعه کنید.

امتیاز اهمیت تأثیرگذاری

موضوعیت به میزان مرتبط بودن یک نتیجه جستجو با عبارات اصلی جستجو اشاره دارد. موضوعیت یک مورد بر اساس معیارهای زیر محاسبه می‌شود:

  • اهمیت هر عبارت جستجو.
  • تعداد بازدیدها (تعداد دفعاتی که یک عبارت جستجو در محتوا یا فراداده‌ی آیتم ظاهر می‌شود).
  • نوع عبارت جستجو و انواع آن با یک آیتم فهرست‌بندی شده در جستجوی ابری مطابقت دارد.

برای تأثیرگذاری بر امتیاز موضوعیت یک ویژگی متنی، RetrievalImportance را برای ویژگی متنی در طرحواره خود تعریف کنید. تطبیق روی یک ویژگی با RetrievalImportance بالا، در مقایسه با تطبیق روی یک ویژگی با RetrievalImportance پایین، امتیاز بالاتری را به همراه دارد.

برای مثال، فرض کنید یک منبع داده با مشخصات زیر دارید:

  • منبع داده برای ذخیره تاریخچه اشکالات نرم‌افزاری استفاده می‌شود.
  • هر اشکال دارای نام، توضیحات و اولویت است.

بیشتر کاربران با استفاده از نام باگ، این منبع داده را جستجو می‌کنند، بنابراین شما باید در طرحواره، مقدار RetrievalImportance را برای این نام روی HIGHEST تنظیم کنید.

برعکس، اکثر کاربران ممکن است با استفاده از توضیحات مربوط به اشکال، از این منبع داده پرس‌وجو نکنند، بنابراین، مقدار RetrievalImportance را در توضیحات روی DEFAULT تنظیم کنید. در ادامه، طرحواره نمونه‌ای شامل تنظیمات RetrievalImportance آمده است.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

در مورد اسناد HTML، برچسب‌هایی مانند <title> و <h1> به همراه تنظیمات قالب‌بندی مانند اندازه فونت و بولد کردن، برای تعیین اهمیت اصطلاحات مختلف استفاده می‌شوند. اگر ContentFormat TEXT باشد، ItemContent اهمیت بازیابی DEFAULT دارد و اگر HTML باشد، اهمیت بازیابی آن بر اساس ویژگی‌های HTML تعیین می‌شود.

بر تازگی تأثیر بگذارید

تازگی، میزان تغییرات اخیر یک آیتم را اندازه‌گیری می‌کند و توسط ویژگی‌های createTime و updateTime در ItemMetadata تعیین می‌شود. آیتم‌های قدیمی‌تر در نتایج جستجو رتبه پایین‌تری دارند.

می‌توان با تنظیم freshnessProperty و freshnessDuration از FreshnessOptions در طرحواره، بر نحوه محاسبه freshness برای یک شیء تأثیر گذاشت.

freshnessProperty به شما امکان می‌دهد به جای updateTime پیش‌فرض، از ویژگی‌های date یا timestamp برای محاسبه‌ی refreshness استفاده کنید.

در مثال قبلی ما از یک سیستم ردیابی اشکالات نرم‌افزاری، تاریخ سررسید می‌توانست به عنوان یک freshnessProperty استفاده شود، به طوری که اقلامی که تاریخ سررسید آنها به تاریخ فعلی نزدیک‌تر است، «تازه‌تر» در نظر گرفته می‌شوند و رتبه‌بندی آنها افزایش می‌یابد. در زیر، طرحواره نمونه‌ای شامل تنظیمات freshnessProperty آمده است:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

از freshnessDuration برای شناسایی زمانی که یک آیتم قدیمی در نظر گرفته می‌شود، استفاده کنید. به عنوان مثال، ممکن است منبع داده‌ای داشته باشید که به طور منظم ایندکس نمی‌شود یا نمی‌خواهید که refreshness آن بر رتبه‌بندی تأثیر بگذارد. می‌توانید با تعیین مقدار بالا برای freshnessDuration به این هدف برسید.

فرض کنید یک منبع داده با اطلاعات پروفایل کارمند دارید. در این سناریو، ممکن است بخواهید freshnessDuration بالایی داشته باشید زیرا تغییرات در اطلاعات کارمند اغلب به رتبه‌بندی کارمند مربوط نمی‌شود. در زیر یک طرحواره نمونه شامل تنظیمات freshnessDuration آمده است:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

همچنین می‌توانید برای منابع داده‌ای که محتوای آنها به سرعت تغییر می‌کند، مانند منبع داده‌ای که حاوی مقالات خبری است، freshnessDuration روی مقدار بسیار کمی تنظیم کنید. در این سناریو، اسنادی که اخیراً ایجاد یا اصلاح شده‌اند، بیشترین ارتباط را دارند. در زیر، طرحواره نمونه‌ای حاوی تنظیمات freshnessDuration برای منبع داده‌ای که محتوای آن به سرعت در حال تغییر است، آمده است:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

کیفیت تأثیرگذاری

کیفیت، معیاری برای سنجش دقت و مفید بودن یک آیتم است. یک منبع داده می‌تواند شامل چندین سند از نظر معنایی مشابه باشد که هر کدام سطح کیفیت متفاوتی دارند. می‌توانید با استفاده از SearchQualityMetadata ، مقدار کیفیت را بین ۰ و ۱ تعیین کنید. آیتم‌هایی که مقادیر بالاتری دارند، نسبت به آیتم‌هایی که مقادیر پایین‌تری دارند، رتبه‌بندی بهتری دریافت می‌کنند. از این تنظیم فقط در صورتی استفاده کنید که نیاز به تأثیرگذاری یا افزایش کیفیت یک آیتم، خارج از اطلاعات ارائه شده به Cloud Search دارید.

برای مثال، فرض کنید منبع داده‌ای دارید که شامل اسناد مزایای کارکنان است. می‌توانید SearchQualityMetadata برای افزایش رتبه اسناد نوشته شده توسط کارمندان منابع انسانی نسبت به اسناد نوشته شده توسط سایر کارمندان استفاده کنید.

در زیر نمونه‌ای از طرحواره حاوی تنظیمات SearchQualityMetadata برای مشکلات موجود در یک سیستم ردیابی اشکال آمده است:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

با توجه به این طرح، وقتی کاربری با استفاده از عبارت «مسئله» جستجو می‌کند، مسئله ۳ در طرح (کیفیت ۱) رتبه بالاتری نسبت به مسئله ۲ (کیفیت ۰.۵) و مسئله ۱ (اگر چیزی مشخص نشده باشد، کیفیت پیش‌فرض ۰ است) دارد.

تأثیرگذاری با استفاده از نوع فیلد

جستجوی ابری به شما امکان می‌دهد بر اساس مقدار ویژگی‌های enum یا integer، رتبه‌بندی را تحت تأثیر قرار دهید. برای هر ویژگی integer یا enum، می‌توان یک OrderedRanking مشخص کرد. این تنظیم دارای مقادیر زیر است:

  • NO_ORDER (پیش‌فرض): این ویژگی بر رتبه‌بندی تأثیری ندارد.
  • ASCENDING : مواردی که مقادیر بالاتری برای این ویژگی عدد صحیح یا شمارشی دارند، در مقایسه با مواردی که مقادیر کمتری دارند، رتبه‌بندی بهتری دریافت می‌کنند.
  • DESCENDING : مواردی که مقادیر پایین‌تری برای ویژگی عدد صحیح یا شمارشی دارند، در مقایسه با مواردی که مقادیر بالاتری دارند، رتبه‌بندی بهتری دریافت می‌کنند.

برای مثال، فرض کنید هر باگ در یک سیستم ردیابی باگ، یک ویژگی شمارشی (enum) برای ذخیره اولویت باگ به صورت HIGH (1)، MEDIUM (2) یا LOW (3) دارد. در این سناریو، تنظیم OrderedRanking به صورت DESCENDING رتبه‌بندی باگ‌های با اولویت HIGH را در مقایسه با باگ‌های با اولویت LOW افزایش می‌دهد. در ادامه، طرحواره نمونه‌ای شامل تنظیمات OrderedRanking برای مشکلات در یک سیستم ردیابی باگ آمده است:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

یک سیستم ردیابی باگ همچنین می‌تواند یک ویژگی عدد صحیح به نام votes داشته باشد که برای جمع‌آوری بازخورد از کاربران در مورد اهمیت نسبی یک باگ استفاده می‌شود. شما می‌توانید از ویژگی votes برای تأثیرگذاری بر رتبه‌بندی با ارائه اهمیت بالاتر به باگ‌هایی که بیشترین رأی را دارند، استفاده کنید. در این حالت، می‌توانید OrderedRanking به صورت ASCENDING برای ویژگی votes مشخص کنید تا مسائلی که بیشترین رأی را دارند، رتبه‌بندی بهتری دریافت کنند. در زیر یک طرح نمونه شامل تنظیمات OrderedRanking برای مسائل در یک سیستم ردیابی باگ آمده است:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

از طریق گسترش جستجو، رتبه‌بندی را تحت تأثیر قرار دهید

بسط پرس‌وجو به بسط اصطلاحات موجود در پرس‌وجو، با استفاده از مترادف‌ها و املا، برای بازیابی نتایج بهتر اشاره دارد.

از مترادف‌ها برای تأثیرگذاری بر نتایج جستجو استفاده کنید

جستجوی ابری از مترادف‌های استنباط‌شده از محتوای وب عمومی برای گسترش عبارات جستجو استفاده می‌کند. همچنین می‌توانید مترادف‌های سفارشی را برای ثبت اصطلاحات خاص سازمان، مانند کلمات اختصاری رایج مورد استفاده در یک سازمان یا اصطلاحات خاص صنعت، تعریف کنید.

مترادف‌های سفارشی را می‌توان در یک منبع داده یا به عنوان یک منبع داده جداگانه تعریف کرد. به طور پیش‌فرض، مترادف‌ها برای همه منابع داده در تمام برنامه‌های جستجو اعمال می‌شوند. با این حال، می‌توانید مترادف‌ها را بر اساس منبع داده و برنامه جستجو گروه‌بندی کنید. برای اطلاعات در مورد تعریف مترادف‌های سفارشی، از جمله گروه‌بندی بر اساس برنامه جستجو، به تعریف مترادف‌ها مراجعه کنید.

از املای کلمات برای تأثیرگذاری بر نتایج جستجو استفاده کنید

جستجوی ابری (Cloud Search) بر اساس مدل‌هایی که با استفاده از داده‌های عمومی جستجوی گوگل ساخته شده‌اند، پیشنهادات املایی ارائه می‌دهد. اگر جستجوی ابری در متن یک پرس‌وجو غلط املایی تشخیص دهد، پرس‌وجوی پیشنهادی را در SpellResult برمی‌گرداند. املای پیشنهادی می‌تواند به عنوان یک پیشنهاد به کاربر نمایش داده شود. به عنوان مثال، کاربر ممکن است عبارت پرس‌وجوی «employe» را اشتباه املایی بنویسد و پیشنهاد «آیا منظورتان کارمند بود؟» را دریافت کند.

جستجوی ابری همچنین از تصحیح املا به عنوان مترادف استفاده می‌کند تا به بازیابی اسنادی که ممکن است به دلیل خطای املایی از دست بروند، کمک کند.

تأثیرگذاری بر رتبه‌بندی از طریق تنظیمات برنامه جستجو

همانطور که در مقدمه جستجوی ابری گوگل ذکر شد، یک برنامه جستجو گروهی از تنظیمات است که وقتی با رابط جستجو مرتبط می‌شوند، اطلاعات زمینه‌ای در مورد جستجوها ارائه می‌دهند. پیکربندی‌های زیر به شما امکان می‌دهند از طریق برنامه جستجو بر رتبه‌بندی تأثیر بگذارید:

  • پیکربندی امتیازدهی
  • پیکربندی منبع

دو بخش زیر توضیح می‌دهند که چگونه این پیکربندی‌ها در تأثیرگذاری بر رتبه‌بندی مفید هستند.

پیکربندی امتیازدهی را تنظیم کنید

برای هر برنامه جستجو، می‌توانید یک ScoringConfig مشخص کنید که برای کنترل اعمال برخی سیگنال‌ها در طول رتبه‌بندی استفاده می‌شود. در حال حاضر، می‌توانید refreshness و personalization را غیرفعال کنید.

اگر تازگی غیرفعال باشد، صرف نظر از گزینه‌های تازگی مشخص شده در طرحواره برای منبع داده، برای همه منابع داده فهرست شده در برنامه جستجو غیرفعال می‌شود. به طور مشابه، اگر شخصی‌سازی غیرفعال باشد، افزایش مالکیت و افزایش تعامل بر رتبه‌بندی تأثیری نمی‌گذارد.

برای دستورالعمل‌های گام به گام در مورد پیکربندی این تنظیم، به سفارشی‌سازی تجربه جستجو در جستجوی ابری مراجعه کنید.

پیکربندی منبع را تنظیم کنید

پیکربندی منبع به شما امکان می‌دهد تنظیمات سطح منبع داده را در یک برنامه جستجو مشخص کنید. تنظیمات زیر پشتیبانی می‌شوند:

  • اهمیت منبع
  • ازدحام جمعیت

تنظیم اهمیت منبع

اهمیت منبع به اهمیت نسبی یک منبع داده در یک برنامه جستجو اشاره دارد. این تنظیم را می‌توان در فیلد SourceImportance در SourceScoringConfig مشخص کرد. مواردی از یک منبع داده با اهمیت منبع HIGH ، در مقایسه با مواردی از یک منبع داده با اهمیت منبع DEFAULT یا LOW ، افزایش رتبه دریافت می‌کنند. از این تنظیم برای تأثیرگذاری بر رتبه‌بندی زمانی که معتقدید کاربران نتایج منابع داده خاصی را ترجیح می‌دهند، استفاده کنید.

برای مثال، فرض کنید یک پورتال پشتیبانی محصول دارید که شامل داده‌های عیب‌یابی خارجی و داخلی است. در این سناریو، ممکن است بخواهید برنامه جستجوی خود را طوری پیکربندی کنید که نتایج منبع داده داخلی را در اولویت قرار دهد.

برای دستورالعمل‌های گام به گام در مورد پیکربندی این تنظیم، به سفارشی‌سازی تجربه جستجو در جستجوی ابری مراجعه کنید.

تنظیم ازدحام

ازدحام به حداکثر تعداد نتایجی اشاره دارد که می‌توان از یک منبع داده در یک برنامه جستجو بازگرداند. این مقدار را می‌توان با استفاده از فیلد numResults در SourceCrowdingConfig کنترل کرد. این مقدار به صورت پیش‌فرض روی ۳ قرار دارد، به این معنی که اگر ۳ نتیجه از یک منبع داده نشان داده باشیم، جستجوی ابری شروع به ارائه نتایج از منابع داده دیگر می‌کند. موارد از منبع داده اول فقط در صورتی بررسی می‌شوند که همه منابع داده به حد ازدحام خود رسیده باشند یا هیچ نتیجه‌ای از منابع داده دیگر وجود نداشته باشد.

این تنظیم در تضمین تنوع نتایج جستجو و جلوگیری از تسلط یک منبع داده بر صفحه نتایج جستجو مفید است.

برای دستورالعمل‌های گام به گام در مورد پیکربندی این تنظیم، به سفارشی‌سازی تجربه جستجو در جستجوی ابری مراجعه کنید.

تأثیرگذاری بر رتبه‌بندی از طریق شخصی‌سازی

شخصی‌سازی به ارائه نتایج جستجوی شخصی‌سازی‌شده بر اساس دسترسی هر کاربر به نتیجه اشاره دارد. شما می‌توانید با اولویت‌بندی موارد بر اساس معیارهای زیر، بر رتبه‌بندی تأثیر بگذارید:

  • مالکیت کالا
  • تعامل آیتم
  • کلیک‌های کاربر
  • زبان مورد

سه بخش بعدی به چگونگی تأثیرگذاری بر کیفیت جستجو بر اساس این معیارها می‌پردازد.

رتبه‌بندی نفوذ بر اساس مالکیت آیتم

مالکیت آیتم به ارائه افزایش رتبه به آیتم‌هایی اشاره دارد که متعلق به کاربری هستند که جستجویی را انجام می‌دهد. هر آیتم دارای یک ItemAcl با یک فیلد owners است. اگر کاربری که جستجویی را انجام می‌دهد، مالک یک آیتم باشد، به طور پیش‌فرض، آن آیتم افزایش رتبه دریافت می‌کند. می‌توانید شخصی‌سازی را در برنامه جستجو غیرفعال کنید.

افزایش رتبه‌بندی بر اساس تعامل آیتم‌ها

تعامل آیتم به افزایش رتبه آیتم‌هایی اشاره دارد که کاربر با آن‌ها تعامل داشته است (مشاهده، نظر، ویرایش و غیره).

سیگنال‌های تعامل آیتم‌ها به طور خودکار برای محصولات Google Workspace مانند Drive و Gmail دریافت می‌شوند. برای سایر محصولات، می‌توانید داده‌های تعامل در سطح آیتم، از جمله نوع تعامل (مشاهده، ویرایش)، مهر زمانی تعامل و کاربر اصلی (کاربری که با آیتم تعامل داشته است) را ارائه دهید. توجه داشته باشید که آیتم‌هایی که تعاملات اخیر دارند، رتبه بالاتری کسب می‌کنند.

افزایش رتبه بر اساس کلیک کاربران

جستجوی ابری، کلیک‌های روی نتایج جستجوی فعلی را جمع‌آوری می‌کند و از آن برای بهبود رتبه‌بندی برای جستجوهای آینده با افزایش مواردی که قبلاً توسط همان کاربر کلیک شده‌اند، استفاده می‌کند.

رتبه‌بندی تأثیرگذار از طریق تفسیر پرس‌وجو

ویژگی تفسیر پرس‌وجو در Cloud Search به طور خودکار عملگرها و فیلترهای موجود در پرس‌وجوی کاربر را تفسیر می‌کند و آن عناصر را به یک پرس‌وجوی ساختاریافته و مبتنی بر عملگر تبدیل می‌کند. تفسیر پرس‌وجو از عملگرهای تعریف‌شده در طرحواره، همراه با اسناد فهرست‌شده، برای استنباط معنای پرس‌وجوی کاربر استفاده می‌کند. این ویژگی به کاربر اجازه می‌دهد تا با حداقل کلمات کلیدی جستجو کند، اما همچنان نتایج دقیقی به دست آورد. برای اطلاعات بیشتر، برای تفسیر بهینه پرس‌وجو به Structure a schema مراجعه کنید.

افزایش رتبه‌بندی بر اساس زبان آیتم

زبان به معنای تنزل رتبه مواردی است که زبان آنها با زبان جستجو مطابقت ندارد. عوامل زیر بر رتبه‌بندی موارد بر اساس زبان تأثیر می‌گذارند:

  • زبان پرس‌وجو. زبان خودکار شناسایی‌شده‌ی پرس‌وجو، یا languageCode مشخص‌شده در RequestOptions .

    اگر یک رابط جستجوی سفارشی می‌سازید، باید languageCode روی زبان رابط کاربر یا ترجیح زبانی (مثلاً زبان مرورگر وب یا صفحه رابط جستجو) تنظیم کنید. زبان پرس‌وجوی خودکار شناسایی‌شده بر languageCode اولویت دارد، به طوری که وقتی کاربر پرس‌وجویی را به زبانی متفاوت از رابط خود تایپ می‌کند، کیفیت جستجو به خطر نمی‌افتد.

  • زبان آیتم. زبان contentLanguage که در زمان فهرست‌بندی در ItemMetadata تنظیم شده است، یا زبان محتوایی که به‌طور خودکار توسط Cloud Search شناسایی می‌شود.

    اگر contentLanguage یک سند در زمان فهرست‌بندی خالی بماند و ItemContent پر شود، Cloud Search تلاش می‌کند زبان مورد استفاده در ItemContent را شناسایی کرده و آن را به صورت داخلی ذخیره کند. زبان شناسایی‌شده خودکار به فیلد contentLanguage اضافه نمی‌شود.

اگر زبان پرس‌وجو و آیتم مطابقت داشته باشند، هیچ تنزل رتبه‌ای برای زبان اعمال نمی‌شود. اگر این تنظیمات مطابقت نداشته باشند، آیتم تنزل رتبه می‌یابد. تنزل رتبه برای اسنادی که contentLanguage خالی است و Cloud Search نمی‌تواند به‌طور خودکار زبان را تشخیص دهد، اعمال نمی‌شود. در نتیجه، اگر Cloud Search نتواند زبان یک سند را تشخیص دهد، رتبه‌بندی آن تحت تأثیر قرار نمی‌گیرد.

افزایش رتبه‌بندی بر اساس زمینه آیتم

شما می‌توانید رتبه‌بندی مواردی را که بیشتر به زمینه‌ی یک عبارت جستجو مرتبط هستند، افزایش دهید. زمینه ( contextAttributes ) مجموعه‌ای از ویژگی‌های نامگذاری شده است که می‌توانید در طول فهرست‌بندی و در درخواست جستجو، برای ارائه زمینه برای یک عبارت جستجوی خاص، مشخص کنید.

برای مثال، فرض کنید یک آیتم، مانند یک سند مزایای کارکنان، در زمینه یک Location و Department ، مانند یک شهر ( San Francisco )، ایالت ( California )، کشور ( USA ) و یک Department ( Engineering )، مرتبط‌تر است. در این حالت، می‌توانید آیتم را با ویژگی‌های نامگذاری شده زیر فهرست‌بندی کنید:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

وقتی کاربر عبارت «مزایا» را در رابط جستجو وارد می‌کند، می‌توانید اطلاعات موقعیت مکانی و دپارتمان کاربر را در درخواست جستجو وارد کنید. برای مثال، در اینجا یک درخواست جستجو شامل اطلاعات موقعیت مکانی و دپارتمان برای یک مهندس در شیکاگو آمده است:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

از آنجا که هم مورد فهرست‌بندی شده و هم درخواست جستجو حاوی ویژگی‌های «Department=Engineering» و «Location=USA» هستند، مورد فهرست‌بندی شده (یک سند مزایای کارمندی) در نتایج جستجو بالاتر ظاهر می‌شود.

حالا فرض کنید کاربر دیگری، یک مهندس در هند، عبارت جستجوی «مزایا» را در رابط جستجو وارد می‌کند. در اینجا یک درخواست جستجو حاوی اطلاعات موقعیت مکانی و دپارتمان او آمده است:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

از آنجا که هم مورد فهرست‌شده و هم درخواست جستجو فقط شامل ویژگی «Department=Engineering» هستند، مورد فهرست‌شده فقط کمی بالاتر در نتایج جستجو ظاهر می‌شود (در مقایسه با اولین عبارت جستجو با عنوان «مزایا» که توسط یک مهندس ساکن شیکاگو، ایلینوی، ایالات متحده وارد شده است).

در زیر چند نمونه از زمینه‌هایی که ممکن است بخواهید برای افزایش رتبه‌بندی استفاده کنید، آورده شده است:

  • مکان: آیتم‌ها می‌توانند برای کاربرانی که در یک مکان خاص مانند یک ساختمان، یک شهر، یک کشور یا یک منطقه قرار دارند، مرتبط‌تر باشند.
  • نقش شغلی: موارد می‌توانند برای کاربرانی که در یک نقش شغلی خاص مانند نویسنده فنی یا مهندس هستند، مرتبط‌تر باشند.
  • بخش: موارد می‌توانند بیشتر به بخش‌های خاصی مانند فروش یا بازاریابی مربوط باشند.
  • سطح شغلی: موارد می‌توانند بیشتر به سطوح شغلی خاصی مانند مدیر یا مدیرعامل مربوط باشند.
  • نوع کارمند: موارد می‌توانند بیشتر به انواع خاصی از کارمندان، مانند کارمندان پاره وقت و تمام وقت، مربوط باشند.
  • مدت تصدی: مواردی می‌توانند بیشتر به مدت تصدی یک کارمند مربوط باشند، مانند استخدام جدید.

تأثیرگذاری بر رتبه‌بندی از طریق محبوبیت آیتم‌ها

جستجوی ابری رتبه‌بندی موارد محبوب را افزایش می‌دهد؛ یعنی مواردی را که در جستجوهای اخیر کلیک دریافت کرده‌اند، ارتقا می‌دهد.

تأثیرگذاری بر رتبه‌بندی از طریق کلیک‌بوست

جستجوی ابری، کلیک‌های روی نتایج جستجوی فعلی را جمع‌آوری می‌کند و از آن برای بهبود رتبه‌بندی برای جستجوهای آینده با افزایش موارد محبوب برای یک عبارت جستجوی خاص استفاده می‌کند.

خلاصه‌ای از تنظیمات کیفیت جستجوی پیشنهادی و اختیاری

جدول زیر تمام تنظیمات کیفیت جستجوی پیشنهادی و اختیاری را فهرست می‌کند. این توصیه‌ها باید به شما کمک کنند تا بیشترین بهره را از مدل‌های رتبه‌بندی Cloud Search ببرید.

تنظیم مکان توصیه شده/اختیاری جزئیات
تنظیمات طرحواره
فیلد ItemContent ItemContent توصیه شده هنگام ایجاد یا به‌روزرسانی طرحواره خود، محتوای بدون ساختار یک آیتم را وارد کنید. این فیلد برای تولید قطعه کدها استفاده می‌شود.
فیلد RetrievalImportance RetrievalImportance توصیه شده هنگام ایجاد یا به‌روزرسانی یک طرحواره، ویژگی‌های متنی را تنظیم کنید که به وضوح مهم یا موضوعی هستند.
FreshnessOptions FreshnessOptions اختیاری هنگام ایجاد یا به‌روزرسانی یک طرحواره، مطمئن شوید که آیتم‌ها به دلیل داده‌های نادرست یا مواردی که داده‌ها از دست رفته‌اند، تنزل رتبه نمی‌یابند.
تنظیمات نمایه‌سازی
createTime / updateTime ItemMetadata توصیه شده در طول فهرست‌بندی یک آیتم، مقداردهی اولیه انجام می‌شود.
contentLanguage ItemMetadata توصیه شده در طول فهرست‌بندی یک آیتم، مقداردهی می‌شود. در صورت عدم وجود، Cloud Search تلاش می‌کند زبان مورد استفاده در ItemContent را تشخیص دهد.
میدان owners ItemAcl() توصیه شده در طول فهرست‌بندی یک آیتم، مقداردهی اولیه انجام می‌شود.
مترادف‌های سفارشی طرحواره _dictionaryEntry توصیه شده در سطح منبع داده یا به عنوان منبع داده جداگانه در طول فهرست‌بندی تعریف شود.
زمینه quality SearchQualityMetadata اختیاری برای افزایش کیفیت پایه در مقایسه با سایر موارد مشابه از نظر معنایی، کیفیت را در حین فهرست‌بندی تنظیم کنید. تنظیم این فیلد برای همه موارد در یک منبع داده، اثر آن را خنثی می‌کند.
داده‌های تعامل در سطح آیتم interaction اختیاری اگر منبع داده تعاملات کاربر را ثبت و دسترسی به آنها را فراهم می‌کند، تعاملات را برای هر مورد در طول فهرست‌بندی وارد کنید.
ویژگی‌های عدد صحیح/شمارشی OrderedRanking اختیاری وقتی ترتیب آیتم‌ها مهم است، رتبه‌بندی مرتب‌شده برای ویژگی‌های عدد صحیح و شمارشی را در طول اندیس‌گذاری مشخص کنید.
تنظیمات برنامه را جستجو کنید
Personalization=false ScoringConfig یا استفاده از رابط کاربری ادمین CloudSearch توصیه شده هنگام ایجاد یا به‌روزرسانی برنامه جستجو، اطمینان حاصل کنید که اطلاعات صحیح مالک را مطابق با آنچه در «تأثیرگذاری بر رتبه‌بندی از طریق شخصی‌سازی» توضیح داده شده است، ارائه می‌دهید.
فیلد SourceImportance SourceCrowdingConfig اختیاری برای ایجاد سوگیری در نتایج حاصل از منابع داده خاص، این فیلد را تنظیم کنید.
فیلد numResults SourceCrowdingConfig اختیاری برای کنترل تنوع نتایج، این فیلد را تنظیم کنید.

مراحل بعدی

در اینجا چند گام بعدی که می‌توانید بردارید، آورده شده است:

  1. یک طرحواره برای تفسیر بهینه پرس و جو ایجاد کنید .

  2. یاد بگیرید که چگونه از طرحواره _dictionaryEntry برای تعریف مترادف‌های اصطلاحات رایج در شرکت خود استفاده کنید. برای استفاده از طرحواره _dictionaryEntry ، به بخش «تعریف مترادف‌ها» مراجعه کنید.