검색 품질 향상

검색 품질이란 사용자가 인식하는 순위 및 재현율을 기준으로 측정한 검색 결과의 품질입니다.

순위는 항목의 순서이고 재현율은 검색된 관련 항목의 수입니다. 항목 (또는 문서)은 Microsoft Office 문서, PDF 파일, 데이터베이스 행, 고유 URL 등 Google Cloud Search가 색인을 생성할 수 있는 모든 디지털 콘텐츠를 말합니다. 항목은 다음으로 구성됩니다.

  • 구조화된 메타데이터
  • 색인 생성이 가능한 콘텐츠
  • ACL

Cloud Search는 다양한 신호를 사용하여 결과를 가져오고 순위를 매깁니다. 스키마, 항목 콘텐츠 및 메타데이터, 검색 애플리케이션의 설정을 통해 이러한 신호에 영향을 줄 수 있습니다. 이 문서를 사용하여 이러한 신호 영향 요소를 수정하여 검색 품질을 개선하세요.

설정 요약은 검색 품질 설정 요약을 참고하세요.

적합성 점수에 영향 주기

적합성은 검색 결과와 검색어의 관련성입니다. Cloud Search는 다음을 기반으로 적합성을 계산합니다.

  • 각 검색어의 중요도
  • 적중 횟수 (콘텐츠 또는 메타데이터에서 검색어가 등장하는 횟수)
  • 검색어와 색인이 생성된 항목 간의 검색 유형입니다.

텍스트 속성의 적합성 점수에 영향을 주려면 스키마에서 RetrievalImportance를 정의합니다. RetrievalImportance가 높은 속성과 일치하면 더 높은 점수가 부여됩니다.

예를 들어 소프트웨어 버그 기록을 저장하는 경우 사용자는 버그 이름으로 쿼리할 가능성이 높습니다. 이름의 RetrievalImportanceHIGHEST로 설정합니다. 설명에는 DEFAULT를 사용합니다.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

HTML 문서의 경우 <title><h1>와 같은 태그를 사용하여 검색어 중요도를 판단합니다. ContentFormatTEXT인 경우 ItemContentDEFAULT 중요도를 사용합니다. HTML인 경우 중요도는 HTML 속성에 따라 달라집니다.

최신성에 영향 주기

최신성ItemMetadata에서 createTimeupdateTime을 사용하여 상품이 마지막으로 수정된 시점을 측정합니다. 오래된 항목의 순위가 낮습니다.

FreshnessOptions에서 freshnessPropertyfreshnessDuration를 조정하여 최신성에 영향을 줄 수 있습니다. freshnessProperty를 사용하면 updateTime 대신 맞춤 날짜 또는 타임스탬프를 사용할 수 있습니다. 버그의 경우 기한을 사용하여 현재 날짜와 가장 가까운 날짜의 항목이 더 높은 순위를 차지하도록 할 수 있습니다.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

freshnessDuration을 사용하여 항목이 만료된 것으로 간주할 시점을 지정합니다. 100년과 같은 높은 값을 지정하면 최신성 효과가 무효화됩니다. 이는 직원 프로필과 같은 정적 데이터에 유용합니다. 뉴스에는 3일과 같은 작은 값을 사용합니다.

품질에 영향 주기

품질은 상품의 정확성과 유용성을 측정합니다. SearchQualityMetadata을 사용하여 0에서 1 사이의 값을 지정합니다. 값이 높을수록 순위가 올라갑니다. 예를 들어 인사팀에서 작성한 복지 혜택 문서를 부스팅할 수 있습니다.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

필드 유형 사용에 영향 주기

OrderedRanking를 사용하여 열거형 또는 정수 속성을 기반으로 순위에 영향을 줄 수 있습니다.

  • NO_ORDER (기본값): 순위에 영향을 주지 않습니다.
  • ASCENDING: 값이 클수록 순위가 상승합니다.
  • DESCENDING: 값이 작을수록 순위가 상승합니다.

버그 우선순위의 경우 HIGH이 1이고 LOW이 3이면 DESCENDING를 사용합니다. votes 속성의 경우 ASCENDING을 사용합니다.

검색어 확장을 통해 순위에 영향 주기

검색어 확장은 동의어와 맞춤법을 사용하여 결과를 개선합니다.

동의어 사용

Cloud Search는 동의어에 공개 웹 콘텐츠를 사용합니다. 조직별 용어에 대한 맞춤 동의어를 정의할 수도 있습니다. 동의어 정의를 참고하세요.

맞춤법 사용

Cloud Search는 SpellResult에서 맞춤법을 추천합니다. 또한 맞춤법 교정을 동의어로 사용하여 문서를 찾습니다.

검색 애플리케이션 설정을 통해 순위에 영향 주기

검색 애플리케이션은 컨텍스트 정보를 제공합니다. 다음 설정을 사용하여 순위에 영향을 줄 수 있습니다.

스코어링 구성 조정

ScoringConfig을 지정하여 최신성 또는 맞춤설정을 사용 중지합니다. 맞춤설정을 사용 중지하면 소유자상호작용 순위 상승이 삭제됩니다. 검색 환경 맞춤설정을 참고하세요.

소스 구성 조정

데이터 소스 수준 설정을 지정합니다.

  • 소스 중요도: 중요도가 HIGH인 소스의 항목이 더 높은 순위를 차지합니다.
  • 중복: 다양성을 보장하기 위해 단일 소스의 결과를 제한합니다 (기본값은 3).

맞춤설정

맞춤설정은 사용자를 기반으로 결과를 우선순위 지정합니다.

  • 항목 소유권: 사용자가 소유한 항목을 부스팅합니다.
  • 항목 상호작용: 사용자가 최근에 조회, 수정 또는 댓글을 작성한 항목을 부스팅합니다.
  • 사용자 클릭: 사용자가 이전에 클릭한 항목을 부스팅합니다. 결과 URL은 이 데이터를 수집하는 데 사용되므로 수정하지 마세요.

검색어 해석

검색어 해석 기능은 스키마 정의를 사용하여 사용자 검색어를 구조화된 연산자 기반 검색어로 변환합니다. 이를 통해 최소한의 키워드로도 정확한 결과를 얻을 수 있습니다. 검색어 해석 최적화를 위한 스키마 구조화를 참고하세요.

항목 언어

Cloud Search는 언어가 검색어 언어와 일치하지 않는 항목의 순위를 내립니다. RequestOptions에서 languageCode를 사용자의 환경설정으로 설정합니다.

상품 컨텍스트

contextAttributes를 사용하여 위치나 부서와 같은 쿼리 컨텍스트와 관련된 항목의 순위를 높입니다.

상품 인기도

Cloud Search는 사용자가 최근 쿼리에서 자주 클릭하는 항목을 부스팅합니다. 검색 결과 URL은 클릭을 추적하는 데 사용되므로 수정하지 마세요.

검색 품질 설정 요약

다음 표는 검색 품질 설정을 요약한 것입니다.

스키마 설정

설정 위치 권장사항 세부정보
ItemContent ItemContent 추천 주제
RetrievalImportance RetrievalImportance 추천 주제
FreshnessOptions FreshnessOptions 선택사항 최신성

색인 생성 설정

설정 위치 권장사항 세부정보
createTime/updateTime ItemMetadata 추천 최신성
contentLanguage ItemMetadata 추천 상품 언어
owners ItemAcl 추천 상품 소유권
커스텀 동의어 _dictionaryEntry 추천 동의어 사용하기
quality SearchQualityMetadata 선택사항 품질에 영향 주기
상호작용 데이터 interaction 선택사항 상품 상호작용
OrderedRanking OrderedRanking 선택사항 필드 유형

검색 애플리케이션 설정

설정 위치 권장사항 세부정보
맞춤설정 사용 안함 ScoringConfig 추천 맞춤설정
소스 중요도 SourceCrowdingConfig 선택사항 소스 구성
크라우딩 SourceCrowdingConfig 선택사항 소스 구성

다음 단계

  1. 검색어 해석 최적화를 위해 스키마를 구조화합니다.
  2. 동의어 정의