기본 확장, 해석, 최적화에 대한 보상

Google Cloud Search에는 검색결과에 영향을 미치는 여러 가지 기본 확장, 해석, 최적화 기능이 있습니다. 검색어에서 예상치 못한 결과가 발생하는 경우 Cloud Search 지원팀에 문의하기 전에 이 가이드를 참조하세요.

기본 확장

사용자가 [Joe’s PDFs]와 같은 문자열을 사용하여 검색하고 있지만 일부 반환된 결과에 'PDF' 대신 'documents'와 같이 강조 표시된 단어가 포함되어 있다고 가정해 보겠습니다. 검색어에 포함되지 않았는데 강조 표시된 단어가 검색결과에 포함되는 이유는 무엇인가요?

기본적으로 Google Cloud Search는 Google 웹 검색과 마찬가지로 검색어의 정확한 단어만 검색하지 않습니다. 대신 Cloud Search는 동의어와 단어의 어간을 포함하도록 쿼리를 확장합니다 (자체 동의어를 구현하지 않은 경우에도). 이러한 확장은 쿼리의 아이디어와 의도와 광범위하게 일치하는 문서 검색을 위해 수행됩니다. 이 광범위한 문서 집합을 선택한 후 순위 지정 알고리즘은 가장 일치하는 결과가 결과 집합의 상단에 배치되도록 합니다.

사용자가 [Joe’s PDFs]를 검색하면 Cloud Search는 허용되는 추가 단어로 다음을 제공했습니다.

  • [Joe’s]의 경우 Cloud Search가 'joe' (스템 확장) 및 'joes' (구두점 기반 동의어)와 일치할 수도 있습니다.
  • [PDF]의 경우 Cloud Search는 '문서' (동의어 확장) 및 'pdf' (스템 확장)와도 일치할 수 있습니다.

기본적으로 동의어가 반드시 양방향인 것은 아닙니다. 예를 들어 사용자가 '피싱'이라는 용어를 검색하면 Cloud Search는 '피싱'을 동의어 확장으로 일치시킬 수 있습니다. 하지만 사용자가 '피싱'을 검색하면 Google에서 '피싱'을 확장으로 일치시키지 않을 수 있습니다.

하이픈으로 연결된 단어와 하이픈이 없는 단어에 대한 확장

사용자가 하이픈으로 연결된 단어와 하이픈이 없는 단어를 검색할 때(예: [벽면 벽장] 및 [벽장으로 벽걸이]) Cloud Search는 이러한 쿼리를 다르게 처리합니다.

또한 하이픈으로 연결된 단어와 밑줄이 있는 단어에 여러 가지 최적화가 사용됩니다(예: [walk-in], [walk_in]).

기본 확장 보상

기본적으로 확장이 보장되지는 않습니다. 동의어 또는 도메인별 동의어 확장을 양방향으로 보장하려면 도메인별 동의어 집합을 직접 만드세요. 동의어 구현에 관한 자세한 내용은 동의어 정의를 참고하세요.

기본 해석

또한 Cloud Search는 특정 데이터 소스에 대해 업로드된 스키마에 따라 쿼리에 사용된 객체, 속성, 필드 값을 해석하는 자연어 해석을 제공합니다. 이 자연어 해석에 대한 자세한 내용은 검색어 해석 최적화를 위한 스키마 구조화를 참조하세요.

자연어 해석 사용 중지

특정 쿼리의 자연어 해석을 사용 중지하려면 검색 요청에서 QueryInterpretationOptions.disableNlInterpretationtrue로 설정합니다.

기본 최적화

Cloud Search는 다음과 같은 기본 최적화도 제공합니다.

  • 맞춤법 교정을 통해 제공된 결과에 혼합 예를 들어 쿼리 문자열이 [corpoate recommendations]이면 Cloud Search는 'corpoate'를, 'company'의 올바른 맞춤법은 일치시킵니다.

  • 결과가 0개 또는 거의 없는 쿼리의 경우 Cloud Search는 결과를 일치시킬 때 직접 동의어보다 범위가 더 넓은 관련 용어 집합을 사용합니다. 자세한 내용은 추가 결과 처리를 참고하세요.

문서 및 쿼리 정규화

정규화는 검색 전 또는 후에 특정 단어나 구문을 표준화하는 것을 의미합니다. 쿼리에 보다 일관성 있는 응답을 제공하려면 다음과 같은 방법으로 문서 (색인 생성 이전 또는 도중)와 쿼리 (사용자가 쿼리한 후)를 정규화하는 것이 좋습니다.

  • 문서를 정규화하려면 다음 안내를 따르세요.

    1. 저장소 내 문서에 사용되는 중요한 단어의 표준 철자를 선택합니다.
    2. 소스 저장소 문서에서 또는 콘텐츠 색인을 생성할 때 표준 철자와 일치하도록 맞춤법을 수정합니다.
  • 쿼리를 정규화하려면 다음 안내를 따르세요.

    1. 사용자 쿼리를 Cloud Search로 보내기 전에 가로챕니다.
    2. 색인이 생성된 데이터 소스에서 가장 일반적인 맞춤법과 일치하도록 사용자 쿼리의 단어를 다시 작성합니다.
    3. Cloud Search로 쿼리를 전송합니다.

모든 쿼리에 대한 확장, 해석, 최적화 사용 중지

특정 쿼리에 대한 확장, 해석, 최적화를 사용 중지하려면 검색 요청에서 QueryInterpretationOptions.enableVerbatim Modetrue로 설정합니다.