Google Cloud Search에는 검색 결과에 영향을 미치는 여러 기본 확장, 해석, 최적화가 있습니다. 검색어에 예상치 못한 결과가 표시되는 경우 Cloud Search 지원팀에 문의하기 전에 이 가이드를 참고하세요.
기본 확장
사용자가 [조의 PDF]와 같은 문자열을 사용하여 검색하고 있지만 반환된 일부 결과에 'PDF' 대신 '문서'와 같이 강조 표시된 단어가 포함되어 있다고 가정해 보겠습니다. 검색어에 포함되지 않은 강조 표시된 단어가 결과에 포함되는 이유는 무엇인가요?
기본적으로 Google Cloud Search는 Google 웹 검색과 마찬가지로 검색어의 정확한 단어만 검색하지 않습니다. 대신 Cloud Search는 동의어와 단어 줄기를 포함하도록 쿼리를 확장합니다 (자체 동의어를 구현하지 않은 경우에도 마찬가지). 이 확장은 쿼리의 아이디어와 의도와 대략적으로 일치하는 문서를 검색하기 위해 실행됩니다. 이러한 광범위한 문서 집합이 선택되면 순위 알고리즘이 가장 일치하는 문서가 결과 집합의 맨 위에 표시되도록 작동합니다.
사용자가 [조의 PDF]를 검색했을 때 Cloud Search는 다음을 추가로 허용되는 단어로 제공했습니다.
- [Joe’s]의 경우 Cloud Search에서 'joe' (시작어 확장) 및 'joes' (구두점을 기반으로 한 동의어)와도 일치할 수 있습니다.
- [PDF]의 경우 Cloud Search에서 '문서' (동의어 확장) 및 'pdf' (줄기 확장)와도 일치시킬 수 있습니다.
기본적으로 동의어는 반드시 양방향이 아닙니다. 예를 들어 사용자가 '피싱'이라는 검색어를 검색하면 Cloud Search에서 '피시'를 동의어 확장으로 일치시킬 수 있습니다. 하지만 사용자가 '피싱'이라는 용어를 검색하면 Google에서 '피싱'을 확장검색으로 일치시키지 않을 수 있습니다.
하이픈이 있는 단어와 하이픈이 없는 단어의 확장
사용자가 [walk-in closet] 와 [walk in closet]와 같이 하이픈이 있는 단어와 하이픈이 없는 등가 표현을 검색하면 Cloud Search에서 이러한 검색어를 다르게 처리합니다.
또한 [walk-in] 및 [walk_in]과 같이 하이픈이 추가되거나 밑줄이 추가된 단어에는 다른 최적화가 사용됩니다.
기본 확장 보상
기본적으로 확장이 보장되지는 않습니다. 동의어 또는 도메인별 동의어 확장의 양방향성을 보장하려면 자체 도메인별 동의어 집합을 만드세요. 동의어 구현에 관한 자세한 내용은 동의어 정의를 참고하세요.
기본 해석
Cloud Search는 특정 데이터 소스에 업로드된 스키마에 따라 쿼리에 사용된 객체, 속성, 필드 값을 해석하는 자연어 해석도 제공합니다. 이 자연 언어 해석에 관한 자세한 내용은 검색어 해석 최적화를 위한 스키마 구조화를 참고하세요.
자연어 해석 사용 중지
특정 검색어에 대해 자연어 해석을 사용 중지하려면 검색 요청에서 QueryInterpretationOptions.disableNlInterpretation
를 true
로 설정합니다.
기본 최적화
Cloud Search는 다음과 같은 기본 최적화도 제공합니다.
맞춤법 수정으로 제공된 결과를 혼합합니다. 예를 들어 쿼리 문자열이 [corpoate benefits]인 경우 Cloud Search는 'corpoate'와 올바른 철자 'corporate'를 일치시킵니다.
검색 결과가 0개이거나 적은 검색어의 경우 Cloud Search는 결과를 일치시킬 때 직접적인 동의어보다 더 광범위한 관련 용어 집합을 사용합니다. 자세한 내용은 보충 결과 처리를 참고하세요.
문서 및 쿼리 정규화
정규화는 쿼리하기 전이나 후에 특정 단어 또는 구문을 표준화하는 것을 말합니다. 검색어에 더 일관된 응답을 제공하려면 다음과 같은 방식으로 (색인 생성 전 또는 생성 중) 문서와 (사용자가 검색한 후) 검색어를 정규화하는 것이 좋습니다.
문서를 정규화하려면 다음 단계를 따르세요.
- 저장소 내 문서에 사용되는 중요한 단어의 표준 맞춤법을 선택합니다.
- 소스 저장소 문서 또는 콘텐츠 색인을 생성할 때 표준 철자와 일치하도록 철자를 수정합니다.
쿼리를 표준화하려면 다음 단계를 따르세요.
- 사용자 검색어를 Cloud Search로 전송하기 전에 가로채는 기능
- 색인이 생성된 데이터 소스의 가장 일반적인 맞춤법과 일치하도록 사용자 쿼리의 단어를 재작성합니다.
- Cloud Search에 쿼리를 전송합니다.
모든 검색어에 대한 확장, 해석, 최적화 사용 중지
특정 검색어에 대한 확장, 해석, 최적화를 사용 중지하려면 검색 요청에서 QueryInterpretationOptions.enableVerbatim Mode
를 true
로 설정합니다.