동의어 정의

조직은 일반적으로 개념이나 사물을 지칭하는 고유한 용어나 여러 가지 방법을 사용합니다. 사용자가 원하는 항목을 검색하는 데 도움이 되도록 용어의 유사성을 정립하는 동의어를 정의해야 합니다.

동의어는 _dictionaryEntry라는 잘 알려진 스키마를 사용하여 항목의 색인을 생성하는 방식으로 정의합니다.

_dictionaryEntry 유형의 항목에는 다음 속성이 포함될 수 있습니다.

속성 유형 설명 필수 여부
_term string 정의할 용어. 권장 값은 구두점과 하이픈이 없는 단어 또는 구입니다. 필수
_synonym string (repeated) _term에 정의된 문자열과 일치하며, 쿼리에 포함되는 대체 용어 필수
_onlyApplicableForAttachedSearchApplications boolean 데이터 소스 및 검색 애플리케이션별로 동의어를 그룹화할 수 있습니다. 자세한 내용은 데이터 소스별 동의어 정의를 참고하세요. 선택사항

사용자가 쿼리에 _term 속성의 값을 포함하면 유효한 쿼리는 '검색어 또는 동의어'가 됩니다. 예를 들어 "scifi"라는 용어가 "science fiction"이라는 동의어로 정의된 경우 "scifi"라는 단어가 포함된 쿼리는 "scifi" 또는 "science fiction."가 포함된 항목과 일치합니다.

동의어는 양방향으로 적용되지 않습니다. 대신에 "science fiction,"에 대한 쿼리에는 동의어가 적용되지 않습니다. 이 쿼리는 "science fiction."가 포함된 항목과만 일치합니다. "scifi"가 포함된 항목은 생략됩니다.

두 용어를 서로 바꿔서 사용할 수 있게 하려면 각 용어를 별도로 정의하세요.

용어 동의어
scifi science fiction
science fiction scifi

쿼리 처리 중에는 하이픈 및 기타 구두점이 제거된 후 동의어가 적용됩니다. 사용자 검색어 "sci-fi"_term "sci fi."와 일치합니다. 사용자가 하이픈을 추가할 수 있는 용어의 동의어를 만들려면 먼저 하이픈 대신 공백을 사용하도록 _term을 정규화하세요.

위의 예에서 다음과 같은 정의는 "sci-fi," "sci fi," "scifi,""science fiction"을 서로 바꿔서 사용할 수 있는 용어로 처리하는 사용자 쿼리와 일치합니다.

용어 동의어
scifi science fiction, sci fi
sci fi science fiction, scifi
science fiction scifi, sci fi

기본적으로 모든 데이터 소스의 동의어는 전체 도메인에 적용됩니다. 특히 동의어는 데이터 소스에 관계없이 모든 검색의 검색 애플리케이션 전반에 적용됩니다. 데이터 소스별 동의어를 사용하려면 데이터 소스별 동의어 정의를 참고하세요.

Cloud Search SDK를 사용하여 전 세계 동의어 정의

콘텐츠 커넥터 SDK를 사용하여 용어와 동의어를 정의할 수 있습니다. 커넥터 제작 방법을 보려면 콘텐츠 커넥터 만들기를 참조하세요.

다음 스니펫은 CSV 파일 레코드를 기반으로 용어와 동의어를 나타내는 RepositoryDoc를 빌드하는 방법을 보여줍니다.

DictionaryConnector.java
/**
 * Creates a document for indexing.
 *
 * For this connector sample, the created document is domain public
 *  searchable. The content is a simple text string.
 *
 * @param record The current CSV record to convert
 * @return the fully formed document ready for indexing
 */
private ApiOperation buildDocument(CSVRecord record) {
  // Extract term and synonyms from record
  String term = record.get(0);
  List<String> synonyms = StreamSupport.stream(record.spliterator(), false)
      .skip(1) // Skip term
      .collect(Collectors.toList());

  Multimap<String, Object> structuredData = ArrayListMultimap.create();
  structuredData.put("_term", term);
  structuredData.putAll("_synonym", synonyms);

  if (Configuration.getBoolean("dictionary.attachedToSearchApp", false).get()) {
    structuredData.put("_onlyApplicableForAttachedSearchApplications", true);
  }

  String itemName = String.format("dictionary/%s", term);

  // Using the SDK item builder class to create the item
  Item item =
      IndexingItemBuilder.fromConfiguration(itemName)
          .setItemType(IndexingItemBuilder.ItemType.CONTENT_ITEM)
          .setObjectType("_dictionaryEntry")
          .setValues(structuredData)
          .setAcl(DOMAIN_PUBLIC_ACL)
          .build();

  // Create the fully formed document
  return new RepositoryDoc.Builder()
      .setItem(item)
      .build();
}

동의어를 정의할 때는 다음 사항에 유의하세요.

  • 동의어 항목은 도메인 공용이어야 합니다. 이전 예에서는 ACL을 DOMAIN_PUBLIC_ACL로 설정하면 이를 구현할 수 있습니다.
  • 다음 속성은 코드의 도메인 공개 설정을 재정의하므로 구성 파일에 정의되어서는 안 됩니다.
    • defaultAcl.mode=FALLBACK
    • defaultAcl.public=true

검색 애플리케이션별 동의어 정의

기본적으로 동의어는 모든 검색 애플리케이션의 모든 데이터 소스에 적용됩니다.

하지만 조직에 엔지니어링팀과 영업팀이 별도로 있고 각 팀에 직무 역할별 동의어를 포함한 서로 다른 검색 환경을 제공하려고 한다고 가정해 보겠습니다. 이 경우 엔지니어링 관련 데이터 소스 및 동의어로 검색 애플리케이션 하나를 만들고 영업 관련 데이터 소스 및 동의어로 검색 애플리케이션 하나를 만들 수 있습니다. 이 목표를 달성하려면 _onlyApplicableForAttachedSearchApplications=true를 사용하여 특정 데이터 소스의 각 동의어에 색인을 생성합니다. 이 설정은 동의어가 특정 데이터 소스가 포함된 검색 애플리케이션에만 적용되도록 제한합니다.

예를 들어 이전 코드 샘플에 다음 코드 줄을 추가하면 색인이 생성된 동의어가 데이터 소스별로 지정됩니다.

structuredData.put("_onlyApplicableForAttachedSearchApplications", true);