동의어 정의

조직은 일반적으로 개념이나 사물을 지칭하는 고유한 용어나 여러 가지 방법을 사용합니다. 사용자가 원하는 항목을 검색하는 데 도움이 되도록 용어의 유사성을 정립하는 동의어를 정의해야 합니다.

동의어는 _dictionaryEntry이라는 잘 알려진 스키마를 사용하여 항목의 색인을 생성하는 방식으로 정의합니다.

_dictionaryEntry 유형의 항목에는 다음 속성이 있을 수 있습니다.

속성	유형	설명	필수 여부
`_term`	string	정의할 용어. 권장 값은 구두점과 하이픈이 없는 단어 또는 구입니다.	필수
`_synonym`	string (repeated)	`_term`에 정의된 문자열과 일치하며, 쿼리에 포함되는 대체 용어	필수
`_onlyApplicableForAttachedSearchApplications`	boolean	데이터 소스 및 검색 애플리케이션별로 동의어를 그룹화할 수 있습니다. 자세한 내용은 데이터 소스별 동의어 정의를 참고하세요.	선택사항

사용자가 쿼리에 _term 속성 값을 포함하면 유효한 쿼리가 'term OR synonyms'이 됩니다. 예를 들어 "scifi"이라는 용어가 "science fiction"이라는 동의어로 정의된 경우 "scifi"이라는 단어가 포함된 쿼리는 "scifi" 또는 "science fiction."이 포함된 항목과 일치합니다.

동의어는 양방향으로 적용되지 않습니다. 대신에 "science fiction,"에 대한 쿼리에는 동의어가 적용되지 않습니다. 이 쿼리는 "science fiction."이 포함된 항목하고만 일치합니다. "scifi"이 포함된 항목은 생략됩니다.

두 용어를 서로 바꿔서 사용할 수 있게 하려면 각 용어를 별도로 정의하세요.

용어	동의어
scifi	science fiction
science fiction	scifi

쿼리 처리 중에는 하이픈 및 기타 구두점이 제거된 후 동의어가 적용됩니다. 사용자 쿼리가 _term과 일치합니다. "sci fi." 사용자가 하이픈을 추가할 수 있는 용어의 동의어를 만들려면 먼저 하이픈 대신 공백을 사용하도록 _term을 정규화하세요."sci-fi"

위의 예에서 다음과 같은 정의는 "sci-fi," "sci fi," "scifi,"과 "science fiction"을 서로 바꿔서 사용할 수 있는 용어로 처리하는 사용자 쿼리와 일치합니다.

용어	동의어
scifi	science fiction, sci fi
sci fi	science fiction, scifi
science fiction	scifi, sci fi

기본적으로 모든 데이터 소스의 동의어는 전체 도메인에 적용됩니다. 특히 동의어는 데이터 소스에 관계없이 모든 검색의 검색 애플리케이션에 적용됩니다. 데이터 소스별 동의어가 필요한 경우 데이터 소스별 동의어 정의를 참고하세요.

Cloud Search SDK를 사용하여 전역 동의어 정의

콘텐츠 커넥터 SDK를 사용하여 용어와 동의어를 정의할 수 있습니다. 커넥터 제작 방법을 보려면 콘텐츠 커넥터 만들기를 참조하세요.

다음 스니펫은 CSV 파일 레코드를 기반으로 용어와 동의어를 표현하는 RepositoryDoc를 만드는 방법을 보여줍니다.

DictionaryConnector.java

GitHub에서 보기

/**
 * Creates a document for indexing.
 *
 * For this connector sample, the created document is domain public
 *  searchable. The content is a simple text string.
 *
 * @param record The current CSV record to convert
 * @return the fully formed document ready for indexing
 */
private ApiOperation buildDocument(CSVRecord record) {
  // Extract term and synonyms from record
  String term = record.get(0);
  List<String> synonyms = StreamSupport.stream(record.spliterator(), false)
      .skip(1) // Skip term
      .collect(Collectors.toList());

  Multimap<String, Object> structuredData = ArrayListMultimap.create();
  structuredData.put("_term", term);
  structuredData.putAll("_synonym", synonyms);

  if (Configuration.getBoolean("dictionary.attachedToSearchApp", false).get()) {
    structuredData.put("_onlyApplicableForAttachedSearchApplications", true);
  }

  String itemName = String.format("dictionary/%s", term);

  // Using the SDK item builder class to create the item
  Item item =
      IndexingItemBuilder.fromConfiguration(itemName)
          .setItemType(IndexingItemBuilder.ItemType.CONTENT_ITEM)
          .setObjectType("_dictionaryEntry")
          .setValues(structuredData)
          .setAcl(DOMAIN_PUBLIC_ACL)
          .build();

  // Create the fully formed document
  return new RepositoryDoc.Builder()
      .setItem(item)
      .build();
}

동의어를 정의할 때는 다음 사항에 유의하세요.

동의어 항목은 도메인 공용이어야 합니다. 이전 예에서는 ACL을 DOMAIN_PUBLIC_ACL로 설정하면 이를 구현할 수 있습니다.
다음 속성은 코드의 도메인 공개 설정을 재정의하므로 구성 파일에 정의되어서는 안 됩니다.
- defaultAcl.mode=FALLBACK
- defaultAcl.public=true

검색 애플리케이션별 동의어 정의

기본적으로 동의어는 모든 검색 애플리케이션의 모든 데이터 소스에 적용됩니다.

하지만 조직에 엔지니어링팀과 영업팀이 별도로 있고 직무별 동의어를 포함하여 각 팀에 서로 다른 검색 환경을 제공하려는 경우를 가정해 보겠습니다. 이 경우 엔지니어링 전용 데이터 소스와 동의어가 있는 검색 애플리케이션과 영업 전용 데이터 소스와 동의어가 있는 검색 애플리케이션을 각각 만들 수 있습니다. 이 목표를 달성하려면 _onlyApplicableForAttachedSearchApplications=true를 사용하여 특정 데이터 소스의 각 동의어를 색인화합니다. 이 설정은 특정 데이터 소스를 포함하는 검색 애플리케이션에만 동의어가 적용되도록 동의어를 제한합니다.

예를 들어 이전 코드 샘플에 다음 코드 줄을 추가하면 색인이 생성된 동의어가 데이터 소스에만 적용됩니다.

structuredData.put("_onlyApplicableForAttachedSearchApplications", true);

동의어 정의 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

Cloud Search SDK를 사용하여 전역 동의어 정의

검색 애플리케이션별 동의어 정의

동의어 정의