コンテンツコネクタを作成する

コンテンツコネクタは、企業のリポジトリ内のデータを走査して所定のデータソースを完成する目的で使われるソフトウェアプログラムです。Google は、コンテンツコネクタを開発するためのオプションを提供しています。

Content Connector SDK。これは Java プログラマーに適したオプションです。SDK は、コネクタをすばやく作成するための REST API を簡単に使えるようにしたラッパーです。この SDK でコンテンツコネクタを作成するには、Content Connector SDK を使用してコンテンツコネクタを作成するをご覧ください。
低レベル REST API、その他の各種の API ライブラリ。Java を使用していない場合や、コードベースが REST API やライブラリに問題なく対応できる場合は、これらのオプションをご利用ください。この REST API を使用してコンテンツコネクタを作成する場合は、REST API を使用してコンテンツコネクタを作成するをご覧ください。

コンテンツコネクタで行われる標準的なタスクは次のとおりです。

構成パラメータを読み取り、処理する。
インデックス登録可能な離散的なデータチャンク（これを「アイテム」と呼びます）をサードパーティのリポジトリから pull する。
ACL、メタデータ、コンテンツデータを結合して、インデックス登録可能なアイテムを作成する。
アイテムを Cloud Search データソースにインデックス登録する。
（省略可）リポジトリからの変更通知をリッスンします。変更通知はインデックス登録リクエストに変換され、Cloud Search データソースの同期が維持されます。なお、コンテンツコネクタによるこのタスクは、リポジトリが変更検出機能に対応している場合にのみ行われます。

Content Connector SDK を使用してコンテンツコネクタを作成する

以降のセクションでは、Content Connector SDK を使用してコンテンツコネクタを作成する方法について説明します。

依存関係を設定する

これらの依存関係をビルドファイルに含めます。

Maven

xml <dependency> <groupId>com.google.enterprise.cloudsearch</groupId> <artifactId>google-cloudsearch-indexing-connector-sdk</artifactId> <version>v1-0.0.3</version> </dependency>

Gradle

groovy compile group: 'com.google.enterprise.cloudsearch', name: 'google-cloudsearch-indexing-connector-sdk', version: 'v1-0.0.3'

コネクタ構成を作成する

すべてのコネクタは、リポジトリ ID などのパラメータに構成ファイルを使用します。パラメータを api.sourceId=1234567890abcdef などの Key-Value ペアとして定義します。

Google Cloud Search SDK には、すべてのコネクタ用の Google 提供のパラメータが含まれています。構成ファイルで次のことを宣言する必要があります。

コンテンツコネクタ: api.sourceId と api.serviceAccountPrivateKeyFile を宣言します。これらは、リポジトリとアクセスに必要な秘密鍵を識別します。

ID コネクタ: 外部 ID ソースを識別するために api.identitySourceId を宣言します。ユーザーの同期では、api.customerId（Google Workspace アカウントの固有 ID）も宣言します。

他の Google 提供パラメータは、デフォルト値をオーバーライドする場合にのみ宣言します。ID と鍵の生成について詳しくは、Google 提供のパラメータをご覧ください。

構成ファイルでリポジトリ固有のパラメータを定義することもできます。

構成ファイルをコネクタに渡す

構成ファイルを渡すように config システムプロパティを設定します。コネクタを起動するときに -D 引数を使用します。次に例を示します。

java -classpath myconnector.jar -Dconfig=MyConfig.properties MyConnector

この引数を省略すると、SDK はローカルディレクトリ内の connector-config.properties という名前のファイルを使用しようとします。

使用する走査戦略を決める

コンテンツコネクタの主な機能は、リポジトリを走査してそのデータをインデックス登録することです。リポジトリのサイズとレイアウトに基づいて戦略を実装する必要があります。独自の戦略を設計することも、SDK の戦略を選択することもできます。

フル走査戦略: リポジトリ全体をスキャンして、すべてのアイテムをインデックス登録します。この戦略は、インデックス登録のたびにフル走査のオーバーヘッドを許容できる小規模なリポジトリに最適です。概ね静的で階層構造を持たないデータを含む小規模なリポジトリや、変更検出が困難な場合に使用します。
リスト走査戦略: リポジトリ全体をスキャンして各アイテムのステータスを確認した後、新規または更新されたアイテムのみをインデックス登録します。変更検出がサポートされていない場合に、大規模な非階層インデックスの増分更新に使用します。
グラフトラバーサル: 親ノードをスキャンしてアイテムのステータスを確認し、そのノード内の新しいアイテムまたは更新されたアイテムのインデックスを作成します。次に、子ノードを再帰的に処理します。これは、ディレクトリ構造やウェブサイトなど、すべての ID をリストすることが現実的でない階層型リポジトリに使用します。

SDK は、これらの戦略をテンプレートコネクタクラスに実装します。これらのテンプレートを使用すると、開発を迅速に進めることができます。テンプレートを使用するには、対応するセクションをご覧ください。

テンプレートクラスを使用してフル走査コネクタを作成する
テンプレートクラスを使用してリスト走査コネクタを作成する
テンプレートクラスを使用してグラフ走査コネクタを作成する

テンプレートクラスを使用してフル走査コネクタを作成する

このセクションでは、FullTraversalSample のコードについて説明します。

コネクタのエントリポイントを実装する

エントリポイントは main() メソッドです。Application インスタンスを作成し、start() を呼び出してコネクタを実行します。

application.start() を呼び出す前に、IndexingApplication.Builder クラスを使用して FullTraversalConnector テンプレートをインスタンス化します。このテンプレートは Repository オブジェクトを受け取ります。

FullTraversalSample.java

﻿コンテンツ コネクタを作成する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Content Connector SDK を使用してコンテンツ コネクタを作成する

依存関係を設定する

Maven

Gradle

コネクタ構成を作成する

構成ファイルをコネクタに渡す

使用する走査戦略を決める

テンプレート クラスを使用してフル走査コネクタを作成する

コネクタのエントリ ポイントを実装する

Repository インターフェースを実装する

カスタム構成パラメータを取得する

フル走査を実行する

アイテムへのアクセス許可を設定する

アイテムのメタデータを設定する

インデックス登録可能なアイテムを作成する

イテレータ内のインデックス登録可能な各アイテムをパッケージ化する

次のステップ

テンプレート クラスを使用してリスト走査コネクタを作成する

コネクタのエントリ ポイントを実装する

Repository インターフェースを実装する

リスト走査を実行する

アイテムの ID とハッシュ値を push する

各アイテムを取得して処理する

削除対象のアイテムを処理する

未変更のアイテムを処理する

アイテムへのアクセス許可を設定する

アイテムのメタデータを設定する

インデックス登録可能なアイテムを作成する

次のステップ

テンプレート クラスを使用してグラフ走査コネクタを作成する

コネクタのエントリ ポイントを実装する

Repository インターフェースを実装する

グラフ走査を実行する

アイテムの ID とハッシュ値を push する

各アイテムを取得して処理する

削除対象のアイテムを処理する

メタデータを設定してアイテムを作成する

インデックス登録キューに子 ID を入れる

REST API を使用してコンテンツ コネクタを作成する

使用する走査戦略を決める

走査戦略を実装しアイテムをインデックス登録する

リポジトリの変更を処理する

コンテンツコネクタを作成する

Content Connector SDK を使用してコンテンツコネクタを作成する

テンプレートクラスを使用してフル走査コネクタを作成する

コネクタのエントリポイントを実装する

テンプレートクラスを使用してリスト走査コネクタを作成する

コネクタのエントリポイントを実装する

テンプレートクラスを使用してグラフ走査コネクタを作成する

コネクタのエントリポイントを実装する

REST API を使用してコンテンツコネクタを作成する