Tworzenie łącznika treści

Wtyczka treści to program, który przeszukuje dane w repozytorium przedsiębiorstwa i wypełnia źródło danych. Google udostępnia te opcje tworzenia oprogramowania sprzęgającego treści:

Pakiet SDK łącznika treści. To dobre rozwiązanie dla programistów Java. Pakiet SDK to otoczka interfejsu API typu REST, która umożliwia szybkie tworzenie oprogramowania sprzęgającego. Aby utworzyć oprogramowanie sprzęgające treści za pomocą pakietu SDK, zapoznaj się z artykułem Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector.
interfejs REST API niskiego poziomu lub biblioteki interfejsów API. Skorzystaj z tych opcji, jeśli nie używasz Javy lub jeśli baza kodu lepiej obsługuje interfejs API REST lub bibliotekę. Aby utworzyć oprogramowanie sprzęgające treści za pomocą interfejsu API REST, zapoznaj się z artykułem Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST.

Typowy łącznik treści wykonuje te zadania:

Odczytuje i przetwarza parametry konfiguracji.
Pobiera z repozytorium innej firmy oddzielne fragmenty danych, które można indeksować, zwane „elementami”.
Łączy listy kontroli dostępu, metadane i dane treści w indeksowane elementy.
Indeksuje elementy w źródle danych Cloud Search.
(Opcjonalnie) Nasłuchuje powiadomień o zmianach w repozytorium. Powiadomienia o zmianach są przekształcane w prośby o indeksowanie, aby zachować synchronizację źródła danych Cloud Search. Oprogramowanie sprzęgające wykonuje to zadanie tylko wtedy, gdy repozytorium obsługuje wykrywanie zmian.

Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector

W sekcjach poniżej znajdziesz informacje o tym, jak utworzyć oprogramowanie sprzęgające treści za pomocą pakietu SDK oprogramowania sprzęgającego treści.

Konfigurowanie zależności

Uwzględnij te zależności w pliku kompilacji.

Maven

xml <dependency> <groupId>com.google.enterprise.cloudsearch</groupId> <artifactId>google-cloudsearch-indexing-connector-sdk</artifactId> <version>v1-0.0.3</version> </dependency>

Gradle

groovy compile group: 'com.google.enterprise.cloudsearch', name: 'google-cloudsearch-indexing-connector-sdk', version: 'v1-0.0.3'

Tworzenie konfiguracji oprogramowania sprzęgającego

Każde oprogramowanie sprzęgające używa pliku konfiguracji do określania parametrów, takich jak identyfikator repozytorium. Zdefiniuj parametry jako pary klucz-wartość, np. api.sourceId=1234567890abcdef.

Pakiet Google Cloud Search SDK zawiera parametry dostarczone przez Google dla wszystkich łączników. W pliku konfiguracyjnym musisz zadeklarować te elementy:

Łącznik treści: zadeklaruj api.sourceId i api.serviceAccountPrivateKeyFile. Określają one Twoje repozytorium i klucz prywatny potrzebny do uzyskania dostępu.

Łącznik tożsamości: zadeklaruj api.identitySourceId, aby zidentyfikować zewnętrzne źródło tożsamości. W przypadku synchronizacji użytkowników zadeklaruj też api.customerId (unikalny identyfikator konta Google Workspace).

Deklaruj inne parametry dostarczane przez Google tylko wtedy, gdy chcesz zastąpić ich wartości domyślne. Szczegółowe informacje o generowaniu identyfikatorów i kluczy znajdziesz w sekcji Parametry dostarczane przez Google.

W pliku konfiguracyjnym możesz też zdefiniować parametry specyficzne dla repozytorium.

Przekazywanie pliku konfiguracji do oprogramowania sprzęgającego

Ustaw właściwość systemową config, aby przekazać plik konfiguracji. Podczas uruchamiania oprogramowania sprzęgającego użyj argumentu -D. Na przykład:

java -classpath myconnector.jar -Dconfig=MyConfig.properties MyConnector

Jeśli pominiesz ten argument, pakiet SDK spróbuje użyć pliku o nazwie connector-config.properties w katalogu lokalnym.

Określ strategię przechodzenia

Główną funkcją łącznika treści jest przeszukiwanie repozytorium i indeksowanie jego danych. Musisz wdrożyć strategię opartą na rozmiarze i układzie repozytorium. Możesz zaprojektować własną strategię lub wybrać jedną z dostępnych w pakiecie SDK:

Strategia pełnego przechodzenia: Skanuje całe repozytorium i indeksuje każdy element. Ta strategia jest najlepsza w przypadku małych repozytoriów, w których możesz sobie pozwolić na pełne przeszukiwanie podczas każdego indeksowania. Używaj go w przypadku małych repozytoriów zawierających głównie statyczne, niehierarchiczne dane lub gdy wykrywanie zmian jest trudne.
Strategia przechodzenia listy: Skanuje całe repozytorium, aby określić stan każdego elementu, a następnie indeksuje tylko nowe lub zaktualizowane elementy. Używaj tej metody do przyrostowych aktualizacji dużego, niehierarchicznego indeksu, gdy wykrywanie zmian nie jest obsługiwane.
Przeszukiwanie grafu: Skanuje węzeł nadrzędny, aby określić stan jego elementów, a następnie indeksuje nowe lub zaktualizowane elementy w tym węźle. Następnie rekursywnie przetwarza węzły podrzędne. Użyj tej opcji w przypadku repozytoriów hierarchicznych, w których wyświetlanie wszystkich identyfikatorów nie jest praktyczne, np. w przypadku struktur katalogów lub witryn.

Pakiet SDK implementuje te strategie w klasach szablonów oprogramowania sprzęgającego. Te szablony mogą przyspieszyć proces tworzenia. Aby użyć szablonu, zapoznaj się z odpowiednią sekcją:

Tworzenie łącznika pełnego przeszukiwania za pomocą klasy szablonu
Tworzenie łącznika przechodzenia po liście za pomocą klasy szablonu
Tworzenie oprogramowania sprzęgającego przechodzenie po grafie za pomocą klasy szablonu

Tworzenie łącznika pełnego przechodzenia za pomocą klasy szablonu

Ta sekcja odnosi się do kodu z FullTraversalSample.

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Punkt wejścia to metoda main(). Tworzy instancję Application i wywołuje start(), aby uruchomić oprogramowanie sprzęgające.

Przed wywołaniem funkcji application.start() użyj klasy IndexingApplication.Builder do utworzenia instancji szablonu FullTraversalConnector. Ten szablon akceptuje obiekt Repository.

FullTraversalSample.java

Tworzenie łącznika treści Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector

Konfigurowanie zależności

Maven

Gradle

Tworzenie konfiguracji oprogramowania sprzęgającego

Przekazywanie pliku konfiguracji do oprogramowania sprzęgającego

Określ strategię przechodzenia

Tworzenie łącznika pełnego przechodzenia za pomocą klasy szablonu

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Implementowanie interfejsu Repository

Pobieranie parametrów konfiguracji niestandardowej

Przeprowadź pełne przeszukiwanie

Ustawianie uprawnień do elementu

Ustawianie metadanych elementu

Tworzenie elementu, który można indeksować

Zapakuj każdy indeksowany element w iterator

Dalsze kroki

Tworzenie łącznika przechodzenia po liście za pomocą klasy szablonu

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Implementowanie interfejsu Repository

Przejdź przez listę

Przesyłanie identyfikatorów produktów i wartości skrótu

Pobieranie i obsługa każdego elementu

Obsługa usuniętych elementów

Obsługa niezmienionych elementów

Ustawianie uprawnień do elementu

Ustawianie metadanych elementu

Tworzenie elementu, który można indeksować

Dalsze kroki

Tworzenie łącznika przechodzenia po grafie za pomocą klasy szablonu

Wdróż punkt wejścia oprogramowania sprzęgającego

Implementowanie interfejsu Repository

Wykonaj przeszukiwanie grafu

Przesyłanie identyfikatorów produktów i wartości skrótu

Pobieranie i obsługa każdego elementu

Obsługa usuniętych elementów

Ustawianie metadanych i tworzenie elementu

Umieszczanie identyfikatorów elementów podrzędnych w kolejce indeksowania

Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST

Określ strategię przechodzenia

Wdrażanie strategii przechodzenia i indeksowanie elementów

Obsługa zmian w repozytorium

Tworzenie łącznika treści