Możesz skonfigurować usługę Google Cloud Search tak, aby zwracała wyniki z treści Dataplex Online, które są dodatkiem do treści z Google Workspace. Ty użyć oprogramowania sprzęgającego Google Cloud Search z SharePoint Online i skonfigurować je tak, uzyskać dostęp do określonego źródła danych SharePoint Online.
Ważne informacje
Honorowe ustawienia usługi SharePoint
Oprogramowanie sprzęgające Cloud Search SharePoint Online zawsze obsługuje ustawienie Widoczność przy wyszukiwaniu, którego nie można zastąpić. W przypadku dokumentów roboczych uprawnienia do konta użytkownika (używane przez oprogramowanie sprzęgające do uzyskiwania dostępu do usługi SharePoint Online) określają, które wersje robocze dokumentów są indeksowane i zwracane. Jeśli konto ma tylko stan „Pełny odczyt” uprawnień, oprogramowanie sprzęgające uwzględnia ustawienie „Widoczność elementu w wersji roboczej” w SharePoint.
Skonfigurujesz też oprogramowanie sprzęgające tak, aby ograniczyć wyniki na podstawie dostępu do konta użytkownika. Aby zastosować przycinanie zabezpieczeń w przypadku treści z SharePoint, musisz zsynchronizować te tożsamości zewnętrzne z katalogiem Google:
- Użytkownicy Office 365 / Azure AD
- Office 365 / grupy zabezpieczeń Azure AD
- grupy SharePoint (z użytkownikami i grupami Office 365 jako członkami);
Optymalizacja wyszukiwania
Możesz poprawić przez skonfigurowanie oprogramowania sprzęgającego tak, aby zwracało trafniejsze wyniki wyszukiwania.
Aby korzystać z tego interfejsu API, ustaw wartości parametrów generowania kodu HTML w pliku konfiguracji oprogramowania sprzęgającego SharePoint Online. Te parametry pozwalają określić, które pola mają większy lub mniejszy wpływ na dopasowania.
Aby skonfigurować schemat, postępuj zgodnie z instrukcjami podanymi w artykule Tworzenie i rejestrowanie schematu. Podczas konfigurowania schematu:
W celu zmapowania nazw typów treści oprogramowania sprzęgającego na odpowiednie definicje obiektów oprogramowanie sprzęgające normalizuje nazwy typów treści przez wykluczenie nieobsługiwanych znaków. W przypadku definicji obiektów interfejs Cloud Search API obsługuje jako prawidłowe znaki tylko z A–Z, a–z i 0–9. Na przykład typ treści „Ogłoszenia” jest mapowany na definicję obiektu „Ogłoszenia”. typ treści „Artykuł z wiadomościami”, mapuje na „NewsArticle” (bez spacji).
Gdy oprogramowanie sprzęgające nie może dopasować definicji obiektu do definicji obiektu, oprogramowanie sprzęgające używa typu obiektu kreacji zastępczej (
itemMetadata.objectType
). Dowiedz się więcej o parametrach konfiguracji metadanych.Oprogramowanie sprzęgające mapuje nazwy właściwości SharePoint na definicje właściwości.
Gdy oprogramowanie sprzęgające napotka pliki .msg w Microsoft Outlook podczas indeksowania treści, zastępuje typ treści tych plików i indeksuje je jako
application/vnd.ms-outlook.
Znane ograniczenia oprogramowania sprzęgającego
- Każda instancja oprogramowania sprzęgającego może indeksować treść tylko z jednego zbioru witryn. Aby indeksować wiele zbiorów witryn, skonfiguruj dodatkowe instancje oprogramowania sprzęgającego.
- Wykorzystanie pamięci zwiększa się wraz z liczbą unikalnych użytkowników i grup używanych na listach kontroli dostępu (ACL) w każdej kolekcji witryn.
- Powiadomienia o usunięciu nie są natychmiastowe. Zanim oprogramowanie sprzęgające wykryje, że użytkownik usunął treści z repozytorium źródłowego, może minąć ponad 4 godziny.
Wymagania systemowe
Wymagania systemowe | |
---|---|
System operacyjny |
|
Uwierzytelnianie |
|
Oprogramowanie |
|
Wdrażanie oprogramowania sprzęgającego
Wymagania wstępne
Utwórz klucz prywatny Google Workspace zawierający identyfikator konta usługi. Aby dowiedzieć się, jak uzyskać klucz prywatny, przeczytaj artykuł Konfigurowanie dostępu do interfejsu Google Cloud Search API.
Administrator Google Workspace musi dodać źródło danych do przeszukiwania. Zanotuj identyfikator źródła danych.
Jeśli oprogramowanie sprzęgające zwraca wyniki na podstawie list kontroli dostępu (wyniki nie są publiczne), administrator Google Workspace musi utworzyć 2 źródła tożsamości i przekazać Ci ich identyfikatory:
- po jednym dla użytkowników i grup Office 365
- po jednej dla grup SharePoint.
Administrator musi też uzyskać i przekazać Ci identyfikator klienta Google Workspace Twojej organizacji.
Aby dowiedzieć się, jak uzyskać te wartości, przeczytaj artykuł Mapowanie tożsamości użytkowników w Cloud Search.
Skonfiguruj konto użytkownika oprogramowania sprzęgającego, które ma uprawnienia administratora gromadzenia danych o witrynach online.
Jeśli oprogramowanie sprzęgające zwraca wyniki na podstawie list kontroli dostępu (wyniki nie są publiczne), utwórz dane logowania, aby odczytywać użytkowników i grupy z konta Office 365. Wykonaj instrukcje Microsoftu, aby utworzyć aplikację Azure Active Directory. Podczas konfigurowania aplikacji:
- Nadaj aplikacji nazwę opisową, na przykład „gcs-o365-identity-connector”.
- Dodaj uprawnienia. Aplikacja wymaga ustawienia „Group.Read.All” i „User.Read.All”.
- Zapisz te informacje, które będą używane w konfiguracji oprogramowania sprzęgającego:
- Identyfikator aplikacji
- Najemca
- Tajny klucz klienta
Krok 1. Zainstaluj oprogramowanie sprzęgające usługi SharePoint Online
Sklonuj repozytorium oprogramowania sprzęgającego z GitHuba.
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
Sprawdź odpowiednią wersję oprogramowania sprzęgającego:
$ git checkout tags/v1-0.0.3
Utwórz oprogramowanie sprzęgające.
$ mvn package
Aby pominąć testy podczas tworzenia oprogramowania sprzęgającego, uruchom
mvn package -DskipTests
zamiastmvn package
.Skopiuj plik ZIP oprogramowania sprzęgającego do lokalnego katalogu instalacji:
$ cp target/google-cloudsearch-sharepoint-connector-v1-0.0.3.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-sharepoint-connector-v1-0.0.3.zip $ cd google-cloudsearch-sharepoint-connector-v1-0.0.3
Krok 2. Tworzenie pliku konfiguracji oprogramowania sprzęgającego SharePoint Online
W tym samym katalogu, w którym znajduje się instalacja oprogramowania sprzęgającego, utwórz nowy plik i nadaj mu nazwę
sharepoint-online-connector.config
. Jeśli planujesz uruchomić wiele instancji oprogramowania sprzęgającego, dodaj więcej szczegółów do nazwy, aby ją rozróżnić.Dodaj parametry jako pary klucz/wartość do zawartości pliku, jak w tym przykładzie:
### SharePoint Online connector configuration ### # Required parameters for data source access api.sourceId=08ef8becd116faa4546b8ca2c84b2879 api.serviceAccountPrivateKeyFile=service_account.json # Required parameters for SharePoint Online access sharepoint.server=https://mydomain.onmicrosoft.com sharepoint.siteCollectionOnly=true sharepoint.username=admin@mydomain.onmicrosoft.com sharepoint.password=pa$sw0rd sharepoint.formsAuthenticationMode=LIVE sharepoint.deploymentType=ONLINE # SharePoint identity mapping parameters api.identitySourceId=08ef8becd116faa475de26d9b291fed9 api.referenceIdentitySources=defaultIdentitySource api.referenceIdentitySource.defaultIdentitySource.id=08ef8becd116faa5d3783f8c5a80e5aa # Optional SharePoint List Item metadata parameters contentTemplate.sharepointItem.title=Title contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Szczegółowe opisy poszczególnych parametrów znajdziesz w dokumentacji parametrów konfiguracji.
(Opcjonalnie) Skonfiguruj dodatkowe parametry oprogramowania sprzęgającego zgodnie z potrzebami. Więcej informacji: Parametry oprogramowania sprzęgającego udostępnione przez Google.
Krok 3. Konfigurowanie logowania w oprogramowaniu sprzęgającym z SharePoint Online
W tym samym katalogu, który zawiera plik binarny oprogramowania sprzęgającego, utwórz folder o nazwie logs.
W tym samym katalogu utwórz plik zakodowany w standardzie Latin-1 o nazwie logging.properties i dodaj tę treść:
handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for SharePoint APIsa #com.google.enterprise.cloudsearch.sharepoint.level=FINE # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Krok 4. Konfigurowanie oprogramowania sprzęgającego tożsamości SharePoint Online
Ten krok jest wymagany, aby w wynikach wyszukiwania zastosować oparte na tożsamości listy kontroli dostępu (ACL) usługi SharePoint Online. Jeśli skonfigurujesz oprogramowanie sprzęgające z publicznymi listami kontroli dostępu, możesz pominąć ten krok.
W tym samym katalogu, w którym znajduje się instalacja oprogramowania sprzęgającego z SharePoint Online, utwórz nowy plik i nadaj mu nazwę
sharepoint-online-identity-connector.config
.Dodaj parametry jako pary klucz/wartość do zawartości pliku, jak w tym przykładzie:
### SharePoint Online identity connector configuration ### # Required parameters for data source access api.customerId=C05d3djk8 api.serviceAccountPrivateKeyFile=service_account.json # Required parameters for SharePoint Online access sharepoint.server=https://mydomain.onmicrosoft.com sharepoint.siteCollectionOnly=true sharepoint.username=admin@mydomain.onmicrosoft.com sharepoint.password=pa$sw0rd sharepoint.formsAuthenticationMode=LIVE sharepoint.deploymentType=ONLINE # SharePoint identity mapping parameters api.identitySourceId=08ef8becd116faa475de26d9b291fed9 api.referenceIdentitySources=defaultIdentitySource api.referenceIdentitySource.defaultIdentitySource.id=08ef8becd116faa5d3783f8c5a80e5aa
Wartości są prawie takie same jak w przypadku oprogramowania sprzęgającego SharePoint Online, z tym że zamiast
api.sourceId
parametrem jestapi.customerId
. Wartośćapi.customerId
to identyfikator klienta otrzymany od administratora Google Workspace.
Krok 5. Zainstaluj oprogramowanie sprzęgające tożsamości Office 365
Ten krok jest wymagany, aby w wynikach wyszukiwania zastosować oparte na tożsamości listy kontroli dostępu (ACL) usługi SharePoint Online. Jeśli skonfigurujesz oprogramowanie sprzęgające z publicznymi listami kontroli dostępu, możesz pominąć ten krok.
Sklonuj repozytorium oprogramowania sprzęgającego z GitHuba.
$ git clone https://github.com/google-cloudsearch/office-365-connector.git $ cd office-365-connector
Sprawdź odpowiednią wersję oprogramowania sprzęgającego:
$ git checkout tags/v1-0.0.3
Utwórz oprogramowanie sprzęgające.
$ mvn package
Aby pominąć testy podczas tworzenia oprogramowania sprzęgającego, uruchom
mvn package -DskipTests
zamiastmvn package
.Skopiuj plik ZIP oprogramowania sprzęgającego do lokalnego katalogu instalacji:
$ cp target/google-cloudsearch-office-365-connector-v1-0.0.3.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-office-365-connector-v1-0.0.3.zip $ cd google-cloudsearch-office-365-connector-v1-0.0.3
Krok 6. Skonfiguruj oprogramowanie sprzęgające tożsamości Office 365 oraz logowanie
W tym samym katalogu, w którym znajduje się zainstalowany łącznik tożsamości, utwórz nowy plik i nadaj mu nazwę
o365-identity-connector.config
.Dodaj parametry jako pary klucz/wartość do zawartości pliku, jak w przykładzie poniżej. Uwaga: wszystkie parametry są wymagane.
### Office 365 Identity connector configuration ###
api.identitySourceId=12345abcde api.customerId=abcde12345 o365.clientId=a63c6eb3-29e7-486 o365.tenant=185ef9ed-29e7-486 o365.clientSecret=raHJN15vRLBKsSzczegółowe opisy poszczególnych parametrów znajdziesz w dokumentacji konfiguracji oprogramowania sprzęgającego tożsamości Office 365.
W tym samym katalogu, który zawiera plik binarny oprogramowania sprzęgającego, utwórz folder o nazwie logs.
W tym samym katalogu utwórz plik ASCII lub UTF-8 o nazwie logging.properties i dodaj tę treść:
handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for Office 365 APIs #com.google.enterprise.cloudsearch.o365.level=FINE # uncomment line below to increase logging level to enable Google API traces #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-o365.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Krok 7. Uruchom oprogramowanie sprzęgające usługi SharePoint Online
W kolejnych krokach zmapujesz podmioty zabezpieczeń zarówno w Office 365, jak i w kolekcji witryny Dataplex na tożsamości w usłudze Cloud Identity. Synchronizacja jest przeprowadzana za pomocą oprogramowania sprzęgającego Office 365 Identity i oprogramowania sprzęgającego tożsamości SharePoint Online.
Po zsynchronizowaniu użytkowników i grup przez oprogramowanie sprzęgające Office 365 uruchom oprogramowanie sprzęgające tożsamości usługi SharePoint Online, aby zsynchronizować grupy kolekcji witryn SharePoint. Następnie uruchamiasz oprogramowanie sprzęgające z SharePoint Online, aby indeksować i udostępniać wyniki użytkownikom Cloud Search.
Uruchom łącznik tożsamości Office 365:
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-office-365-connector-v1-0.0.3.jar -Dconfig=o365-identity-connector.config
Uruchom oprogramowanie sprzęgające tożsamości usługi SharePoint Online:
$ java -Djava.util.logging.config.file=logging.properties -cp "google-cloudsearch-sharepoint-connector-v1-0.0.3.jar" com.google.enterprise.cloudsearch.sharepoint.SharePointIdentityConnector -Dconfig=sharepoint-online-identity-connector.config
Uruchom oprogramowanie sprzęgające usługi SharePoint Online:
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-0.0.3.jar -Dconfig=sharepoint-online-connector.config
Dokumentacja parametrów konfiguracji
Dostęp do źródła danych
Ustawienie | Parametr |
Identyfikator źródła danych | api.sourceId=1234567890abcdef
Wymagane. Identyfikator źródła danych Google Cloud Search skonfigurowany przez administratora Google Workspace. |
Ścieżka do pliku klucza prywatnego konta usługi | api.serviceAccountPrivateKeyFile=PrivateKey.json
Wymagane. Ścieżka do pliku klucza konta usługi Google Cloud Search. |
Dostęp do SharePoint Online
Ustawienie | Parametr |
Pełna i jednoznaczna nazwa domeny dla kolekcji witryn Dataplex | sharepoint.server= http://yoursharepoint.example.com/
Wymagane. Jeśli nazwa domeny nie jest w pełni kwalifikowana, ustaw zastąpienie DNS na hoście oprogramowania sprzęgającego. |
Tryb Tylko zbieranie witryn | sharepoint.siteCollectionOnly=true
Wymagane. W przypadku usługi SharePoint Online ustaw wartość |
Nazwa użytkownika SharePoint | sharepoint.username=username
Wymagane. Nazwa użytkownika konta używanego do uzyskiwania dostępu do usługi SharePoint Online. |
Hasło SharePoint | sharepoint.password=user_password
Wymagane. Hasło do konta używanego do korzystania z SharePoint Online. |
Tryb uwierzytelniania | sharepoint.formsAuthenticationMode=LIVE
Wymagane. W przypadku usługi SharePoint Online wartość to zawsze „LIVE”. |
Typ wdrożenia | sharepoint.deploymentType=ONLINE
Wymagane. W przypadku SharePoint Online wartość to zawsze „ONLINE”. |
Mapowanie tożsamości Dataplex
Ustawienie | Parametr |
Identyfikator źródła tożsamości | api.identitySourceId=1234567890abcdef
Wymagane. Identyfikator źródła tożsamości Cloud Search dla źródła tożsamości grup SharePoint. |
Referencyjne źródła tożsamości | api.referenceIdentitySources=defaultIdentitySource
Wymagane. W przypadku SharePoint Online wartością zawsze jest „defaultIdentitySource”. |
Identyfikatory źródeł tożsamości referencyjnych | api.referenceIdentitySource.defaultIdentitySource.id=112233abcd
Wymagane. Identyfikator źródła tożsamości Cloud Search dla źródła tożsamości użytkowników i grup Office 365. |
Generowanie treści HTML
Ustawienie | Parametr |
Pole tytułu szablonu HTML | contentTemplate.sharePointItem.title=Title
Pole SharePoint używane jako tytuł szablonu HTML dla wygenerowanego kodu HTML. |
Pola treści HTML wysokiej jakości | contentTemplate.sharePointItem.quality.high=highField1[,highField2,...]
Rozdzielona przecinkami lista pól, które mają zostać uwzględnione w wygenerowanym kodzie HTML jako pola wysokiej jakości. Gdy wyszukiwane hasła pasują do tych pól, wyniki mają wyższą pozycję w rankingu. |
Pola jakości medium wyszukiwania w treści HTML | contentTemplate.sharePointItem.quality.medium=mediumField1[,mediumField2,...]
Rozdzielona przecinkami lista pól, które mają zostać uwzględnione w wygenerowanym kodzie HTML jako pola o średniej jakości. |
Pola treści HTML niskiej jakości | contentTemplate.sharePointItem.quality.low=lowField1[,lowField2,...]
Rozdzielona przecinkami lista pól, które mają zostać uwzględnione w wygenerowanym kodzie HTML jako pola niskiej jakości. |
Kolumny niezmapowane treści HTML | contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Jak oprogramowanie sprzęgające obsługuje niezmapowane kolumny. Wartość to APPEND (domyślna) lub IGNORE.
|
Konfiguracja oprogramowania sprzęgającego tożsamości Office 365
Ustawienie | Parametr |
Identyfikator źródła tożsamości | api.identitySourceId=1234567890abcdef
Wymagane. Identyfikator źródła tożsamości Office 365. Ta wartość powinna pasować do wartości `api.referenceIdentitySource.defaultIdentitySource.id` w konfiguracji oprogramowania sprzęgającego SharePoint Online. |
Identyfikator klienta Google | api.customerId=c1b1d1e1
Wymagane. Identyfikator klienta Google Workspace Twojej organizacji. |
Identyfikator aplikacji Office 365 | o365.clientId=a63c6eb3-29e7-486
Wymagane. Identyfikator aplikacji z konfiguracji aplikacji Office 365. |
Najemca Office 365 | o365.tenant=185ef9ed-29e7-486
Wymagane. Najemca Twojego konta Office 365 (aplikacja Azure Activity Directory) |
Tajny klucz klienta Office 365 | o365.clientSecret=raHJN15vRLBKs
Wymagane. Obiekt tajny danych logowania z konfiguracji aplikacji Office 365 |