Możesz skonfigurować usługę Google Cloud Search tak, aby zwracała wyniki z Microsoft Windows udostępnia treści wraz z treściami z Google Workspace. Ty użyć oprogramowania sprzęgającego Google Cloud Search File Systems i skonfigurować je, aby uzyskać dostęp do określonych udziałów systemu Windows. Pojedyncza instancja oprogramowania sprzęgającego może obsługiwać wiele Udostępnienia systemu Microsoft Windows.
Ważne informacje
Ciągłe automatyczne aktualizacje
Domyślnie oprogramowanie sprzęgające stale monitoruje ścieżki początkowe (wartości z pliku fs.src
w pliku konfiguracji oprogramowania sprzęgającego) podczas uruchamiania oprogramowania sprzęgającego. Gdy system plików zgłosi zmiany w treści lub kontroli dostępu, oprogramowanie sprzęgające uruchamia się, aby ponownie zindeksować system plików. To ponowne indeksowanie może pochłaniać dużo zasobów. Aby wyłączyć monitorowanie systemu plików, ustaw fs.monitorForUpdates
na false
. Znacznie zmniejszasz wykorzystanie zasobów oprogramowania sprzęgającego, ale opóźniasz wprowadzenie tych zmian w oprogramowaniu sprzęgającym. Więcej informacji
Kontrola dostępu do DFS
System DFS stosuje kontrolę dostępu do swoich połączeń, a zwykle każde z nich ma własną listę kontroli dostępu. Jednym z mechanizmów używanych w DFS jest wyliczenie oparte na dostępie (ABE), które może ograniczyć linki do DFS zwracane użytkownikowi. Jeśli ABE wyodrębnia hostowane katalogi główne, użytkownicy mogą otrzymywać tylko podzbiór linków DFS, a nawet tylko 1 link. Gdy oprogramowanie sprzęgające przemierza system DFS, oprogramowanie sprzęgające respektuje listę kontroli dostępu DFS i docelowej listy kontroli dostępu (ACL), a lista ACL udziału dziedziczy z listy kontroli dostępu DFS.
Znane ograniczenia
- System plików: oprogramowanie sprzęgające systemu plików nie obsługuje dysków zmapowanych ani dysków lokalnych.
- Rozproszony system plików: zmapowany dysk na DFS w UNC nie działa prawidłowo. Niektóre listy ACL nie są poprawnie odczytywane.
- Oprogramowanie sprzęgające systemów plików obsługuje przestrzenie nazw i linki rozproszonego systemu plików (DFS). Oprogramowanie sprzęgające obsługuje jednak linki DFS tylko w przestrzeni nazw DFS, a nie w zwykłych folderach w przestrzeni nazw DFS.
- Linków do plików zwróconych na cloudsearch.google.com nie można kliknąć. W większości przeglądarek nie można też kliknąć linków do plików zwracanych przez interfejs Query API.
Wymagania systemowe
Wymagania systemowe | |
---|---|
System operacyjny |
|
Oprogramowanie |
|
Protokoły systemu plików |
Nieobsługiwane: lokalne systemy plików Windows, NFS 2.0, Sun Network File System (NFS) 3.0 lub lokalny system plików Linux. |
Wdrażanie oprogramowania sprzęgającego
Wymagania wstępne
Zanim wdrożysz oprogramowanie sprzęgające Cloud Search File Systems, sprawdź, czy ma wszystkie te elementy wstępne:
Informacje z Google Workspace wymagane do nawiązania relacji między Google Cloud Search a źródłem danych:
- Klucz prywatny Google Workspace (zawierający identyfikator konta usługi). Dla: na temat uzyskiwania klucza prywatnego, przejdź do sekcji Skonfiguruj dostęp do interfejsu Google Cloud Search REST API.
- Identyfikator źródła danych Google Workspace. Aby dowiedzieć się, jak uzyskać identyfikator źródła danych, Idź do Dodaj źródło danych do wyszukiwania.
- Identyfikator źródła tożsamości. Aby uzyskać informacje o uzyskiwaniu źródła tożsamości ID, przejdź do Utwórz źródło tożsamości. Jeśli synchronizujesz katalog Google Workspace z Active Directory, skonfiguruj źródło tożsamości przy użyciu GCDS.
Zwykle te dane może uzyskać administrator Google Workspace w Twojej organizacji.
Upewnij się, że konto Windows ma wystarczające uprawnienia. Więcej informacji znajdziesz w w następnej sekcji.
Wymagane uprawnienia konta Microsoft Windows
Konto Microsoft Windows, na którym działa oprogramowanie sprzęgające, musi mieć wystarczających uprawnień do wykonania następujących działań:
- Wyświetlanie zawartości folderów
- Odczytywanie treści dokumentów
- Odczytywanie atrybutów plików i folderów
- Uprawnienia do odczytu (listy kontroli dostępu) zarówno do plików, jak i folderów
- Uprawnienia do zapisu podstawowych atrybutów
Przynależność do jednej z tych grup zapewnia kontu Windows wystarczające uprawnienia wymagane przez oprogramowanie sprzęgające:
- Administratorzy
- Doświadczeni użytkownicy
- Operatory drukowania
- Operatorzy serwera
Krok 1. Zainstaluj oprogramowanie sprzęgające systemów plików Google Cloud Search
Pobierz repozytorium oprogramowania sprzęgającego z GitHuba i skompiluj je.
Aby użyć git na serwerze z systemem Windows:
Sklonuj repozytorium:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Sprawdź odpowiednią wersję oprogramowania sprzęgającego:
> git checkout tags/v1-0.0.3
Aby pobrać bezpośrednio z GitHuba:
- Wejdź na https://github.com/google-cloudsearch/windows-filesystems-connector.
- Kliknij Sklonuj lub pobierz Pobierz plik ZIP.
- Rozpakuj pakiet.
- Przejdź do nowego katalogu:
> cd windows-filesystems-connector
Utwórz oprogramowanie sprzęgające. W razie potrzeby zainstaluj Apache Maven.
> mvn package
Aby pominąć testy podczas tworzenia oprogramowania sprzęgającego, uruchom
mvn package -DskipTests
zamiastmvn package
.Skopiuj plik ZIP oprogramowania sprzęgającego do lokalnego katalogu instalacji:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Krok 2. Tworzenie pliku konfiguracji oprogramowania sprzęgającego
W tym samym katalogu, w którym znajduje się instalacja oprogramowania sprzęgającego, utwórz plik i nazwij go
connector-config.properties
.Dodaj parametry jako pary klucz/wartość do zawartości pliku, jak w tym przykładzie:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Szczegółowe opisy poszczególnych parametrów znajdziesz w dokumentacji parametrów konfiguracji.
(Opcjonalnie) W razie potrzeby skonfiguruj inne parametry oprogramowania sprzęgającego. Więcej informacji: Parametry oprogramowania sprzęgającego udostępnione przez Google.
Krok 3. Włącz logowanie
- Utwórz folder o nazwie
logs
w katalogu zawierającym oprogramowanie sprzęgające binarny. Utwórz plik ASCII lub UTF-8 o nazwie
logging.properties
w który zawiera plik binarny oprogramowania sprzęgającego i dodaj następującą treść:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Krok 4. (Opcjonalnie) Konfigurowanie typów multimediów
Domyślnie oprogramowanie sprzęgające próbuje wykryć typ multimediów w każdym pliku Udostępnione przez JDK wykrywanie typów multimediów. W systemie Microsoft Windows pakiet JDK korzysta z rejestru w systemie Windows, określania typów multimediów dla plików. Brak wpisu w rejestrze może spowodować wartość null i typu multimediów w przypadku określonych plików.
W razie potrzeby możesz określić typ mediów, który zastąpi istniejące powiązania lub uniemożliwia użycie typu mediów o wartości null.
- W katalogu oprogramowania sprzęgającego utwórz plik o nazwie
mime-type.properties
zaszyfrowany za pomocą algorytmu Latin-1. Wpisz rozszerzenia plików i odpowiadające im typy multimediów, jak w tych przykładach:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Krok 5. Uruchom oprogramowanie sprzęgające systemów plików
Po zainstalowaniu i skonfigurowaniu oprogramowania sprzęgającego systemów plików, aby je uruchomić na na hoście, uruchom polecenie podobne do tego przykładu:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Podaj ścieżkę pliku konfiguracji, jeśli jest inna niż domyślna (znajduje się w tym samym katalogu co plik binarny o nazwie connector-config.properties
).
Dokumentacja parametrów konfiguracji
Dostęp do źródła danych
Ustawienie | Parametr |
Identyfikator źródła danych | api.sourceId=1234567890abcdef
Wymagane. Identyfikator źródła Google Cloud Search skonfigurowany przez administratora Google Workspace. |
Ścieżka do pliku klucza prywatnego konta usługi | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Wymagane. Plik klucza konta usługi Google Cloud Search na potrzeby ułatwień dostępu w oprogramowaniu sprzęgającym Google Cloud Search File Systems. |
Identyfikator źródła tożsamości | api.identitySourceId=x0987654321
Wymagane. Identyfikator źródła tożsamości Cloud Search skonfigurowany przez administratora Google Workspace na potrzeby synchronizowania tożsamości Active Directory przy użyciu GCDS. |
Dostęp do systemu plików
Ustawienie | Parametr |
Źródłowe systemy plików | fs.src=path1[,path2, ...]
Wymagane. Określ źródłowe systemy plików jako co najmniej 1 źródło UNC rozdzielone separatorem skonfigurowanym przez funkcję |
Znak separatora ścieżki
Ustawienie | Parametr |
Znak separatora ścieżki | fs.src.separator=separator-character
Domyślny separator to „;”. Jeśli ścieżki źródłowe zawierają średniki, możesz ustawić inny separator, np. przecinek („,”), który nie będzie kolidował ze znakami w ścieżkach i nie będzie zarezerwowany przez składnię pliku właściwości. Jeśli wartość |
Działanie oprogramowania sprzęgającego
Ustawienie | Parametr |
Domena Windows | fs.supportedDomain=domain
Wymagane, aby umożliwić użytkownikom ze skonfigurowanym GCDS dostęp do dokumentów za pomocą Cloud Search. Podaj jedną nazwę domeny NetBIOS Active Directory. |
Uwzględnij konta w ACLS | fs.supportedAccounts=account-1[, account-2,...]
Rozdzielona przecinkami lista kont, które mają zostać uwzględnione na listach kontroli dostępu (ACL), niezależnie od tego, czy są to konta wbudowane. Wartość domyślna to |
Wyklucz wbudowane konta z list kontroli dostępu | fs.builtinGroupPrefix=prefix
Określ przedrostek kont wbudowanych. Konto rozpoczynające się od tego prefiksu jest uznawane za konto wbudowane i zostanie wykluczone z list kontroli dostępu. Wartość domyślna to |
Zezwalaj na indeksowanie ukrytych plików i folderów | fs.crawlHiddenFiles=boolean
Ustaw na |
Zezwalaj na indeksowanie zindeksowanych list folderów i wyliczeń przestrzeni nazw DFS | fs.indexFolders=boolean
Jeśli ustawisz wartość |
Włącz monitorowanie zmian w systemie plików | fs.monitorForUpdates=boolean
Jeśli zasada ma wartość |
Ustaw maksymalny rozmiar pamięci podręcznej katalogów | fs.directoryCacheSize=number-of-entries
Maksymalny rozmiar pamięci podręcznej katalogu. Oprogramowanie sprzęgające korzysta z pamięci podręcznej do identyfikowania ukrytych folderów w celu uniknięcia indeksowania plików i folderów w ukrytych folderach. Wartość domyślna to 50 tys. wpisów, co zwykle zużywa 10–15 MB pamięci RAM. |
Zachowanie sygnatury czasowej i kontrola indeksowania
Ustawienie | Parametr |
Zachowaj sygnaturę czasową ostatniego dostępu | fs.preserveLastAccessTime=value
Gdy oprogramowanie sprzęgające indeksuje pliki i foldery, może zmienić sygnaturę czasową ostatniego dostępu do plików i folderów na czas indeksowania. Jeśli czas ostatniego dostępu nie zostanie zachowany, systemy kopii zapasowych i archiwizowania mogą nie przenieść odpowiednich plików i folderów do pamięci dodatkowej z powodu wizyty oprogramowania sprzęgającego. Domyślnie oprogramowanie sprzęgające próbuje zachować czas ostatniego dostępu (wartość Możliwe wartości:
|
Indeksuj tylko te pliki, do których uzyskano dostęp po określonej dacie | fs.lastAccessedDate=YYYY-MM-DD
Indeksuj treść tylko wtedy, gdy czas ostatniego dostępu jest późniejszy niż określona data. Wartością domyślną jest Podaj datę w formacie ISO8601: RRRR-MM-DD. Jeśli na przykład wartością jest 2010-01-01, oprogramowanie sprzęgające będzie indeksować tylko treści, do których uzyskano dostęp później niż na początku 2010 roku. Jeśli podasz wartość |
Indeksuj tylko te pliki, do których uzyskano dostęp w ciągu ostatnich dni | fs.lastAccessedDays=number-of-days
Indeksuj treść tylko wtedy, gdy czas ostatniego dostępu przypada w ciągu ostatnich dni. Wartością domyślną jest Używaj tej usługi, aby wygasać wcześniej zindeksowane treści, z których od jakiegoś czasu nie było korzystać. Na przykład ustaw wartość 365, aby indeksować tylko te treści, które były otwierane w ciągu ostatniego roku. Jeśli podasz wartość |
Indeksuj tylko pliki zmodyfikowane po określonej dacie | fs.lastModifiedDate=YYYY-MM-DD
Indeksuj treść tylko wtedy, gdy czas ostatniej modyfikacji jest późniejszy niż określona data. Wartością domyślną jest Podaj datę w formacie ISO8601: RRRR-MM-DD. Jeśli na przykład wartością jest 2010-01-01, oprogramowanie sprzęgające będzie indeksować tylko treści zmodyfikowane później. Jeśli podasz wartość |
Indeksuj tylko pliki zmodyfikowane w ciągu ostatniej liczby dni | fs.lastModifiedDays=number-of-days
Indeksuj treść tylko wtedy, gdy czas ostatniej modyfikacji przypada w ciągu ostatnich dni. Wartością domyślną jest Używaj tej właściwości, aby wygasać wcześniej zindeksowane treści, które nie były od jakiegoś czasu modyfikowane. Na przykład ustaw wartość 365, aby indeksować tylko te treści, które zostały zmodyfikowane w ciągu ostatniego roku. Jeśli podasz wartość |
Pomiń kontrolę dostępu do udziału plików
Domyślnie oprogramowanie sprzęgające zachowuje integralność kontroli dostępu, gdy wysyła listy kontroli dostępu (ACL) do interfejsu API indeksowania, w tym listy kontroli dostępu w udziale plików. Jednak w niektórych konfiguracjach oprogramowanie sprzęgające może nie mieć wystarczających uprawnień do odczytu udostępnianej listy kontroli dostępu (ACL). W takich przypadkach oprogramowanie sprzęgające nie zwraca w wynikach wyszukiwania żadnych plików przechowywanych w tym udziale.
Możesz skonfigurować oprogramowanie sprzęgające tak, aby ignorowało współdzieloną listę kontroli dostępu (ACL), dzięki czemu treści będą zawsze zwracane w wynikach wyszukiwania. W takim przypadku interfejs API indeksowania otrzymuje całkowicie mniej rygorystyczną listę kontroli dostępu (ACL), a nie faktyczną listę kontroli dostępu (ACL).
Ustawienie | Parametr |
Pomiń kontrolę dostępu do udziału plików | fs.skipShareAccessControl=boolean
Ustaw wartość |