Możesz skonfigurować Google Cloud Search tak, aby oprócz treści Google Workspace zwracał wyniki z udziałów Microsoft Windows w organizacji. Używasz łącznika Cloud Search File Systems i konfigurujesz go tak, aby miał dostęp do określonych udziałów systemu Windows. Jedna instancja łącznika może obsługiwać wiele udziałów Microsoft Windows.
Istotne kwestie
Przed wdrożeniem złącza systemów plików zapoznaj się z poniższymi informacjami.
Ciągłe automatyczne aktualizacje
Domyślnie po uruchomieniu oprogramowanie sprzęgające stale monitoruje ścieżki początkowe (wartości z elementu
fs.src w pliku konfiguracyjnym). Gdy system plików zgłosi zmiany w treści lub kontroli dostępu, łącznik ponownie przeszuka system plików. Ponowne indeksowanie może być zasobochłonne. Aby wyłączyć monitorowanie, ustaw fs.monitorForUpdates na false. Zmniejsza to zużycie zasobów, ale opóźnia odzwierciedlanie zmian przez oprogramowanie sprzęgające. Więcej informacji
Kontrola dostępu DFS
System DFS stosuje kontrolę dostępu do swoich linków, a każdy link DFS ma zwykle własną listę ACL. DFS używa wyliczania na podstawie dostępu (ABE), aby ograniczyć liczbę linków zwracanych użytkownikowi. Gdy ABE izoluje katalogi domowe, użytkownicy mogą widzieć tylko podzbiór linków DFS lub tylko jeden link. Podczas przechodzenia przez system DFS łącznik uwzględnia listę kontroli dostępu do linku DFS i listę kontroli dostępu do udziału miejsca docelowego. Lista kontroli dostępu do udziału dziedziczy uprawnienia z listy kontroli dostępu DFS.
Znane ograniczenia
W tej sekcji znajdziesz listę znanych ograniczeń oprogramowania sprzęgającego systemu plików.
- System plików: oprogramowanie sprzęgające nie obsługuje zamapowanych ani lokalnych dysków.
- Rozproszony system plików: zmapowany dysk do UNC DFS nie działa prawidłowo, a niektóre listy ACL mogą nie być odczytywane poprawnie.
- Oprogramowanie sprzęgające obsługuje przestrzenie nazw i linki DFS, ale nie zwykłe foldery w przestrzeni nazw DFS.
- Linki do plików w
cloudsearch.google.comlub zwracane przez interfejs Query API nie są klikalne w większości przeglądarek.
Wymagania systemowe
Zanim wdrożysz łącznik systemów plików, upewnij się, że maszyna hosta spełnia te wymagania:
| Wymagania systemowe | |
|---|---|
| System operacyjny |
|
| Oprogramowanie |
|
| Protokoły systemu plików |
Nieobsługiwane: lokalne systemy plików Windows, NFS 2.0, NFS 3.0 ani lokalne systemy plików Linux. |
Wdróż oprogramowanie sprzęgające
Aby wdrożyć oprogramowanie sprzęgające Systemy plików, wykonaj te czynności.
Wymagania wstępne
Zanim wdrożysz łącznik, upewnij się, że w Twoim środowisku są te komponenty:
Informacje o Google Workspace potrzebne do nawiązania połączeń:
- Klucz prywatny Google Workspace (zawierający identyfikator konta usługi). Zobacz Konfigurowanie dostępu do interfejsu Cloud Search API.
- Identyfikator źródła danych Google Workspace. Patrz Dodawanie źródła danych do wyszukiwania.
- Identyfikator źródła tożsamości. Zobacz Tworzenie źródła tożsamości. Jeśli synchronizujesz dane z Active Directory, użyj GCDS.
Te dane logowania może zwykle podać administrator Google Workspace.
Sprawdź, czy konto Windows ma wystarczające uprawnienia.
Wymagane uprawnienia konta Microsoft Windows
Konto systemu Windows, na którym działa oprogramowanie sprzęgające, musi mieć uprawnienia do:
- Wyświetl zawartość folderu.
- Odczytywanie zawartości dokumentu.
- odczytywać atrybuty plików i folderów;
- uprawnienia do odczytu (listy ACL) plików i folderów;
- Zapisz atrybuty podstawowe.
Członkostwo w jednej z tych grup zwykle przyznaje wystarczające uprawnienia: Administratorzy, Zaawansowani użytkownicy, Operatorzy drukowania lub Operatorzy serwera.
Krok 1. Instalowanie oprogramowania sprzęgającego
Pobierz lub skopiuj repozytorium oprogramowania sprzęgającego z GitHuba, a następnie skompiluj pakiet oprogramowania sprzęgającego.
Pobierz repozytorium konektora z GitHuba i skompiluj je.
Aby używać Gita na serwerze z systemem Windows:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
Aby pobrać bezpośrednio:
- Otwórz stronę windows-filesystems-connector.
- Kliknij Sklonuj lub pobierz > Pobierz ZIP.
- Rozpakuj pakiet i przejdź do katalogu.
Utwórz oprogramowanie sprzęgające za pomocą Apache Maven:
Aby pominąć testy, użyj> mvn package
mvn package -DskipTests.Rozpakuj plik ZIP oprogramowania sprzęgającego w katalogu instalacyjnym:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Krok 2. Tworzenie pliku konfiguracji
Po zainstalowaniu oprogramowania sprzęgającego utwórz plik konfiguracyjny zawierający ustawienia oprogramowania sprzęgającego.
- W katalogu łącznika utwórz plik o nazwie
connector-config.properties. Dodaj parametry w postaci par klucz-wartość. Na przykład:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDParametry specyficzne dla systemu plików znajdziesz w dokumentacji parametrów konfiguracji. Listę typowych parametrów używanych przez wszystkie łączniki Cloud Search znajdziesz w artykule Parametry łączników dostarczane przez Google.
Krok 3. Włącz logowanie
Utwórz katalog na logi i plik konfiguracji logowania.
- W katalogu oprogramowania sprzęgającego utwórz folder o nazwie
logs. Utwórz plik o nazwie
logging.propertiesz tą treścią:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Krok 4. (Opcjonalnie) Konfigurowanie typów multimediów
Oprogramowanie sprzęgające próbuje wykryć typy multimediów plików za pomocą domyślnego mechanizmu, który w systemie Windows opiera się na wpisach w rejestrze. Jeśli brakuje wpisu w rejestrze dla rozszerzenia pliku, oprogramowanie sprzęgające może nie wykryć prawidłowo typu multimediów. Jeśli typy multimediów nie są wykrywane prawidłowo lub chcesz zastąpić domyślny typ rozszerzenia, wykonaj te czynności:
- W katalogu oprogramowania sprzęgającego utwórz plik o nazwie
mime-type.properties. - Wpisz rozszerzenia i typy w formacie
extension=media/type:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Krok 5. Uruchom oprogramowanie sprzęgające systemów plików
Uruchom oprogramowanie sprzęgające na komputerze hosta:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]Domyślnie oprogramowanie sprzęgające szuka pliku konfiguracji o nazwie connector-config.properties w katalogu, w którym jest uruchamiane.
Jeśli plik konfiguracyjny ma inną nazwę lub znajduje się w innym katalogu, użyj parametru -Dconfig, aby określić jego ścieżkę.
Informacje o parametrach konfiguracji
W tabelach poniżej znajdziesz listę parametrów używanych do konfigurowania złącza Systemy plików oraz ich opisy.
Dostęp do źródła danych
| Ustawienie | Parametr |
| Identyfikator źródła danych | api.sourceId=1234567890abcdef
Wymagane. Identyfikator źródła Cloud Search. |
| Konto usługi | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Wymagane. Ścieżka do pliku klucza konta usługi. |
| Identyfikator źródła tożsamości | api.identitySourceId=x0987654321
Wymagane. Identyfikator źródła tożsamości Cloud Search skonfigurowany przez administratora Google Workspace do synchronizowania tożsamości Active Directory za pomocą GCDS. |
Dostęp do systemu plików
Użyj tych parametrów, aby określić źródła systemu plików do indeksowania.
| Ustawienie | Parametr |
| Systemy plików źródłowych | fs.src=path1[,path2, ...]
Wymagane. Określ źródłowe systemy plików jako co najmniej 1 źródło UNC rozdzielone separatorem skonfigurowanym przez |
Znak separatora ścieżki
| Ustawienie | Parametr |
| Znak separatora ścieżki | fs.src.separator=separator-character
Domyślny separator to „;”. Jeśli ścieżki źródłowe zawierają średniki, możesz ustawić inny ogranicznik, np. przecinek („,”), który nie będzie powodował konfliktu ze znakami w ścieżkach i nie jest zarezerwowany przez samą składnię pliku właściwości. Jeśli wartość |
Działanie oprogramowania sprzęgającego
Użyj tych parametrów, aby dostosować sposób indeksowania systemów plików przez oprogramowanie sprzęgające.
| Ustawienie | Parametr |
| domena Windows, | fs.supportedDomain=domain
Wymagane, aby umożliwić użytkownikom skonfigurowanym za pomocą GCDS dostęp do dokumentów za pomocą Cloud Search. Podaj pojedynczą nazwę NetBIOS domeny Active Directory. |
| Uwzględnianie kont na listach ACL | fs.supportedAccounts=account-1[, account-2,...]
Lista kont rozdzielonych przecinkami, które mają być uwzględnione na listach kontroli dostępu, niezależnie od tego, czy są to konta wbudowane. Wartością domyślną jest |
| Wykluczanie wbudowanych kont z list kontroli dostępu | fs.builtinGroupPrefix=prefix
Określ prefiks wbudowanych kont. Konto, które zaczyna się od tego prefiksu, jest uważane za konto wbudowane i zostanie wykluczone z list kontroli dostępu. Wartością domyślną jest |
| Zezwalaj na indeksowanie ukrytych plików i folderów | fs.crawlHiddenFiles=boolean
Ustaw wartość |
| Zezwalaj na indeksowanie list folderów poddanych indeksowaniu i wyliczeń przestrzeni nazw DFS | fs.indexFolders=boolean
Gdy ta opcja jest ustawiona na |
| Włącz monitorowanie zmian w systemie plików | fs.monitorForUpdates=boolean
Jeśli ta opcja jest ustawiona na |
| Ustawianie maksymalnego rozmiaru pamięci podręcznej katalogów | fs.directoryCacheSize=number-of-entries
Maksymalny rozmiar pamięci podręcznej katalogu. Oprogramowanie sprzęgające używa pamięci podręcznej do identyfikowania ukrytych folderów, aby uniknąć indeksowania plików i folderów w ukrytych folderach. Domyślna wartość to 50 000 pozycji, które zwykle zajmują 10–15 MB pamięci RAM. |
Zachowywanie sygnatury czasowej
Użyj tych parametrów, aby określić, jak oprogramowanie sprzęgające ma obsługiwać zachowywanie sygnatur czasowych.
| Ustawienie | Parametr |
| Zachowaj czas dostępu | fs.preserveLastAccessTime=value
Podczas indeksowania plików i folderów łącznik może zmienić sygnaturę czasową ostatniego dostępu na czas indeksowania. Jeśli czasy ostatniego dostępu nie są zachowywane, systemy tworzenia kopii zapasowych i archiwizacji mogą nie przenosić odpowiednich plików i folderów do pamięci dodatkowej, ponieważ łącznik uzyskał do nich dostęp. Domyślnie parametr Możliwe wartości:
|
| Indeksowanie tylko plików, do których uzyskano dostęp po określonej dacie | fs.lastAccessedDate=YYYY-MM-DD
Indeksowanie treści tylko wtedy, gdy czas ostatniego dostępu jest późniejszy niż podana data (RRRR-MM-DD, format ISO8601).
Wartość domyślna to |
| Indeksowanie tylko plików, do których uzyskano dostęp w ciągu ostatnich X dni | fs.lastAccessedDays=number-of-days
Indeksowanie treści tylko wtedy, gdy czas ostatniego dostępu przypada w okresie określonej liczby dni od dnia bieżącego. Wartość domyślna to |
| Indeksowanie tylko plików zmodyfikowanych po określonej dacie | fs.lastModifiedDate=YYYY-MM-DD
Indeksowanie treści tylko wtedy, gdy czas ostatniej modyfikacji jest późniejszy niż podana data (RRRR-MM-DD, format ISO8601).
Wartość domyślna to |
| Indeksowanie tylko plików zmodyfikowanych w ciągu ostatnich X dni | fs.lastModifiedDays=number-of-days
Indeksowanie treści tylko wtedy, gdy czas ostatniej modyfikacji mieści się w określonej liczbie dni od dnia dzisiejszego. Wartość domyślna to |
Pomiń listy ACL udziału plików
Możesz skonfigurować oprogramowanie sprzęgające tak, aby ignorowało listy ACL udostępniania, jeśli nie ma uprawnień do ich odczytywania. Treści są następnie zwracane z uprawnieniami dostępu do listy ACL z uprawnieniami do udostępniania.
| Ustawienie | Parametr |
| Pomiń listy ACL udostępniania | fs.skipShareAccessControl=boolean
Ustaw wartość |