Wdrażanie oprogramowania sprzęgającego systemu plików Microsoft Windows

Możesz skonfigurować Google Cloud Search tak, aby oprócz treści Google Workspace zwracał wyniki z udziałów Microsoft Windows w organizacji. Używasz łącznika Cloud Search File Systems i konfigurujesz go tak, aby miał dostęp do określonych udziałów systemu Windows. Jedna instancja łącznika może obsługiwać wiele udziałów Microsoft Windows.

Istotne kwestie

Przed wdrożeniem złącza systemów plików zapoznaj się z poniższymi informacjami.

Ciągłe automatyczne aktualizacje

Domyślnie po uruchomieniu oprogramowanie sprzęgające stale monitoruje ścieżki początkowe (wartości z elementu fs.src w pliku konfiguracyjnym). Gdy system plików zgłosi zmiany w treści lub kontroli dostępu, łącznik ponownie przeszuka system plików. Ponowne indeksowanie może być zasobochłonne. Aby wyłączyć monitorowanie, ustaw fs.monitorForUpdates na false. Zmniejsza to zużycie zasobów, ale opóźnia odzwierciedlanie zmian przez oprogramowanie sprzęgające. Więcej informacji

Kontrola dostępu DFS

System DFS stosuje kontrolę dostępu do swoich linków, a każdy link DFS ma zwykle własną listę ACL. DFS używa wyliczania na podstawie dostępu (ABE), aby ograniczyć liczbę linków zwracanych użytkownikowi. Gdy ABE izoluje katalogi domowe, użytkownicy mogą widzieć tylko podzbiór linków DFS lub tylko jeden link. Podczas przechodzenia przez system DFS łącznik uwzględnia listę kontroli dostępu do linku DFS i listę kontroli dostępu do udziału miejsca docelowego. Lista kontroli dostępu do udziału dziedziczy uprawnienia z listy kontroli dostępu DFS.

Znane ograniczenia

W tej sekcji znajdziesz listę znanych ograniczeń oprogramowania sprzęgającego systemu plików.

  • System plików: oprogramowanie sprzęgające nie obsługuje zamapowanych ani lokalnych dysków.
  • Rozproszony system plików: zmapowany dysk do UNC DFS nie działa prawidłowo, a niektóre listy ACL mogą nie być odczytywane poprawnie.
  • Oprogramowanie sprzęgające obsługuje przestrzenie nazw i linki DFS, ale nie zwykłe foldery w przestrzeni nazw DFS.
  • Linki do plików w cloudsearch.google.com lub zwracane przez interfejs Query API nie są klikalne w większości przeglądarek.

Wymagania systemowe

Zanim wdrożysz łącznik systemów plików, upewnij się, że maszyna hosta spełnia te wymagania:

Wymagania systemowe
System operacyjny
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Oprogramowanie
  • Java JRE 1.8 zainstalowana na komputerze, na którym działa oprogramowanie sprzęgające
Protokoły systemu plików
  • Server Message Block (SMB) – SMB1
  • Server Message Block (SMB) - SMB2
  • Rozproszony system plików (DFS)

Nieobsługiwane: lokalne systemy plików Windows, NFS 2.0, NFS 3.0 ani lokalne systemy plików Linux.

Wdróż oprogramowanie sprzęgające

Aby wdrożyć oprogramowanie sprzęgające Systemy plików, wykonaj te czynności.

Wymagania wstępne

Zanim wdrożysz łącznik, upewnij się, że w Twoim środowisku są te komponenty:

Wymagane uprawnienia konta Microsoft Windows

Konto systemu Windows, na którym działa oprogramowanie sprzęgające, musi mieć uprawnienia do:

  • Wyświetl zawartość folderu.
  • Odczytywanie zawartości dokumentu.
  • odczytywać atrybuty plików i folderów;
  • uprawnienia do odczytu (listy ACL) plików i folderów;
  • Zapisz atrybuty podstawowe.

Członkostwo w jednej z tych grup zwykle przyznaje wystarczające uprawnienia: Administratorzy, Zaawansowani użytkownicy, Operatorzy drukowania lub Operatorzy serwera.

Krok 1. Instalowanie oprogramowania sprzęgającego

Pobierz lub skopiuj repozytorium oprogramowania sprzęgającego z GitHuba, a następnie skompiluj pakiet oprogramowania sprzęgającego.

  1. Pobierz repozytorium konektora z GitHuba i skompiluj je.

    Aby używać Gita na serwerze z systemem Windows:

    > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
    > cd windows-filesystems-connector
    > git checkout tags/v1-0.0.3

    Aby pobrać bezpośrednio:

    1. Otwórz stronę windows-filesystems-connector.
    2. Kliknij Sklonuj lub pobierz > Pobierz ZIP.
    3. Rozpakuj pakiet i przejdź do katalogu.
  2. Utwórz oprogramowanie sprzęgające za pomocą Apache Maven:

    > mvn package
    Aby pominąć testy, użyj mvn package -DskipTests.

  3. Rozpakuj plik ZIP oprogramowania sprzęgającego w katalogu instalacyjnym:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

Krok 2. Tworzenie pliku konfiguracji

Po zainstalowaniu oprogramowania sprzęgającego utwórz plik konfiguracyjny zawierający ustawienia oprogramowania sprzęgającego.

  1. W katalogu łącznika utwórz plik o nazwie connector-config.properties.
  2. Dodaj parametry w postaci par klucz-wartość. Na przykład:

    # Required parameters
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # File system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace
    
    # Optional parameters
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Parametry specyficzne dla systemu plików znajdziesz w dokumentacji parametrów konfiguracji. Listę typowych parametrów używanych przez wszystkie łączniki Cloud Search znajdziesz w artykule Parametry łączników dostarczane przez Google.

Krok 3. Włącz logowanie

Utwórz katalog na logi i plik konfiguracji logowania.

  1. W katalogu oprogramowania sprzęgającego utwórz folder o nazwie logs.
  2. Utwórz plik o nazwie logging.properties z tą treścią:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

Krok 4. (Opcjonalnie) Konfigurowanie typów multimediów

Oprogramowanie sprzęgające próbuje wykryć typy multimediów plików za pomocą domyślnego mechanizmu, który w systemie Windows opiera się na wpisach w rejestrze. Jeśli brakuje wpisu w rejestrze dla rozszerzenia pliku, oprogramowanie sprzęgające może nie wykryć prawidłowo typu multimediów. Jeśli typy multimediów nie są wykrywane prawidłowo lub chcesz zastąpić domyślny typ rozszerzenia, wykonaj te czynności:

  1. W katalogu oprogramowania sprzęgającego utwórz plik o nazwie mime-type.properties.
  2. Wpisz rozszerzenia i typy w formacie extension=media/type:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf

Krok 5. Uruchom oprogramowanie sprzęgające systemów plików

Uruchom oprogramowanie sprzęgające na komputerze hosta:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Domyślnie oprogramowanie sprzęgające szuka pliku konfiguracji o nazwie connector-config.properties w katalogu, w którym jest uruchamiane. Jeśli plik konfiguracyjny ma inną nazwę lub znajduje się w innym katalogu, użyj parametru -Dconfig, aby określić jego ścieżkę.

Informacje o parametrach konfiguracji

W tabelach poniżej znajdziesz listę parametrów używanych do konfigurowania złącza Systemy plików oraz ich opisy.

Dostęp do źródła danych

Ustawienie Parametr
Identyfikator źródła danych api.sourceId=1234567890abcdef

Wymagane. Identyfikator źródła Cloud Search.

Konto usługi api.serviceAccountPrivateKeyFile=./PrivateKey.json

Wymagane. Ścieżka do pliku klucza konta usługi.

Identyfikator źródła tożsamości api.identitySourceId=x0987654321

Wymagane. Identyfikator źródła tożsamości Cloud Search skonfigurowany przez administratora Google Workspace do synchronizowania tożsamości Active Directory za pomocą GCDS.

Dostęp do systemu plików

Użyj tych parametrów, aby określić źródła systemu plików do indeksowania.

Ustawienie Parametr
Systemy plików źródłowych fs.src=path1[,path2, ...]

Wymagane. Określ źródłowe systemy plików jako co najmniej 1 źródło UNC rozdzielone separatorem skonfigurowanym przez fs.src.separator. Jeśli używasz znaków spoza zestawu Latin1, zakoduj je za pomocą znaków ucieczki Unicode w języku Java.

Znak separatora ścieżki

Ustawienie Parametr
Znak separatora ścieżki fs.src.separator=separator-character

Domyślny separator to „;”. Jeśli ścieżki źródłowe zawierają średniki, możesz ustawić inny ogranicznik, np. przecinek („,”), który nie będzie powodował konfliktu ze znakami w ścieżkach i nie jest zarezerwowany przez samą składnię pliku właściwości.

Jeśli wartość fs.src.separator jest pustym ciągiem znaków, wartość fs.src jest traktowana jako pojedyncza ścieżka.

Działanie oprogramowania sprzęgającego

Użyj tych parametrów, aby dostosować sposób indeksowania systemów plików przez oprogramowanie sprzęgające.

Ustawienie Parametr
domena Windows, fs.supportedDomain=domain

Wymagane, aby umożliwić użytkownikom skonfigurowanym za pomocą GCDS dostęp do dokumentów za pomocą Cloud Search. Podaj pojedynczą nazwę NetBIOS domeny Active Directory.

Uwzględnianie kont na listach ACL fs.supportedAccounts=account-1[, account-2,...]

Lista kont rozdzielonych przecinkami, które mają być uwzględnione na listach kontroli dostępu, niezależnie od tego, czy są to konta wbudowane.

Wartością domyślną jest BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users.

Wykluczanie wbudowanych kont z list kontroli dostępu fs.builtinGroupPrefix=prefix

Określ prefiks wbudowanych kont. Konto, które zaczyna się od tego prefiksu, jest uważane za konto wbudowane i zostanie wykluczone z list kontroli dostępu.

Wartością domyślną jest BUILTIN\\.

Zezwalaj na indeksowanie ukrytych plików i folderów fs.crawlHiddenFiles=boolean

Ustaw wartość true, aby indeksować ukryte pliki. Wartość domyślna to false.

Zezwalaj na indeksowanie list folderów poddanych indeksowaniu i wyliczeń przestrzeni nazw DFS fs.indexFolders=boolean

Gdy ta opcja jest ustawiona na true (domyślnie), oprogramowanie sprzęgające podczas indeksowania folderu tworzy obiekt CONTAINER_ITEM. Jeśli ta wartość jest ustawiona na false, oprogramowanie sprzęgające tworzy obiekt VIRTUAL_CONTAINER_ITEM.

Włącz monitorowanie zmian w systemie plików fs.monitorForUpdates=boolean

Jeśli ta opcja jest ustawiona na true (domyślnie), łącznik automatycznie ponownie indeksuje treści po wprowadzeniu zmian w treści lub kontroli dostępu. Ustawienie tej opcji na false zmniejsza zużycie zasobów, ale opóźnia odzwierciedlanie zmian w wynikach wyszukiwania.

Ustawianie maksymalnego rozmiaru pamięci podręcznej katalogów fs.directoryCacheSize=number-of-entries

Maksymalny rozmiar pamięci podręcznej katalogu. Oprogramowanie sprzęgające używa pamięci podręcznej do identyfikowania ukrytych folderów, aby uniknąć indeksowania plików i folderów w ukrytych folderach.

Domyślna wartość to 50 000 pozycji, które zwykle zajmują 10–15 MB pamięci RAM.

Zachowywanie sygnatury czasowej

Użyj tych parametrów, aby określić, jak oprogramowanie sprzęgające ma obsługiwać zachowywanie sygnatur czasowych.

Ustawienie Parametr
Zachowaj czas dostępu fs.preserveLastAccessTime=value

Podczas indeksowania plików i folderów łącznik może zmienić sygnaturę czasową ostatniego dostępu na czas indeksowania. Jeśli czasy ostatniego dostępu nie są zachowywane, systemy tworzenia kopii zapasowych i archiwizacji mogą nie przenosić odpowiednich plików i folderów do pamięci dodatkowej, ponieważ łącznik uzyskał do nich dostęp.

Domyślnie parametr fs.preserveLastAccessTime ma wartość ALWAYS, co oznacza, że łącznik próbuje zachować ostatni czas dostępu. Jeśli konto użytkownika, na którym działa łącznik, nie ma uprawnień do zapisywania atrybutów plików, łącznik nie może przywrócić czasu ostatniego dostępu. Jeśli ta opcja jest ustawiona na ALWAYS, a oprogramowanie sprzęgające nie może zachować czasu ostatniego dostępu, odrzuca ono żądania indeksowania systemu plików, aby nie zmieniać sygnatur czasowych plików.

Możliwe wartości:

  • ALWAYS: podczas indeksowania plików i folderów łącznik próbuje zachować ostatni czas dostępu. Jeśli nie może zachować czasu ostatniego dostępu, odrzuca wszystkie kolejne prośby o zindeksowanie systemu plików, aby zapobiec zmianie sygnatur czasowych.
  • IF_ALLOWED: podczas indeksowania plików i folderów łącznik próbuje zachować czas ostatniego dostępu. Nadal indeksuje, nawet jeśli niektóre sygnatury czasowe mogą nie zostać zachowane.
  • NEVER: złącze nie próbuje zachować czasu ostatniego dostępu.
Indeksowanie tylko plików, do których uzyskano dostęp po określonej dacie fs.lastAccessedDate=YYYY-MM-DD

Indeksowanie treści tylko wtedy, gdy czas ostatniego dostępu jest późniejszy niż podana data (RRRR-MM-DD, format ISO8601). Wartość domyślna to disabled. Na przykład 2010-01-01 indeksuje treści dostępne po początku 2010 roku. Nie można używać z usługą fs.lastAccessedDays.

Indeksowanie tylko plików, do których uzyskano dostęp w ciągu ostatnich X dni fs.lastAccessedDays=number-of-days

Indeksowanie treści tylko wtedy, gdy czas ostatniego dostępu przypada w okresie określonej liczby dni od dnia bieżącego. Wartość domyślna to disabled. Przydatne w przypadku treści, które tracą ważność, np. 365 indeksuje treści, do których uzyskano dostęp w ostatnim roku. Nie można używać z fs.lastAccessedDate.

Indeksowanie tylko plików zmodyfikowanych po określonej dacie fs.lastModifiedDate=YYYY-MM-DD

Indeksowanie treści tylko wtedy, gdy czas ostatniej modyfikacji jest późniejszy niż podana data (RRRR-MM-DD, format ISO8601). Wartość domyślna to disabled. Na przykład 2010-01-01 indeksuje treści zmodyfikowane po początku 2010 roku. Nie można używać z usługą fs.lastModifiedDays.

Indeksowanie tylko plików zmodyfikowanych w ciągu ostatnich X dni fs.lastModifiedDays=number-of-days

Indeksowanie treści tylko wtedy, gdy czas ostatniej modyfikacji mieści się w określonej liczbie dni od dnia dzisiejszego. Wartość domyślna to disabled. Przydatne w przypadku usuwania starych treści, np. 365 indeksuje treści zmodyfikowane w ostatnim roku. Nie można używać z usługą fs.lastModifiedDate.

Pomiń listy ACL udziału plików

Możesz skonfigurować oprogramowanie sprzęgające tak, aby ignorowało listy ACL udostępniania, jeśli nie ma uprawnień do ich odczytywania. Treści są następnie zwracane z uprawnieniami dostępu do listy ACL z uprawnieniami do udostępniania.

Ustawienie Parametr
Pomiń listy ACL udostępniania fs.skipShareAccessControl=boolean

Ustaw wartość true, aby ignorować listy kontroli dostępu do udostępniania. Wartość domyślna to false.