Microsoft Windows Dosya Sistemleri bağlayıcısını dağıtma

Google Cloud Search'i, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından da sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanır ve belirtilen Windows paylaşımlarına erişecek şekilde yapılandırırsınız. Tek bir bağlayıcı örneği birden fazla Microsoft Windows paylaşımını destekleyebilir.

Dikkat edilmesi gerekenler

Sürekli otomatik güncellemeler

Varsayılan olarak, bağlayıcı başlatılırken başlangıç yollarını (bağlayıcı yapılandırma dosyasında fs.src içindeki değerler) sürekli olarak izler. Dosya sistemi, içerik veya erişim denetimlerinde değişiklik olduğunu bildirdiğinde bağlayıcı, dosya sistemini yeniden taraması için tetiklenir. Bu yeniden tarama, kaynakların yoğun bir şekilde kullanılmasına yol açabilir. Dosya sistemi izlemeyi devre dışı bırakmak için fs.monitorForUpdatesfalse olarak ayarlayın. Konnektörün kaynak kullanımını önemli ölçüde azaltırsınız ancak konnektörün değişiklikleri yansıtması gecikir. Daha fazla bilgi

DFS erişim denetimi

DFS sistemi, bağlantılarına erişim denetimi uygular ve genellikle her DFS bağlantısının kendi EKL'si vardır. DFS'nin kullandığı mekanizmalardan biri, kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilen Erişime Dayalı Listeleme'dir (ABE). Kullanıcılar, ABE barındırılan ana dizinleri izole ettiğinde DFS bağlantılarının yalnızca bir alt kümesini veya hatta tek bir bağlantıyı alabilir. Bağlantılayıcı, bir DFS sisteminde gezinirken DFS bağlantı ACL'sine ve hedefin Paylaşım ACL'sine uyar. Paylaşım ACL'si, DFS ACL'sinden devralınır.

Bilinen sınırlamalar

  • Dosya Sistemi: Dosya Sistemleri bağdaştırıcısı, eşlenen sürücüleri ve yerel sürücüleri desteklemez.
  • Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenen bir sürücü düzgün çalışmıyor. Bazı ACL'ler doğru şekilde okunmuyor.
  • Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantılarını destekler. Ancak bağlayıcı, DFS ad alanındaki normal klasörleri değil, yalnızca DFS ad alanındaki DFS bağlantılarını destekler.
  • cloudsearch.google.com adresinde döndürülen dosya bağlantıları tıklanabilir değildir. Query API tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanamaz.

Sistem gereksinimleri

Sistem gereksinimleri
İşletim sistemi
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Yazılım
  • Google Cloud Search Dosya Sistemleri bağlayıcısını çalıştıracak bilgisayarda Java JRE 1.8 yüklü olmalıdır.
Dosya sistemi protokolleri
  • Sunucu İleti Bloğu (SMB) - SMB1
  • Sunucu İleti Bloğu (SMB) - SMB2
  • Dağıtık Dosya Sistemi (DFS)

Desteklenmeyenler: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya yerel Linux dosya sistemi.

Bağlayıcıyı dağıtma

Ön koşullar

Cloud Search File Systems bağlayıcısını dağıtmadan önce ortamınızda aşağıdaki önkoşul bileşenlerinin tümünün bulunduğundan emin olun:

Gerekli Microsoft Windows hesap izinleri

Bağlantıyı sağlayan aracının çalıştığı Microsoft Windows hesabının aşağıdaki işlemleri gerçekleştirmek için yeterli izinleri olmalıdır:

  • Klasörlerin içeriğini listeleme
  • Belgelerin içeriğini okuma
  • Dosya ve klasör özelliklerini okuma
  • Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
  • Temel özellikler için yazma izinleri

Aşağıdaki gruplardan birine üyelik, Windows hesabına bağlayıcının ihtiyaç duyduğu yeterli izinleri verir:

  • Yöneticiler
  • Deneyimli Kullanıcılar
  • Yazdırma Operatörleri
  • Sunucu Operatörleri

1. Adım: Google Cloud Search Dosya Sistemleri bağlayıcısını yükleme

  1. GitHub'dan bağlayıcı deposunu alın ve derleyin.

    Windows sunucusunda git'i kullanmak için:

    1. Kod deposunu klonlayın:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. Bağlayıcının istenen sürümüne göz atın:

      > git checkout tags/v1-0.0.3

    Doğrudan GitHub'dan indirmek için:

    1. https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
    2. Klonla veya indir Zip dosyasını indir'i tıklayın.
    3. Paketi açın.
    4. Yeni dizine gidin:
      > cd windows-filesystems-connector
  2. Bağlayıcıyı oluşturun. Gerekirse Apache Maven'i yükleyin.

    > mvn package

    Bağlantıyı oluştururken testleri atlamak için mvn package yerine mvn package -DskipTests komutunu çalıştırın.

  3. Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

2. adım: Bağlayıcı yapılandırma dosyasını oluşturma

  1. Bağlayıcı yüklemesiyle aynı dizinde bir dosya oluşturun ve dosyayı connector-config.properties olarak adlandırın.

  2. Aşağıdaki örnekte gösterildiği gibi, parametreleri dosya içeriğine anahtar/değer çiftleri olarak ekleyin:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Her parametrenin ayrıntılı açıklamaları için yapılandırma parametreleri referansı başlıklı makaleyi inceleyin.

  3. (İsteğe bağlı) Gerekirse diğer bağlayıcı parametrelerini yapılandırın. Ayrıntılar için Google tarafından sağlanan bağlayıcı parametreleri başlıklı makaleyi inceleyin.

3. Adım: Günlük kaydını etkinleştir

  1. Bağlayıcı ikilisini içeren dizinde logs adlı bir klasör oluşturun.
  2. Bağlayıcı ikilisini içeren dizinde logging.properties adlı bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma

Varsayılan olarak bağlayıcı, her dosyanın medya türünü JDK tarafından sağlanan medya türü algılama özelliğiyle algılamaya çalışır. Microsoft Windows'ta JDK, dosyaların medya türlerini belirlemek için Windows kayıt defterini kullanır. Eksik bir kayıt defteri girişi, belirli dosyalar için boş bir medya türüne neden olabilir.

Gerekirse mevcut bağlamaların üzerine yazan veya null medya türünü önleyen bir medya türü belirtebilirsiniz.

  1. Bağlayıcı dizininde mime-type.properties adlı Latin-1 ile şifrelenmiş bir dosya oluşturun.
  2. Dosya uzantılarını ve bunlara karşılık gelen medya türlerini aşağıdaki örneklerde gösterildiği gibi girin:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

5. Adım: Dosya Sistemleri bağlayıcısını çalıştırın

Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra, ana makinede başlatmak için aşağıdaki örnekteki gibi bir komut çalıştırın:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Varsayılandan farklıysa yapılandırma dosyası yolunu belirtin (connector-config.properties adlı ikili dosyanın bulunduğu dizinde).

Yapılandırma parametreleri referansı

Veri kaynağı erişimi

Yer Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcı erişimi için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Zorunlu. GCDS'yi kullanarak Active Directory kimliklerini senkronize etmek için Google Workspace yöneticisi tarafından ayarlanan Cloud Search kimlik kaynağı kimliği.

Dosya sistemi erişimi

Yer Parametre
Kaynak dosya sistemleri fs.src=path1[,path2, ...]

Zorunlu. Kaynak dosya sistemlerini, fs.src.separator tarafından yapılandırılan ayırıcıyla ayrılmış bir veya daha fazla UNC kaynağı olarak belirtin. Latin1'de bulunmayan karakterleri Java Unicode kaçış karakterleriyle kodlayın.

Yol ayırıcı karakteri

Yer Parametre
Yol ayırıcı karakteri fs.src.separator=separator-character

Varsayılan ayırıcı ";"dir. Kaynak yollarınızda noktalı virgül varsa yollarınızdaki karakterlerle çakışmayan ve mülk dosyası söz dizimi tarafından ayrılmış olmayan farklı bir ayırıcı (ör. virgül (",")) ayarlayabilirsiniz.

fs.src.separator değeri boş bir dizeyse fs.src değeri tek bir yol olarak kabul edilir.

Bağlayıcı davranışı

Yer Parametre
Windows alanı fs.supportedDomain=domain

GCDS ile ayarlanan kullanıcıların Cloud Search üzerinden dokümanlara erişmesine izin vermek için gereklidir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin.

Hesapları ACL'lere dahil etme fs.supportedAccounts=account-1[, account-2,...]

Yerleşik hesap olup olmadıklarına bakılmaksızın ACL'lere dahil edilecek hesapların virgül ile ayrılmış listesi.

Varsayılan değer BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users'tür.

Yerleşik hesapları ACL'lerden hariç tutma fs.builtinGroupPrefix=prefix

Yerleşik hesapların ön ekini belirtin. Bu önek ile başlayan hesaplar yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur.

Varsayılan değer BUILTIN\\'tür.

Gizli dosya ve klasörlerin dizine eklenmesine izin verme fs.crawlHiddenFiles=boolean

Bağlantıyı sağlayan aracının gizli dosyaları ve klasörleri taramasına izin vermek için true olarak ayarlayın (Windows dosya sistemlerinde, DOS gizli özelliği ayarlanmışsa bir dosya veya klasör gizli olarak kabul edilir.) Varsayılan değer: false.

Taranan klasör listelemelerinin ve DFS ad alanı listelemelerinin dizine eklenmesine izin verme fs.indexFolders=boolean

true (varsayılan) olarak ayarlandığında, bağlayıcı bir klasörü tararken CONTAINER_ITEM nesnesi oluşturur. Bağlayıcı, yanlış olarak ayarlandığında bunun yerine bir VIRTUAL_CONTAINER_ITEM nesnesi oluşturur.

Dosya sistemi değişiklik izlemeyi etkinleştirme fs.monitorForUpdates=boolean

true (varsayılan) olarak ayarlandığında, içerik veya erişim denetimlerindeki değişiklikler bağlayıcının yeniden taranmasını tetikler. İzlemeyi devre dışı bıraktığınızda (false olarak ayarlanır) bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız ancak bağlayıcının değişiklikleri yansıtması gecikir.

Dizin önbelleğini maksimum boyuta ayarlama fs.directoryCacheSize=number-of-entries

Dizin önbellüğünün maksimum boyutu. Bağlantılayıcı, gizli klasörlerdeki dosya ve klasörlerin dizine eklenmesini önlemek için gizli klasörleri tanımlamak üzere önbelleği kullanır.

Varsayılan değer 50.000 giriştir ve genellikle 10-15 megabayt RAM tüketir.

Zaman damgasının korunması ve tarama kontrolü

Yer Parametre
Son erişim zaman damgasını koruma fs.preserveLastAccessTime=value

Bağlantılayıcı, dosya ve klasörleri tararken dosya ve klasörlerin son erişim zaman damgasını taramanın zamanına değiştirebilir. Son erişim zamanları korunmadığında, bağlayıcının ziyareti nedeniyle yedekleme ve arşiv sistemleri uygun dosyaları ve klasörleri ikincil depolamaya taşımayabilir.

Bağlantılayıcı varsayılan olarak son erişim zamanını korumaya çalışır (fs.preserveLastAccessTime, ALWAYS olarak ayarlanır). Geçiş kullanıcısının dosya özelliklerini yazmak için yeterli ayrıcalıkları yoksa bağlantılayıcı, dosyanın son erişim zamanını geri yükleyemeyebilir. ALWAYS olarak ayarlandığında bağlayıcı, dosyaların son erişim zaman damgalarını değiştirmemek için dosya sistemi için tarama isteklerini reddeder.

Olası değerler:

  • ALWAYS: Bağlantılayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışır. Bağlayıcı, son erişim zamanını ilk kez koruyamadığında son erişim zaman damgasının değiştirilmesini önlemek için dosya sistemi için sonraki tüm tarama isteklerini reddeder.
  • IF_ALLOWED: Bağlantılayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışır. Bazı zaman damgalarının korunamaması durumunda bile tarama işlemi devam eder.
  • NEVER: Bağlantılayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışmaz.
Yalnızca belirli bir tarihten sonra erişilen dosyaları tara fs.lastAccessedDate=YYYY-MM-DD

İçerik yalnızca son erişim zamanı belirtilen tarihten sonraysa taranır. Varsayılan değer: disabled.

Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 01.01.2010 ise bağlayıcı yalnızca 2010'un başından sonra erişilen içeriği tarar.

fs.lastAccessedDate değerini belirtirseniz fs.lastAccessedDays için de bir değer ayarlayamazsınız.

Yalnızca son birkaç gün içinde erişilen dosyaları tarayabilir. fs.lastAccessedDays=number-of-days

İçerik yalnızca son erişim zamanı, geçerli tarihten önceki gün sayısı içindeyse taranır. Varsayılan değer: disabled.

Daha önce dizine eklenen ve bir süredir erişilmeyen içeriğin süresinin dolmasını sağlamak için bu özelliği kullanın. Örneğin, yalnızca son bir yıl içinde erişilen içerikleri taramak için 365 olarak ayarlayın.

fs.lastAccessedDays değerini belirtirseniz fs.lastAccessedDate için de bir değer ayarlayamazsınız.

Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tara fs.lastModifiedDate=YYYY-MM-DD

İçerik yalnızca son değiştirilme zamanı belirtilen tarihten sonraysa taranır. Varsayılan değer: disabled.

Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 01.01.2010 ise bağlayıcı yalnızca 2010'un başından sonra değiştirilen içeriği tarar.

fs.lastModifiedDate değerini belirtirseniz fs.lastModifiedDays için de bir değer ayarlayamazsınız.

Yalnızca son birkaç gün içinde değiştirilen dosyaları tarayabilir. fs.lastModifiedDays=number-of-days

İçerik yalnızca son değiştirme zamanı mevcut zamandan önceki gün sayısı içindeyse taranır. Varsayılan değer: disabled.

Bir süredir değiştirilmemiş olan daha önce dizine eklenen içeriğin süresinin dolmasını sağlamak için bu özelliği kullanın. Örneğin, içeriği yalnızca son bir yıl içinde değiştirildiyse taramak için 365 olarak ayarlayın.

fs.lastModifiedDays değerini belirtirseniz fs.lastModifiedDate için de bir değer ayarlayamazsınız.

Dosya paylaşımı erişim denetimini atlama

Bağlayıcı, varsayılan olarak dosya paylaşımındaki EKL'ler dahil olmak üzere dizine ekleme API'sine erişim kontrol listeleri (EKL'ler) gönderirken erişim denetimi bütünlüğünü korur. Ancak bazı yapılandırmalarda bağlayıcının, paylaşım ACL'sini okumak için yeterli izni olmayabilir. Bu durumlarda bağlayıcı, arama sonuçlarında söz konusu dosya paylaşımında bulunan dosyaları döndürmez.

İçeriğin her zaman arama sonuçlarında döndürülmesi için bağlayıcıyı, paylaşım ACL'sini yok sayacak şekilde ayarlayabilirsiniz. Bu durumda dizine ekleme API'si, gerçek paylaşım ACL'si yerine tamamen izin verici bir paylaşım ACL'si alır.

Yer Parametre
Dosya paylaşımı erişim denetimini atlama fs.skipShareAccessControl=boolean

Paylaşım ACL'lerini zorunlu kılmak için false (varsayılan) olarak ayarlayın. Paylaşım ACL'lerini yoksaymak için true olarak ayarlayın.