رابط Microsoft Windows File Systems را مستقر کنید

شما می‌توانید Google Cloud Search را طوری تنظیم کنید که علاوه بر محتوای Google Workspace شما، نتایجی از اشتراک‌گذاری‌های Microsoft Windows سازمانتان را نیز برگرداند. شما از رابط Cloud Search File Systems استفاده می‌کنید و آن را برای دسترسی به اشتراک‌گذاری‌های مشخص‌شده‌ی Windows پیکربندی می‌کنید. یک نمونه رابط می‌تواند از چندین اشتراک‌گذاری Microsoft Windows پشتیبانی کند.

ملاحظات مهم

قبل از استقرار رابط سیستم‌های فایل، ملاحظات زیر را بررسی کنید.

به‌روزرسانی‌های خودکار مداوم

به طور پیش‌فرض، کانکتور هنگام راه‌اندازی، به طور مداوم مسیرهای شروع (مقادیر fs.src در فایل پیکربندی) را رصد می‌کند. هنگامی که سیستم فایل تغییرات در محتوا یا کنترل‌های دسترسی را گزارش می‌دهد، کانکتور سیستم فایل را دوباره بررسی می‌کند. این بررسی مجدد می‌تواند منابع زیادی مصرف کند. برای خاموش کردن نظارت، fs.monitorForUpdates را روی false تنظیم کنید. این کار استفاده از منابع را کاهش می‌دهد اما زمانی که کانکتور تغییرات را منعکس می‌کند، تأخیر ایجاد می‌کند. اطلاعات بیشتر

کنترل دسترسی DFS

سیستم DFS کنترل دسترسی را روی لینک‌های خود اعمال می‌کند و معمولاً هر لینک DFS دارای ACL مخصوص به خود است. DFS از شمارش مبتنی بر دسترسی (ABE) برای محدود کردن لینک‌های بازگشتی به یک کاربر استفاده می‌کند. کاربران ممکن است فقط زیرمجموعه‌ای از لینک‌های DFS یا فقط یک لینک را در زمانی که ABE دایرکتوری‌های خانگی را جدا می‌کند، ببینند. هنگام عبور از یک سیستم DFS، رابط به ACL لینک DFS و Share ACL هدف احترام می‌گذارد؛ Share ACL از DFS ACL به ارث می‌رسد.

محدودیت‌های شناخته‌شده

این بخش محدودیت‌های شناخته‌شده‌ی رابط سیستم فایل را فهرست می‌کند.

  • سیستم فایل : این کانکتور از درایوهای نگاشت‌شده یا محلی پشتیبانی نمی‌کند.
  • سیستم فایل توزیع‌شده : یک درایو نگاشت‌شده به یک سیستم فایل توزیع‌شده‌ی UNC به درستی کار نمی‌کند و برخی از ACLها ممکن است به درستی خوانده نشوند.
  • این کانکتور از فضاهای نام و لینک‌های DFS پشتیبانی می‌کند، اما پوشه‌های معمولی در فضای نام DFS را پشتیبانی نمی‌کند.
  • لینک‌های فایل در cloudsearch.google.com یا لینک‌های برگردانده شده توسط Query API در اکثر مرورگرها قابل کلیک نیستند.

الزامات سیستم

قبل از اینکه کانکتور File Systems را مستقر کنید، مطمئن شوید که دستگاه میزبان الزامات زیر را برآورده می‌کند:

الزامات سیستم
سیستم عامل
  • ویندوز سرور ۲۰۱۶
  • ویندوز سرور ۲۰۱۲
  • ویندوز سرور 2008 R2
نرم‌افزار
  • جاوا JRE 1.8 روی رایانه‌ای که کانکتور را اجرا می‌کند نصب شده باشد
پروتکل‌های سیستم فایل
  • بلوک پیام سرور (SMB) - SMB1
  • بلوک پیام سرور (SMB) - SMB2
  • سیستم فایل توزیع‌شده (DFS)

پشتیبانی نمی‌شود: سیستم فایل محلی ویندوز، NFS 2.0، NFS 3.0 یا سیستم فایل محلی لینوکس.

کانکتور را مستقر کنید

برای استقرار رابط سیستم‌های فایل، این مراحل را دنبال کنید.

پیش‌نیازها

قبل از نصب کانکتور، مطمئن شوید که محیط شما این اجزا را دارد:

  • اطلاعات Google Workspace برای ایجاد ارتباط:

    سرپرست Google Workspace شما معمولاً می‌تواند این اعتبارنامه‌ها را ارائه دهد.

  • مطمئن شوید که حساب کاربری ویندوز مجوزهای کافی را دارد.

مجوزهای لازم برای حساب کاربری مایکروسافت ویندوز

حساب کاربری ویندوز که رابط را اجرا می‌کند باید مجوزهای زیر را داشته باشد:

  • فهرست کردن محتوای پوشه.
  • محتوای سند را بخوانید.
  • خواندن ویژگی‌های فایل و پوشه
  • مجوزهای خواندن (ACL) برای فایل‌ها و پوشه‌ها.
  • ویژگی‌های اساسی را بنویسید.

عضویت در یکی از این گروه‌ها معمولاً مجوزهای کافی را اعطا می‌کند: مدیران، کاربران حرفه‌ای، اپراتورهای چاپ یا اپراتورهای سرور.

مرحله 1. کانکتور را نصب کنید

مخزن کانکتور را از گیت‌هاب دانلود یا کلون کنید و سپس بسته کانکتور را بسازید.

  1. مخزن کانکتور را از گیت‌هاب دریافت کنید و آن را بسازید.

    برای استفاده از git در ویندوز سرور:

    > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
    > cd windows-filesystems-connector
    > git checkout tags/v1-0.0.3

    برای دانلود مستقیم:

    1. به فایل windows-filesystems-connector بروید.
    2. روی کلون یا دانلود > دانلود فایل فشرده کلیک کنید.
    3. بسته را از حالت فشرده خارج کرده و به پوشه مورد نظر بروید.
  2. اتصال‌دهنده را با استفاده از Apache Maven بسازید:

    > mvn package
    برای رد کردن تست‌ها، از mvn package -DskipTests استفاده کنید.

  3. فایل زیپ کانکتور را در پوشه نصب خود استخراج کنید:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

مرحله ۲. ایجاد فایل پیکربندی

پس از نصب کانکتور، یک فایل پیکربندی ایجاد کنید که شامل تنظیمات مربوط به کانکتور باشد.

  1. در دایرکتوری کانکتور، فایلی با نام connector-config.properties ایجاد کنید.
  2. پارامترها را به صورت جفت‌های کلید-مقدار اضافه کنید. برای مثال:

    # Required parameters
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # File system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace
    
    # Optional parameters
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    برای پارامترهای خاص سیستم فایل، به مرجع پارامترهای پیکربندی مراجعه کنید. برای فهرستی از پارامترهای رایج مورد استفاده توسط همه رابط‌های جستجوی ابری، به پارامترهای رابط ارائه شده توسط گوگل مراجعه کنید.

مرحله ۳. فعال کردن ثبت وقایع

یک دایرکتوری برای گزارش‌ها ایجاد کنید و یک فایل پیکربندی گزارش‌گیری نیز بسازید.

  1. یک پوشه با نام logs در دایرکتوری کانکتور ایجاد کنید.
  2. فایلی با نام logging.properties با محتوای زیر ایجاد کنید:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

مرحله ۴. (اختیاری) پیکربندی انواع رسانه

این رابط سعی می‌کند انواع رسانه‌های فایل را با استفاده از مکانیسم پیش‌فرض خود که در ویندوز به ورودی‌های رجیستری متکی است، شناسایی کند. اگر ورودی رجیستری برای یک پسوند فایل وجود نداشته باشد، رابط ممکن است نتواند نوع رسانه را به درستی تشخیص دهد. اگر انواع رسانه‌ها به درستی شناسایی نشوند، یا اگر می‌خواهید نوع پیش‌فرض یک پسوند را نادیده بگیرید، این مراحل را دنبال کنید:

  1. فایلی با نام mime-type.properties در دایرکتوری کانکتور ایجاد کنید.
  2. پسوندها و انواع را به صورت extension=media/type وارد کنید: properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf

مرحله ۵. رابط سیستم‌های فایل را اجرا کنید

کانکتور را از دستگاه میزبان اجرا کنید:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

به طور پیش‌فرض، کانکتور به دنبال یک فایل پیکربندی با نام connector-config.properties در دایرکتوری که کانکتور در آن اجرا می‌شود، می‌گردد. اگر فایل پیکربندی شما نام دیگری دارد یا در دایرکتوری دیگری است، از پارامتر -Dconfig برای مشخص کردن مسیر آن استفاده کنید.

مرجع پارامترهای پیکربندی

جداول زیر پارامترهای مورد استفاده برای پیکربندی رابط سیستم‌های فایل را فهرست و شرح می‌دهند.

دسترسی به منبع داده

تنظیم پارامتر
شناسه منبع داده api.sourceId= 1234567890abcdef

الزامی. شناسه منبع جستجوی ابری.

حساب کاربری خدمات api.serviceAccountPrivateKeyFile= ./PrivateKey.json

الزامی. مسیر فایل کلید حساب سرویس.

شناسه منبع هویت api.identitySourceId= x0987654321

الزامی. شناسه منبع هویت جستجوی ابری که توسط مدیر Google Workspace برای همگام‌سازی هویت‌های دایرکتوری فعال با استفاده از GCDS تنظیم شده است.

دسترسی به سیستم فایل

از این پارامترها برای مشخص کردن منابع سیستم فایل برای خزش استفاده کنید.

تنظیم پارامتر
سیستم‌های فایل منبع fs.src= path1 [, path2 , ...]

الزامی. سیستم‌های فایل منبع را به عنوان یک یا چند منبع UNC مشخص کنید که توسط جداکننده پیکربندی شده توسط fs.src.separator از هم جدا شده‌اند. اگر از کاراکترهایی استفاده می‌کنید که در Latin1 نیستند، آنها را با escapeهای یونیکد جاوا کدگذاری کنید.

کاراکتر جداکننده مسیر

تنظیم پارامتر
کاراکتر جداکننده مسیر fs.src.separator= separator-character

جداکننده پیش‌فرض ";" است. اگر مسیرهای منبع شما حاوی نقطه ویرگول باشند، می‌توانید جداکننده متفاوتی مانند کاما (",") تنظیم کنید که با کاراکترهای مسیرهای شما تداخل نداشته باشد و توسط خود سینتکس فایل ویژگی رزرو نشده باشد.

اگر مقدار fs.src.separator یک رشته خالی باشد، آنگاه مقدار fs.src به عنوان یک مسیر واحد در نظر گرفته می‌شود.

رفتار کانکتور

از این پارامترها برای تنظیم نحوه‌ی خزش کانکتور در سیستم‌های فایل استفاده کنید.

تنظیم پارامتر
دامنه ویندوز fs.supportedDomain= domain

برای دسترسی کاربرانی که GCDS را تنظیم کرده‌اند به اسناد از طریق جستجوی ابری لازم است. به عنوان یک نام دامنه NetBIOS واحد از Active Directory مشخص کنید.

حساب‌ها را در ACLS بگنجانید fs.supportedAccounts= account-1[, account-2,...]

فهرستی از حساب‌ها که با کاما از هم جدا شده‌اند تا در ACLها لحاظ شوند، صرف نظر از اینکه حساب‌های داخلی باشند یا خیر.

مقدار پیش‌فرض عبارت است از BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users

حساب‌های داخلی را از ACLها مستثنی کنید fs.builtinGroupPrefix= prefix

پیشوند حساب‌های داخلی را مشخص کنید. حسابی که با این پیشوند شروع شود، یک حساب داخلی محسوب می‌شود و از ACLها حذف خواهد شد.

مقدار پیش‌فرض BUILTIN\\ است.

اجازه دهید فایل‌ها و پوشه‌های مخفی ایندکس شوند fs.crawlHiddenFiles= boolean

برای خزش فایل‌های مخفی، روی true تنظیم کنید. مقدار پیش‌فرض false است.

امکان ایندکس کردن فهرست پوشه‌های پیمایش‌شده و شمارش‌های فضای نام DFS fs.indexFolders= boolean

وقتی روی true (پیش‌فرض) تنظیم شده باشد، وقتی کانکتور یک پوشه را پیمایش می‌کند، یک شیء CONTAINER_ITEM ایجاد می‌کند. وقتی روی false تنظیم شده باشد، کانکتور به جای آن یک شیء VIRTUAL_CONTAINER_ITEM ایجاد می‌کند.

فعال کردن نظارت بر تغییر سیستم فایل fs.monitorForUpdates= boolean

وقتی روی true (پیش‌فرض) تنظیم شود، رابط به‌طور خودکار پس از تغییرات در محتوا یا کنترل‌های دسترسی، دوباره خزش می‌کند. تنظیم این مقدار روی false ، استفاده از منابع را کاهش می‌دهد اما سرعت نمایش تغییرات در نتایج جستجو را به تأخیر می‌اندازد.

حداکثر اندازه حافظه پنهان دایرکتوری‌ها را تنظیم کنید fs.directoryCacheSize= number-of-entries

حداکثر اندازه حافظه پنهان دایرکتوری. رابط از حافظه پنهان برای شناسایی پوشه‌های مخفی استفاده می‌کند تا از فهرست‌بندی فایل‌ها و پوشه‌ها در پوشه‌های مخفی جلوگیری کند.

مقدار پیش‌فرض ۵۰،۰۰۰ ورودی است که معمولاً ۱۰ تا ۱۵ مگابایت از رم را اشغال می‌کنند.

حفظ مهر زمانی

از این پارامترها برای مشخص کردن نحوه مدیریت حفظ مهر زمانی توسط کانکتور استفاده کنید.

تنظیم پارامتر
زمان دسترسی را حفظ کنید fs.preserveLastAccessTime= value

هنگام خزش فایل‌ها و پوشه‌ها، رابط می‌تواند آخرین زمان دسترسی آنها را به زمان خزش تغییر دهد. اگر آخرین زمان‌های دسترسی حفظ نشوند، سیستم‌های پشتیبان‌گیری و بایگانی ممکن است فایل‌ها و پوشه‌های مناسب را به حافظه ثانویه منتقل نکنند زیرا رابط به آنها دسترسی داشته است.

به طور پیش‌فرض، fs.preserveLastAccessTime روی ALWAYS تنظیم شده است، به این معنی که کانکتور سعی می‌کند آخرین زمان دسترسی را حفظ کند. اگر حساب کاربری که کانکتور را اجرا می‌کند، فاقد امتیاز نوشتن ویژگی‌های فایل باشد، کانکتور نمی‌تواند آخرین زمان دسترسی را بازیابی کند. اگر روی ALWAYS تنظیم شده باشد و کانکتور نتواند آخرین زمان دسترسی را حفظ کند، درخواست‌های خزش برای سیستم فایل را رد می‌کند تا مهرهای زمانی فایل را تغییر ندهد.

مقادیر ممکن عبارتند از:

  • ALWAYS : این رابط تلاش می‌کند تا آخرین زمان دسترسی را هنگام خزش فایل‌ها و پوشه‌ها حفظ کند. اگر نتواند آخرین زمان دسترسی را حفظ کند، تمام درخواست‌های خزش بعدی برای سیستم فایل را رد می‌کند تا از تغییر مهرهای زمانی جلوگیری کند.
  • IF_ALLOWED : این کانکتور تلاش می‌کند تا آخرین زمان دسترسی را هنگام پیمایش فایل‌ها و پوشه‌ها حفظ کند. این کانکتور حتی زمانی که ممکن است برخی از مهرهای زمانی حفظ نشده باشند، به پیمایش ادامه می‌دهد.
  • NEVER : رابط تلاشی برای حفظ آخرین زمان دسترسی نمی‌کند.
فقط فایل‌هایی را که پس از یک تاریخ مشخص به آنها دسترسی پیدا شده است، خزش کنید fs.lastAccessedDate= YYYY-MM-DD

فقط در صورتی که آخرین زمان دسترسی بعد از تاریخ مشخص شده (YYYY-MM-DD، فرمت ISO8601 ) باشد، محتوا را بررسی می‌کند. پیش‌فرض disabled است. برای مثال، 2010-01-01 محتوایی را که پس از شروع سال ۲۰۱۰ دسترسی پیدا کرده‌اند، بررسی می‌کند. نمی‌توان از آن با fs.lastAccessedDays استفاده کرد.

فقط فایل‌هایی را که در چند روز گذشته به آنها دسترسی پیدا شده است، خزش کنید fs.lastAccessedDays= number-of-days

فقط در صورتی که آخرین زمان دسترسی در بازه زمانی مشخص شده از زمان حال باشد، محتوا را بررسی می‌کند. پیش‌فرض disabled است. برای انقضای محتوای قدیمی مفید است؛ مثلاً 365 محتوایی را که در سال گذشته مورد دسترسی قرار گرفته است، بررسی می‌کند. نمی‌توان از آن با fs.lastAccessedDate استفاده کرد.

فقط فایل‌هایی را که پس از یک تاریخ مشخص تغییر یافته‌اند، خزش کنید fs.lastModifiedDate= YYYY-MM-DD

فقط در صورتی که آخرین زمان تغییر پس از تاریخ مشخص شده (YYYY-MM-DD، فرمت ISO8601 ) باشد، محتوا را بررسی می‌کند. پیش‌فرض disabled است. برای مثال، 2010-01-01 محتوای تغییر یافته پس از شروع سال 2010 را بررسی می‌کند. نمی‌توان از آن با fs.lastModifiedDays استفاده کرد.

فقط فایل‌هایی را که در چند روز گذشته تغییر یافته‌اند، خزش کنید fs.lastModifiedDays= number-of-days

فقط در صورتی که آخرین زمان اصلاح، در تعداد روزهای مشخص شده از زمان حال باشد، محتوا را بررسی می‌کند. پیش‌فرض disabled است. برای انقضای محتوای قدیمی مفید است؛ مثلاً، 365 محتوای اصلاح‌شده در سال گذشته را بررسی می‌کند. نمی‌توان از آن با fs.lastModifiedDate استفاده کرد.

نادیده گرفتن ACL های اشتراک گذاری فایل

شما می‌توانید کانکتور را طوری تنظیم کنید که اگر مجوزهای خواندن ACLهای اشتراکی را ندارد، آنها را نادیده بگیرد. سپس محتوا با یک ACL اشتراکی مجاز بازگردانده می‌شود.

تنظیم پارامتر
نادیده گرفتن ACL های اشتراک گذاری fs.skipShareAccessControl= boolean

برای نادیده گرفتن ACL های اشتراکی، روی true تنظیم کنید. مقدار پیش‌فرض false است.