نشر موصّل أنظمة الملفات في Microsoft Windows

يمكنك إعداد Google Cloud Search لعرض نتائج من ملفّات مشاركة Microsoft Windows في مؤسستك بالإضافة إلى محتوى Google Workspace. يمكنك استخدام موصل "أنظمة الملفات" في Google Cloud Search وضبطه للوصول إلى موارد مشترَكة محدّدة في Windows. يمكن أن تتوافق نسخة واحدة من الموصّل مع عدة موارد مشترَكة في Microsoft Windows.

اعتبارات مهمة

التحديثات التلقائية المستمرة

يتتبّع الموصِّل بشكلٍ تلقائي مسارات البدء (القيم من fs.src في ملف إعدادات الموصِّل) عند بدء تشغيله. عندما يُبلغ نظام الملفات عن تغييرات في عناصر التحكّم بالوصول أو المحتوى، يتم تفعيل الموصّل لإعادة الزحف إلى نظام الملفات. يمكن أن تستهلك عملية إعادة الزحف هذه الكثير من الموارد. لإيقاف مراقبة نظام الملفات، اضبط fs.monitorForUpdates على false. يمكنك تقليل استخدام الموصّل للموارد بشكل كبير، ولكنّ ذلك يؤدّي إلى تأخير ظهور التغييرات في الموصّل. مزيد من المعلومات

التحكّم في الوصول إلى نظام الملفات الموزَّع

يطبّق نظام DFS عنصر التحكّم في الوصول على روابطه، وعادةً ما يكون لكل رابط DFS قائمة ACL خاصة به. من الآليات التي تستخدمها خدمة "الفهرسة المستندة إلى الوصول" (ABE) هي التعداد المستند إلى الوصول، والذي يمكن أن يحدّ من روابط "الفهرسة المستندة إلى البيانات" التي يتم عرضها للمستخدم. قد يحصل المستخدمون على مجموعة فرعية فقط من روابط DFS، أو حتى رابط واحد فقط عندما تعزل ABE الدلائل المنزلية المستضافة. عندما ينتقل الموصّل عبر نظام DFS، يراعي الموصّل قائمة التحكّم بالوصول إلى رابط DFS وقائمة التحكّم بالوصول إلى المشاركة المستهدَفة، وتتوارث قائمة التحكّم بالوصول إلى المشاركة قائمة التحكّم بالوصول إلى DFS.

القيود المعروفة

  • نظام الملفات: لا يتوافق محوِّل أنظمة الملفات مع محركات الأقراص المُعرَّفة ومحركات الأقراص المحلية.
  • نظام الملفات الموزَّعة: لا يعمل محرك الأقراص المرتبط بنظام الملفات الموزَّعة (DFS) عبر بروتوكول UNC بشكل صحيح. لا تتم قراءة بعض قوائم التحكّم في الوصول بشكل صحيح.
  • يتوافق موصل أنظمة الملفات مع مساحات أسماء نظام الملفات الموزَّعة (DFS) والروابط. ومع ذلك، لا يتيح الموصّل روابط DFS إلا في مساحة اسم DFS، وليس المجلدات العادية في مساحة اسم DFS.
  • لا يمكن النقر على روابط الملفات التي يتم عرضها في cloudsearch.google.com. لا يمكن النقر على روابط الملفات التي تعرضها Query API في معظم المتصفّحات أيضًا.

متطلبات النظام

متطلبات النظام
نظام التشغيل
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
البرامج
  • تثبيت Java JRE 1.8 على الكمبيوتر الذي سيتم تشغيل موصل أنظمة الملفات في Google Cloud Search عليه
بروتوكولات نظام الملفات
  • مجموعة رسائل الخادم (SMB) - SMB1
  • مجموعة رسائل الخادم (SMB) - SMB2
  • نظام الملفات الموزَّعة (DFS)

غير متوافقة: أنظمة ملفات Windows المحلية أو نظام ملفات الشبكة (NFS) 2.0 من Sun أو نظام ملفات الشبكة (NFS) 3.0 من Sun أو نظام ملفات Linux المحلي

نشر الموصّل

المتطلبات الأساسية

قبل نشر محوِّل أنظمة الملفات في Cloud Search، تأكَّد من أنّ بيئتك تتضمّن جميع المكوّنات الأساسية التالية:

أذونات حساب Microsoft Windows المطلوبة

يجب أن يكون لحساب Microsoft Windows الذي يعمل عليه أداة الربط أذونات كافية لتنفيذ الإجراءات التالية:

  • إدراج محتوى المجلدات
  • قراءة محتوى المستندات
  • قراءة سمات الملفات والمجلدات
  • أذونات القراءة (قوائم التحكّم بالوصول) لكلٍّ من الملفات والمجلدات
  • أذونات كتابة السمات الأساسية

يمنح الانضمام إلى إحدى المجموعات التالية حساب Windows الأذونات الكافية التي يحتاجها الموصّل:

  • المشرفون
  • المستخدمون المتقدّمون
  • عوامل تشغيل الطباعة
  • مشغّلو الخوادم

الخطوة 1: تثبيت موصل أنظمة الملفات في Google Cloud Search

  1. احصل على مستودع الموصّل من GitHub وأنشئ الموصّل.

    لاستخدام git على خادم Windows:

    1. استنسِخ المستودع:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. اطّلِع على الإصدار المطلوب من الموصّل:

      > git checkout tags/v1-0.0.3

    لتنزيل التطبيق من GitHub مباشرةً:

    1. انتقِل إلى https://github.com/google-cloudsearch/windows-filesystems-connector.
    2. انقر على نسخة طبق الأصل أو تنزيل تنزيل ملف zip.
    3. فكِّ ضغط الحزمة.
    4. انتقِل إلى الدليل الجديد:
      > cd windows-filesystems-connector
  2. أنشئ الموصّل. ثبِّت Apache Maven إذا لزم الأمر.

    > mvn package

    لتخطّي الاختبارات عند إنشاء الموصِّل، شغِّل mvn package -DskipTests بدلاً من mvn package.

  3. انسخ ملف zip الخاص بالموصّل إلى دليل التثبيت على الجهاز:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

الخطوة 2: إنشاء ملف إعداد الموصِّل

  1. في الدليل نفسه الذي تم فيه تثبيت أداة الربط، أنشئ ملفًا واسمه connector-config.properties.

  2. أضِف المَعلمات كأزواج مفتاح/قيمة إلى محتوى الملف، كما هو موضّح في المثال التالي:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    للحصول على أوصاف تفصيلية لكل مَعلمة، انتقِل إلى مرجع مَعلمات الضبط.

  3. (اختياري) اضبط مَعلمات الموصِّل الأخرى حسب الحاجة. لمعرفة التفاصيل، انتقِل إلى مَعلمات الموصِّل المقدَّمة من Google.

الخطوة 3: تمكين التسجيل

  1. أنشئ مجلدًا باسم logs في الدليل الذي يحتوي على ملف الموصِّل الثنائي.
  2. أنشئ ملفًا بترميز ASCII أو UTF-8 باسم logging.properties في الدليل الذي يحتوي على الملف الثنائي للموصّل وأضِف المحتوى التالي:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

الخطوة 4. (اختياري) ضبط أنواع الوسائط

يحاول الموصِّل تلقائيًا رصد نوع الوسائط لكل ملف باستخدام ميزة رصد نوع الوسائط التي يوفّرها JDK . على نظام التشغيل Microsoft Windows، يعتمد JDK على سجلّ Windows لتحديد أنواع الوسائط للملفات. يمكن أن يؤدي عدم توفّر إدخال في السجلّ إلى عدم توفّر نوع وسائط معيّن لملفّات معيّنة.

إذا لزم الأمر، يمكنك تحديد نوع وسائط يحلّ محلّ أيّ عمليات ربط حالية أو يمنع استخدام نوع وسائط فارغ.

  1. في دليل الموصِّل، أنشِئ ملفًا مشفَّرًا بترميز Latin-1 باسم mime-type.properties.
  2. أدخِل امتدادات الملفات وأنواع الوسائط المقابلة لها كما هو موضّح في الأمثلة التالية:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

الخطوة 5: تشغيل موصِّل "أنظمة الملفات"

بعد تثبيت موصل "أنظمة الملفات" وضبطه، لتشغيله على الجهاز المضيف، شغِّل أمرًا مثل المثال التالي:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

حدِّد مسار ملف الإعدادات إذا كان مختلفًا عن المسار التلقائي (في الدليل نفسه الذي يتضمّن الملف الثنائي الذي يحمل الاسم connector-config.properties).

مرجع مَعلمات الإعدادات

الوصول إلى مصدر البيانات

الإعدادات المَعلمة
معرّف مصدر البيانات api.sourceId=1234567890abcdef

مطلوب. رقم تعريف مصدر Google Cloud Search الذي أعدّه مشرف Google Workspace

مسار ملف المفتاح الخاص لحساب الخدمة api.serviceAccountPrivateKeyFile=./PrivateKey.json

مطلوب. ملف مفتاح حساب خدمة Google Cloud Search للوصول إلى موصل "أنظمة الملفات" في Google Cloud Search

رقم تعريف مصدر الهوية api.identitySourceId=x0987654321

مطلوب. رقم تعريف مصدر الهوية في Cloud Search الذي أعدّه مشرف Google Workspace لمزامنة هويات Active Directory باستخدام GCDS.

الوصول إلى نظام الملفات

الإعدادات المَعلمة
أنظمة ملفات المصدر fs.src=path1[,path2, ...]

مطلوب. حدِّد أنظمة الملفات المصدر كأحد مصادر UNC أو أكثر مفصولة بالمحدِّد الذي تم ضبطه بواسطة fs.src.separator. إذا كنت تستخدم أحرفًا غير لاتينية، يمكنك ترميزها باستخدام أحرف الهروب Unicode في Java.

حرف فاصل المسار

الإعدادات المَعلمة
حرف فاصل المسار fs.src.separator=separator-character

الفصل التلقائي هو ";". إذا كانت مسارات المصدر تحتوي على فاصلة منقوطة، يمكنك ضبط فاصل مختلف، مثل فاصلة (",")، لا يتعارض مع الأحرف في المسارات ولا يكون محجوزًا من خلال بنية ملف السمة نفسها.

إذا كانت قيمة fs.src.separator سلسلة فارغة، يتم التعامل مع قيمة fs.src على أنّها مسار واحد.

سلوك الموصِّل

الإعدادات المَعلمة
نطاق Windows fs.supportedDomain=domain

مطلوب للسماح للمستخدمين الذين تم إعدادهم باستخدام GCDS بالوصول إلى المستندات من خلال Cloud Search. حدِّد اسم نطاق NetBIOS واحدًا في Active Directory.

تضمين الحسابات في أذونات الوصول المحدودة fs.supportedAccounts=account-1[, account-2,...]

قائمة بالحسابات التي يجب تضمينها في جداول أذونات الوصول، بغض النظر عمّا إذا كانت حسابات مدمجة

القيمة التلقائية هي BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users

استبعاد الحسابات المضمّنة من جداول التحكم في الوصول fs.builtinGroupPrefix=prefix

حدِّد البادئة للحسابات المضمّنة. يُعتبر الحساب الذي يبدأ بهذه البادئة حسابًا مضمّنًا وسيتم استبعاده من قوائم التحكّم بالوصول.

القيمة التلقائية هي BUILTIN\\

السماح بفهرسة الملفات والمجلدات المخفية fs.crawlHiddenFiles=boolean

اضبط القيمة على true للسماح للموصّل بالزحف إلى الملفات والمجلدات المخفية (في أنظمة ملفات Windows، يُعتبر الملف أو المجلد مخفيًا إذا تم ضبط السمة المخفية في نظام التشغيل DOS). تكون القيمة التلقائية false.

السماح بفهرسة بيانات المجلدات التي تم الزحف إليها وعمليات سرد مساحات أسماء DFS fs.indexFolders=boolean

عند ضبطه على true (الإعداد التلقائي)، عندما يزحف الموصّل إلى مجلد، ينشئ الموصّل عنصر CONTAINER_ITEM. عند ضبطه على false، ينشئ الموصِّل عنصر VIRTUAL_CONTAINER_ITEM بدلاً من ذلك.

تفعيل مراقبة التغييرات في نظام الملفات fs.monitorForUpdates=boolean

عند ضبط القيمة على true (الإعداد التلقائي)، تؤدي التغييرات في عناصر التحكّم في المحتوى أو الوصول إلى إعادة الزحف إلى الموصّل. عند إيقاف المراقبة (يتم ضبطها على false)، يتم تقليل استخدام الموصّل للموارد بشكل كبير، ولكن يتم تأخير وقت تطبيق الموصّل للتغييرات.

ضبط الحد الأقصى لحجم ذاكرة التخزين المؤقت للأدلة fs.directoryCacheSize=number-of-entries

الحد الأقصى لحجم ذاكرة التخزين المؤقت للدليل يستخدم الموصّل ذاكرة التخزين المؤقت لتحديد المجلدات المخفية لتجنُّب فهرسة الملفات والمجلدات في المجلدات المخفية.

الإعداد التلقائي هو 50,000 إدخال، ويستهلك عادةً من 10 إلى 15 ميغابايت من ذاكرة الوصول العشوائي.

الحفاظ على الطابع الزمني والتحكّم في الزحف

الإعدادات المَعلمة
الاحتفاظ بالطابع الزمني لآخر عملية وصول fs.preserveLastAccessTime=value

عندما يزحف الموصّل إلى الملفات والمجلدات، يمكن أن يغيّر الموصّل الطابع الزمني لآخر عملية وصول إلى الملفات والمجلدات إلى وقت الزحف. في حال عدم الاحتفاظ بأوقات الوصول الأخيرة، قد لا تنقل أنظمة الاحتفاظ بنسخة احتياطية والأرشفة الملفات والمجلدات المناسبة إلى مساحة التخزين الثانوية بسبب زيارة الموصّل.

يحاول الموصّل تلقائيًا الاحتفاظ بوقت الوصول الأخير (fs.preserveLastAccessTime مضبوط على ALWAYS). قد يتعذّر على الموصّل استعادة وقت الوصول الأخير للملف عندما لا يمتلك مستخدم التنقّل امتيازات كافية لكتابة سمات الملف. عند ضبط القيمة على ALWAYS، يرفض الموصِّل طلبات الزحف إلى نظام الملفات حتى لا يغيّر الطوابع الزمنية لآخر وصول إلى الملفات.

القيم المتاحة:

  • ALWAYS: يحاول الموصّل الاحتفاظ بوقت الوصول الأخير أثناء الزحف إلى الملفات والمجلدات. في المرة الأولى التي يتعذّر فيها على الموصِّل الاحتفاظ بوقت الوصول الأخير، يرفض الموصِّل جميع طلبات الزحف اللاحقة إلى نظام الملفات لمنع تغيير الطوابع الزمنية لآخر عملية وصول.
  • IF_ALLOWED: يحاول الموصّل الاحتفاظ بوقت الوصول الأخير أثناء الزحف إلى الملفات والمجلدات. ويستمر الزحف حتى في حال عدم الاحتفاظ ببعض الطوابع الزمنية.
  • NEVER: لا يحاول الموصّل الاحتفاظ بوقت الوصول الأخير أثناء الزحف إلى الملفات والمجلدات.
الزحف إلى الملفات التي تم الوصول إليها بعد تاريخ معيّن فقط fs.lastAccessedDate=YYYY-MM-DD

الزحف إلى المحتوى فقط إذا كان وقت الوصول الأخير بعد التاريخ المحدّد تكون القيمة التلقائية disabled.

حدِّد التاريخ بتنسيق ISO8601: YYYY-MM-DD. على سبيل المثال، إذا كانت القيمة هي ‎2010-01-01، لا يزحف الموصّل إلا إلى المحتوى الذي تم الوصول إليه بعد بداية عام 2010.

في حال تحديد fs.lastAccessedDate، لا يمكنك أيضًا ضبط قيمة لسمة fs.lastAccessedDays.

الزحف إلى الملفات التي تم الوصول إليها خلال عدد الأيام السابق فقط fs.lastAccessedDays=number-of-days

الزحف إلى المحتوى فقط إذا كان وقت الوصول الأخير ضمن عدد الأيام قبل الوقت الحالي تكون القيمة التلقائية disabled.

استخدِم هذه السمة لانتهاء صلاحية المحتوى المفهرَس سابقًا والذي لم يتم الوصول إليه منذ فترة. على سبيل المثال، يمكنك ضبط المدة على 365 يومًا للزحف إلى المحتوى فقط إذا تم الوصول إليه في العام الماضي.

في حال تحديد fs.lastAccessedDays، لا يمكنك أيضًا ضبط قيمة لسمة fs.lastAccessedDate.

الزحف إلى الملفات التي تم تعديلها بعد تاريخ معيّن فقط fs.lastModifiedDate=YYYY-MM-DD

الزحف إلى المحتوى فقط إذا كان وقت آخر تعديل بعد التاريخ المحدّد تكون القيمة التلقائية disabled.

حدِّد التاريخ بتنسيق ISO8601: YYYY-MM-DD. على سبيل المثال، إذا كانت القيمة هي ‎01-01-2010، لا يزحف الموصّل إلا إلى المحتوى الذي تم تعديله بعد بداية عام 2010.

في حال تحديد fs.lastModifiedDate، لا يمكنك أيضًا ضبط قيمة لسمة fs.lastModifiedDays.

الزحف إلى الملفات التي تم تعديلها خلال عدد الأيام السابق فقط fs.lastModifiedDays=number-of-days

الزحف إلى المحتوى فقط إذا كان وقت آخر تعديل ضمن عدد الأيام قبل الوقت الحالي تكون القيمة التلقائية disabled.

استخدِم هذه السمة لانتهاء صلاحية المحتوى المفهرَس سابقًا والذي لم يتم تعديله منذ فترة. على سبيل المثال، يمكنك ضبط المدة على 365 يومًا للزحف إلى المحتوى فقط إذا تم تعديله في العام الماضي.

في حال تحديد fs.lastModifiedDays، لا يمكنك أيضًا ضبط قيمة لسمة fs.lastModifiedDate.

تخطّي ميزة التحكّم في الوصول إلى مشاركة الملفات

يحافظ الموصّل تلقائيًا على سلامة التحكّم في الوصول عند إرسال قوائم التحكّم في الوصول (ACL) إلى واجهة برمجة التطبيقات للفهرسة، بما في ذلك قوائم التحكّم في الوصول في مشاركة الملفات. في بعض الإعدادات، قد لا يكون لدى أداة الربط أذونات كافية لقراءة قائمة التحكّم في الوصول إلى المشاركة. وفي هذه الحالات، لا يعرض الموصّل أي ملفات محفوظة في مشاركة الملفات هذه في نتائج البحث.

يمكنك ضبط أداة الربط لتجاهل قائمة التحكّم بالوصول إلى المشاركة حتى يتم عرض المحتوى دائمًا في نتائج البحث. في هذه الحالة، تحصل واجهة برمجة التطبيقات للفهرسة على قائمة تحكم بالوصول (ACL) للمشاركة تتيح الوصول بشكل كامل، بدلاً من قائمة تحكم بالوصول الفعلية للمشاركة.

الإعدادات المَعلمة
تخطّي ميزة التحكّم في الوصول إلى مشاركة الملفات fs.skipShareAccessControl=boolean

اضبط القيمة على false (الإعداد التلقائي) لفرض جداول أذونات الوصول إلى المشاركة. اضبط القيمة على true لتجاهل جداول التحكم في الوصول إلى المشاركة.