يمكنك إعداد Google Cloud Search لعرض نتائج من ملفّات مشاركة Microsoft Windows في مؤسستك بالإضافة إلى محتوى Google Workspace. يمكنك استخدام موصل "أنظمة الملفات" في Google Cloud Search وضبطه للوصول إلى موارد مشترَكة محدّدة في Windows. يمكن أن تتوافق نسخة واحدة من الموصّل مع عدة موارد مشترَكة في Microsoft Windows.
اعتبارات مهمة
التحديثات التلقائية المستمرة
يتتبّع الموصِّل بشكلٍ تلقائي مسارات البدء (القيم من fs.src
في ملف إعدادات الموصِّل) عند بدء تشغيله. عندما يُبلغ نظام الملفات عن تغييرات في عناصر التحكّم بالوصول أو المحتوى، يتم تفعيل الموصّل لإعادة الزحف إلى نظام الملفات. يمكن أن تستهلك عملية إعادة الزحف هذه الكثير من الموارد. لإيقاف مراقبة نظام الملفات، اضبط fs.monitorForUpdates
على false
. يمكنك تقليل استخدام الموصّل للموارد بشكل كبير، ولكنّ ذلك يؤدّي إلى تأخير ظهور التغييرات في الموصّل. مزيد من المعلومات
التحكّم في الوصول إلى نظام الملفات الموزَّع
يطبّق نظام DFS عنصر التحكّم في الوصول على روابطه، وعادةً ما يكون لكل رابط DFS قائمة ACL خاصة به. من الآليات التي تستخدمها خدمة "الفهرسة المستندة إلى الوصول" (ABE) هي التعداد المستند إلى الوصول، والذي يمكن أن يحدّ من روابط "الفهرسة المستندة إلى البيانات" التي يتم عرضها للمستخدم. قد يحصل المستخدمون على مجموعة فرعية فقط من روابط DFS، أو حتى رابط واحد فقط عندما تعزل ABE الدلائل المنزلية المستضافة. عندما ينتقل الموصّل عبر نظام DFS، يراعي الموصّل قائمة التحكّم بالوصول إلى رابط DFS وقائمة التحكّم بالوصول إلى المشاركة المستهدَفة، وتتوارث قائمة التحكّم بالوصول إلى المشاركة قائمة التحكّم بالوصول إلى DFS.
القيود المعروفة
- نظام الملفات: لا يتوافق محوِّل أنظمة الملفات مع محركات الأقراص المُعرَّفة ومحركات الأقراص المحلية.
- نظام الملفات الموزَّعة: لا يعمل محرك الأقراص المرتبط بنظام الملفات الموزَّعة (DFS) عبر بروتوكول UNC بشكل صحيح. لا تتم قراءة بعض قوائم التحكّم في الوصول بشكل صحيح.
- يتوافق موصل أنظمة الملفات مع مساحات أسماء نظام الملفات الموزَّعة (DFS) والروابط. ومع ذلك، لا يتيح الموصّل روابط DFS إلا في مساحة اسم DFS، وليس المجلدات العادية في مساحة اسم DFS.
- لا يمكن النقر على روابط الملفات التي يتم عرضها في cloudsearch.google.com. لا يمكن النقر على روابط الملفات التي تعرضها Query API في معظم المتصفّحات أيضًا.
متطلبات النظام
متطلبات النظام | |
---|---|
نظام التشغيل |
|
البرامج |
|
بروتوكولات نظام الملفات |
غير متوافقة: أنظمة ملفات Windows المحلية أو نظام ملفات الشبكة (NFS) 2.0 من Sun أو نظام ملفات الشبكة (NFS) 3.0 من Sun أو نظام ملفات Linux المحلي |
نشر الموصّل
المتطلبات الأساسية
قبل نشر محوِّل أنظمة الملفات في Cloud Search، تأكَّد من أنّ بيئتك تتضمّن جميع المكوّنات الأساسية التالية:
معلومات Google Workspace المطلوبة لإنشاء علاقات بين Google Cloud Search ومصدر البيانات:
- مفتاح Google Workspace الخاص (الذي يحتوي على رقم تعريف حساب الخدمة) للحصول على معلومات عن الحصول على مفتاح خاص، انتقِل إلى مقالة ضبط الوصول إلى Google Cloud Search REST API.
- رقم تعريف مصدر بيانات Google Workspace للحصول على معلومات عن الحصول على رقم تعريف مصدر بيانات، انتقِل إلى إضافة مصدر بيانات إلى البحث.
- رقم تعريف مصدر الهوية للحصول على معلومات عن كيفية الحصول على رقم تعريف مصدر الهوية، انتقِل إلى إنشاء مصدر هوية. في حال مزامنة دليل Google Workspace مع Active Directory، عليك إعداد مصدر الهوية باستخدام GCDS.
يمكن لمشرف Google Workspace في مؤسستك عادةً تزويدك بهذه بيانات الاعتماد.
تأكَّد من أنّ حساب Windows لديه أذونات كافية، كما هو موضَّح في القسم التالي.
أذونات حساب Microsoft Windows المطلوبة
يجب أن يكون لحساب Microsoft Windows الذي يعمل عليه أداة الربط أذونات كافية لتنفيذ الإجراءات التالية:
- إدراج محتوى المجلدات
- قراءة محتوى المستندات
- قراءة سمات الملفات والمجلدات
- أذونات القراءة (قوائم التحكّم بالوصول) لكلٍّ من الملفات والمجلدات
- أذونات كتابة السمات الأساسية
يمنح الانضمام إلى إحدى المجموعات التالية حساب Windows الأذونات الكافية التي يحتاجها الموصّل:
- المشرفون
- المستخدمون المتقدّمون
- عوامل تشغيل الطباعة
- مشغّلو الخوادم
الخطوة 1: تثبيت موصل أنظمة الملفات في Google Cloud Search
احصل على مستودع الموصّل من GitHub وأنشئ الموصّل.
لاستخدام git على خادم Windows:
استنسِخ المستودع:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
اطّلِع على الإصدار المطلوب من الموصّل:
> git checkout tags/v1-0.0.3
لتنزيل التطبيق من GitHub مباشرةً:
- انتقِل إلى https://github.com/google-cloudsearch/windows-filesystems-connector.
- انقر على نسخة طبق الأصل أو تنزيل تنزيل ملف zip.
- فكِّ ضغط الحزمة.
- انتقِل إلى الدليل الجديد:
> cd windows-filesystems-connector
أنشئ الموصّل. ثبِّت Apache Maven إذا لزم الأمر.
> mvn package
لتخطّي الاختبارات عند إنشاء الموصِّل، شغِّل
mvn package -DskipTests
بدلاً منmvn package
.انسخ ملف zip الخاص بالموصّل إلى دليل التثبيت على الجهاز:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
الخطوة 2: إنشاء ملف إعداد الموصِّل
في الدليل نفسه الذي تم فيه تثبيت أداة الربط، أنشئ ملفًا واسمه
connector-config.properties
.أضِف المَعلمات كأزواج مفتاح/قيمة إلى محتوى الملف، كما هو موضّح في المثال التالي:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
للحصول على أوصاف تفصيلية لكل مَعلمة، انتقِل إلى مرجع مَعلمات الضبط.
(اختياري) اضبط مَعلمات الموصِّل الأخرى حسب الحاجة. لمعرفة التفاصيل، انتقِل إلى مَعلمات الموصِّل المقدَّمة من Google.
الخطوة 3: تمكين التسجيل
- أنشئ مجلدًا باسم
logs
في الدليل الذي يحتوي على ملف الموصِّل الثنائي. أنشئ ملفًا بترميز ASCII أو UTF-8 باسم
logging.properties
في الدليل الذي يحتوي على الملف الثنائي للموصّل وأضِف المحتوى التالي:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
الخطوة 4. (اختياري) ضبط أنواع الوسائط
يحاول الموصِّل تلقائيًا رصد نوع الوسائط لكل ملف باستخدام ميزة رصد نوع الوسائط التي يوفّرها JDK . على نظام التشغيل Microsoft Windows، يعتمد JDK على سجلّ Windows لتحديد أنواع الوسائط للملفات. يمكن أن يؤدي عدم توفّر إدخال في السجلّ إلى عدم توفّر نوع وسائط معيّن لملفّات معيّنة.
إذا لزم الأمر، يمكنك تحديد نوع وسائط يحلّ محلّ أيّ عمليات ربط حالية أو يمنع استخدام نوع وسائط فارغ.
- في دليل الموصِّل، أنشِئ ملفًا مشفَّرًا بترميز Latin-1 باسم
mime-type.properties
. أدخِل امتدادات الملفات وأنواع الوسائط المقابلة لها كما هو موضّح في الأمثلة التالية:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
الخطوة 5: تشغيل موصِّل "أنظمة الملفات"
بعد تثبيت موصل "أنظمة الملفات" وضبطه، لتشغيله على الجهاز المضيف، شغِّل أمرًا مثل المثال التالي:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
حدِّد مسار ملف الإعدادات إذا كان مختلفًا عن المسار التلقائي (في الدليل نفسه الذي يتضمّن الملف الثنائي الذي يحمل الاسم connector-config.properties
).
مرجع مَعلمات الإعدادات
الوصول إلى مصدر البيانات
الإعدادات | المَعلمة |
معرّف مصدر البيانات | api.sourceId=1234567890abcdef
مطلوب. رقم تعريف مصدر Google Cloud Search الذي أعدّه مشرف Google Workspace |
مسار ملف المفتاح الخاص لحساب الخدمة | api.serviceAccountPrivateKeyFile=./PrivateKey.json
مطلوب. ملف مفتاح حساب خدمة Google Cloud Search للوصول إلى موصل "أنظمة الملفات" في Google Cloud Search |
رقم تعريف مصدر الهوية | api.identitySourceId=x0987654321
مطلوب. رقم تعريف مصدر الهوية في Cloud Search الذي أعدّه مشرف Google Workspace لمزامنة هويات Active Directory باستخدام GCDS. |
الوصول إلى نظام الملفات
الإعدادات | المَعلمة |
أنظمة ملفات المصدر | fs.src=path1[,path2, ...]
مطلوب. حدِّد أنظمة الملفات المصدر كأحد مصادر UNC أو أكثر مفصولة بالمحدِّد الذي تم ضبطه بواسطة |
حرف فاصل المسار
الإعدادات | المَعلمة |
حرف فاصل المسار | fs.src.separator=separator-character
الفصل التلقائي هو ";". إذا كانت مسارات المصدر تحتوي على فاصلة منقوطة، يمكنك ضبط فاصل مختلف، مثل فاصلة (",")، لا يتعارض مع الأحرف في المسارات ولا يكون محجوزًا من خلال بنية ملف السمة نفسها. إذا كانت قيمة |
سلوك الموصِّل
الإعدادات | المَعلمة |
نطاق Windows | fs.supportedDomain=domain
مطلوب للسماح للمستخدمين الذين تم إعدادهم باستخدام GCDS بالوصول إلى المستندات من خلال Cloud Search. حدِّد اسم نطاق NetBIOS واحدًا في Active Directory. |
تضمين الحسابات في أذونات الوصول المحدودة | fs.supportedAccounts=account-1[, account-2,...]
قائمة بالحسابات التي يجب تضمينها في جداول أذونات الوصول، بغض النظر عمّا إذا كانت حسابات مدمجة القيمة التلقائية هي |
استبعاد الحسابات المضمّنة من جداول التحكم في الوصول | fs.builtinGroupPrefix=prefix
حدِّد البادئة للحسابات المضمّنة. يُعتبر الحساب الذي يبدأ بهذه البادئة حسابًا مضمّنًا وسيتم استبعاده من قوائم التحكّم بالوصول. القيمة التلقائية هي |
السماح بفهرسة الملفات والمجلدات المخفية | fs.crawlHiddenFiles=boolean
اضبط القيمة على |
السماح بفهرسة بيانات المجلدات التي تم الزحف إليها وعمليات سرد مساحات أسماء DFS | fs.indexFolders=boolean
عند ضبطه على |
تفعيل مراقبة التغييرات في نظام الملفات | fs.monitorForUpdates=boolean
عند ضبط القيمة على |
ضبط الحد الأقصى لحجم ذاكرة التخزين المؤقت للأدلة | fs.directoryCacheSize=number-of-entries
الحد الأقصى لحجم ذاكرة التخزين المؤقت للدليل يستخدم الموصّل ذاكرة التخزين المؤقت لتحديد المجلدات المخفية لتجنُّب فهرسة الملفات والمجلدات في المجلدات المخفية. الإعداد التلقائي هو 50,000 إدخال، ويستهلك عادةً من 10 إلى 15 ميغابايت من ذاكرة الوصول العشوائي. |
الحفاظ على الطابع الزمني والتحكّم في الزحف
الإعدادات | المَعلمة |
الاحتفاظ بالطابع الزمني لآخر عملية وصول | fs.preserveLastAccessTime=value
عندما يزحف الموصّل إلى الملفات والمجلدات، يمكن أن يغيّر الموصّل الطابع الزمني لآخر عملية وصول إلى الملفات والمجلدات إلى وقت الزحف. في حال عدم الاحتفاظ بأوقات الوصول الأخيرة، قد لا تنقل أنظمة الاحتفاظ بنسخة احتياطية والأرشفة الملفات والمجلدات المناسبة إلى مساحة التخزين الثانوية بسبب زيارة الموصّل. يحاول الموصّل تلقائيًا الاحتفاظ بوقت الوصول الأخير ( القيم المتاحة:
|
الزحف إلى الملفات التي تم الوصول إليها بعد تاريخ معيّن فقط | fs.lastAccessedDate=YYYY-MM-DD
الزحف إلى المحتوى فقط إذا كان وقت الوصول الأخير بعد التاريخ المحدّد تكون القيمة التلقائية حدِّد التاريخ بتنسيق ISO8601: YYYY-MM-DD. على سبيل المثال، إذا كانت القيمة هي 2010-01-01، لا يزحف الموصّل إلا إلى المحتوى الذي تم الوصول إليه بعد بداية عام 2010. في حال تحديد |
الزحف إلى الملفات التي تم الوصول إليها خلال عدد الأيام السابق فقط | fs.lastAccessedDays=number-of-days
الزحف إلى المحتوى فقط إذا كان وقت الوصول الأخير ضمن عدد الأيام قبل الوقت الحالي تكون القيمة التلقائية استخدِم هذه السمة لانتهاء صلاحية المحتوى المفهرَس سابقًا والذي لم يتم الوصول إليه منذ فترة. على سبيل المثال، يمكنك ضبط المدة على 365 يومًا للزحف إلى المحتوى فقط إذا تم الوصول إليه في العام الماضي. في حال تحديد |
الزحف إلى الملفات التي تم تعديلها بعد تاريخ معيّن فقط | fs.lastModifiedDate=YYYY-MM-DD
الزحف إلى المحتوى فقط إذا كان وقت آخر تعديل بعد التاريخ المحدّد تكون القيمة التلقائية حدِّد التاريخ بتنسيق ISO8601: YYYY-MM-DD. على سبيل المثال، إذا كانت القيمة هي 01-01-2010، لا يزحف الموصّل إلا إلى المحتوى الذي تم تعديله بعد بداية عام 2010. في حال تحديد |
الزحف إلى الملفات التي تم تعديلها خلال عدد الأيام السابق فقط | fs.lastModifiedDays=number-of-days
الزحف إلى المحتوى فقط إذا كان وقت آخر تعديل ضمن عدد الأيام قبل الوقت الحالي تكون القيمة التلقائية استخدِم هذه السمة لانتهاء صلاحية المحتوى المفهرَس سابقًا والذي لم يتم تعديله منذ فترة. على سبيل المثال، يمكنك ضبط المدة على 365 يومًا للزحف إلى المحتوى فقط إذا تم تعديله في العام الماضي. في حال تحديد |
تخطّي ميزة التحكّم في الوصول إلى مشاركة الملفات
يحافظ الموصّل تلقائيًا على سلامة التحكّم في الوصول عند إرسال قوائم التحكّم في الوصول (ACL) إلى واجهة برمجة التطبيقات للفهرسة، بما في ذلك قوائم التحكّم في الوصول في مشاركة الملفات. في بعض الإعدادات، قد لا يكون لدى أداة الربط أذونات كافية لقراءة قائمة التحكّم في الوصول إلى المشاركة. وفي هذه الحالات، لا يعرض الموصّل أي ملفات محفوظة في مشاركة الملفات هذه في نتائج البحث.
يمكنك ضبط أداة الربط لتجاهل قائمة التحكّم بالوصول إلى المشاركة حتى يتم عرض المحتوى دائمًا في نتائج البحث. في هذه الحالة، تحصل واجهة برمجة التطبيقات للفهرسة على قائمة تحكم بالوصول (ACL) للمشاركة تتيح الوصول بشكل كامل، بدلاً من قائمة تحكم بالوصول الفعلية للمشاركة.
الإعدادات | المَعلمة |
تخطّي ميزة التحكّم في الوصول إلى مشاركة الملفات | fs.skipShareAccessControl=boolean
اضبط القيمة على |