আপনার প্রতিষ্ঠানের Microsoft Windows শেয়ার থেকে ফলাফল ফেরত দেওয়ার জন্য আপনি Google Cloud Search সেট আপ করতে পারেন, আপনার Google Workspace কন্টেন্টের পাশাপাশি। আপনি Cloud Search File Systems কানেক্টর ব্যবহার করেন এবং নির্দিষ্ট Windows শেয়ার অ্যাক্সেস করার জন্য এটি কনফিগার করেন। একটি একক কানেক্টর ইন্সট্যান্স একাধিক Microsoft Windows শেয়ার সমর্থন করতে পারে।
গুরুত্বপূর্ণ বিবেচ্য বিষয়
ফাইল সিস্টেম সংযোগকারী স্থাপনের আগে, নিম্নলিখিত বিবেচ্য বিষয়গুলি পর্যালোচনা করুন।
ক্রমাগত স্বয়ংক্রিয় আপডেট
ডিফল্টরূপে, সংযোগকারীটি শুরু হওয়ার সময় স্টার্ট পাথগুলি (কনফিগারেশন ফাইলের fs.src থেকে মান) ক্রমাগত পর্যবেক্ষণ করে। যখন ফাইল সিস্টেম কন্টেন্ট বা অ্যাক্সেস নিয়ন্ত্রণে পরিবর্তনের রিপোর্ট করে, তখন সংযোগকারী ফাইল সিস্টেমটিকে পুনরায় ক্রল করে। এই পুনরায় ক্রলটি রিসোর্স ইনটেনসিভ হতে পারে। পর্যবেক্ষণ বন্ধ করতে, fs.monitorForUpdates কে false এ সেট করুন। এটি রিসোর্স ব্যবহার কমায় কিন্তু সংযোগকারী পরিবর্তনগুলি প্রতিফলিত করার সময় বিলম্ব করে। আরও জানুন
ডিএফএস অ্যাক্সেস নিয়ন্ত্রণ
DFS সিস্টেম তার লিঙ্কগুলিতে অ্যাক্সেস নিয়ন্ত্রণ প্রয়োগ করে এবং সাধারণত প্রতিটি DFS লিঙ্কের নিজস্ব ACL থাকে। ব্যবহারকারীর কাছে ফেরত আসা লিঙ্কগুলিকে সীমাবদ্ধ করতে DFS অ্যাক্সেস-ভিত্তিক গণনা (ABE) ব্যবহার করে। ব্যবহারকারীরা শুধুমাত্র DFS লিঙ্কগুলির একটি উপসেট দেখতে পারেন অথবা ABE হোম ডিরেক্টরিগুলিকে বিচ্ছিন্ন করলে কেবল একটি লিঙ্ক দেখতে পারেন। DFS সিস্টেমটি অতিক্রম করার সময়, সংযোগকারী DFS লিঙ্ক ACL এবং লক্ষ্যের শেয়ার ACL কে সম্মান করে; শেয়ার ACL DFS ACL থেকে উত্তরাধিকারসূত্রে প্রাপ্ত হয়।
জ্ঞাত সীমাবদ্ধতা
এই বিভাগে ফাইল সিস্টেম সংযোগকারীর জ্ঞাত সীমাবদ্ধতাগুলি তালিকাভুক্ত করা হয়েছে।
- ফাইল সিস্টেম : সংযোগকারীটি ম্যাপ করা বা স্থানীয় ড্রাইভ সমর্থন করে না।
- ডিস্ট্রিবিউটেড ফাইল সিস্টেম : UNC DFS-এ ম্যাপ করা ড্রাইভ সঠিকভাবে কাজ করে না এবং কিছু ACL সঠিকভাবে পড়া নাও হতে পারে।
- সংযোগকারীটি DFS নেমস্পেস এবং লিঙ্কগুলিকে সমর্থন করে কিন্তু DFS নেমস্পেসে নিয়মিত ফোল্ডারগুলিকে সমর্থন করে না।
-
cloudsearch.google.comএ থাকা অথবা Query API-এর মাধ্যমে ফেরত দেওয়া ফাইল লিঙ্কগুলি বেশিরভাগ ব্রাউজারে ক্লিক করা যায় না।
সিস্টেমের জন্য আবশ্যক
ফাইল সিস্টেম সংযোগকারী স্থাপন করার আগে, নিশ্চিত করুন যে হোস্ট মেশিনটি নিম্নলিখিত প্রয়োজনীয়তাগুলি পূরণ করে:
| সিস্টেমের জন্য আবশ্যক | |
|---|---|
| অপারেটিং সিস্টেম |
|
| সফটওয়্যার |
|
| ফাইল সিস্টেম প্রোটোকল |
সমর্থিত নয়: স্থানীয় উইন্ডোজ ফাইল সিস্টেম, NFS 2.0, NFS 3.0, অথবা স্থানীয় লিনাক্স ফাইল সিস্টেম। |
সংযোগকারী স্থাপন করুন
ফাইল সিস্টেম সংযোগকারী স্থাপন করতে এই পদক্ষেপগুলি অনুসরণ করুন।
পূর্বশর্ত
সংযোগকারী স্থাপন করার আগে, নিশ্চিত করুন যে আপনার পরিবেশে এই উপাদানগুলি রয়েছে:
সংযোগ স্থাপনের জন্য Google Workspace তথ্য:
- Google Workspace প্রাইভেট কী (পরিষেবা অ্যাকাউন্ট আইডি ধারণকারী)। ক্লাউড অনুসন্ধান API-তে অ্যাক্সেস কনফিগার করুন দেখুন।
- গুগল ওয়ার্কস্পেস ডেটা সোর্স আইডি। অনুসন্ধানের জন্য একটি ডেটা সোর্স যোগ করুন দেখুন।
- একটি পরিচয় উৎস আইডি। একটি পরিচয় উৎস তৈরি করুন দেখুন। যদি আপনি অ্যাক্টিভ ডিরেক্টরির সাথে সিঙ্ক করেন, তাহলে GCDS ব্যবহার করুন।
আপনার Google Workspace অ্যাডমিনিস্ট্রেটর সাধারণত এই শংসাপত্রগুলি প্রদান করতে পারেন।
নিশ্চিত করুন যে উইন্ডোজ অ্যাকাউন্টের পর্যাপ্ত অনুমতি আছে।
প্রয়োজনীয় মাইক্রোসফট উইন্ডোজ অ্যাকাউন্ট অনুমতি
সংযোগকারীটি চালিত উইন্ডোজ অ্যাকাউন্টের অবশ্যই নিম্নলিখিত অনুমতি থাকতে হবে:
- ফোল্ডারের বিষয়বস্তু তালিকাভুক্ত করুন।
- নথির বিষয়বস্তু পড়ুন।
- ফাইল এবং ফোল্ডারের বৈশিষ্ট্যগুলি পড়ুন।
- ফাইল এবং ফোল্ডারগুলির জন্য পড়ার অনুমতি (ACL)।
- মৌলিক বৈশিষ্ট্যগুলি লিখ।
এই গ্রুপগুলির একটিতে সদস্যপদ সাধারণত পর্যাপ্ত অনুমতি প্রদান করে: প্রশাসক, পাওয়ার ব্যবহারকারী, প্রিন্ট অপারেটর, অথবা সার্ভার অপারেটর।
ধাপ ১. সংযোগকারী ইনস্টল করুন
GitHub থেকে সংযোগকারী সংগ্রহস্থলটি ডাউনলোড বা ক্লোন করুন, এবং তারপর সংযোগকারী প্যাকেজটি তৈরি করুন।
GitHub থেকে সংযোগকারী সংগ্রহস্থলটি পান এবং এটি তৈরি করুন।
উইন্ডোজ সার্ভারে গিট ব্যবহার করতে:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
সরাসরি ডাউনলোড করতে:
- windows-filesystems-connector এ যান।
- ক্লোন অথবা ডাউনলোড > ডাউনলোড জিপ ক্লিক করুন।
- প্যাকেজটি আনজিপ করুন এবং ডিরেক্টরিতে যান।
অ্যাপাচি ম্যাভেন ব্যবহার করে সংযোগকারী তৈরি করুন:
পরীক্ষা এড়িয়ে যেতে,> mvn package
mvn package -DskipTestsব্যবহার করুন।আপনার ইনস্টলেশন ডিরেক্টরিতে সংযোগকারী জিপ ফাইলটি বের করুন:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
ধাপ ২. কনফিগারেশন ফাইল তৈরি করুন
সংযোগকারী ইনস্টল করার পরে, একটি কনফিগারেশন ফাইল তৈরি করুন যাতে সংযোগকারীর সেটিংস থাকে।
- সংযোগকারী ডিরেক্টরিতে,
connector-config.propertiesনামে একটি ফাইল তৈরি করুন। কী-মান জোড়া হিসেবে প্যারামিটার যোগ করুন। উদাহরণস্বরূপ:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDফাইল-সিস্টেম-নির্দিষ্ট প্যারামিটারের জন্য কনফিগারেশন প্যারামিটার রেফারেন্স দেখুন। সমস্ত ক্লাউড সার্চ সংযোগকারীর দ্বারা ব্যবহৃত সাধারণ প্যারামিটারের তালিকার জন্য, Google-সরবরাহকৃত সংযোগকারী পরামিতি দেখুন।
ধাপ ৩. লগিং সক্ষম করুন
লগের জন্য একটি ডিরেক্টরি তৈরি করুন এবং একটি লগিং কনফিগারেশন ফাইল তৈরি করুন।
- সংযোগকারী ডিরেক্টরিতে
logsনামে একটি ফোল্ডার তৈরি করুন। এই কন্টেন্ট দিয়ে
logging.propertiesনামে একটি ফাইল তৈরি করুন:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
ধাপ ৪। (ঐচ্ছিক) মিডিয়া প্রকারগুলি কনফিগার করুন
সংযোগকারীটি তার ডিফল্ট প্রক্রিয়া ব্যবহার করে ফাইল মিডিয়া প্রকারগুলি সনাক্ত করার চেষ্টা করে যা উইন্ডোজে রেজিস্ট্রি এন্ট্রির উপর নির্ভর করে। যদি কোনও ফাইল এক্সটেনশনের জন্য কোনও রেজিস্ট্রি এন্ট্রি অনুপস্থিত থাকে, তবে সংযোগকারীটি মিডিয়া প্রকারটি সঠিকভাবে সনাক্ত করতে ব্যর্থ হতে পারে। যদি মিডিয়া প্রকারগুলি সঠিকভাবে সনাক্ত না করা হয়, অথবা আপনি যদি কোনও এক্সটেনশনের জন্য ডিফল্ট প্রকারটি ওভাররাইড করতে চান, তাহলে এই পদক্ষেপগুলি অনুসরণ করুন:
- সংযোগকারী ডিরেক্টরিতে
mime-type.propertiesনামে একটি ফাইল তৈরি করুন। - এক্সটেনশন এবং প্রকারগুলি
extension=media/typeহিসেবে লিখুন:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
ধাপ ৫. ফাইল সিস্টেম সংযোগকারীটি চালান।
হোস্ট মেশিন থেকে সংযোগকারী চালু করুন:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config] ডিফল্টরূপে, সংযোগকারীটি সংযোগকারীটি যে ডিরেক্টরিতে চালানো হয় সেখানে connector-config.properties নামে একটি কনফিগারেশন ফাইল অনুসন্ধান করে। যদি আপনার কনফিগারেশন ফাইলের নাম ভিন্ন হয় বা অন্য কোনও ডিরেক্টরিতে থাকে, তাহলে এর পথ নির্দিষ্ট করতে -Dconfig প্যারামিটার ব্যবহার করুন।
কনফিগারেশন প্যারামিটার রেফারেন্স
নিম্নলিখিত টেবিলগুলি ফাইল সিস্টেম সংযোগকারী কনফিগার করতে ব্যবহৃত পরামিতিগুলির তালিকা এবং বর্ণনা করে।
ডেটা সোর্স অ্যাক্সেস
| বিন্যাস | প্যারামিটার |
| ডেটা সোর্স আইডি | api.sourceId= 1234567890abcdefপ্রয়োজনীয়। ক্লাউড সার্চ সোর্স আইডি। |
| পরিষেবা অ্যাকাউন্ট | api.serviceAccountPrivateKeyFile= ./PrivateKey.jsonপ্রয়োজনীয়। পরিষেবা অ্যাকাউন্ট কী ফাইলের পথ। |
| পরিচয় উৎস আইডি | api.identitySourceId= x0987654321প্রয়োজন। GCDS ব্যবহার করে সক্রিয় ডিরেক্টরি পরিচয় সিঙ্ক করার জন্য Google Workspace প্রশাসক দ্বারা সেট আপ করা ক্লাউড সার্চ পরিচয় উৎস আইডি। |
ফাইল সিস্টেম অ্যাক্সেস
ক্রল করার জন্য ফাইল সিস্টেমের উৎসগুলি নির্দিষ্ট করতে এই প্যারামিটারগুলি ব্যবহার করুন।
| বিন্যাস | প্যারামিটার |
| উৎস ফাইল সিস্টেম | fs.src= path1 [, path2 , ...] প্রয়োজনীয়। |
পথ বিভাজক অক্ষর
| বিন্যাস | প্যারামিটার |
| পথ বিভাজক অক্ষর | fs.src.separator= separator-characterডিফল্ট বিভাজক হল ";"। যদি আপনার সোর্স পাথে সেমিকোলন থাকে, তাহলে আপনি একটি ভিন্ন ডিলিমিটার সেট করতে পারেন, যেমন একটি কমা (","), যা আপনার পাথের অক্ষরের সাথে বিরোধ করে না এবং সম্পত্তি ফাইল সিনট্যাক্স দ্বারা সংরক্ষিত নয়। যদি |
সংযোগকারীর আচরণ
সংযোগকারী কীভাবে ফাইল সিস্টেম ক্রল করে তা টিউন করতে এই পরামিতিগুলি ব্যবহার করুন।
| বিন্যাস | প্যারামিটার |
| উইন্ডোজ ডোমেইন | fs.supportedDomain= domainGCDS ব্যবহার করে সেট আপ করা ব্যবহারকারীদের ক্লাউড সার্চের মাধ্যমে ডকুমেন্ট অ্যাক্সেস করার অনুমতি দেওয়ার জন্য প্রয়োজনীয়। অ্যাক্টিভ ডিরেক্টরির একটি একক NetBIOS ডোমেন নাম হিসাবে উল্লেখ করুন। |
| ACLS-এ অ্যাকাউন্ট অন্তর্ভুক্ত করুন | fs.supportedAccounts= account-1[, account-2,...]ACL-তে অন্তর্ভুক্ত করার জন্য কমা-বিভাজিত অ্যাকাউন্টগুলির একটি তালিকা, সেগুলি অন্তর্নির্মিত অ্যাকাউন্ট কিনা তা বিবেচনা না করেই। ডিফল্ট মান হল |
| ACL থেকে বিল্ট-ইন অ্যাকাউন্ট বাদ দিন | fs.builtinGroupPrefix= prefixবিল্ট-ইন অ্যাকাউন্টের উপসর্গ উল্লেখ করুন। এই উপসর্গ দিয়ে শুরু হওয়া একটি অ্যাকাউন্টকে বিল্ট-ইন অ্যাকাউন্ট হিসেবে বিবেচনা করা হবে এবং ACL থেকে বাদ দেওয়া হবে। ডিফল্ট মান হল |
| লুকানো ফাইল এবং ফোল্ডারগুলির সূচীকরণের অনুমতি দিন | fs.crawlHiddenFiles= boolean লুকানো ফাইল ক্রল করতে |
| ক্রল করা ফোল্ডার তালিকা এবং DFS নেমস্পেস গণনার ইন্ডেক্সিং মঞ্জুরি দিন | fs.indexFolders= boolean যখন |
| ফাইল সিস্টেম পরিবর্তন পর্যবেক্ষণ সক্ষম করুন | fs.monitorForUpdates= boolean যখন |
| ডিরেক্টরিগুলির ক্যাশের সর্বোচ্চ আকার নির্ধারণ করুন | fs.directoryCacheSize= number-of-entriesডিরেক্টরি ক্যাশের সর্বোচ্চ আকার। সংযোগকারী লুকানো ফোল্ডার সনাক্ত করতে ক্যাশ ব্যবহার করে যাতে লুকানো ফোল্ডারে ফাইল এবং ফোল্ডার সূচী করা না যায়। ডিফল্টভাবে ৫০,০০০ এন্ট্রি থাকে, যা সাধারণত ১০-১৫ মেগাবাইট র্যাম ব্যবহার করে। |
টাইমস্ট্যাম্প সংরক্ষণ
সংযোগকারী কীভাবে টাইমস্ট্যাম্প সংরক্ষণ পরিচালনা করে তা নির্দিষ্ট করতে এই পরামিতিগুলি ব্যবহার করুন।
| বিন্যাস | প্যারামিটার |
| অ্যাক্সেসের সময় সংরক্ষণ করুন | fs.preserveLastAccessTime= valueফাইল এবং ফোল্ডার ক্রল করার সময়, সংযোগকারী তাদের শেষ অ্যাক্সেস টাইমস্ট্যাম্পটি ক্রলের সময় পরিবর্তন করতে পারে। যদি শেষ অ্যাক্সেসের সময় সংরক্ষণ না করা হয়, তাহলে ব্যাকআপ এবং আর্কাইভ সিস্টেমগুলি উপযুক্ত ফাইল এবং ফোল্ডারগুলিকে সেকেন্ডারি স্টোরেজে স্থানান্তর করতে পারে না কারণ সংযোগকারী সেগুলি অ্যাক্সেস করেছে। ডিফল্টরূপে, সম্ভাব্য মানগুলির মধ্যে রয়েছে:
|
| নির্দিষ্ট তারিখের পরে অ্যাক্সেস করা ফাইলগুলি কেবল ক্রল করুন | fs.lastAccessedDate= YYYY-MM-DD নির্দিষ্ট তারিখের পরে শেষ অ্যাক্সেসের সময় হলেই কেবল কন্টেন্ট ক্রল করুন (YYYY-MM-DD, ISO8601 ফর্ম্যাট)। ডিফল্ট |
| শুধুমাত্র গত কয়েক দিনের মধ্যে অ্যাক্সেস করা ফাইলগুলি ক্রল করুন | fs.lastAccessedDays= number-of-days যদি শেষ অ্যাক্সেসের সময় বর্তমান থেকে নির্দিষ্ট দিনের মধ্যে থাকে তবেই কেবল কন্টেন্ট ক্রল করুন। ডিফল্ট |
| শুধুমাত্র নির্দিষ্ট তারিখের পরে পরিবর্তিত ফাইলগুলি ক্রল করুন | fs.lastModifiedDate= YYYY-MM-DD যদি শেষ পরিবর্তিত সময় নির্দিষ্ট তারিখের পরে হয় (YYYY-MM-DD, ISO8601 ফর্ম্যাট) তবেই কেবল সামগ্রী ক্রল করুন। ডিফল্টটি |
| শুধুমাত্র গত কয়েক দিনের মধ্যে পরিবর্তিত ফাইলগুলি ক্রল করুন | fs.lastModifiedDays= number-of-days যদি শেষ পরিবর্তনের সময় বর্তমান থেকে নির্দিষ্ট দিনের মধ্যে থাকে তবেই কেবল কন্টেন্ট ক্রল করুন। ডিফল্ট |
ফাইল শেয়ার ACL গুলি এড়িয়ে যান
যদি সংযোগকারীর কাছে পড়ার অনুমতি না থাকে, তাহলে আপনি সংযোগকারীটিকে শেয়ার ACL উপেক্ষা করার জন্য সেট করতে পারেন। এরপর কন্টেন্টটি একটি অনুমতিমূলক শেয়ার ACL সহ ফেরত পাঠানো হয়।
| বিন্যাস | প্যারামিটার |
| শেয়ার ACL গুলি এড়িয়ে যান | fs.skipShareAccessControl= boolean শেয়ার ACL গুলি উপেক্ষা করতে |