इस पेज का अनुवाद Cloud Translation API से किया गया है.

कॉन्टेंट कनेक्टर बनाना

कॉन्टेंट कनेक्टर एक सॉफ़्टवेयर प्रोग्राम होता है. इसका इस्तेमाल, किसी एंटरप्राइज़ के रिपॉज़िटरी (डेटा स्टोर करने की जगह) में मौजूद डेटा को दिखाने और किसी डेटा सोर्स में अपने-आप जानकारी भरने के लिए किया जाता है. Google, कॉन्टेंट कनेक्टर बनाने के लिए ये विकल्प उपलब्ध कराता है:

कॉन्टेंट कनेक्टर SDK टूल. अगर आपको Java में प्रोग्रामिंग करनी है, तो यह एक अच्छा विकल्प है. कॉन्टेंट कनेक्टर SDK टूल, REST API के लिए एक रैपर है. इससे फटाफट कनेक्टर बनाए जा सकते हैं. SDK टूल का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाने के लिए, Content Connector SDK टूल का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाना देखें.
लो-लेवल का REST API या एपीआई लाइब्रेरी. अगर आपको Java में प्रोग्राम नहीं करना है या आपके कोडबेस में REST API या लाइब्रेरी में बेहतर सुविधा मिलती है, तो इन विकल्पों का इस्तेमाल करें. REST API का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाने के लिए, REST API का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाना देखें.

सामान्य कॉन्टेंट कनेक्टर ये काम करता है:

कॉन्फ़िगरेशन पैरामीटर को पढ़ता और प्रोसेस करता है.
तीसरे पक्ष के कॉन्टेंट रिपॉज़िटरी से, इंडेक्स किए जा सकने वाले डेटा के अलग-अलग हिस्से इकट्ठा करता है, जिन्हें "items" कहा जाता है.
एसीएल, मेटाडेटा, और कॉन्टेंट डेटा को इंडेक्स किए जा सकने वाले आइटम में जोड़ता है.
Cloud Search डेटा सोर्स में आइटम इंडेक्स करता है.
(ज़रूरी नहीं) तीसरे पक्ष के कॉन्टेंट को स्टोर करने की जगह से मिलने वाली सूचनाओं में होने वाले बदलाव को सुनता है. बदलाव की सूचनाओं को इंडेक्स करने के अनुरोधों में बदल दिया जाता है, ताकि Cloud Search के डेटा सोर्स को तीसरे पक्ष के डेटा सोर्स के साथ सिंक रखा जा सके. कनेक्टर यह काम सिर्फ़ तब करता है, जब रिपॉज़िटरी में बदलाव का पता लगाने की सुविधा काम करती हो.

कॉन्टेंट कनेक्टर SDK टूल का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाना

यहां दिए गए सेक्शन में, Content Connector SDK टूल का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाने का तरीका बताया गया है.

डिपेंडेंसी सेट अप करें

SDK टूल का इस्तेमाल करने के लिए, आपको अपनी बिल्ड फ़ाइल में कुछ डिपेंडेंसी शामिल करनी होंगी. अपने बिल्ड एनवायरमेंट की डिपेंडेंसी देखने के लिए, नीचे दिए गए टैब पर क्लिक करें:

Maven

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

ग्रेडल

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

अपना कनेक्टर कॉन्फ़िगरेशन बनाएं

हर कनेक्टर में एक कॉन्फ़िगरेशन फ़ाइल होती है जिसमें, कनेक्टर के इस्तेमाल किए जाने वाले पैरामीटर मौजूद होते हैं. जैसे, रिपॉज़िटरी की आपकी आईडी. पैरामीटर को कुंजी-वैल्यू पेयर के तौर पर परिभाषित किया जाता है, जैसे कि api.sourceId=1234567890abcdef.

Google Cloud Search SDK टूल में, Google के ऐसे कई कॉन्फ़िगरेशन पैरामीटर शामिल हैं जिनका इस्तेमाल सभी कनेक्टर करते हैं. आपको अपनी कॉन्फ़िगरेशन फ़ाइल में Google के दिए गए इन पैरामीटर के बारे में जानकारी देनी होगी:

कॉन्टेंट कनेक्टर के लिए, आपको api.sourceId और api.serviceAccountPrivateKeyFile के बारे में एलान करना होगा, क्योंकि ये पैरामीटर आपके रिपॉज़िटरी और निजी पासकोड की जगह की पहचान करते हैं, जो रिपॉज़िटरी को ऐक्सेस करने के लिए ज़रूरी है.

आइडेंटिटी कनेक्टर के लिए, आपको api.identitySourceId का एलान करना होगा, क्योंकि यह पैरामीटर आपके बाहरी आइडेंटिटी सोर्स की लोकेशन की पहचान करता है. अगर उपयोगकर्ताओं को सिंक किया जा रहा है, तो आपको अपने एंटरप्राइज़ के Google Workspace खाते के लिए, api.customerId को भी यूनीक आईडी के तौर पर बताना होगा.

जब तक आपको Google के उपलब्ध कराए गए अन्य पैरामीटर की डिफ़ॉल्ट वैल्यू को बदलना न हो, तब तक आपको उन्हें अपनी कॉन्फ़िगरेशन फ़ाइल में बताने की ज़रूरत नहीं है. Google के दिए गए कॉन्फ़िगरेशन पैरामीटर के बारे में ज़्यादा जानकारी, जैसे कि कुछ आईडी और कुंजियों को जनरेट करने का तरीका जानने के लिए, Google के उपलब्ध कराए गए कॉन्फ़िगरेशन पैरामीटर देखें.

अपनी कॉन्फ़िगरेशन फ़ाइल में इस्तेमाल के लिए, रिपॉज़िटरी के अपने खास पैरामीटर भी तय किए जा सकते हैं.

कॉन्फ़िगरेशन फ़ाइल को कनेक्टर पर पास करें

कॉन्फ़िगरेशन फ़ाइल को अपने कनेक्टर में भेजने के लिए, सिस्टम प्रॉपर्टी config को सेट करें. कनेक्टर शुरू करते समय, -D आर्ग्युमेंट का इस्तेमाल करके, प्रॉपर्टी को सेट किया जा सकता है. उदाहरण के लिए, यह कमांड, कनेक्टर को MyConfig.properties कॉन्फ़िगरेशन फ़ाइल के साथ शुरू करता है:

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

अगर यह आर्ग्युमेंट मौजूद नहीं है, तो SDK टूल, connector-config.properties नाम की डिफ़ॉल्ट कॉन्फ़िगरेशन फ़ाइल को ऐक्सेस करने की कोशिश करता है.

अपनी ट्रैवर्सल रणनीति तय करना

कॉन्टेंट कनेक्टर का मुख्य काम, किसी रिपॉज़िटरी (डेटा स्टोर करने की जगह) को एक्सप्लोर करना और उसके डेटा को इंडेक्स करना होता है. आपको अपनी रिपॉज़िटरी में डेटा के साइज़ और लेआउट के आधार पर ट्रैवर्सल रणनीति लागू करनी होगी. अपनी रणनीति खुद डिज़ाइन की जा सकती है या SDK टूल में लागू की गई इन रणनीतियों में से किसी एक को चुना जा सकता है:

ट्रैवर्सल की पूरी रणनीति

एक फ़ुल ट्रैवर्सल स्ट्रेटजी, डेटा स्टोर करने की पूरी जगह को स्कैन करती है और बिना सोचे-समझे हर आइटम को इंडेक्स करती है. आम तौर पर इस रणनीति का इस्तेमाल तब किया जाता है, जब आपके पास एक छोटा डेटा स्टोर होता है. साथ ही, आपके पास हर बार इंडेक्स करने पर एक पूरा ट्रैवर्सल करने का खर्च भी हो सकता है.

यह ट्रैवर्सल रणनीति, डेटा स्टोर करने की ऐसी छोटी जगहों के लिए सही है जिनमें ज़्यादातर स्टैटिक, बिना हैरारकी वाला डेटा हो. इस ट्रैवर्सल रणनीति का इस्तेमाल तब भी किया जा सकता है, जब बदलाव का पता लगाना मुश्किल हो या रिपॉज़िटरी के साथ काम न करता हो.

ट्रैवर्सल की रणनीति की सूची बनाएं

लिस्ट ट्रैवर्सल रणनीति, सभी चाइल्ड नोड के साथ पूरे रिपॉज़िटरी को स्कैन करती है. इसमें हर आइटम की स्थिति तय की जाती है. इसके बाद, कनेक्टर एक सेकंड पास लेता है और सिर्फ़ उन आइटम को इंडेक्स करता है जो नए हैं या जिन्हें पिछली बार इंडेक्स किए जाने के बाद अपडेट किया गया है. आम तौर पर, इस रणनीति का इस्तेमाल किसी मौजूदा इंडेक्स को अपडेट करने के लिए किया जाता है. इसका इस्तेमाल इंडेक्स को अपडेट करने के लिए, हर बार पूरा ट्रैवर्सल करने की ज़रूरत नहीं होती.

यह ट्रैवर्सल रणनीति तब सही होती है, जब बदलाव का पता लगाना मुश्किल हो या डेटा स्टोर करने की जगह के साथ काम न करता हो, आपके पास बिना हैरारकी वाला डेटा हो, और बहुत बड़े डेटा सेट के साथ काम किया जा रहा हो.

ग्राफ़ ट्रैवर्सल

ग्राफ़ ट्रैवर्सल रणनीति, हर आइटम की स्थिति तय करने के लिए पूरे पैरंट नोड को स्कैन करती है. इसके बाद, कनेक्टर दूसरा पास लेता है और सिर्फ़ रूट नोड में मौजूद आइटम इंडेक्स करता है. इसके अलावा, यह भी हो सकता है कि वे नए आइटम हों या उन्हें पिछली बार इंडेक्स किए जाने के बाद अपडेट किया गया हो. आखिर में, कनेक्टर किसी भी चाइल्ड आईडी को पास करता है और फिर चाइल्ड नोड में नए या अपडेट किए गए आइटम को इंडेक्स करता है. जब तक सभी आइटम ठीक नहीं हो जाते, तब तक कनेक्टर सभी चाइल्ड नोड में बार-बार होता रहता है. आम तौर पर, ऐसे ट्रैवर्सल का इस्तेमाल हैरारकी के रिपॉज़िटरी के लिए किया जाता है, जहां सभी आईडी की लिस्टिंग करना सही नहीं होता.

अगर आपके पास क्रम के हिसाब से डेटा है, जिसे क्रॉल करने की ज़रूरत है, तो यह रणनीति सही है. जैसे, डायरेक्ट्री या वेब पेजों की सीरीज़.

इनमें से हर ट्रैवर्सल रणनीति, SDK टूल में टेंप्लेट कनेक्टर क्लास की मदद से लागू की जाती है. हालांकि, खुद की ट्रैवर्सल रणनीति लागू की जा सकती है, लेकिन इन टेंप्लेट की मदद से आपके कनेक्टर के डेवलपमेंट की प्रोसेस बहुत तेज़ी से होती है. किसी टेंप्लेट का इस्तेमाल करके कनेक्टर बनाने के लिए, अपनी ट्रैवर्सल रणनीति से जुड़े सेक्शन पर जाएं:

टेंप्लेट क्लास का इस्तेमाल करके, पूरा ट्रैवर्सल कनेक्टर बनाना
टेंप्लेट क्लास का इस्तेमाल करके, लिस्ट ट्रैवर्सल कनेक्टर बनाना
टेंप्लेट क्लास का इस्तेमाल करके, ग्राफ़ ट्रैवर्सल कनेक्टर बनाना

टेंप्लेट क्लास का इस्तेमाल करके, पूरा ट्रैवर्सल कनेक्टर बनाना

दस्तावेज़ का यह सेक्शन, FullTraversalSample उदाहरण में दिए गए कोड स्निपेट के बारे में बताता है.

कनेक्टर का एंट्री पॉइंट लागू करना

किसी कनेक्टर का एंट्री पॉइंट, main() तरीका होता है. इस तरीके का मुख्य टास्क है, Application क्लास का इंस्टेंस बनाना और कनेक्टर को चलाने के लिए इसके start() तरीके को शुरू करना.

application.start() को कॉल करने से पहले, FullTraversalConnector टेंप्लेट को इंस्टैंशिएट करने के लिए, IndexingApplication.Builder क्लास का इस्तेमाल करें. FullTraversalConnector, Repository ऑब्जेक्ट को स्वीकार करता है, जिसके मेथड को लागू किया जाता है. यहां दिया गया कोड स्निपेट, main() तरीके को लागू करने का तरीका दिखाता है:

FullTraversalSample.java

कॉन्टेंट कनेक्टर बनाना

कॉन्टेंट कनेक्टर SDK टूल का इस्तेमाल करके कॉन्टेंट कनेक्टर बनाना

डिपेंडेंसी सेट अप करें

Maven

ग्रेडल

अपना कनेक्टर कॉन्फ़िगरेशन बनाएं

कॉन्फ़िगरेशन फ़ाइल को कनेक्टर पर पास करें

अपनी ट्रैवर्सल रणनीति तय करना

टेंप्लेट क्लास का इस्तेमाल करके, पूरा ट्रैवर्सल कनेक्टर बनाना

कनेक्टर का एंट्री पॉइंट लागू करना

Repository इंटरफ़ेस को लागू करें

कस्टम कॉन्फ़िगरेशन पैरामीटर पाएं

पूरा ट्रैवर्सल करना

किसी आइटम के लिए अनुमतियां सेट करना

किसी आइटम के लिए मेटाडेटा सेट करना

इंडेक्स करने लायक आइटम बनाना

इंडेक्स किए जा सकने वाले हर आइटम को इटरेटर में पैकेज करें

अगले चरण

टेंप्लेट क्लास का इस्तेमाल करके, लिस्ट ट्रैवर्सल कनेक्टर बनाना

कनेक्टर का एंट्री पॉइंट लागू करना

Repository इंटरफ़ेस को लागू करें

कस्टम कॉन्फ़िगरेशन पैरामीटर पाएं

सूची ट्रैवर्सल करना

आइटम आईडी और हैश वैल्यू को पुश करें

हर आइटम को वापस पाएं और मैनेज करें

मिटाए गए आइटम मैनेज करना

बदलाव नहीं किए गए आइटम मैनेज करना

किसी आइटम के लिए अनुमतियां सेट करना

किसी आइटम के लिए मेटाडेटा सेट करना

इंडेक्स करने लायक आइटम बनाना

अगले चरण

टेंप्लेट क्लास का इस्तेमाल करके, ग्राफ़ ट्रैवर्सल कनेक्टर बनाना

कनेक्टर का एंट्री पॉइंट लागू करना

Repository इंटरफ़ेस को लागू करें

कस्टम कॉन्फ़िगरेशन पैरामीटर पाएं

ग्राफ़ ट्रैवर्सल करना

आइटम आईडी और हैश वैल्यू को पुश करें

हर आइटम को वापस पाएं और मैनेज करें

मिटाए गए आइटम मैनेज करना

किसी आइटम के लिए अनुमतियां सेट करना

किसी आइटम के लिए मेटाडेटा सेट करना

इंडेक्स करने लायक आइटम बनाना

चाइल्ड आईडी को Cloud Search इंडेक्स करने की सूची में डालें

अगले चरण

REST API का इस्तेमाल करके, कॉन्टेंट कनेक्टर बनाना

अपनी ट्रैवर्सल रणनीति तय करना

अपनी ट्रैवर्सल रणनीति और इंडेक्स आइटम लागू करें

डेटा स्टोर करने की जगह के बदलावों को मैनेज करना

`Repository` इंटरफ़ेस को लागू करें

`Repository` इंटरफ़ेस को लागू करें

`Repository` इंटरफ़ेस को लागू करें