कॉन्फ़िगरेशन फ़ाइलों की मदद से Programmable Search Engine बनाना

इस पेज पर, Programmable Search Engine की कॉन्फ़िगरेशन फ़ाइलों से जुड़ी बुनियादी बातों के बारे में बताया गया है.

  1. खास जानकारी
  2. Programmable Search Engine में क्या होता है
  3. कॉम्पोनेंट एक साथ कैसे काम करते हैं
  4. सर्च इंजन बनाना
  5. Programmable Search Engine फ़ाइलों में बदलाव करना
  6. सही फ़ॉर्मैट चुनना

खास जानकारी

अगर कंट्रोल पैनल में आपको मनमुताबिक कस्टमाइज़ेशन की ज़रूरत नहीं है, तो Programmable Search के एक्सएमएल फ़ॉर्मैट का इस्तेमाल करें. इससे आपको ज़्यादा कंट्रोल और बेहतर सुविधाओं का ऐक्सेस मिलता है.

Programmable Search Engine की कॉन्फ़िगरेशन फ़ाइलों का इस्तेमाल करने के लिए, सबसे पहले Programmable Search Engine कंट्रोल पैनल का इस्तेमाल करके, बेसिक सर्च इंजन बनाएं. अपना सर्च इंजन बना लेने के बाद, आप कंट्रोल पैनल के खास जानकारी पेज से अपनी एनोटेशन और कॉन्टेक्स्ट एक्सएमएल फ़ाइलें डाउनलोड कर सकते हैं.

एक्सएमएल की बुनियादी बातें

एक्सटेंसिबल मार्कअप लैंग्वेज या XML एक सामान्य मार्कअप भाषा है. यह टैग वाला टेक्स्ट होता है, जिसे पढ़ा जा सकता है. उदाहरण के लिए, Programmable Search के एक्सएमएल फ़ॉर्मैट में, ये टैग शामिल होते हैं: <Context> </Context> और <LookAndFeel> </LookAndFeel>.

किसी भी एक्सएमएल फ़ाइल की तरह, Programmable Search Engine की खास जानकारी, एक्सएमएल सिंटैक्स (<element attribute="value">content</element>) के हिसाब से होनी चाहिए और इसे सही फ़ॉर्मैट में होना चाहिए. एक्सएमएल में ये नियम होते हैं:

  • एक्सएमएल के लिए, आपको अपने टॉप लेवल टैग से पहले एक्सएमएल एलान (<?xml version="1.0"?>) करना होगा. हालांकि, Programmable Search Engine की कॉन्फ़िगरेशन फ़ाइल को इसकी ज़रूरत नहीं होती.
  • आपके सभी एलिमेंट में ओपनिंग टैग (<tag>) और एक क्लोज़िंग टैग (</tag>) होना चाहिए.
  • आपके सभी टैग सही तरीके से नेस्ट किए जाने चाहिए. आपके पास ऐसा एक्सएमएल कोड नहीं हो सकता जो ऐसा दिखता हो: <sandwich><filling> peanut butter</sandwich></filling>. इसके बजाय, यह इस तरह होना चाहिए: <sandwich><filling> peanut butter</filling></sandwich>.
  • एक्सएमएल केस-सेंसिटिव (बड़े और छोटे अक्षरों में अंतर) होता है. इसलिए, निर्देशों में टैग के कैपिटल लेटर और स्पेलिंग का ध्यान से रखें.
  • सभी एट्रिब्यूट की वैल्यू, डबल कोटेशन मार्क (<element attribute="value">) में होनी चाहिए.
  • सभी एट्रिब्यूट की जानकारी, शुरुआती टैग (<element attribute="value">) में दी जानी चाहिए, न कि क्लोज़िंग टैग ( </element>) में.

टिप्पणी वाले टैग (<!-- your comment here -->) का इस्तेमाल करके, अपने लिए नोट लिखे जा सकते हैं. Programmable Search Engine, टेक्स्ट की उस लाइन को एक्सएमएल कोड के तौर पर पार्स नहीं करेगा. रिमाइंडर या ब्यौरा लिखने के अलावा, टिप्पणियों का इस्तेमाल करके कुछ एक्सएमएल कोड को कमीशन से कुछ समय के लिए हटाया जा सकता है. ऐसा तब किया जा सकता है, जब आपको कुछ इफ़ेक्ट के साथ एक्सपेरिमेंट करना हो या आपको समस्याओं को हल करना हो. हालांकि, ये टिप्पणियां आपके द्वारा कंट्रोल पैनल से डाउनलोड की जाने वाली फ़ाइलों में सुरक्षित नहीं रखी जाती हैं. अगर आप टिप्पणियां बनाए रखना चाहते हैं, तो आपको कंट्रोल पैनल पर अपलोड करने के बाद भी अपनी टिप्पणी की गई एक्सएमएल फ़ाइलों की एक कॉपी अपने पास रखनी चाहिए.

एक्सएमएल फ़ाइलें बनाने और उनमें बदलाव करने के लिए, किसी सामान्य टेक्स्ट एडिटर का इस्तेमाल किया जा सकता है. टेक्स्ट फ़ाइल को बस .xml फ़ाइल एक्सटेंशन के साथ सेव करें (उदाहरण के लिए, cse_badminton.xml).

वापस सबसे ऊपर जाएं

Programmable Search Engine में क्या होता है

Programmable Search Engine में दो मुख्य कॉम्पोनेंट होते हैं. इनमें से हर कॉम्पोनेंट को एक्सएमएल फ़ाइल से कंट्रोल किया जाता है:

  • कॉन्टेक्स्ट: कॉन्टेक्स्ट एक्सएमएल फ़ाइल में, सर्च इंजन की बुनियादी सुविधाओं के बारे में बताया जाता है. यह सर्च इंजन की ग्लोबल सेटिंग के बारे में बताता है, जैसे कि इमेज सर्च या प्रमोशन चालू हैं या नहीं. हर सर्च इंजन की अपनी कॉन्टेक्स्ट फ़ाइल होती है. कॉन्टेक्स्ट एक्सएमएल फ़ाइल के बारे में ज़्यादा जानकारी. अपने सर्च इंजन के लिए सबसे सही फ़ाइल फ़ॉर्मैट चुनने के बारे में ज़्यादा जानकारी के लिए, अपने सर्च इंजन के लिए सही फ़ॉर्मैट चुनना लेख पढ़ें.
  • व्याख्या: एनोटेशन एक्सएमएल फ़ाइल में उन वेबपेजों या वेबसाइटों की सूची होती है जिन्हें आपको अपना सर्च इंजन इस्तेमाल करना है. साथ ही, इसमें इन साइटों को आपके खोज नतीजों में रैंक किए जाने के तरीके के बारे में आपकी पसंद की जानकारी भी शामिल होती है. हर साइट और उससे जुड़ी जानकारी को एनोटेशन कहा जाता है. एनोटेशन एक्सएमएल फ़ाइल के बारे में ज़्यादा जानकारी.

हमारा सुझाव है कि आप इनमें से किसी भी फ़ाइल को शुरुआत से न बनाएं. इसके बजाय, उन्हें कंट्रोल पैनल के खास जानकारी पेज से डाउनलोड करें.

इन मुख्य कॉम्पोनेंट के अलावा, किसी सर्च इंजन में ये सहायक फ़ाइलें भी हो सकती हैं:

  • प्रमोशन: प्रमोशन की एक्सएमएल फ़ाइल में, कस्टम नतीजों की ऐसी सीरीज़ की सूची होती है जो क्वेरी शब्दों के पहले से तय किए गए सेट से ट्रिगर होते हैं. जब कोई उपयोगकर्ता ऐसी खोज टाइप करता है जो आपकी किसी क्वेरी के लिए शब्द से पूरी तरह मेल खाती है, तब प्रमोशन पेज में सबसे ऊपर दिखता है. अपने उपयोगकर्ताओं की क्वेरी का सीधे जवाब देने के लिए, प्रमोशन का इस्तेमाल किया जा सकता है. साथ ही, उन्हें ज़रूरी जानकारी पर ले जाया जा सकता है या उन्हें ऐसे वेबपेजों पर ले जाया जा सकता है जो फ़िलहाल नतीजे वाले पेज पर सबसे ऊपर नहीं हैं, लेकिन खास तौर से उनके लिए काम के हैं. कंट्रोल पैनल में, प्रमोशन प्रमोशन टैब में दिखते हैं. प्रमोशन के बारे में ज़्यादा जानकारी.
  • समानार्थी शब्द: समानार्थी शब्द एक्सएमएल फ़ाइल, खोज शब्द के वैरिएंट शामिल करने के लिए आपके उपयोगकर्ताओं की क्वेरी को बड़ा करती है. उदाहरण के लिए, अगर आपका उपयोगकर्ता "सिमियन" खोजता है, तो सर्च इंजन "बंदर" और "ape" को भी खोजता है. कंट्रोल पैनल में, समानार्थी शब्द टैब में समानार्थी शब्द बताए जाते हैं. समानार्थी शब्दों के बारे में ज़्यादा जानकारी.

घटक एक साथ कैसे काम करते हैं

संदर्भ एक्सएमएल फ़ाइल में एनोटेशन फ़ाइल के बारे में नहीं बताया गया है और एनोटेशन एक्सएमएल में संदर्भ फ़ाइल का कोई रेफ़रंस नहीं दिया गया है. Programmable Search Engine, कॉन्टेक्स्ट और एनोटेशन को जोड़ने के लिए, लेबल का इस्तेमाल करता है. कॉन्टेक्स्ट एक्सएमएल फ़ाइल में सर्च इंजन की पहचान करने वाले लेबल शामिल होते हैं और एनोटेशन एक्सएमएल में लिस्ट की गई हर जानकारी को, अपने सर्च इंजन की पहचान करने वाले एक या एक से ज़्यादा लेबल से टैग किया जाता है.अगर कॉन्टेक्स्ट फ़ाइल में लेबल का नाम बदला जाता है, तो आपको उस लेबल के साथ टैग किए गए सभी एनोटेशन को बदलना होगा.

हालांकि, आपके पास एनोटेशन फ़ाइलों को अपलोड करने का विकल्प होता है, लेकिन जब उन्हें कंट्रोल पैनल से डाउनलोड किया जाता है, तो Programmable Search Engine आपकी एनोटेशन फ़ाइलों को एक एनोटेशन फ़ाइल में मर्ज कर देता है. एनोटेशन फ़ाइलों की मदद से, एक ही साइट को अलग-अलग सर्च इंजन के लिए अपनी पसंद के मुताबिक बनाया जा सकता है. उदाहरण के लिए, एक सर्च इंजन अपनी खोज को कुछ साइटों तक सीमित कर सकता है, दूसरा उन साइटों को खत्म कर सकता है, और दूसरा उन साइटों को प्रमोट कर सकता है.

context.xml

यहां कॉन्टेक्स्ट.xml फ़ाइल का एक उदाहरण दिया गया है. इसमें उस सर्च इंजन की पहचान करने वाले लेबल हैं जिस पर यह लागू होता है:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

यहां एनोटेशन फ़ाइल का एक उदाहरण दिया गया है, जिसमें दिखाया गया है कि हर साइट (एनोटेशन) किसी लेबल से कैसे जुड़ी है:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

वापस सबसे ऊपर जाएं

बेहतर Programmable Search Engines बनाना

बेहतर इंजन बनाने के लिए, इन चरणों को पूरा करना होता है:

  1. अपनी ज़रूरत के मुताबिक, फ़ॉर्मैट तय करें.
  2. अपने सर्च इंजन की ज़रूरी शर्तें तय करें.
  3. Programmable Search Engine को बताएं कि किन साइटों को खोजना है.
  4. Programmable Search Engine को खोज के नतीजों की रैंकिंग करने का तरीका बताएं.

Programmable Search Engine की फ़ाइलों में बदलाव करना

किसी एक्सएमएल फ़ाइल पर काम करने के लिए, कंट्रोल पैनल के खास जानकारी पेज से एक्सएमएल स्पेसिफ़िकेशन डाउनलोड करें. नए सिरे से फ़ाइल बनाना शुरू न करें. तो निम्न कार्य करें:

  1. कंट्रोल पैनल के खास जानकारी पेज से, संदर्भ फ़ाइल या एनोटेशन फ़ाइल डाउनलोड करें. खोज सुविधाएं सेक्शन में, डाउनलोड करें बटन पर क्लिक करें.
  2. ऐसे टेक्स्ट एडिटर का इस्तेमाल करें जो UNIX शैली की लाइन के आखिरी हिस्सों (WordPad, Emacs, और TextMate काम करता है) को हैंडल कर सकता है. हालांकि, Notepad काम नहीं करता. इससे फ़र्क़ नहीं पड़ता कि आपने फ़ाइल को क्या नाम दिया है. हालांकि, इसे फ़ाइल एक्सटेंशन .xml का इस्तेमाल करके सेव करना ज़रूरी है, जैसे कि cx_global.xml
  3. डाउनलोड की गई फ़ाइल की बैकअप कॉपी बना लें. इससे, अगर आपका बदलाव किया गया वर्शन उम्मीद के मुताबिक काम नहीं करता है और आपको पिछले वर्शन पर वापस जाना पड़ता है, तो यह काम नहीं करेगा.

    अगर कॉपी नहीं की जाती है और आपने जिस वर्शन में बदलाव किया है वह ठीक से काम नहीं करता, तो आपको अपनी फ़ाइल को डीबग करना होगा या अपना सर्च इंजन फिर से बनाना होगा. मज़ेदार नहीं है.

  4. एक्सएमएल फ़ाइल में बदलाव करें और उसे सेव करें. पक्का करें कि आपका टेक्स्ट एडिटर, फ़ाइल को यूनिकोड टेक्स्ट दस्तावेज़ के तौर पर सेव कर रहा हो, न कि किसी दूसरे फ़ाइल फ़ॉर्मैट के तौर पर.
  5. खास जानकारी पेज पर, खोज की सुविधाएं सेक्शन में जाकर फ़ाइल अपलोड करें.

सही फ़ॉर्मैट चुनना

Programmable Search Engine बनाने से पहले, यह तय कर लें कि आपकी ज़रूरत के हिसाब से कौनसा फ़ॉर्मैट सबसे सही है. ऐसा फ़ॉर्मैट नहीं चुनना चाहिए जो आपकी ज़रूरत से ज़्यादा असरदार और मुश्किल हो. साथ ही, ऐसा फ़ॉर्मैट भी न चुनें जिसे आप जल्द से जल्द आगे बढ़ा पाएं.

सही फ़ॉर्मैट चुनने के लिए, इस टेबल का इस्तेमाल करें.

बनाने के लिए बिक्री और आय बढ़ाने के लिए, क्योंकि सीमाएं ज़्यादा जानकारी
बहुत कम साइटों के साथ एक या कुछ सर्च इंजन कंट्रोल पैनल टेक्स्ट एडिटर का इस्तेमाल करके फ़ाइलें बनाने और उन्हें अपलोड करने के बजाय, टेक्स्ट बॉक्स में टेक्स्ट बॉक्स भरकर तेज़ी से अपना Programmable Search Engine बनाया जा सकता है. कंट्रोल पैनल की मदद से, Programmable Search Engine के बारे में जाना जा सकता है. साथ ही, कुछ साइटों की मदद से सर्च इंजन बनाए जा सकते हैं. शुरू करना
कई साइटों का इस्तेमाल करने वाले कॉम्प्लेक्स सर्च इंजन, जो फ़ीड का इस्तेमाल करते हैं कॉन्टेक्स्ट फ़ाइल और एनोटेशन फ़ाइलें

Programmable Search Engine की फ़ाइलों की मदद से, सर्च इंजन को बेहतर तरीके से कंट्रोल किया जा सकता है. साथ ही, इनसे साइटें तय और मैनेज करना काफ़ी आसान हो जाता है.

भले ही आपकी योजना संदर्भ और एनोटेशन फ़ाइलों का उपयोग करके अपना खोज इंजन बनाने की हो, कंट्रोल पैनल से खुद का परिचय कराना फिर भी एक अच्छा विचार है.

सर्च इंजन को जितना ज़्यादा कस्टमाइज़ किया जाएगा, यह उतना ही मुश्किल हो जाएगा. आपको Programmable Search के एलिमेंट और एट्रिब्यूट को सीखना होगा. इन्हें इस्तेमाल करना मुश्किल नहीं है, लेकिन इन्हें लागू करने के लिए आपको कुछ समय देना पड़ता है.

दुर्भाग्य से, आपको डेवलपर गाइड का बाकी हिस्सा पढ़ना होगा, जो पढ़ने में सबसे रोमांचक सामग्री नहीं है.

कॉन्टेक्स्ट: सर्च इंजन की खास बातों को तय करना और व्याख्या: साइटें चुनना

वापस सबसे ऊपर जाएं