Google Cloud Search में कई डिफ़ॉल्ट एक्सटेंशन, व्याख्याएं, और ऑप्टिमाइज़ेशन होते हैं. इनसे खोज के नतीजों पर असर पड़ता है. अगर आपको खोज क्वेरी के अनचाहे नतीजे दिख रहे हैं, तो Cloud Search की सहायता टीम से संपर्क करने से पहले, इस गाइड को पढ़ें.
डिफ़ॉल्ट तौर पर बड़े किए गए विज्ञापन
मान लें कि कोई व्यक्ति [Joe’s PDFs] जैसी स्ट्रिंग का इस्तेमाल करके खोज रहा है. हालांकि, खोज के कुछ नतीजों में “documents" जैसे हाइलाइट किए गए शब्द शामिल हैं, न कि "PDFs." नतीजों में ऐसे हाइलाइट किए गए शब्द क्यों शामिल हैं जो खोज क्वेरी में नहीं थे?
डिफ़ॉल्ट रूप से, Google Cloud Search, Google Web Search की तरह ही, सिर्फ़ क्वेरी में मौजूद शब्दों को नहीं खोजता. इसके बजाय, Cloud Search क्वेरी को बड़ा करता है, ताकि इसमें समानार्थी शब्द और शब्द के मूल रूप शामिल किए जा सकें. भले ही, आपने अपने समानार्थी शब्द लागू न किए हों. क्वेरी के आइडिया और मकसद से मिलते-जुलते दस्तावेज़ों को वापस पाने के लिए, क्वेरी को बड़ा किया जाता है. दस्तावेज़ों का यह बड़ा सेट चुनने के बाद, रैंकिंग एल्गोरिदम यह पक्का करते हैं कि सबसे मिलते-जुलते दस्तावेज़, नतीजों के सेट में सबसे ऊपर दिखें.
जब उपयोगकर्ता ने [Joe’s PDFs] खोजा, तो Cloud Search ने इन शब्दों को अतिरिक्त शब्दों के तौर पर इस्तेमाल किया:
- [Joe’s] के लिए, Cloud Search "joe" (स्टेम एक्सपैंशन) और "joes" (विराम चिह्न के आधार पर समानार्थी शब्द) से भी मिलान कर सकता है.
- [PDFs] के लिए, Cloud Search "documents" (समानार्थी शब्द) और "pdf" (स्टेम एक्सपैंशन) से भी मिलान कर सकता है.
डिफ़ॉल्ट रूप से, समानार्थी शब्द दोनों दिशाओं में नहीं होते हैं. उदाहरण के लिए, अगर कोई उपयोगकर्ता “फ़िशिंग” शब्द खोजता है, तो Cloud Search, “फ़िश” को समानार्थी शब्द के तौर पर मैच कर सकता है. हालांकि, अगर उपयोगकर्ता “फ़िश” शब्द खोजता है, तो हो सकता है कि Google, “फ़िशिंग” को एक्सपैंशन के तौर पर मैच न करे.
हाइफ़न वाले शब्दों के मुकाबले, हाइफ़न के बिना लिखे गए शब्दों के लिए ज़्यादा विकल्प
जब उपयोगकर्ता हाइफ़न वाले शब्दों के बजाय, उनके बिना हाइफ़न वाले शब्दों को खोजता है, जैसे कि [वॉक-इन क्लोज़ेट] और [वॉक इन क्लोज़ेट], तो Cloud Search इन क्वेरी को अलग-अलग तरीके से प्रोसेस करता है.
इसके अलावा, हाइफ़न और अंडरस्कोर वाले शब्दों, जैसे कि [walk-in] और [walk_in] के लिए अलग-अलग ऑप्टिमाइज़ेशन का इस्तेमाल किया जाता है.
डिफ़ॉल्ट रूप से बड़े किए गए व्यू के लिए, जगह का हिसाब लगाना
डिफ़ॉल्ट रूप से, किसी भी तरह के विस्तार की कोई गारंटी नहीं होती. अगर आपको यह पक्का करना है कि समानार्थी शब्दों या डोमेन के हिसाब से समानार्थी शब्दों के एक्सपैंशन, दोनों दिशाओं में काम करें, तो डोमेन के हिसाब से समानार्थी शब्दों का अपना सेट बनाएं. समानार्थी शब्दों को लागू करने के बारे में ज़्यादा जानने के लिए, समानार्थी शब्द तय करना लेख पढ़ें.
डिफ़ॉल्ट इंटरप्रिटेशन
Cloud Search, सामान्य भाषा में लिखे गए शब्दों को समझने की सुविधा भी देता है. इससे किसी क्वेरी में इस्तेमाल किए गए ऑब्जेक्ट, प्रॉपर्टी, और फ़ील्ड वैल्यू को समझा जा सकता है. ऐसा, किसी डेटा सोर्स के लिए अपलोड किए गए स्कीमा के हिसाब से किया जाता है. आम बोलचाल की भाषा में की गई क्वेरी को समझने की सुविधा के बारे में ज़्यादा जानने के लिए, क्वेरी को बेहतर तरीके से समझने के लिए अपने स्कीमा को स्ट्रक्चर करें लेख पढ़ें.
नैचुरल लैंग्वेज इंटरप्रिटेशन की सुविधा बंद करना
किसी क्वेरी के लिए, सामान्य भाषा में जवाब पाने की सुविधा बंद करने के लिए, खोज के अनुरोध में QueryInterpretationOptions.disableNlInterpretation
को true
पर सेट करें.
डिफ़ॉल्ट ऑप्टिमाइज़ेशन
Cloud Search, डिफ़ॉल्ट रूप से ये ऑप्टिमाइज़ेशन भी करता है:
स्पेलिंग ठीक करने की सुविधा से मिले नतीजों को मिलाना. उदाहरण के लिए, अगर क्वेरी स्ट्रिंग [corpoate benefits] थी, तो Cloud Search, "corpoate" और “corporate” की सही स्पेलिंग से मैच करेगा.
जिन क्वेरी के लिए कोई नतीजा नहीं मिलता या कम नतीजे मिलते हैं उनके लिए Cloud Search, मिलते-जुलते शब्दों का ज़्यादा इस्तेमाल करता है. ये शब्द, सीधे तौर पर समानार्थी शब्दों से ज़्यादा होते हैं. ज़्यादा जानकारी के लिए, अतिरिक्त नतीजों को मैनेज करना लेख पढ़ें.
दस्तावेज़ों और क्वेरी को सामान्य बनाना
नॉर्मलाइज़ करने का मतलब है कि किसी क्वेरी के पहले या बाद में, कुछ शब्दों या वाक्यांशों को स्टैंडर्ड बनाना. अपनी क्वेरी के लिए ज़्यादा सटीक जवाब पाने के लिए, अपने दस्तावेज़ों (इंडेक्स करने से पहले या उसके दौरान) और क्वेरी (उपयोगकर्ता के क्वेरी करने के बाद) को इन तरीकों से सामान्य करें:
दस्तावेज़ों को सामान्य बनाने के लिए:
- अपनी रिपॉज़िटरी में मौजूद दस्तावेज़ों में इस्तेमाल किए गए ज़रूरी शब्दों के लिए, कैननिकल स्पेलिंग चुनें.
- सोर्स रिपॉज़िटरी के दस्तावेज़ों में स्पेलिंग ठीक करें. इसके अलावा, कॉन्टेंट को इंडेक्स करते समय भी स्पेलिंग ठीक करें, ताकि वह कैननिकल स्पेलिंग से मेल खाए.
क्वेरी को सामान्य बनाने के लिए:
- उपयोगकर्ता की क्वेरी को Cloud Search पर भेजने से पहले इंटरसेप्ट करें.
- इंडेक्स किए गए डेटा सोर्स में सबसे ज़्यादा इस्तेमाल की गई स्पेलिंग से मेल खाने के लिए, उपयोगकर्ता की क्वेरी में मौजूद शब्दों को फिर से लिखता है.
- क्वेरी को Cloud Search पर भेजें.
सभी क्वेरी के लिए, जवाब को बड़ा करने, उसकी व्याख्या करने, और उसे ऑप्टिमाइज़ करने की सुविधा बंद करना
किसी क्वेरी के लिए, जवाब को बड़ा करने, उसकी व्याख्या करने, और उसे बेहतर बनाने की सुविधा बंद करने के लिए, खोज के अनुरोध में QueryInterpretationOptions.enableVerbatim Mode
को true
पर सेट करें.