आम तौर पर, किसी संगठन में किसी सिद्धांत या चीज़ के बारे में बताने के लिए, यूनीक शब्दावली या कई तरीके अपनाए जाते हैं. शब्दों की समानता तय करने के लिए, समानार्थी शब्द बनाने चाहिए, ताकि खोज करते समय उपयोगकर्ताओं को आइटम ढूंढने में मदद मिल सके.
समानार्थी शब्द, _dictionaryEntry
लोकप्रिय स्कीमा के साथ आइटम को इंडेक्स करके तय किए जाते हैं.
_dictionaryEntry
टाइप के आइटम में ये प्रॉपर्टी हो सकती हैं:
प्रॉपर्टी | टाइप | ब्यौरा | ज़रूरी है? |
---|---|---|---|
_term |
string | परिभाषित किया जाने वाला शब्द. सुझाई गई वैल्यू, बिना हाइफ़न वाले शब्दों या वाक्यांशों को होती हैं. | ज़रूरी है |
_synonym |
string (repeated) | _term में बताई गई स्ट्रिंग से मेल खाने वाली क्वेरी में शामिल किए जाने वाले वैकल्पिक शब्द. |
ज़रूरी है |
_onlyApplicableForAttachedSearchApplications |
boolean | आपको डेटा सोर्स और खोज ऐप्लिकेशन के हिसाब से, समानार्थी शब्दों को ग्रुप में बांटने की सुविधा मिलती है. ज़्यादा जानकारी के लिए, डेटा सोर्स के हिसाब से समानार्थी शब्द तय करना देखें. | ज़रूरी नहीं |
जब कोई उपयोगकर्ता किसी क्वेरी में _term
प्रॉपर्टी की वैल्यू शामिल करता है, तो लागू होने वाली क्वेरी, "शब्द या समानार्थी शब्द" बन जाती है. उदाहरण के लिए, अगर
"scifi" शब्द को समानार्थी शब्द
"science fiction" से परिभाषित किया गया है, तो "scifi" शब्द वाली क्वेरी,
"scifi" या "science fiction." वाले
आइटम से मेल खाती है
समानार्थी शब्द, दो-तरफ़ा नहीं लागू होते. अगर क्वेरी "science fiction," के लिए है, तो उस क्वेरी में कोई समानार्थी शब्द लागू नहीं होता है. क्वेरी में सिर्फ़ उन आइटम से मेल खाता है जिनमें "scifi" वाले "science fiction." आइटम मौजूद हैं.
दोनों शब्दों को आपस में बदलने लायक बनाने के लिए, हर शब्द को अलग-अलग तय करें:
टर्म | समानार्थी शब्द |
---|---|
scifi | science fiction |
science fiction | scifi |
क्वेरी प्रोसेसिंग के दौरान, समानार्थी शब्द लागू करने से पहले, हाइफ़न और दूसरे विराम चिह्न हटा दिए जाते हैं. उपयोगकर्ता की क्वेरी "sci-fi"
_term
से मेल खाती है "sci fi."
जिन शब्दों को उपयोगकर्ता हाइफ़न कर सकते हैं उनके समानार्थी शब्द बनाने के लिए, पहले _term
को सामान्य करें, ताकि हाइफ़न के बजाय खाली सफ़ेद जगह का इस्तेमाल किया जा सके.
इस उदाहरण में आगे दी गई परिभाषाएं, उपयोगकर्ता क्वेरी के हिसाब से "sci-fi," "sci fi," "scifi," और "science fiction" को आपस में बदल सकती हैं:
टर्म | समानार्थी शब्द |
---|---|
scifi | science fiction, sci fi |
sci fi | science fiction, scifi |
science fiction | scifi, sci fi |
डिफ़ॉल्ट रूप से, किसी भी डेटा सोर्स में मौजूद समानार्थी शब्द पूरे डोमेन पर लागू होते हैं. खास तौर पर, डेटा सोर्स पर ध्यान दिए बिना, सभी खोजों के लिए खोज ऐप्लिकेशन में समानार्थी शब्द लागू किए जाते हैं. अगर आपको डेटा सोर्स के हिसाब से समानार्थी शब्द चाहिए, तो डेटा सोर्स के हिसाब से समानार्थी शब्द तय करने वाला लेख पढ़ें.
Cloud Search SDK टूल का इस्तेमाल करके, दुनिया भर के लिए समानार्थी शब्द तय करें
शब्दों और उनके समानार्थी शब्दों को परिभाषित करने के लिए, कॉन्टेंट कनेक्टर SDK टूल का इस्तेमाल किया जा सकता है. कनेक्टर बनाने के निर्देश पाने के लिए, कॉन्टेंट कनेक्टर बनाना लेख पढ़ें.
नीचे दिया गया स्निपेट, CSV फ़ाइल रिकॉर्ड के आधार पर शब्द और समानार्थी शब्द को दर्शाने वाले RepositoryDoc
को बनाने के बारे में बताता है:
समानार्थी शब्द तय करते समय, इन बातों का ध्यान रखें:
- समानार्थी शब्दों वाली एंट्री को डोमेन सार्वजनिक होना ज़रूरी है. पिछले उदाहरण में,
एीएल को
DOMAIN_PUBLIC_ACL
पर सेट करके ऐसा किया जाता है. - आपकी कॉन्फ़िगरेशन फ़ाइल के लिए ये प्रॉपर्टी नहीं तय की जानी चाहिए, क्योंकि
ये आपके कोड में डोमेन की सार्वजनिक सेटिंग को बदल देती हैं:
defaultAcl.mode=FALLBACK
defaultAcl.public=true
खोज ऐप्लिकेशन-विशिष्ट समानार्थी शब्द परिभाषित करें
डिफ़ॉल्ट रूप से, सभी खोज ऐप्लिकेशन में सभी डेटा सोर्स पर समानार्थी शब्द लागू होते हैं.
हालांकि, मान लें कि आपके संगठन की इंजीनियरिंग और सेल्स टीम की अलग-अलग टीमें हैं और आपको हर टीम को अलग खोज अनुभव उपलब्ध कराना है. इसमें नौकरी के लिए खास तौर पर बने समानार्थी शब्द भी शामिल हैं. इस मामले में, एक सर्च ऐप्लिकेशन बनाया जा सकता है, जिसमें इंजीनियरिंग वाले डेटा सोर्स और समानार्थी शब्द (एक जैसे मतलब वाले शब्द) हों. साथ ही, दूसरा सर्च ऐप्लिकेशन, जिसमें बिक्री से जुड़े डेटा सोर्स और समानार्थी शब्द हों. इस लक्ष्य को पूरा करने के लिए, _onlyApplicableForAttachedSearchApplications=true
का इस्तेमाल करके किसी खास डेटा सोर्स में हर समानार्थी शब्द को इंडेक्स करें. यह सेटिंग समानार्थी शब्दों को सीमित करती है, जैसे कि वे सिर्फ़ उन खोज ऐप्लिकेशन पर लागू की जाती हैं जिनमें कोई खास डेटा सोर्स शामिल होता है.
उदाहरण के लिए, पिछले कोड सैंपल में कोड की नीचे दी गई लाइन जोड़ने से यह पक्का होता है कि इंडेक्स किए गए समानार्थी शब्द, डेटा सोर्स के हिसाब से हैं:
structuredData.put("_onlyApplicableForAttachedSearchApplications", true);