शुक्रवार, 3 जून, 2022
इस हफ़्ते, हमने एल्गोरिदम को बेहतर बनाने की शुरुआत की है. इसकी मदद से ऐसे दस्तावेज़ों की पहचान की जाती है जिनका शीर्षक एलिमेंट, अपने कॉन्टेंट से अलग भाषा या स्क्रिप्ट में लिखा गया हो. साथ ही, हम ऐसा शीर्षक चुनते हैं जो दस्तावेज़ की भाषा और स्क्रिप्ट से मिलता-जुलता है. यह इस सामान्य सिद्धांत पर आधारित है कि किसी दस्तावेज़ का शीर्षक, उसके मुख्य कॉन्टेंट की भाषा या स्क्रिप्ट में ही लिखा जाना चाहिए. यह भी एक वजह है कि हम वेब नतीजे के शीर्षकों के लिए शीर्षक एलिमेंट के शब्दों पर न जाकर, उन्हें बेहतर तरीके से समझ सकते हैं.
कई भाषाओं में उपलब्ध शीर्षक
कई भाषाओं वाले शीर्षकों में एक ही वाक्यांश दो अलग-अलग भाषाओं या स्क्रिप्ट के साथ दोहराया जाता है. सबसे ज़्यादा लोकप्रिय पैटर्न, अंग्रेज़ी वर्शन को मूल शीर्षक टेक्स्ट में जोड़ना है.
गीतांजलि की जीवनी - Geetanjali Biography in Hindi
इस उदाहरण में, शीर्षक के दो हिस्से (हाइफ़न से अलग किए गए) हैं और वे एक ही कॉन्टेंट को अलग-अलग भाषाओं (हिन्दी और अंग्रेज़ी) में दिखाते हैं. हालांकि, शीर्षक दोनों भाषाओं में मौजूद है, लेकिन दस्तावेज़ सिर्फ़ हिन्दी में लिखा है. हमारा सिस्टम इस तरह की गड़बड़ी का पता लगाता है. साथ ही, हो सकता है कि सिर्फ़ हिन्दी हेडलाइन टेक्स्ट का इस्तेमाल किया जाए, जैसे:
गीतांजलि की जीवनी
लैटिन स्क्रिप्ट के शीर्षक
जब कॉन्टेंट को एक भाषा से किसी दूसरी भाषा में लिखा जाता है, तो किसी दूसरी स्क्रिप्ट या वर्णमाला का इस्तेमाल किया जाता है. उदाहरण के लिए, हिन्दी में लिखे गए गाने के पेज के शीर्षक को ध्यान में रखें. हालांकि, हिन्दी की देवनागरी स्क्रिप्ट के बजाय, लैटिन वर्णों का इस्तेमाल करें.
jis desh me holi kheli jati hai
ऐसे में, हमारा सिस्टम, पेज पर मौजूद स्क्रिप्ट का इस्तेमाल करके, कोई दूसरा शीर्षक ढूंढने की कोशिश करता है. ऐसा हो सकता है कि यह शीर्षक इस तरह का हो:
जिस देश में होली खेली जाती है
खास जानकारी
आम तौर पर, हमारे सिस्टम पेज के शीर्षक एलिमेंट का इस्तेमाल करते हैं. कई भाषाओं में या ट्रांसलिट्रेट किए गए शीर्षक के मामले में, हमारे सिस्टम वे विकल्प चुन सकते हैं जो पेज की मुख्य भाषा से मेल खाते हैं. इसलिए, शीर्षक और/या पेज के मुख्य कॉन्टेंट की स्क्रिप्ट से मिलता-जुलता शीर्षक देना अच्छा तरीका है.
हम अपने फ़ोरम में आपके सुझाव, शिकायत या राय का स्वागत करते हैं. यहां इस विषय से जुड़े, इंग्लिश और जैपनीज़ भाषा के हमारे मौजूदा थ्रेड का भी इस्तेमाल किया जा सकता है.