ग्लोबल वर्डनेट असोसिएशन प्रोजेक्ट

इस पेज में एक तकनीकी लेखन प्रोजेक्ट की जानकारी है, जिसे दस्तावेज़ के Google सीज़न के लिए स्वीकार किया जाता है.

प्रोजेक्ट की खास जानकारी

ओपन सोर्स संगठन:
Global Wordnet Association
टेक्निकल राइटर:
योयो वू
प्रोजेक्ट का नाम:
Wordnet का स्ट्रक्चर
प्रोजेक्ट की अवधि:
स्टैंडर्ड अवधि (तीन महीने)

प्रोजेक्ट का विवरण

यह प्रोजेक्ट क्यों

भाषा विज्ञान में विशेषज्ञता रखने वाले तकनीकी लेखक के तौर पर, मुझे यह प्रोजेक्ट देखकर खुशी हो रही है. इस प्रोजेक्ट में, अलग-अलग भाषाओं को एक ही सेमैनटिक-कॉन्सेप्चुअल फ़्रेमवर्क से जोड़ने का आइडिया दिया गया है. साथ ही, इसे Google Translate जैसे असल कारोबारों पर लागू किया गया है. मुझे इस प्रोजेक्ट के दस्तावेज़ों में योगदान देना है, ताकि दर्शकों के लिए इसे ज़्यादा उपयोगकर्ता-अनुकूल बनाया जा सके.

समस्याएं

मैंने मूल दस्तावेज़ को पढ़ लिया है. मुझे लगता है कि इन समस्याओं को हल करके, इसे बेहतर बनाया जा सकता है: शुरुआत में खास जानकारी वाला सेक्शन नहीं है, ताकि WordNet के बुनियादी सिद्धांतों के बारे में बताया जा सके. यह सेक्शन, नए लोगों के लिए मददगार होगा. हालांकि, वर्डनेट के सभी संबंधों को एक यूनिफ़ाइड टेंप्लेट में रोल आउट किया गया है, लेकिन कुछ रिलेशन में ज़रूरी जानकारी नहीं होती. जैसे, उदाहरण और टेस्ट. यह जानकारी Princeton Wordnet के वेबपेज, यूरोवर्डनेट के सामान्य दिशा-निर्देशों, और अन्य संसाधनों में उपलब्ध है. 'संबंध की खास जानकारी' और 'संबंध की जानकारी', 'उदाहरण' और 'कम शब्दों में उदाहरण' में, वाक्य के पैटर्न एक जैसे नहीं हैं. ऐसा इसलिए है, क्योंकि जब उपयोगकर्ता किसी खास संबंध पर कर्सर घुमाता है, तो 'संबंध की खास जानकारी' और 'उदाहरण' कॉलआउट के तौर पर दिखते हैं. वहीं, 'संबंध की जानकारी' और 'उदाहरण', संबंध के बारे में बताने की मुख्य भूमिका निभाते हैं. इसलिए, इनकी बनावट एक जैसी होनी चाहिए, लेकिन इनके पैटर्न अलग-अलग होने चाहिए. ये टेस्ट EWN के हैं, लेकिन शर्तों वाले ब्लॉक को टेस्ट के मुख्य हिस्से से पहले रखना चाहिए. ऐसा इसलिए, क्योंकि उपयोगकर्ता हमेशा शर्तों को देखकर यह तय करेंगे कि उनका भाषाई डेटा शर्तों से मेल खाता है या नहीं. इसके बाद, वे टेस्ट करेंगे. टेस्ट का मुख्य हिस्सा भी आसान नहीं है, क्योंकि इसमें भाषा से जुड़े कई छोटे शब्द इस्तेमाल किए गए हैं. 'टिप्पणियां' सेक्शन का कॉन्टेंट अलग-अलग तरह का है. कभी-कभी इसमें परिभाषा के किसी खास हिस्से पर ज़ोर दिया जाता है. कभी-कभी इसमें प्रोजेक्ट की खास जानकारी शामिल होती है. मुझे लगता है कि हमें इस सेक्शन के लिए एक मानक तय करना चाहिए. खास प्रोजेक्ट की जानकारी को प्रोजेक्ट के हिसाब से बनाए गए नाम वाले सेक्शन में ले जाना, उपयोगकर्ताओं के लिए ज़्यादा सुविधाजनक होना चाहिए. प्रोजेक्ट के हिसाब से नाम वाले सेक्शन में, सभी प्रोजेक्ट में रिलेशन का नाम होता है. इस सेक्शन की समीक्षा ज़रूरी है, क्योंकि नाम मेल न खाने की गड़बड़ियां होती हैं. शब्दों की शब्दावली को सीधे दस्तावेज़ से लिंक करना होगा. साथ ही, उन सभी संक्षिप्त शब्दों और शब्दों को जोड़ना होगा जो शायद नए लोगों को न पता हों.

दिशा-निर्देश

दस्तावेज़ों का ड्राफ़्ट तैयार करने से पहले, मुझे प्रोजेक्ट टीम के साथ इन दो विषयों पर भी चर्चा करनी है. इनसे मिले नतीजे, पूरे प्रोजेक्ट के लिए सामान्य दिशा-निर्देश के तौर पर काम करेंगे.

ऑडियंस के बारे में जानकारी यहां मेरा एक असल उदाहरण है. भले ही, मैं भाषा विज्ञान की पढ़ाई कर रही हूं, लेकिन जब मुझे पहली बार ओरिजनल दस्तावेज़ मिला, तो मुझे नहीं पता था कि “सिनसेट” का क्या मतलब है. मुझे Princeton Wordnet के वेबपेज पर, सिनसेट का मतलब पता चला.

इसलिए, सबसे पहले हमें संभावित ऑडियंस के नॉलेज स्ट्रक्चर का पता लगाना होगा. अगर हम यह पक्का नहीं कर सकते कि सभी ऑडियंस के पास ज़रूरी जानकारी है, तो कम से कम हमें खास जानकारी वाला सेक्शन जोड़ना होगा. साथ ही, शब्दों की शब्दावली और अन्य मिलते-जुलते संसाधनों को लिंक करना होगा, ताकि वे Wordnet और इससे मिलते-जुलते प्रोजेक्ट के बारे में जान सकें. दस्तावेज़ तैयार करने की पूरी प्रक्रिया के दौरान, हमें इस बात का ध्यान रखना चाहिए कि

दस्तावेज़ों के फ़ंक्शन के बारे में जानकारी मेरी समझ के मुताबिक, WordNet के स्ट्रक्चर वाले दस्तावेज़ों का मकसद, उपयोगकर्ताओं को WordNet में मौजूद सभी तरह के संबंधों के बारे में जानकारी देना है. साथ ही, उपयोगकर्ता दी गई जानकारी के आधार पर, शब्दों को उन संबंधों में ग्रुप कर सकते हैं. हालांकि, ओरिजनल दस्तावेज़, ज़्यादातर शैक्षणिक पेपर के एक्सट्रैक्ट जैसे दिखते हैं. अगर दस्तावेज़ों का मकसद, अकादमिक संदर्भ के लिए है, तो ठीक है. हालांकि, अगर इसका मकसद उपयोगकर्ताओं को गाइड करना है, तो अकादमिक और काम के दस्तावेज़ों के बीच समझौता होना चाहिए.

फ़ायदे

हम दस्तावेज़ों के चाइनीज़ वर्शन का अनुवाद करने में आपकी मदद कर सकते हैं. मेरे पास भाषा से जुड़े पेपर का अंग्रेज़ी से चाइनीज़ में अनुवाद करने का अनुभव है. मैं दस्तावेज़ों को फ़ॉर्मैट करने में आपकी मदद कर सकती हूं. मुझे एचटीएमएल/सीएसएस की बुनियादी जानकारी है. साथ ही, मैं दस्तावेज़ों के वेबपेज को बेहतर बनाने में भी आपकी मदद कर सकती हूं. जैसे, साइड नेविगेशन बार जोड़ना. अगर फ़्लोचार्ट से उपयोगकर्ताओं को संबंधों को बेहतर तरीके से समझने में मदद मिल सकती है, तो मैं Visio या Mermaid का इस्तेमाल करके कुछ फ़्लोचार्ट बनाने में आपकी मदद कर सकता/सकती हूं.

माइलस्टोन / समय / लक्ष्य

  • पहला हफ़्ता: प्रोजेक्ट टीम के साथ लक्ष्य, वर्कफ़्लो, और काम करने के प्लान पर चर्चा करें और उन्हें तय करें.
  • दूसरा हफ़्ता: दस्तावेज़ की आउटलाइन तैयार करें और खास जानकारी वाला सेक्शन लिखें.
  • तीसरा हफ़्ता – चौथा हफ़्ता: कॉन्स्टिट्यूटिव रिलेशन वाला हिस्सा लिखें.
  • पांचवां हफ़्ता – छठा हफ़्ता: अन्य और डोमेन के संबंध वाला हिस्सा लिखें.
  • सातवां हफ़्ता – आठवां हफ़्ता: भूमिका के संबंधों का हिस्सा लिखें.
  • नौवां हफ़्ता: बाकी तीन संबंध लिखें और ग्लॉसरी अपडेट करें.
  • दसवां हफ़्ता: अगर ज़रूरी हो, तो चीनी वर्शन का अनुवाद करें.
  • 11वां हफ़्ता: दस्तावेज़ों के फ़ॉर्मैट में बदलाव करना.
  • 12वां हफ़्ता: इस प्रोजेक्ट की आखिरी जांच करें और इसकी खास जानकारी दें.