פרויקט Global Wordnet Association

דף זה מכיל את הפרטים של פרויקט כתיבה טכנית שהתקבל בעונה של Google Docs.

סיכום הפרויקט

ארגון הקוד הפתוח:
האיגוד העולמי ל-Wordnet
כתב טכני:
יויו וו
שם הפרויקט:
המבנה של Wordnet
אורך הפרויקט:
אורך רגיל (3 חודשים)

תיאור הפרויקט

למה דווקא הפרויקט הזה?

ככותב טכני בבלשנות, אני שמח למצוא פרויקט כזה, עם הרעיון של קישור שפות שונות למסגרת מאוחדת מבחינה סמנטית-מושגית, שיושם בעסקים בעולם האמיתי כגון Google Translate. אני רוצה לתרום למסמכי הפרויקט כדי להפוך אותו לידידותי יותר למשתמש.

בעיות

עברתי על המסמך המקורי, ולדעתי נוכל לשפר אותו על ידי פתרון הבעיות הבאות: אין בהתחלה קטע סקירה כללית שמציג את היסודות של Wordnet, ומאמר זה יהיה שימושי למתחילים. למרות שכל היחסים ב-wordnet מוטמעים בתבנית מאוחדת, בחלק מהקשרים חסר מידע נדרש כמו דוגמאות ובדיקות, שמופצות בדף האינטרנט של Princeton Wordnet, בהנחיות הכלליות של EuroWordnet ובמקורות מידע נוספים. ההגדרות וההגדרה של הקישור הקצר, הדוגמה המקוצרת והדוגמה (דוגמה) לא כוללות תבנית משפט אחידה, מאחר שההגדרה הקצרה והדוגמה הקצרה הן ההסברים כאשר העכבר של המשתמש מעביר את העכבר מעל הקישור הספציפי, הגדרה ודוגמה ממלאים את התפקיד העיקרי של הצגת הקשר. לכן, יש ליצור אותן בתבניות אחידות אך שונות מאלה הקצרות שלהן. הבדיקות הן מ-EWN, אבל צריך להציב את חסימת התנאים לפני גוף הבדיקה הראשי, כי משתמשים תמיד יבדקו את התנאים תחילה כדי להחליט אם הנתונים השפתיים שלהם תואמים לתנאים, ואז לבצע את הבדיקה. כמו כן, גוף הבדיקה לא כל כך פשוט עם הרבה ראשי תיבות לשוניים. התוכן בקטע 'תגובות' מגוון, לפעמים הוא מדגיש נקודה מסוימת בהגדרה ולפעמים מצוין בו פרטים ספציפיים לפרויקט. אני חושב שאנחנו צריכים להגדיר תקן עבור הקטע הזה. העברת מידע על פרויקטים ספציפיים לקטע 'שמות ספציפיים לפרויקט' צריכה להיות נוחה יותר למשתמשים. הקטע 'שמות ספציפיים לפרויקט' מסכם את שם הקשר בכל הפרויקטים. צריך לבדוק את הקטע הזה כי מתרחשות שגיאות של חוסר התאמה. צריך לקשר את מילון המונחים ישירות למסמך, ולהוסיף את כל ראשי התיבות והמונחים שאינם מוכרים למתחילים.

הנחיות

אני רוצה גם לדון בהמשך על שני נושאים עם צוות הפרויקט לפני כתיבת המסמכים. המסקנות שיתקבלו ישמשו כהנחיות הכלליות לפרויקט כולו.

על הקהל הנה דוגמה אמיתית שלי, למרות שאני מומחה בלשני, כשאני נתקל במסמך המקורי בפעם הראשונה, אני לא יודע מה המשמעות של "תחביר", כי המשמעות של סיסטט היא בדף האינטרנט של פרינסטון וורדנט.

לכן, תחילה עלינו להבין את מבנה הידע של קהל פוטנציאלי. אם אנחנו לא יכולים לוודא שכל הקהל מצויד בידע רלוונטי, לפחות עלינו להוסיף קטע סקירה, לקשר את מילון המונחים ומקורות מידע נוספים כדי להנחות אותם ב-Wordnet ובפרויקטים הקשורים אליו. תמיד צריך לזכור את ההנחה הזו לאורך כל תהליך התיעוד,

לגבי התפקיד של המסמכים למיטב הבנתי, המטרה של מסמכים של מבנה Wordnet היא לעזור למשתמשים להכיר את כל סוגי הקשרים ב-Wordnet, והמשתמשים יוכלו לקבץ מילים בקשרים האלה על סמך המידע שמתקבל. עם זאת, המסמכים המקוריים נראים יותר כמו תמצית של מאמרים אקדמיים. אם מטרת המסמכים היא להתייחסות אקדמית, זה בסדר, אבל אם הם משרתים את המשתמשים למטרות הדרכה, חייבים למצוא איזון בין אקדמיה ותועלת.

יתרונות

אוכל לעזור בתרגום הגרסה הסינית של המסמכים. יש לי ניסיון בתרגום מאמרים לשוניים מאנגלית לסינית. אני יכול לעזור בעיצוב המסמכים, אני מכיר את היסודות של HTML/CSS ויכול לעזור לי לשפר את מראה דף האינטרנט של המסמכים, למשל באמצעות הוספת סרגל ניווט צדדי. אוכל לעזור לשרטט כמה תרשימי זרימה באמצעות Visio או Mermaid, אם תרשימי הזרימה יכולים לעזור למשתמשים להבין טוב יותר את הקשרים.

אבני דרך / זמן / יעד

  • שבוע 1: נהלו דיון והגדירו את היעד, תהליך העבודה ותוכנית העבודה עם צוות הפרויקט.
  • שבוע 2: הגדירו את מתאר המסמכים וכתבו את הקטע 'סקירה כללית'.
  • שבוע 3 – שבוע 4: כתיבת החלק 'יחסים מכוננים'.
  • שבוע 5 עד שבוע 6: כתיבת החלק 'אחר' ו'יחסי דומיין'.
  • שבוע 7 עד שבוע 8: כותבים את החלק של הקשרים בין התפקידים.
  • שבוע 9: כתבו את שלושת הקשרים שנותרו ועדכנו את מילון המונחים.
  • שבוע 10: תרגום הגרסה לסינית במידת הצורך.
  • שבוע 11: שינוי הפורמט של המסמכים.
  • שבוע 12: בדיקה אחרונה וסיכום של הפרויקט.