פרויקט Global Wordnet Association

דף זה מכיל את הפרטים של פרויקט כתיבה טכנית שהתקבל בעונה של Google Docs.

סיכום הפרויקט

ארגון הקוד הפתוח:
Wordnet גלובלי
כתב טכני:
קומאר
שם הפרויקט:
The Open Multilingual Wordnet (OMW)
אורך הפרויקט:
אורך רגיל (3 חודשים)

תיאור הפרויקט

בקשה לפרויקט:

יצרתי קשר עם מנטורים של Global Wordnet Association ושלחתי בקשת משיכה שנבדקה על ידם. אם תהיה לי הזדמנות, אוכל להקדיש 40 שעות (או יותר) בשבוע לפרויקט הזה. יש לי הבנה טובה ב-Python, ב-Git, ב-HTML, ב-C++ , ב-Java וב-C. אני דו-לשונית ואני יכול לדבר שוטפת באנגלית ובהינדי, למדתי צרפתית בבית הספר וגם קצת גרמנית. אני מאוד נלהב מהתרומה שלי ל-Global Wordnet Association באמצעות הפרויקט הזה, אם תהיה לי הזדמנות לעבוד במסירות רבה.

מצב נוכחי:

התיעוד הנוכחי של Open Multilingual Wordnet הוא רדוד ולא שלם במדריכים הקיימים למשתמשים, שחסרים בהם תוכן, גרפיקה, דוגמאות והוראות מפורשות. אין מדריך משתמש שיעזור למי שמחפש ב-wordnet, איך לקרוא את הדפים שהוחזרו, איך להתקין אותם או לתת משוב. קיימים תיעודים מסוימים הקשורים לתרומת Wordnet חדשה, אבל התיעוד הזה לא שלם או ברור כדי להדריך מישהו כיצד להצטרף ל-Wordnet הפתוח בכמה שפות. אין תיעוד לאופן האינטראקציה עם האינדקס המשותף (CILI) יש דף מבוא ל-CILI, שחסר בו מידע כמו הסיבה להוצאת מושגים משימוש והחלפה שלהם, ושיפוט של מועמדים חדשים. באופן כללי, במסמכי התיעוד הנוכחיים אין תוכן, בהירות, דוגמאות ורכיבים חזותיים לעזרה.

תוכנית:

תכננתי להוציא לפועל את הפרויקט הזה בארבעה שלבים. בשלב א' אני אתעד מדריך למישהו שתורם ל-Wordnet חדש. בשלב הזה אעסוק ביצירה של WordNet בפורמט תקין, איך להעלות אותו ואיך להבין את המשוב. בשלב ב' אני אתעד מדריך למישהו שמחפש ב-wordnet (או במשפחה של Wordnets), במסמך הזה, ואסביר איך לקרוא את הדפים שהוחזרו, איך להוריד אותם ואיך לתת משוב. בשלב ג' אני אתעד מדריך לאינטראקציה עם האינדקס האינטרלינגואלי המשותף, איך להוציא משימוש מושגים ולהחליף אותם, ושיפוט של מועמדים חדשים יתבצע בשלב ג'. בשלב ד', אני אאכלס את התיעוד של ה-Open Multilingual Wordnet, ואשפר את התיעוד הקיים של הפרויקט הזה מלבד התיעוד שמתואר בשלבים א', ב' וג'. מכיוון שיש חפיפה בין הפרויקטים של GWA, שלב ד' יוקדש גם הוא לדרישות הארגון. תכננתי להקצות את שבועות 1,2 ו-3 לשלב א', שבועות 4,5 ו-6 יוקצו לשלב ב', שבועות 7 ו-9 ו-9 לשלב ג' ושות 10 ו-11 לשלב ד'.

יעדי הפרויקט:

1) ניתוח התיעוד הקיים, וקביעה איזה קטע דורש שיפור.

2) שחזור של המבנה של התיעוד הקיים.

3) תיעוד מדריך למישהו שתורם ל-Wordnet חדשה.

4) תיעוד מדריך למי שמחפש ב-wordnet.

5) תיעוד מדריך לאינטראקציה עם האינדקס המשותף האינטרלינגואלי.

6) הוספת דוגמאות ורכיבים חזותיים לתיעוד.

7) אכלוס הדפים הקיימים שבהם נראה שהתיעוד רדוד.

ציר הזמן:

  • שלב גיבוש הקהילה: 17 באוגוסט עד 13 בספטמבר.

    • בפרק הזמן הזה אצור קשר עם הקהילה ואכיר את הקהילה טוב יותר.
    • הגדרת ערוץ תקשורת.
    • מגדירים שעה לתקשורת.
    • כדאי לחדד את היעדים ולהגדיר ציפיות משני הצדדים.
  • שלב פיתוח המסמך (14 בספטמבר- 30 בנובמבר)

    • אעבוד בשיתוף פעולה צמוד עם המנטורים שלי ואסיים את הפרויקט שלי בשלב הזה בהתאם לתוכניות השבועיות.
    • ממלאים סקר כלשהו ממנהלי התוכנית של Google.
  • שבוע 1-3 (14-27 בספטמבר)

    • שלב א' במסמכים
  • שבוע 1 (14-20 בספטמבר)

    • יתחיל תיעוד עבור מדריך לאדם שתורם ל-Wordnet חדש.
    • השבוע אעשה את התיעוד, איך ליצור WordNet בפורמט תקין.
    • תתועד הוראה ברורה להמרת ה-Wordnet של המשתמש להגדרת סוג המסמך הציבורי LMF של Wordnet (DTD).
    • בנוסף, היא תכלול את כלי ההמרה.
  • שבוע 2 (21-27 בספטמבר)

    • השבוע אעשה את התיעוד לגבי האופן שבו תעלה את ה-Wordnet של המשתמש (לאחר ההמרה להגדרת סוג המסמך LMF של Wordnet) ל-OMW.
    • התיעוד הקיים רדוד (אבל מדויק). אכלס אותו ואוסיף דוגמאות לתיעוד.
  • שבוע 3 (28 בספטמבר עד 4 באוקטובר)

    • השבוע נשתמש לתיעוד שיסביר את המשמעות של המשוב.
    • המסמכים האלה נדרשים להיכתב מההתחלה כי אין תיעוד קיים בנושא הזה.
  • שבוע 4-6 (5-25 באוקטובר)

    • שלב ב' בתיעוד
  • שבוע 4 (5-11 באוקטובר)

    • השבוע אתחיל לתעד מדריך לאנשים שמחפשים את המילה 'wordnet' (או משפחת ה-wordnets).
    • השבוע אכתוב תיעוד שמסביר איך לקרוא את הדפים שהוחזרו.
  • שבוע 5 (12 עד 18 באוקטובר)

    • השבוע אתעד את אופן ההורדה.
    • אין תיעוד בנושא הזה, כי צריך לכתוב אותו מאפס.
  • שבוע 6 (19-25 באוקטובר)

    • השבוע אסביר איך לשלוח משוב לארגון.
    • אין תיעוד קודם שניתן להסתמך עליו, ולכן גם התוכן הזה ייכתב מההתחלה.
  • שבוע 6-9 (26 באוקטובר עד 15 בנובמבר)

    • שלב ג' במסמכים
  • שבוע 7 (26 באוקטובר עד 1 בנובמבר)

    • השבוע אתחיל בתיעוד של מדריך לאינטראקציה עם האינדקס המשותף (CILI)
    • השבוע אסביר איך ומדוע כדאי להוציא משימוש קונספטים ולהחליף אותם.
  • שבוע 8 (2-8 בנובמבר)

    • השבוע אתעד מידע נוסף על CILI, ואכתוב הוראות להורדה של CILI ולעמידה בדרישות הארגוניות שמפורטות בתיעוד של CILI, וצריך לכתוב את המסמכים האלה מאפס.
  • שבוע 9-11 (9-29 בנובמבר)

    • שלב ד' בתיעוד
  • שבוע 9 (9-15 בנובמבר)

    • OMW 2.0 פותח כעת, בהתאם לצורכי הארגון.
  • שבוע 10 (16-22 בנובמבר)

    • התיעוד של דף הבית Open Multilingual Wordnet (OMW) נראה רדוד, השבוע אעבוד עליו ואוסיף את המידע הנוסף הקשור ל-OMW, ואבדוק באילו דפים קיימים אחרים של OMW צריך לאכלס.
    • אם אין דפי OMW חסרים, נשפר, וכשאפשר, אנסה להוסיף רכיבים חזותיים.
  • שבוע 11 (23-29 בנובמבר)

    • מכיוון שיש חפיפה בפרויקטים של GWA, השבוע שמור למענה על הצרכים הארגוניים החופפים האלה ולמסמכים שונים אחרים.
  • שלב השלמת הפרויקט והערכת הפרויקט (30 בנובמבר עד 5 בדצמבר)

    • השבוע יוקדש על הגהה של התיעוד לאיתור שגיאות הקלדה ושגיאות.
    • אני אכתוב את דוח הפרויקט שלי.
    • אבקש מהמנטורים שלי לבדוק את דוח הפרויקט שלי.
    • אסיים ואגיש את דוח הפרויקט שלי.
    • אני אכתוב ואגיש הערכה של המנטורים שלי ושל החוויה שלי בעונה של Docs.

תקשורת:

תדירות הקשר תהיה תלויה בדיון עם מנטורים. אני רוצה לשמור על תקשורת קבועה – ההצעה שלי היא פעמיים בשבוע כדי לספק עדכון ולקבל משוב על העבודה שעשית עד עכשיו. עם זאת, האפשרות הזו גמישה גם בהתאם להעדפות שלהם.

למה דווקא הפרויקט הזה?

אני מתעניין בבלשנות, והרעיון של חיבור רשתות מילים לכל שפות העולם סקרן אותי להצטרף ל-Global Wordnet Association ולתרום לפרויקט הזה. העיקרון של Open Multilingual Wordnet הוא חיבור בולט לעין כאשר רשתות מילים בודדות מקושרות לרשתות מילוליות אחרות בשפות אחרות, מה שהופך את רשתות ה-wordnet האלה לנגישות יותר. ה-Open Multilingual Wordnet ורכיביו יכולים להשתמש, לשנות ולשתף באופן חופשי על ידי כל אחד לכל מטרה. למרות של-GWA יש רעיון מוצק וכוונה אצולה, הארגון לא מוכר ויש לו מעט מדי קרדיט. סביר להניח שאחת הסיבות היא תיעוד רדוד והיעדר מדריכים למשתמש שיכולים לסייע ביצירת התוכן ובשימוש בו. הבנתי שפרויקט Open Multilingual Wordnet הוא משהו שבו אני יכול לתרום כדי לסייע ל-Global Wordnet Association ולקהילת הקוד הפתוח במשותף.

תוכניות עתידיות:

לאחר שאשלים את GSoD 20, אמשיך לתרום ל-Global Wordnet Association גם בפרויקטים אחרים. אין לי ספק שאשתתף בכל כנס של הארגון אם תהיה לי הזדמנות.