โปรเจ็กต์ Global Wordnet Association

หน้านี้มีรายละเอียดของโครงการการเขียนเชิงเทคนิคที่ยอมรับสำหรับ Google Season of Docs

ข้อมูลสรุปของโปรเจ็กต์

องค์กรโอเพนซอร์ส:
Wordnet ทั่วโลก
ผู้เขียนด้านเทคนิค:
คูมาร์
ชื่อโปรเจ็กต์:
The Open Multiภาษา Wordnet (OMW)
ระยะเวลาของโปรเจ็กต์:
ระยะเวลามาตรฐาน (3 เดือน)

คำอธิบายโปรเจ็กต์

คำขอโปรเจ็กต์:

เราได้ติดต่อ Mentor ของ Global Wordnet Association และได้ส่งคำขอพุลที่ได้รับการตรวจสอบแล้ว หากมีโอกาส ฉันสามารถใช้เวลา 40 ชั่วโมง (หรือมากกว่า) ต่อสัปดาห์ในโปรเจ็กต์นี้ ฉันมีความเข้าใจเกี่ยวกับ Python, Git, HTML, C++, Java และ C เป็นอย่างดี ฉันพูดได้ 2 ภาษาได้คล่องแคล่วทั้งภาษาอังกฤษและฮินดี นอกจากนี้ ฉันเรียนภาษาฝรั่งเศสที่โรงเรียนและรู้ภาษาเยอรมันไม่มากพอ ฉันกระตือรือร้นและกระตือรือร้นที่จะให้ความช่วยเหลือแก่ Global Wordnet Association ผ่านโครงการนี้ หากได้รับโอกาส ฉันจะทุ่มเทอย่างเต็มที่

สถานะปัจจุบัน:

เอกสารประกอบปัจจุบันเกี่ยวกับ Wordnet หลายภาษาสำหรับแบบเปิดนั้นไม่ครบถ้วนและต้องมีเนื้อหา กราฟิก ตัวอย่าง และคำแนะนำที่ชัดเจน ไม่มีคู่มือผู้ใช้สำหรับช่วยผู้ที่ใช้การค้นหา Wordnet, วิธีอ่านหน้าที่แสดงผล, วิธีติดตั้ง, วิธีแสดงความคิดเห็น เอกสารบางอย่างมีในการมีส่วนร่วม Wordnet ใหม่ แต่เอกสารนั้นไม่สมบูรณ์หรือไม่ชัดเจนเพื่อแนะนำวิธีการเข้าร่วม Wordnet หลายภาษาสำหรับเปิด ไม่มีเอกสารประกอบสำหรับวิธีโต้ตอบกับ Collaborative Interlingual Index (CILI) แต่เรามีหน้าแนะนำ CILI ซึ่งไม่มีข้อมูล เช่น เหตุผลและวิธีในการเลิกใช้งานและแทนที่แนวคิดต่างๆ และการตัดสินผู้สมัครรายใหม่ เอกสารปัจจุบันโดยรวมขาดเนื้อหา ความชัดเจน ตัวอย่าง และภาพในการให้ความช่วยเหลือ

แผน:

ฉันได้วางแผนที่จะดำเนินโครงการนี้โดยแบ่งเป็น 4 ระยะ ในระยะ A ฉันจะจัดทำคู่มือสำหรับผู้มีส่วนร่วมเชื่อมต่อ Wordnet ใหม่ โดยในขั้นนี้จะอธิบายเกี่ยวกับวิธีสร้าง Wordnet ที่มีรูปแบบเหมาะสม วิธีอัปโหลด และวิธีใช้ความคิดเห็นเหล่านั้น ในระยะถัดไป B ฉันจะจัดทำคู่มือสำหรับผู้ที่ค้นหา Wordnet (หรือชุดของ Wordnet) ในเอกสารนั้น ฉันจะพูดถึงวิธีอ่านหน้าที่แสดงผล วิธีดาวน์โหลด และวิธีแสดงความคิดเห็น ในระยะที่ C ฉันจะจัดทำคู่มือในการโต้ตอบกับ Collaborative Interlingual Index วิธีเลิกใช้และแทนที่แนวคิดต่างๆ และผลการตัดสินผู้สมัครใหม่จะได้รับการจัดทำเป็นเอกสารในระยะที่ C ในระยะ D ฉันจะป้อนข้อมูลเอกสารของ Wordnet หลายภาษาสำหรับ Open แล้วปรับปรุงเอกสารประกอบที่มีอยู่ของโครงการนี้ นอกเหนือไปจากเอกสารในระยะ A, B และ C เนื่องจากมีความคาบเกี่ยวกันระหว่างโครงการของ GWA ระยะ D จึงทำตามข้อกำหนดขององค์กรด้วย ฉันวางแผนที่จะจัดสรรสัปดาห์ที่ 1,2 และ 3 สำหรับเฟส A, สัปดาห์ที่ 4,5 และ 6 จะจัดสรรให้กับเฟส B, สัปดาห์ที่ 7,8 และ 9 สำหรับเฟส C และสัปดาห์ที่ 10 และ 11 สำหรับเฟส D

เป้าหมายของโครงการ:

1) วิเคราะห์เอกสารที่มีอยู่และพิจารณาว่าส่วนใดที่ต้องปรับปรุง

2) การฟื้นฟูโครงสร้างของเอกสารที่มีอยู่

3) จัดทำเอกสารคู่มือสำหรับผู้ที่ร่วมเขียน Wordnet ใหม่

4) จัดทำเอกสารคู่มือสำหรับผู้ที่ค้นหาเวิร์ดเน็ต

5) การจัดทำเอกสารคู่มือสำหรับการโต้ตอบกับดัชนีการใช้ภาษาระหว่างการทำงานร่วมกัน

6) การเพิ่มตัวอย่างและภาพลงในเอกสารประกอบ

7) เติมข้อมูลหน้าที่มีอยู่ซึ่งดูเหมือนว่าเอกสารประกอบจะตื้นตัน

ไทม์ไลน์:

  • ช่วงสานสัมพันธ์ของชุมชน: 17 สิงหาคม - 13 กันยายน

    • ในช่วงเวลานี้ ฉันจะโต้ตอบกับชุมชนและรู้จักชุมชนดีขึ้น
    • กำหนดช่องทางการสื่อสาร
    • กำหนดเวลาในการสื่อสาร
    • ปรับแต่งเป้าหมายและกำหนดความคาดหวังทั้ง 2 ฝ่าย
  • ระยะการพัฒนาเอกสาร (14 กันยายน - 30 พฤศจิกายน)

    • ฉันจะทำงานกับที่ปรึกษาอย่างใกล้ชิดและจะดำเนินการโครงการให้เสร็จสมบูรณ์ในระยะนี้ตามแผนประจำสัปดาห์
    • ตอบแบบสำรวจจากผู้ดูแลระบบโปรแกรม Google
  • สัปดาห์ที่ 1-3 (14-27 กันยายน)

    • เอกสารประกอบระยะ A
  • สัปดาห์ที่ 1 (14-20 กันยายน)

    • เอกสารประกอบสำหรับคู่มือสำหรับผู้ที่ร่วมให้ข้อมูล Wordnet ใหม่จะเริ่มต้นขึ้น
    • สัปดาห์นี้ ผมจะมาอธิบายเกี่ยวกับการจัดทำเอกสารเกี่ยวกับวิธีสร้าง Wordnet ที่มีการจัดรูปแบบที่ดี
    • จะมีการบันทึกคำแนะนำที่ชัดเจนสำหรับการแปลง Wordnet ของผู้ใช้เป็นคำจำกัดความประเภทเอกสาร (DTD) ของ Wordnet LMF แบบสาธารณะ
    • ซึ่งเครื่องมือดังกล่าวจะครอบคลุมเครื่องมือ Conversion ด้วย
  • สัปดาห์ที่ 2 (21-27 กันยายน)

    • สัปดาห์นี้ เราจะทำเรื่องเอกสารเกี่ยวกับวิธีอัปโหลด Wordnet ของผู้ใช้ (หลังจากแปลงเป็นคำจำกัดความประเภทเอกสารของ Wordnet LMF) ไปยัง OMW
    • เอกสารประกอบที่มีอยู่ไม่ครบถ้วน (แต่ถูกต้อง) ฉันจะป้อนข้อมูลและเพิ่มตัวอย่างลงในเอกสารประกอบ
  • สัปดาห์ที่ 3 (28 กันยายน - 4 ตุลาคม)

    • สัปดาห์นี้เราจะได้ใช้เอกสารประกอบเกี่ยวกับวิธีทำความเข้าใจความคิดเห็น
    • เอกสารนี้ต้องเขียนขึ้นเองตั้งแต่ต้นเนื่องจากไม่มีเอกสารประกอบเกี่ยวกับหัวข้อนี้
  • สัปดาห์ที่ 4-6 (5-25 ตุลาคม)

    • เอกสารประกอบระยะ B
  • สัปดาห์ที่ 4 (5-11 ตุลาคม)

    • สัปดาห์นี้ ฉันจะเริ่มบันทึกคู่มือสำหรับผู้ที่ค้นหาเวิร์ดเน็ต (หรือชุดซอฟต์แวร์เรียงต่อกัน)
    • สัปดาห์นี้ ฉันจะเขียนเอกสารสำหรับวิธีอ่านหน้าที่แสดงผล
  • สัปดาห์ที่ 5 (12-18 ตุลาคม)

    • สัปดาห์นี้ ฉันจะบันทึกวิธีดาวน์โหลดไว้
    • ไม่มีเอกสารประกอบในกรณีนี้ จึงต้องเขียนขึ้นเองตั้งแต่ต้น
  • สัปดาห์ที่ 6 (19-25 ตุลาคม)

    • สัปดาห์นี้ ฉันจะบันทึกวิธีแสดงความคิดเห็นให้กับองค์กร
    • เนื่องจากเราไม่มีเอกสารให้อ้างอิงก่อนหน้านี้ จึงต้องเขียนใหม่ตั้งแต่ต้น
  • สัปดาห์ที่ 6-9 (26 ตุลาคม - 15 พฤศจิกายน)

    • เอกสารประกอบระยะ C
  • สัปดาห์ที่ 7 (26 ตุลาคม - 1 พฤศจิกายน)

    • สัปดาห์นี้ ฉันจะเริ่มจัดทำเอกสารของคู่มือสำหรับการโต้ตอบกับ Collaborative Interlingual Index (CILI)
    • สัปดาห์นี้ ผมจะบันทึกวิธีและสาเหตุที่จะเลิกใช้และแทนที่แนวคิด
  • สัปดาห์ที่ 8 (2-8 พฤศจิกายน)

    • สัปดาห์นี้ ฉันจะบันทึกข้อมูลเพิ่มเติมเกี่ยวกับ CILI และเขียนวิธีการดาวน์โหลด CILI และทำตามข้อกำหนดขององค์กรในเอกสาร CILI เอกสารนี้จำเป็นต้องเขียนขึ้นเองตั้งแต่ต้น
  • สัปดาห์ที่ 9-11 (9-29 พฤศจิกายน)

    • เอกสารประกอบระยะ D
  • สัปดาห์ที่ 9 (9-15 พฤศจิกายน)

    • ปัจจุบัน OMW 2.0 จะพัฒนาตามความต้องการขององค์กร
  • สัปดาห์ที่ 10 (16-22 พฤศจิกายน)

    • เอกสารหน้าแรกของ Open Multi Language (OMW) ที่ใช้เป็นคำ
    • หากขาดหน้า OMW เราก็จะได้รับการปรับปรุงและจะพยายามเพิ่มภาพในหน้านั้นทุกครั้งที่เป็นไปได้
  • สัปดาห์ที่ 11 (23-29 พฤศจิกายน)

    • เนื่องจากโครงการของ GWA ทับซ้อนกัน สัปดาห์นี้จึงสงวนไว้สำหรับการตอบสนองความต้องการขององค์กรที่ทับซ้อนเหล่านี้และเอกสารประกอบอื่นๆ
  • ระยะสรุปและประเมินโครงการ (30 พฤศจิกายน - 5 ธันวาคม)

    • เราจะใช้เวลาในสัปดาห์นี้ในการพิสูจน์อักษรในเอกสารที่มีการพิมพ์ผิดและข้อผิดพลาด
    • ฉันจะเขียนรายงานโครงการ
    • ฉันจะขอให้ที่ปรึกษาตรวจสอบรายงานโปรเจ็กต์ของฉัน
    • ฉันจะสรุปและส่งรายงานโปรเจ็กต์ของฉัน
    • ฉันจะเขียนและส่งการประเมินสำหรับ Mentor และประสบการณ์การใช้งาน Season of Docs

การสื่อสาร

ความถี่ในการติดต่อจะขึ้นอยู่กับการหารือกับที่ปรึกษา ฉันต้องการรับการติดต่อสื่อสารเป็นประจำ - คำแนะนำของฉันคือสัปดาห์ละ 2 ครั้งเพื่อให้ข้อมูลอัปเดตและรับความคิดเห็นเกี่ยวกับงานที่ทำจนถึงปัจจุบัน อย่างไรก็ตาม กระบวนการนี้สามารถปรับเปลี่ยนได้ตามความต้องการของผู้ใช้เช่นกัน

ทำไมต้องมีโครงการนี้

ฉันสนใจในสาขาภาษา และไอเดียที่จะเชื่อมต่อ Wordnet สำหรับทุกภาษาทั่วโลกทำให้ฉันสนใจเข้าร่วม Global Wordnet Association และมีส่วนร่วมในโครงการนี้ แนวคิดของ Wordnet หลายภาษาสำหรับแบบเปิดนั้นน่าประทับใจอย่างยิ่ง เนื่องจากอาจมีการเชื่อมโยง Wordnet แต่ละคำกับ Wordnet ในภาษาอื่น ซึ่งทำให้เวิร์ดเน็ตเหล่านี้เข้าถึงได้ง่ายขึ้น ทุกคนสามารถใช้ แก้ไข และแชร์ Wordnet หลายภาษาและองค์ประกอบของ Open ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ แม้ว่า GWA จะมีแนวคิดที่แข็งแกร่งและความตั้งใจอันสูงส่ง แต่องค์กรก็ไม่ได้มีชื่อเสียงมากนักและยังได้รับการประเมินต่ำกว่าความเป็นจริง สาเหตุหนึ่งอาจเกิดจากเอกสารประกอบที่ตื้นเขินและการไม่มีคู่มือผู้ใช้ที่ช่วยสนับสนุนและนำไปใช้ ฉันเห็นว่าโครงการ Wordnet หลายภาษาสำหรับเปิดเป็นสิ่งที่ฉันสามารถสนับสนุน Global Wordnet Association และชุมชนโอเพนซอร์สที่มีร่วมกัน

แผนในอนาคต:

หลังจากเรียนจบ GSoD 20 แล้ว ฉันจะยังมีส่วนร่วมกับ Global Wordnet Association ในโปรเจ็กต์อื่นๆ ด้วย ฉันจะเข้าร่วมการประชุมขององค์กรทุกครั้งหากมีโอกาส