โปรเจ็กต์ Global Wordnet Association

หน้านี้มีรายละเอียดของโครงการการเขียนเชิงเทคนิคที่ยอมรับสำหรับ Google Season of Docs

ข้อมูลสรุปของโปรเจ็กต์

องค์กรโอเพนซอร์ส:
การเชื่อมโยง Wordnet ทั่วโลก
ผู้เขียนด้านเทคนิค:
โยโย วู
ชื่อโปรเจ็กต์:
โครงสร้างของ Wordnet
ระยะเวลาของโปรเจ็กต์:
ระยะเวลามาตรฐาน (3 เดือน)

คำอธิบายโปรเจ็กต์

ทำไมจึงต้องมีโปรเจ็กต์นี้

ในฐานะนักเขียนด้านเทคนิคที่เชี่ยวชาญด้านภาษาศาสตร์ ฉันยินดีที่จะได้ค้นหาโครงการดังกล่าวซึ่งมีแนวคิดที่จะเชื่อมโยงภาษาต่างๆ เข้ากับเฟรมเวิร์กความหมายเชิงอรรถศาสตร์ที่เป็นหนึ่งเดียว และมีการนำมาใช้กับธุรกิจในโลกจริง เช่น Google แปลภาษา ฉันต้องการมีส่วนร่วมในเอกสารของโครงการนี้ เพื่อให้เป็นมิตรกับผู้ชมมากขึ้น

ปัญหา

ผมได้ทบทวนเอกสารต้นฉบับและคิดว่าเราสามารถปรับปรุงให้ดีขึ้นได้โดยการแก้ไขปัญหาด้านล่างนี้ การขาดส่วนภาพรวมในตอนต้นเพื่อแนะนำพื้นฐานของ Wordnet ซึ่งจะเป็นประโยชน์ต่อมือใหม่ แม้ว่าความสัมพันธ์ทั้งหมดใน Wordnet จะแสดงในรูปแบบเทมเพลตแบบรวม แต่ความสัมพันธ์บางอย่างอาจขาดข้อมูลที่จำเป็น เช่น ตัวอย่างและการทดสอบ ซึ่งเผยแพร่ในหน้าเว็บของ Princeton Wordnet, หลักเกณฑ์ทั่วไปของ EuroWordnet และแหล่งข้อมูลอื่นๆ คำจำกัดความและคำจำกัดความแบบสั้น ตัวอย่างแบบสั้นและตัวอย่างไม่มีรูปแบบประโยคที่เป็นหนึ่งเดียว เนื่องจากคำจำกัดความแบบสั้นและตัวอย่างแบบสั้นคือไฮไลต์เมื่อผู้ใช้วางเมาส์เหนือความสัมพันธ์หนึ่งๆ คำจำกัดความและตัวอย่างมีบทบาทหลักในการแนะนำความสัมพันธ์ จึงควรมีโครงสร้างที่เป็นหนึ่งเดียวกัน แต่แตกต่างจากรูปแบบสั้นๆ การทดสอบมาจาก EWN แต่ควรวางบล็อกเงื่อนไขไว้ก่อนหน้าส่วนการทดสอบหลัก เนื่องจากผู้ใช้จะดูเงื่อนไขก่อนเสมอเพื่อตัดสินใจว่าข้อมูลภาษาของตนตรงกับเงื่อนไขหรือไม่ จากนั้นจึงทำการทดสอบ นอกจากนี้ ตัวทดสอบก็ไม่ได้ตรงไปตรงมาแบบนั้นโดยใช้ตัวย่อในภาษาต่างๆ มากมาย เนื้อหาของส่วนความคิดเห็นมีความหลากหลาย บางครั้งจะเน้นย้ำถึงบางประเด็นของคำนิยาม และบางครั้งอาจระบุรายละเอียดเฉพาะของโครงการ เราคิดว่าเราควรกำหนดมาตรฐานสำหรับส่วนนี้ การย้ายข้อมูลเกี่ยวกับโปรเจ็กต์หนึ่งๆ ไปยังส่วน "ชื่อเฉพาะโปรเจ็กต์" น่าจะสะดวกสำหรับผู้ใช้มากกว่า ส่วน "ชื่อเฉพาะโปรเจ็กต์" จะสรุปชื่อความสัมพันธ์ในโปรเจ็กต์ทั้งหมด ส่วนนี้ต้องได้รับการตรวจสอบเนื่องจากเกิดข้อผิดพลาดที่ไม่ตรงกัน ต้องลิงก์อภิธานศัพท์เข้ากับเอกสารโดยตรง และเพิ่มตัวย่อและคำศัพท์ทั้งหมดซึ่งอาจไม่คุ้นเคยกับผู้ใช้มือใหม่

หลักเกณฑ์

นอกจากนี้ผมยังต้องการพูดคุยถึงหัวข้อสองหัวข้อด้านล่างกับทีมโครงการก่อนที่จะร่างเอกสาร บทสรุปที่ได้รับจะใช้เป็นแนวทางทั่วไปของโครงการทั้งหมด

เกี่ยวกับผู้ชม นี่คือตัวอย่างของฉันจริงๆ ถึงแม้ว่าฉันจะเป็นอาจารย์ด้านภาษาศาสตร์ แต่เมื่อเจอเอกสารต้นฉบับเป็นครั้งแรก ฉันไม่รู้ว่า "ซินเซ็ต" หมายถึงอะไร แต่ฉันหาความหมายของคำพ้องความหมายบนหน้าเว็บของ Princeton Wordnet

ดังนั้นก่อนอื่นเราต้องค้นหาโครงสร้างความรู้ของผู้ที่มีโอกาสเป็นกลุ่มเป้าหมาย หากเราไม่สามารถมั่นใจได้ว่ากลุ่มเป้าหมายทั้งหมดจะมีความรู้ที่เกี่ยวข้อง อย่างน้อยเราก็ต้องเพิ่มส่วนภาพรวม ลิงก์อภิธานศัพท์ และแหล่งข้อมูลที่เกี่ยวข้องอื่นๆ เพื่อแนะนำผู้ใช้ผ่านเวิร์ดเน็ตและโครงการที่เกี่ยวข้อง เราควรคำนึงถึงข้อสันนิษฐานนี้ไว้เสมอ ตลอดทั้งกระบวนการจัดทำเอกสาร

เกี่ยวกับฟังก์ชันของเอกสาร ตามความเข้าใจของฉัน เป้าหมายของโครงสร้างเอกสารแบบ Wordnet คือช่วยให้ผู้ใช้คุ้นเคยกับความสัมพันธ์ทุกประเภทใน Wordnet และผู้ใช้สามารถจัดกลุ่มคำเป็นความสัมพันธ์เหล่านั้นตามข้อมูลที่ให้ไว้ แต่เอกสารต้นฉบับนั้นดูคล้ายกับการคัดแยกงานวิจัยทางวิชาการมากกว่า หากเอกสารมีจุดประสงค์เพื่อการอ้างอิงทางวิชาการ แต่ถ้าเอกสารมีจุดประสงค์เพื่อแนะนำผู้ใช้ ก็จะต้องมีข้อดีข้อเสียระหว่างวิชาการกับยูทิลิตี

ข้อดี

เราช่วยแปลเอกสารเวอร์ชันภาษาจีนได้ ฉันมีประสบการณ์ในการแปลเอกสารภาษาศาสตร์จากภาษาอังกฤษเป็นภาษาจีน ฉันสามารถช่วยจัดรูปแบบเอกสาร ฉันรู้ข้อมูลพื้นฐานเกี่ยวกับ HTML/CSS และช่วยทำให้หน้าเว็บในเอกสารดูดีขึ้นได้ เช่น การเพิ่มแถบนำทางด้านข้าง ฉันสามารถช่วยวาดโฟลว์ชาร์ตโดยใช้ Visio หรือ Mermaid ได้ถ้าโฟลว์ชาร์ตช่วยให้ผู้ใช้เข้าใจความสัมพันธ์มากขึ้น

เป้าหมาย / เวลา / เป้าหมาย

  • สัปดาห์ที่ 1: ปรึกษาหารือและกำหนดเป้าหมาย เวิร์กโฟลว์ และแผนการทำงานกับทีมโครงการ
  • สัปดาห์ที่ 2: แก้ไขโครงร่างเอกสารและเขียนส่วนภาพรวม
  • สัปดาห์ที่ 3 – สัปดาห์ที่ 4: เขียนข้อมูลในส่วนของความสัมพันธ์
  • สัปดาห์ที่ 5 – สัปดาห์ที่ 6: เขียนส่วนความสัมพันธ์อื่นๆ และของโดเมน
  • สัปดาห์ที่ 7 – สัปดาห์ที่ 8: เขียนข้อมูลส่วนความสัมพันธ์ของบทบาท
  • สัปดาห์ที่ 9: เขียนความสัมพันธ์ที่เหลือ 3 รายการและอัปเดตอภิธานศัพท์
  • สัปดาห์ที่ 10: แปลภาษาจีนหากจำเป็น
  • สัปดาห์ที่ 11: แก้ไขรูปแบบของเอกสาร
  • สัปดาห์ที่ 12: ตรวจสอบขั้นสุดท้ายและสรุปโครงการนี้