โปรเจ็กต์ Global Wordnet Association

หน้านี้มีรายละเอียดของโปรเจ็กต์การเขียนเชิงเทคนิคที่ได้รับการยอมรับสำหรับ Google Season of Docs

สรุปโปรเจ็กต์

องค์กรโอเพนซอร์ส
Global Wordnet Association
นักเขียนเชิงเทคนิค
Yoyo Wu
ชื่อโปรเจ็กต์:
โครงสร้าง Wordnet
ระยะเวลาของโปรเจ็กต์
ระยะเวลามาตรฐาน (3 เดือน)

คำอธิบายโปรเจ็กต์

เหตุผลที่เลือกโปรเจ็กต์นี้

ในฐานะนักเขียนด้านเทคนิคที่เชี่ยวชาญด้านภาษาศาสตร์ เรายินดีที่ได้พบโปรเจ็กต์เช่นนี้ที่มีแนวคิดในการเชื่อมโยงภาษาต่างๆ เข้าด้วยกันด้วยกรอบแนวคิดเชิงความหมายแบบรวม และนำไปใช้ในธุรกิจในชีวิตจริง เช่น Google แปลภาษา ฉันต้องการมีส่วนร่วมในเอกสารของโปรเจ็กต์นี้เพื่อทำให้เนื้อหาเข้าใจง่ายขึ้นสำหรับผู้ใช้

ปัญหา

เราได้อ่านเอกสารต้นฉบับและคิดว่าเราสามารถปรับปรุงได้โดยแก้ปัญหาด้านล่าง ไม่มีส่วนภาพรวมตอนต้นเพื่อแนะนำข้อมูลเบื้องต้นเกี่ยวกับ WordNet ซึ่งจะเป็นประโยชน์สำหรับผู้เริ่มต้น ถึงแม้ว่าความสัมพันธ์ทั้งหมดใน Wordnet จะมีการเผยแพร่ในเทมเพลตแบบรวม แต่ความสัมพันธ์บางอย่างก็ยังขาดข้อมูลที่จำเป็น เช่น ตัวอย่างและการทดสอบ ซึ่งเผยแพร่ในหน้าเว็บ Princeton Wordnet หลักเกณฑ์ทั่วไปของ EuroWordnet และแหล่งข้อมูลอื่นๆ คำจำกัดความแบบสั้นและคําจํากัดความ ตัวอย่างแบบสั้นและตัวอย่างไม่มีรูปแบบประโยคแบบเดียวกัน เนื่องจากคำจำกัดความแบบสั้นและตัวอย่างแบบสั้นคือข้อความไฮไลต์เมื่อเมาส์ของผู้ใช้วางเหนือความสัมพันธ์หนึ่งๆ คำจำกัดความและตัวอย่างมีบทบาทหลักในการแนะนำความสัมพันธ์ จึงควรมีโครงสร้างแบบเดียวกันแต่มีรูปแบบแตกต่างจากคู่แบบสั้น การทดสอบมาจาก EWN แต่ควรวางบล็อกเงื่อนไขไว้ก่อนเนื้อหาการทดสอบหลัก เนื่องจากผู้ใช้จะดูที่เงื่อนไขก่อนเสมอเพื่อตัดสินใจว่าข้อมูลภาษาตรงกับเงื่อนไขหรือไม่ จากนั้นจึงจะทำการทดสอบ และเนื้อความก็ไม่ง่ายนักที่จะมีคำย่อทางภาษาจำนวนมาก เนื้อหาของส่วนความคิดเห็นมีความหลากหลาย บางครั้งจะเน้นจุดใดจุดหนึ่งของคําจํากัดความ บางครั้งจะระบุรายละเอียดเฉพาะของโปรเจ็กต์ เราควรกำหนดมาตรฐานสำหรับส่วนนี้ การย้ายข้อมูลเกี่ยวกับโปรเจ็กต์ที่เฉพาะเจาะจงไปยังส่วนชื่อเฉพาะโปรเจ็กต์น่าจะสะดวกสำหรับผู้ใช้มากกว่า ส่วน "ชื่อเฉพาะโปรเจ็กต์" จะสรุปชื่อความสัมพันธ์ในทุกโปรเจ็กต์ ส่วนนี้ต้องได้รับการตรวจสอบเนื่องจากเกิดข้อผิดพลาดในการจับคู่ไม่ตรงกัน ต้องลิงก์อภิธานศัพท์กับเอกสารโดยตรง และเพิ่มคำย่อและคำศัพท์ทั้งหมดที่ผู้ใช้ใหม่อาจไม่คุ้นเคย

หลักเกณฑ์

นอกจากนี้ เรายังอยากพูดคุยถึง 2 หัวข้อด้านล่างกับทีมโครงการก่อนที่จะร่างเอกสาร โดยข้อสรุปที่ได้รับจะเป็นหลักเกณฑ์ทั่วไปของทั้งโครงการ

เกี่ยวกับผู้ชม นี่คือตัวอย่างที่แท้จริงของตัวฉันเอง แม้ว่าฉันจะเป็นวิชาเอกภาษาศาสตร์ แต่เมื่อฉันเจอเอกสารต้นฉบับเป็นครั้งแรก ฉันไม่รู้ว่า "synset" แปลว่าอะไร แต่อยู่ในหน้าเว็บ Princeton Wordnet ที่ฉันเห็นความหมายของคำพ้องความหมาย

ดังนั้นในตอนแรกเราต้องหาโครงสร้างความรู้ของผู้มีโอกาสเป็นกลุ่มเป้าหมาย หากเราไม่สามารถมั่นใจได้ว่าผู้ชมทุกคนมีความรู้ที่เกี่ยวข้อง อย่างน้อยที่สุดเราก็ควรเพิ่มส่วนภาพรวม ลิงก์อภิธานศัพท์ และแหล่งข้อมูลอื่นๆ ที่เกี่ยวข้องเพื่อแนะนำผู้ชมผ่าน WordNet และโปรเจ็กต์ที่เกี่ยวข้อง เราควรคำนึงถึงสมมติฐานนี้เสมอตลอดทั้งกระบวนการจัดทำเอกสาร

เกี่ยวกับฟังก์ชันของเอกสาร จากความเข้าใจของเรา เป้าหมายของเอกสารโครงสร้าง WordNet คือช่วยให้ผู้ใช้คุ้นเคยกับความสัมพันธ์ทุกประเภทใน WordNet และผู้ใช้สามารถจัดกลุ่มคำเป็นความสัมพันธ์เหล่านั้นตามข้อมูลที่ให้ไว้ อย่างไรก็ตาม เอกสารต้นฉบับมีลักษณะคล้ายกับข้อความที่ตัดมาจากงานเขียนทางวิชาการมากกว่า หากวัตถุประสงค์ของเอกสารมีไว้เพื่ออ้างอิงทางวิชาการ ก็ไม่เป็นไร แต่หากมีไว้เพื่อวัตถุประสงค์ในการแนะนำผู้ใช้ ก็ต้องมีการแลกเปลี่ยนระหว่างวิชาการและประโยชน์

ประโยชน์

เราช่วยแปลเอกสารเวอร์ชันภาษาจีนได้ ฉันมีประสบการณ์ในการแปลบทความทางภาษาศาสตร์จากภาษาอังกฤษเป็นจีน ฉันช่วยจัดรูปแบบเอกสารได้ ฉันรู้พื้นฐานของ HTML/CSS และสามารถช่วยทำให้หน้าเว็บเอกสารดูดีขึ้นได้ เช่น การเพิ่มแถบนำทางด้านข้าง เราช่วยวาดผังงานโดยใช้ Visio หรือ Mermaid ได้หากผังงานจะช่วยให้ผู้ใช้เข้าใจความสัมพันธ์ได้ดียิ่งขึ้น

เหตุการณ์สำคัญ / เวลา / เป้าหมาย

  • สัปดาห์ที่ 1: พูดคุยและตกลงเป้าหมาย เวิร์กโฟลว์ และแผนการทำงานกับทีมโปรเจ็กต์
  • สัปดาห์ที่ 2: สรุปโครงร่างเอกสาร และเขียนส่วนภาพรวม
  • สัปดาห์ที่ 3 – สัปดาห์ที่ 4: เขียนส่วนความสัมพันธ์เชิงประกอบ
  • สัปดาห์ที่ 5 – สัปดาห์ที่ 6: เขียนส่วน "อื่นๆ" และ "ความสัมพันธ์ของโดเมน"
  • สัปดาห์ที่ 7 – สัปดาห์ที่ 8: เขียนส่วนความสัมพันธ์ของบทบาท
  • สัปดาห์ที่ 9: เขียนความสัมพันธ์อีก 3 รายการที่เหลือและอัปเดตอภิธานศัพท์
  • สัปดาห์ที่ 10: แปลเวอร์ชันจีนหากจำเป็น
  • สัปดาห์ที่ 11: แก้ไขรูปแบบของเอกสาร
  • สัปดาห์ที่ 12: ตรวจสอบขั้นสุดท้ายและสรุปโครงการนี้