Dự án Liên kết Wordnet toàn cầu

Trang này chứa thông tin chi tiết về một dự án viết kỹ thuật được chấp nhận cho Phần Google Tài liệu.

Tóm tắt dự án

Tổ chức nguồn mở:
Wordnet toàn cầu
Người viết nội dung kỹ thuật:
Kumar
Tên dự án:
Mở Wordnet đa ngôn ngữ (OMW)
Thời lượng dự án:
Thời gian tiêu chuẩn (3 tháng)

Mô tả dự án

Yêu cầu dự án:

Tôi đã liên hệ với các chuyên gia cố vấn của Hiệp hội Wordnet toàn cầu và đã gửi một yêu cầu lấy dữ liệu và được họ xem xét tích cực. Nếu có cơ hội, tôi có thể dành 40 giờ (hoặc hơn) mỗi tuần cho dự án này. Tôi có thành thạo ngôn ngữ Python, Git, HTML, C++, Java và C. Tôi biết hai ngôn ngữ và có thể nói trôi chảy tiếng Anh và tiếng Hindi. Tôi học tiếng Pháp ở trường và cũng biết một chút tiếng Đức. Tôi rất quan tâm và nhiệt tình đóng góp cho Hiệp hội Wordnet toàn cầu thông qua dự án này. Nếu có cơ hội, tôi sẽ làm việc hết mình với sự cống hiến của bạn.

Trạng thái hiện tại:

Tài liệu Mở đa ngôn ngữ trong Wordnet hiện tại có nội dung nghèo nàn và chưa hoàn chỉnh, do đó thiếu nội dung, hình ảnh, ví dụ và hướng dẫn rõ ràng. Không có hướng dẫn sử dụng nào để hỗ trợ người tìm kiếm trên wordnet, cách đọc các trang được trả về, cách cài đặt, cách cung cấp phản hồi. Có một số tài liệu về việc đóng góp wordnet mới, nhưng tài liệu đó không đầy đủ và không rõ ràng để hướng dẫn người dùng cách tham gia Open MultiLanguage Wordnet. Không có tài liệu nào về cách tương tác với Chỉ mục liên ngôn ngữ cộng tác (CILI). Ngoài ra, có một trang giới thiệu CILI thiếu thông tin như lý do và cách thức không dùng nữa và thay thế các khái niệm, đánh giá các đề xuất mới. Nhìn chung, các tài liệu hiện tại vẫn thiếu nội dung, sự rõ ràng, ví dụ và hình ảnh để hỗ trợ.

Lập kế hoạch:

Tôi dự định thực hiện dự án này theo 4 giai đoạn. Trong giai đoạn A, tôi sẽ ghi lại hướng dẫn cho một người đóng góp Wordnet mới. Trong giai đoạn này, tôi sẽ trình bày cách tạo Wordnet được định dạng tốt, cách tải lên và cách hiểu ý nghĩa của phản hồi. Ở giai đoạn tiếp theo B, tôi sẽ ghi lại hướng dẫn cho những người đang tìm kiếm wordnet (hoặc nhóm wordnet). Trong tài liệu đó, tôi sẽ trình bày cách đọc các trang được trả về, cách tải xuống và cách đưa ra ý kiến phản hồi. Trong giai đoạn C, tôi sẽ ghi lại hướng dẫn tương tác với Chỉ mục liên ngôn ngữ cộng tác, cách không dùng nữa và thay thế các khái niệm, cũng như việc đánh giá ứng viên mới sẽ được ghi lại trong giai đoạn C. Trong giai đoạn D, tôi sẽ điền sẵn tài liệu về Open MultiLanguage Wordnet, cải thiện tài liệu hiện có của dự án này ngoài những tài liệu đã trình bày ở giai đoạn A, B và C. Do có sự trùng lặp giữa các dự án của GWA, giai đoạn D cũng sẽ được dành riêng cho các yêu cầu về tổ chức. Tôi đã lên kế hoạch phân bổ các tuần 1,2 & 3 cho giai đoạn A, các tuần 4,5 & 6 sẽ được phân bổ cho giai đoạn B, tuần 7,8 & 9 cho giai đoạn C và các tuần 10 và 11 cho giai đoạn D.

Mục tiêu dự án:

1) Phân tích tài liệu hiện có và xác định mục nào cần cải thiện.

2) Xây dựng lại cấu trúc của tài liệu hiện có.

3) Ghi lại hướng dẫn cho một người nào đó đóng góp wordnet mới.

4) Lập tài liệu hướng dẫn cho người tìm kiếm wordnet.

5) Ghi lại hướng dẫn tương tác với Chỉ mục cộng tác liên ngôn ngữ.

6) Thêm ví dụ và hình ảnh vào tài liệu.

7) Điền vào các trang hiện có mà tài liệu trông có vẻ thiếu thông tin.

Dòng thời gian:

  • Giai đoạn gắn kết cộng đồng: 17/8 – 13/9.

    • Trong thời gian này, tôi sẽ tương tác với cộng đồng và sẽ hiểu rõ hơn về cộng đồng.
    • Thiết lập một kênh liên lạc.
    • Thiết lập thời gian liên lạc.
    • Tinh chỉnh mục tiêu và đặt kỳ vọng cho cả hai phía.
  • Giai đoạn phát triển tài liệu (từ ngày 14 đến ngày 30 tháng 11)

    • Tôi sẽ phối hợp chặt chẽ với người cố vấn và sẽ hoàn thành dự án của mình trong giai đoạn này theo kế hoạch hằng tuần.
    • Hoàn thành bài khảo sát bất kỳ từ các quản trị viên chương trình Google.
  • Tuần 1-3 (14-27/9)

    • Giai đoạn A của tài liệu
  • Tuần 1 (từ ngày 14 đến ngày 20 tháng 9)

    • Bắt đầu có tài liệu hướng dẫn cho người đóng góp wordnet mới.
    • Tuần này tôi sẽ hướng dẫn bạn cách tạo wordnet được định dạng tốt.
    • Hướng dẫn rõ ràng về việc chuyển đổi wordnet của người dùng sang định nghĩa loại tài liệu Wordnet LMF công khai (DTD) sẽ được ghi lại.
    • Các công cụ chuyển đổi cũng sẽ được đề cập trong báo cáo này.
  • Tuần 2 (từ ngày 21 đến 27 tháng 9)

    • Tuần này tôi sẽ làm tài liệu về cách tải một wordnet của một người (sau khi chuyển đổi sang định nghĩa loại tài liệu LMF của Wordnet) lên OMW.
    • Tài liệu hiện có nội dung nghèo nàn (nhưng chính xác). Tôi sẽ điền sẵn tài liệu đó và thêm ví dụ vào tài liệu.
  • Tuần 3 (từ ngày 28 tháng 9 đến ngày 4 tháng 10)

    • Chúng tôi sẽ sử dụng tuần này để soạn tài liệu về cách hiểu ý kiến phản hồi.
    • Tài liệu này phải được viết từ đầu, vì hiện chưa có tài liệu nào về chủ đề này.
  • Tuần 4-6 (ngày 5-25 tháng 10)

    • Giai đoạn B của tài liệu
  • Tuần 4 (ngày 5 – 11 tháng 10)

    • Tuần này, tôi sẽ bắt đầu tạo tài liệu hướng dẫn cho ai đó đang tìm kiếm wordnet (hoặc nhóm wordnet).
    • Tuần này, tôi sẽ viết tài liệu về cách đọc các trang được trả về.
  • Tuần 5 (12-18/10)

    • Tuần này, tôi sẽ ghi lại cách tải xuống.
    • Hiện không có tài liệu nào về việc này nên không cần phải viết từ đầu.
  • Tuần 6 (19-25/10)

    • Tuần này, tôi sẽ ghi lại cách đưa ra ý kiến phản hồi cho tổ chức.
    • Vì không có tài liệu nào trước đó để tham khảo nên chúng tôi cũng sẽ viết lại từ đầu.
  • Tuần 6-9 (ngày 26 tháng 10 đến ngày 15 tháng 11)

    • Giai đoạn-C của tài liệu
  • Tuần 7 (26 tháng 10 đến 1 tháng 11)

    • Tuần này, tôi sẽ bắt đầu tài liệu về hướng dẫn tương tác với Chỉ mục cộng tác liên ngôn ngữ (CILI)
    • Tuần này, tôi sẽ ghi lại cách thức và lý do không dùng nữa và thay thế các khái niệm.
  • Tuần 8 (ngày 2 – 8 tháng 11)

    • Tuần này, tôi sẽ ghi lại thông tin bổ sung về CILI, và viết hướng dẫn về cách tải xuống CILI cũng như đáp ứng các yêu cầu về tổ chức trên tài liệu về CIR, mà tài liệu này cần phải được viết từ đầu.
  • Tuần 9 – 11 (ngày 9 – 29/11)

    • Giai đoạn D của tài liệu
  • Tuần 9 (từ ngày 9 đến ngày 15 tháng 11)

    • OMW 2.0 sẽ được phát triển ngay bây giờ, tuỳ theo nhu cầu của tổ chức.
  • Tuần 10 (từ ngày 16 đến 22 tháng 11)

    • Tài liệu về trang chủ Mở đa ngôn ngữ Wordnet (OMW) có vẻ nông, tuần này tôi sẽ làm việc về nó và thêm thông tin bổ sung liên quan đến OMW, đồng thời tôi sẽ xem xét các trang OMW hiện có khác cần được điền vào.
    • Chúng tôi sẽ cải thiện những trang thiếu OMW và sẽ cố gắng thêm hình ảnh bất cứ khi nào có thể.
  • Tuần 11 (từ ngày 23 đến ngày 29 tháng 11)

    • Vì có sự trùng lặp trong các dự án của GWA, nên tuần này được dành riêng để đáp ứng những nhu cầu chồng chéo của tổ chức này, cũng như các tài liệu khác.
  • Giai đoạn tổng kết và đánh giá dự án (30/11 – 5/12)

    • Bạn sẽ dành tuần này để đọc tài liệu về lỗi chính tả và lỗi.
    • Tôi sẽ viết báo cáo dự án của mình.
    • Tôi sẽ yêu cầu người cố vấn xem báo cáo dự án của tôi.
    • Tôi sẽ hoàn tất và gửi báo cáo dự án của mình.
    • Tôi sẽ viết và gửi bài đánh giá về người cố vấn cũng như trải nghiệm của tôi về Phần Tài liệu.

Giao tiếp:

Tần suất liên hệ sẽ phụ thuộc vào phiên thảo luận với người cố vấn. Tôi muốn liên lạc thường xuyên hơn. Tôi đề xuất hai lần mỗi tuần để cung cấp thông tin cập nhật và nhận phản hồi về công việc đã thực hiện từ trước đến nay. Tuy nhiên, cách này cũng linh hoạt tuỳ thuộc vào ý muốn của họ.

Tại sao có dự án này?

Tôi quan tâm đến ngôn ngữ học và ý tưởng kết nối các mạng lưới cho tất cả các ngôn ngữ trên thế giới đã thôi thúc tôi tham gia Hiệp hội Wordnet toàn cầu và đóng góp cho dự án này. Khái niệm về Wordnet đa ngôn ngữ mở rất đáng ngưỡng mộ khi các lưới word riêng lẻ được liên kết với lưới Wordnet bằng các ngôn ngữ khác, giúp các lưới word này có thể truy cập dễ dàng hơn. Mở Wordnet đa ngôn ngữ và các thành phần của nó có thể được tự do sử dụng, sửa đổi và chia sẻ bởi bất kỳ ai cho bất kỳ mục đích nào. Mặc dù GWA có ý tưởng vững vàng và ý định cao cả, nhưng tổ chức này không nổi tiếng và bị đánh giá thấp. Có thể một trong những lý do là tài liệu nông và thiếu hướng dẫn sử dụng để hỗ trợ việc đóng góp và sử dụng nó. Tôi nhận thấy dự án Open MultiLanguage Wordnet là một điều gì đó mà tôi có thể đóng góp để hỗ trợ Hiệp hội Wordnet toàn cầu và cộng đồng nguồn mở nói chung.

Kế hoạch trong tương lai:

Sau khi hoàn thành GSoD 20, tôi sẽ tiếp tục đóng góp cho Hiệp hội Wordnet toàn cầu trong các dự án khác. Tôi chắc chắn sẽ tham dự bất kỳ hội nghị nào của tổ chức nếu có thời gian.