Global Wordnet Association projesi

Bu sayfa, Google Dokümanlar Sezonu için kabul edilen bir teknik yazı projesinin ayrıntılarını içerir.

Proje özeti

Açık kaynak kuruluşu:
Global Wordnet Derneği
Teknik yazar:
Yoyo Wu
Projenin adı:
Wordnet Yapısı
Proje süresi:
Standart uzunluk (3 ay)

Proje açıklaması

Neden bu proje?

Dilbilim alanında uzman olan bir teknik yazar olarak, farklı dilleri birleşik bir anlamsal kavramsal çerçeveyle birbirine bağlama fikrine sahip böyle bir proje bulduğuma sevindim. Bu proje, Google Çeviri gibi gerçek dünya işlerine uygulandı. Bu projenin daha kullanıcı dostu olmasını sağlamak için belgelerine katkıda bulunmak istiyorum.

Sorunlar

Orijinal belgeyi inceledim ve aşağıdaki sorunları çözerek bu belgeyi geliştirebileceğimizi düşünüyorum: Başlangıçta, yeni başlayanlar için faydalı olabilecek wordnet'in temellerini tanıtan bir Genel Bakış bölümü eksik. Wordnet'teki tüm ilişkiler birleştirilmiş bir şablon olarak sunulsa da, bazı ilişkilerde, Princeton Wordnet web sayfası, EuroWordnet genel yönergeleri ve diğer kaynaklarda dağıtılan örnekler ve testler gibi gerekli bilgiler eksiktir. Kısa tanım ve tanım, kısa örnek ve örnek bölümlerinde birleşik cümle kalıbı yoktur. Bunun nedeni, kullanıcının faresiyle belirli bir ilişkinin üzerine fare ile üzerine gelindiğinde açıklama metni olmasıdır. Tanım ve örnek, temel rol olarak ilişkinin tanıtılmasında rol oynar. Bunlar, birleştirilmiş ancak kısa karşılıklarından farklı kalıplar halinde yapılandırılmalıdır. Testler EWN kaynaklıdır, ancak kullanıcılar dilsel verilerinin koşullarla eşleşip eşleşmediğine karar vermek için her zaman önce koşullara bakacağı ve sonra teste gireceği için, koşul bloğu ana test gövdesinin önüne yerleştirilmelidir. Ayrıca test metni, çok sayıda dilsel kısaltma ile yeterince açık değildir. Yorumlar bölümünün içeriği çok çeşitlidir. Bazen tanımın belirli bir noktasını vurgular, bazen de projeye özgü ayrıntıları belirtir. Bence bu bölüm için bir standart belirlemeliyiz: Belirli projelerle ilgili bilgileri Projeye Özel Adlar bölümüne taşımak kullanıcılar için daha uygun olacaktır. Projeye Özel Adlar bölümü tüm projelerdeki ilişki adını özetler. Uyuşmazlık hataları ortaya çıktığı için bu bölümün incelenmesi gerekir. Terimler Sözlüğü'nü doğrudan dokümana bağlamanız ve yeni başlayanlar için tanıdık gelebilecek tüm kısaltmaları ve terimleri eklemeniz gerekir.

Yönergeler

Belge taslağını hazırlamadan önce aşağıdaki iki konuyu proje ekibiyle tartışmak da istiyorum. Elde edilen sonuç tüm proje için genel bir kılavuz görevi görür.

Hedef kitle hakkında Kendime dair gerçek bir örnek vereyim. Dilbilim alanında uzman olmama rağmen, orijinal belgeyle ilk karşılaştığımda, "synset" ifadesinin ne anlama geldiğini bilmiyorum. Sendsetin anlamını Princeton Wordnet web sayfasında çıkarıyorum.

Bu nedenle, ilk olarak potansiyel kitlenin bilgi yapısını belirlememiz gerekir. Tüm hedef kitlenin alakalı bilgilerle donatıldığından emin olamazsak, en azından bir Genel Bakış bölümü eklememiz, wordnet ve ilgili projelerde rehberlik etmesi için Terimler Sözlüğü'nü ve ilgili diğer kaynakları bağlamamız gerekir. Tüm belgeleme süreci boyunca bu varsayımı her zaman aklımızda tutmalıyız.

Dokümanların işlevi hakkında Bildiğim kadarıyla wordnet yapısı dokümanlarının amacı, kullanıcıların wordnet'teki tüm ilişki türlerini tanımalarına yardımcı olmaktır ve kullanıcılar, sağlanan bilgilere göre kelimeleri bu ilişkiler altında gruplandırabilir. Ancak, orijinal dokümanlar daha çok akademik makale özetlerine benzer. Dokümanların amacı akademik referanssa sorun değil ancak kullanıcıları yönlendirme amacına hizmet ediyorsa akademi ile fayda arasında ödün verilmelidir.

Avantajları

Dokümanların Çince sürümünün çevrilmesine yardımcı olabilirim. Dilbilim makalelerini İngilizceden Çinceye çevirme deneyimim var. Dokümanları biçimlendirmeye yardımcı olabilirim, HTML/CSS ile ilgili temel bilgileri biliyorum ve yan gezinme çubuğu eklemek gibi dokümanlar web sayfasının daha iyi görünmesine yardımcı olabilirim. Kullanıcıların ilişkileri daha iyi anlamalarına yardımcı oluyorsa Visio veya Deniz Kızı kullanarak bazı akış şemaları çizmeye yardımcı olabilirim.

Ara Hedefler / Zaman / Hedef

  • 1. Hafta: Proje ekibiyle hedefi, iş akışını ve çalışma planını tartışma ve karara bağlama.
  • 2. Hafta: Dokümanların ana hatlarını belirleyin ve Genel Bakış bölümünü yazın.
  • 3. Hafta – 4. Hafta: Kurucu ilişkiler bölümünü yazın.
  • 5. Hafta - 6. Hafta: Diğer ve Alan ilişkileri bölümünü yazın.
  • 7. Hafta – 8. Hafta: Rol ilişkileri bölümünü yazın.
  • 9. Hafta: Kalan üç ilişkiyi yazın ve sözlüğü güncelleyin.
  • 10. Hafta: Gerekirse Çince sürümü çevirin.
  • 11. Hafta: Dokümanların biçimini gözden geçirin.
  • 12. Hafta: Son kontrol yaparak bu projeyi özetleyin.