Global Wordnet Association projesi

Bu sayfada, Google Dokümanlar Sezonu için kabul edilen bir teknik yazım projesinin ayrıntıları yer almaktadır.

Proje özeti

Açık kaynak kuruluşu:
Global Wordnet Association
Teknik yazar:
Yoyo Wu
Proje adı:
Wordnet Yapısı
Proje uzunluğu:
Standart uzunluk (3 ay)

Proje açıklaması

Neden bu proje?

Lisansımı dilbilim alanında tamamlamış bir teknik yazar olarak, farklı dilleri birleştirilmiş bir anlamsal-kavramsal çerçeveyle birbirine bağlama fikrini temel alan ve Google Çeviri gibi gerçek dünyadaki işletmelere uygulanmış böyle bir projeyle karşılaşmaktan memnuniyet duyuyorum. Kitle için daha kullanıcı dostu hale getirmek amacıyla bu projenin dokümanlarına katkıda bulunmak istiyorum.

Sorunlar

Orijinal belgeyi inceledim ve aşağıdaki sorunları gidererek bu belgeyi geliştirebileceğimizi düşünüyorum: Yeni başlayanlar için yararlı olacak, wordnet'in temellerini tanıtmak için başlangıçta bir Genel Bakış bölümü eksik. Wordnet'teki tüm ilişkiler birleştirilmiş bir şablonda kullanıma sunulsa da bazı ilişkilerde Princeton Wordnet web sayfasında, EuroWordnet genel yönergelerinde ve diğer kaynaklarda dağıtılan örnekler ve testler gibi gerekli bilgiler eksiktir. Kısa tanım ve Tanım, kısa örnek ve Örnek, birleşik bir cümle kalıbına sahip değildir. Kısa tanım ve kısa örnek, kullanıcının fareyle belirli bir ilişkinin üzerine geldiğinde gösterilen açıklama metinleridir. Tanım ve örnek ise ilişkiyi tanıtma konusunda ana rolü üstlenir. Bu nedenle, bu metinler birleşik ancak kısa muadillerinden farklı kalıplarda yapılandırılmalıdır. Testler EWN'den alınmıştır ancak kullanıcılar dilsel verilerinin koşullarla eşleşip eşleşmediğine karar vermek için her zaman önce koşullara bakacağından ve ardından testi yapacağından koşullar bloğu ana test gövdesinin önüne yerleştirilmelidir. Test metni de birçok dilsel kısaltma içerdiği için çok açık değil. Yorumlar bölümünün içeriği çeşitlidir. Bazen tanımın belirli bir noktasını vurgular, bazen de projeye özel ayrıntıları belirtir. Bu bölüm için bir standart belirlememiz gerektiğini düşünüyorum. Belirli projelerle ilgili bilgileri Projeye özgü adlar bölümüne taşımak kullanıcılar için daha uygun olacaktır. Projeye özgü adlar bölümü, tüm projelerdeki ilişki adını özetler. Eşleşme hataları oluştuğu için bu bölümün incelenmesi gerekir. Terimler Sözlüğü'nün doğrudan dokümana bağlanması ve yeni başlayanların aşina olmayabileceği tüm kısaltmaların ve terimlerin eklenmesi gerekiyor.

Yönergeler

Ayrıca, dokümanları taslak haline getirmeden önce aşağıdaki iki konuyu proje ekibiyle de görüşmek isterim. Elde edilen sonuç, projenin tamamı için genel yönergeler olarak kullanılacaktır.

Kitle hakkında Burada kendimle ilgili gerçek bir örnek vereceğim. Dilbilim uzmanı olmama rağmen orijinal dokümanla ilk kez karşılaştığımda "synset"in ne anlama geldiğini bilmiyordum. Synset'in anlamını Princeton Wordnet web sayfasında buldum.

Bu nedenle, öncelikle potansiyel kitlenin bilgi yapısını anlamamız gerekiyor. Kitlenin tamamının ilgili bilgilere sahip olmasını sağlayamıyorsak en azından bir Genel Bakış bölümü eklememiz, WordNet ve ilgili projelerde onlara rehberlik etmek için terimler sözlüğünü ve diğer ilgili kaynakları bağlamamız gerekiyor. Belgelendirme sürecinin tamamında bu varsayımı her zaman göz önünde bulundurmalıyız.

Dokümanların işlevi hakkında Anladığım kadarıyla, wordnet yapısı dokümanlarının amacı kullanıcıların wordnet'teki tüm ilişki türlerini tanımasına yardımcı olmaktır ve kullanıcılar, verilen bilgilere göre kelimeleri bu ilişkilerde gruplandırabilir. Ancak orijinal dokümanlar daha çok akademik makale alıntılarına benzer. Belgelerin amacı akademik referans sağlamaksa sorun yoktur ancak kullanıcılara yol göstermek amacıyla kullanılıyorsa akademik ve faydalı olma arasında bir denge kurulmalıdır.

Avantajları

Dokümanların Çince sürümünün çevrilmesine yardımcı olabilirim. Dilbilim makalelerini İngilizceden Çinceye çevirme konusunda deneyimliyim. Dokümanları biçimlendirmenize yardımcı olabilirim. HTML/CSS'nin temellerini biliyorum ve dokümanlar web sayfasının daha iyi görünmesi için yan gezinme çubuğu ekleme gibi işlemler yapabilirim. Akış şemaları kullanıcıların ilişkileri daha iyi anlamasına yardımcı olursa Visio veya Deniz Kızı kullanarak bazı akış şemaları çizmeye yardımcı olabilirim.

Dönüm noktaları / Süre / Hedef

  • 1. Hafta: Proje ekibiyle hedef, iş akışı ve çalışma planını tartışın ve kararlaştırın.
  • 2. Hafta: Doküman ana hatlarını belirleyin ve Genel Bakış bölümünü yazın.
  • 3. Hafta - 4. Hafta: Kurucu ilişkiler bölümünü yazın.
  • 5. Hafta – 6. Hafta: Diğer ve Alan ilişkileri bölümünü yazın.
  • 7. Hafta – 8. Hafta: Rol ilişkileri bölümünü yazın.
  • 9. Hafta: Kalan üç ilişkiyi yazın ve sözlüğü güncelleyin.
  • 10. Hafta: Gerekirse Çince sürümü çevirin.
  • 11. Hafta: Dokümanların biçimini gözden geçirin.
  • 12. Hafta: Son kontrol ve bu projeyi özetleyin.