Global Wordnet Association projesi

Bu sayfa, Google Dokümanlar Sezonu için kabul edilen bir teknik yazı projesinin ayrıntılarını içerir.

Proje özeti

Açık kaynak kuruluşu:
Global Wordnet
Teknik yazar:
Kumar
Projenin adı:
Open Çok Dilli Wordnet (OMW)
Proje süresi:
Standart uzunluk (3 ay)

Proje açıklaması

Proje talebi:

Global Wordnet Association danışmanlarıyla iletişime geçtim ve onlar tarafından olumlu şekilde değerlendirilen bir çekme talebi gönderdim. Mümkün olursa bu projede haftada 40 saat (veya daha fazla) harcayabilirim. Python, Git, HTML, C++, Java ve C'yi iyi biliyorum. İki dilim var, İngilizce ve Hintçe konuşabiliyorum. Okulda Fransızca öğrendim, ayrıca az miktarda Almanca biliyorum. Son derece özveriyle çalışma şansım olursa bu projeyle Global Wordnet Association'a katkıda bulunma konusunda çok hevesli ve hevesliyim.

Mevcut Durum:

Mevcut Çok Dilli Open Wordnet dokümanları yüzeyseldir ve mevcut kullanıcı rehberlerinde içerik, grafik, örnek ve açık talimatlar yoktur. Wordnet'te arama yapan bir kullanıcıya, geri verilen sayfaların nasıl okunacağına, nasıl yükleneceğine ve geri bildirim sağlanmasına yardımcı olacak bir kullanıcı kılavuzu yok. Yeni wordnet'e katkıda bulunmayla ilgili bazı dokümanlar mevcuttur, ancak bu dokümanlar tam veya açık değildir. Ayrıca, Open Çok Dilli Wordnet'e katılma konusunda kullanıcılara yol gösterecek bilgiler de yoktur. Collaborative Interlingual Index (CILI) ile nasıl etkileşimde bulunulacağına dair herhangi bir belge yoktur. CILI giriş sayfası vardır. Bu sayfada, yeni adayları değerlendirirken neden ve nasıl kavramların nasıl kullanımdan kaldırılacağı ve yerinin alınacağı gibi bilgiler yer almaz. Mevcut belgelerde yardım için içerik, netlik, örnek ve görsel eksikliği var.

Plan:

Bu projeyi dört aşamada yürütmeyi planladım. A aşamasında, yeni wordnet'e katkıda bulunan biri için bir kılavuz oluşturacağım. Bu aşamada, iyi biçimlendirilmiş wordnet'in nasıl oluşturulacağını, nasıl yükleneceği ve geri bildirimin nasıl anlamlandırılacağını ele alacağız. Sonraki aşamada B'de, wordnet'te (veya wordnet ailesinden) arama yapan bir kişi için bir kılavuz hazırlayacağım. Bu dokümanda, döndürülen sayfaların nasıl okunacağını, nasıl indirileceğini ve nasıl geri bildirim sağlanacağını ele alacağım. C aşamasında, Collaborative Interlingual Index ile etkileşime ilişkin bir kılavuzu yayınlayacağım, kavramları nasıl kullanımdan kaldıracağınızı ve yerini nasıl alacağınızı ve yeni adayların nasıl değerlendirileceğini C aşamasında ele alacağız. D aşamasında, Open Multilingual Wordnet belgelerini dolduracağım ve A, B ve C aşamalarında ele alınan dokümanlar dışında bu projenin mevcut belgelerini iyileştireceğim. GWA projeleri arasında çakışma olduğundan, D aşamasında kurumsal gereksinimler de ayrılacaktır. A aşaması için 1, 2 ve 3. haftaları; 4,5 ve 6. haftalar, aşama C için 7,8 ve 9. haftalara ve D aşaması için 10 ve 11. haftalara tahsis etmeyi planlıyorum.

Proje Hedefleri:

1) Mevcut belgeleri analiz etme ve hangi bölümün iyileştirme gerektirdiğini belirleme.

2) Mevcut belge yapısının yeniden oluşturulması.

3) Yeni Wordnet'e katkıda bulunan bir kullanıcı için bir kılavuzu belgelemek.

4) Wordnet'te arama yapan biri için bir kılavuzu belgeleme.

5) Collaborative Interlingual Index ile etkileşime ilişkin kılavuzu belgeleme.

6) Dokümanlara örnekler ve görseller ekleme.

7) Dokümanların yüzeysel olduğu düşünülen mevcut sayfaları doldurun.

Zaman çizelgesi:

  • Toplulukla bağ kurma aşaması: 17 Ağustos - 13 Eylül.

    • Bu dönemde toplulukla etkileşime geçip topluluğu daha iyi tanıyacağım.
    • Bir iletişim kanalı kurun.
    • İletişim için bir zaman belirleyin.
    • Hedefleri hassaslaştırın ve her iki tarafta da beklentileri belirleyin.
  • Belge Geliştirme aşaması (14 Eylül - 30 Kasım)

    • Mentorlarımla yakından çalışacak ve bu aşamada projemi haftalık planlara göre tamamlayacağım.
    • Google program yöneticilerinin anketlerini tamamlayın.
  • 1-3. Hafta (14-27 Eylül)

    • Belgeleme A aşaması
  • 1. Hafta (14-20 Eylül)

    • Yeni Wordnet'e katkıda bulunan bir kullanıcı için kılavuz belgeleri başlar.
    • Bu hafta, doğru biçimlendirilmiş Wordnet'in nasıl oluşturulacağını anlatacağım.
    • Kullanıcının wordnet'ini herkese açık Wordnet LMF doküman türü tanımına (DTD) dönüştürmeyle ilgili açık talimatlar belgelenecektir.
    • Bu bölümde dönüşüm araçları da ele alınacaktır.
  • 2. Hafta (21-27 Eylül)

    • Bu hafta, bir wordnet'in (Wordnet LMF doküman türü tanımına dönüştürüldükten sonra) OMW'ye nasıl yükleneceğiyle ilgili belgeleri yapacağım.
    • Mevcut belgeler yüzeysel (ancak doğru) Belgeyi doldurup belgelere ekleyeceğim.
  • 3. Hafta (28 Eylül - 4 Ekim)

    • Bu hafta, geri bildirimin nasıl anlam ifade edeceğini gösteren dokümanlar için kullanılacaktır.
    • Bu konuyla ilgili mevcut bir doküman olmadığından, bu belge sıfırdan yazılmalıdır.
  • 4-6. Hafta (5-25 Ekim)

    • Belgeleme aşaması-B
  • 4. Hafta (5-11 Ekim)

    • Bu hafta, wordnet'te (veya kelime ağları ailesinde) arama yapan kullanıcılar için bir kılavuzu belgelemeye başlayacağım.
    • Bu hafta, döndürülen sayfaların nasıl okunacağıyla ilgili dokümanlar yazacağım.
  • 5. Hafta (12-18 Ekim)

    • Bu hafta, nasıl indirileceğini anlatacağım.
    • Bununla ilgili mevcut bir belge yok ve sıfırdan yazılması gerekiyor.
  • 6. Hafta (19-25 Ekim)

    • Bu hafta, kuruma nasıl geri bildirim sağlayabileceğimi açıklayacağım.
    • Referans olarak kullanılabilecek daha önceki bir belge olmadığından, bu belge de sıfırdan yazılacaktır.
  • 6-9. Hafta (26 Ekim-15 Kasım)

    • Belgeleme (C) aşaması
  • 7. Hafta (26 Ekim-1 Kasım)

    • Bu hafta, Collaborative Interlingual Index (CILI) ile etkileşim kurma kılavuzunu içeren bir kılavuza başlayacağım.
    • Bu hafta kavramları nasıl ve neden kullanımdan kaldıracağımızı ve bunların yerini nasıl alabileceğimizi açıklayacağım.
  • 8. Hafta (2-8 Kasım)

    • Bu hafta CILI ile ilgili ek bilgileri ele alacağız ve bu dokümanın en baştan yazılması gereken CILI dokümanlarında CILI'nin nasıl indirileceği ve kuruluş gereksinimlerinin nasıl karşılanacağı ile ilgili talimatları yazacağım.
  • 9-11. Hafta (9-29 Kasım)

    • Belgeleme (D) aşaması
  • 9. Hafta (9-15 Kasım)

    • OMW 2.0 şimdi kurumsal ihtiyaçlar doğrultusunda geliştirilecektir.
  • 10. Hafta (16-22 Kasım)

    • Open Çok Dilli Wordnet (OMW) ana sayfası dokümanları yüzeysel görünüyordu. Bu hafta bu konu üzerinde çalışacağım, OMW ile ilgili ek bilgileri de ekleyeceğim ve diğer OMW'daki mevcut sayfaların başka hangi sayfaların doldurulması gerektiğine bakacağım.
    • OMW sayfaları eksik olduğunda iyileştirilecek ve mümkün olduğunda bu sayfalara görsel eklemeye çalışacağım.
  • 11. Hafta (23-29 Kasım)

    • GWA projelerinde çakışmalar olduğundan, bu hafta söz konusu çakışan kurumsal ihtiyaçları ve diğer çeşitli belgeleri karşılamak için ayırdınız.
  • Projenin kesinleşme ve değerlendirme aşaması (30 Kasım – 5 Aralık)

    • Bu hafta belgelerdeki yazım hatalarını ve hataları gözden geçirmek için ayıracağız.
    • Proje raporumu yazacağım.
    • Mentorlarımdan proje raporumu incelemelerini isteyeceğim.
    • Proje raporumu tamamlayıp göndereceğim.
    • Mentorlarım ve Dokümanlar Mevsimi deneyimim hakkında bir değerlendirme yazıp göndereceğim.

İletişim:

Görüşmenin sıklığı mentorlarla yapılacak görüşmeye bağlıdır. Düzenli iletişimi tercih ediyorum. Her hafta iki kez öneriyorum, şimdiye kadar yapılan çalışmalar hakkında güncel bilgi vermek ve geri bildirim almak istiyorum. Ancak bu, kullanıcıların tercihlerine bağlı olarak da esnektir.

Neden bu proje?

Dil bilimiyle ilgileniyorum ve dünyadaki tüm diller için kelime ağlarını bir araya getirme fikri beni Global Wordnet Association'a katılmaya ve bu projeye katkıda bulunmaya teşvik etti. Tek tek kelime ağları diğer dillerdeki kelime ağlarına bağlandığı için Çok Dilli Open Wordnet kavramı oldukça faydalıdır. Bu da söz konusu kelime ağlarını daha kolay erişilebilir hale getirir. Open Çok Dilli Wordnet ve bileşenleri herhangi bir amaç için serbestçe kullanılabilir, değiştirilebilir ve paylaşılabilir. GWA'nın sağlam bir fikri ve soylu bir niyeti olsa da, kuruluş pek tanınmıyor ve yeterince tanınmıyor. Muhtemelen nedenlerden biri, yüzeysel belgeler ve katkı sağlamak ve kullanımı konusunda yardımcı olacak kullanıcı rehberlerinin olmamasıdır. Open Çok Dilli Wordnet projesinin Global Wordnet Association ve açık kaynak topluluğuna yardımcı olmak için katkıda bulunabileceğim bir proje olduğunu fark ettim.

Gelecekteki Planlar:

GSoD 20'yi tamamladıktan sonra, Global Wordnet Association'a diğer projelerde de katkıda bulunmaya devam edeceğim. Fırsat olursa kuruluşun konferanslarına mutlaka katılırım.