Bu sayfada, Google Dokümanlar Sezonu için kabul edilen bir teknik yazım projesinin ayrıntıları yer almaktadır.
Proje özeti
- Açık kaynak kuruluşu:
- Data Commons
- Teknik yazar:
- KilimAnnejaro
- Proje adı:
- DataCommons'u Kullanmaya Başlama Dokümanını İyileştirme
- Proje süresi:
- Standart uzunluk (3 ay)
Proje açıklaması
Yazılım mühendisi olarak kariyerimde, yeni bir ekibe veya projeye katılma, bir kod deposunu açma, bu deposu çalıştırma ve belgelerde temel adımlar eksik olduğunda yazılımın bozulmasını izleme deneyimimden dolayı sürekli olarak hayal kırıklığına uğradım. Yazma ve kompozisyona yönelik ömür boyu tutkumu bu ihtiyaçlara uygulayabileceğimi hemen fark ettim. Bu süreçte, birlikte çalıştığım geliştiricilerin bilinen cevaplarla sorunları çözmek yerine teknik inovasyona ve yaratıcılığa odaklanmaları için destekleyici bir ortam yarattı.
Bu teknik yeniliğe ve yaratıcılığa, toplumun birçok segmentinde acilen ihtiyaç vardır. Özellikle de hükümetteki liderler ve sorunlu alanlarda veri kümelerini analiz etmek isteyen sivil toplum kuruluşu sektöründe bu ihtiyaçlara acilen ihtiyaç vardır. DataCommons, bu verileri hizmet olarak kolayca kullanılabilir hâle getirerek erişimi kolay ve rolleri için ihtiyaç duydukları biçime yakın veriler arayan analistlerin giriş engelini azaltır. DataCommons bunu, kullandığı verilere ait bir Bilgi Grafiği oluşturarak yapar. Bu süreçte, açık kaynak bağlamında veri kalitesi ve yönetimi hakkında ilginç sorular sorar. Google Summer of Docs'a DataCommons kuruluşu için bir teklifle başvurarak kamu yararına açık veri alanındaki bu teknik çalışmaları desteklemeyi ve ilerletmeyi umuyorum.
Önerilen Çözümlerle Belgelerdeki Mevcut Sorunlar dataCommons web sitesi dataCommons'a veri kümeleri ekleme talimatları içerse de talimatlar çok kısa ve nettir. Bunlar, söz konusu verileri bağışta bulunan kişiyi schema.org işaretlemesini kullanmaya yönlendiren birkaç madde işaretinden oluşur. Bu proje kapsamında, dataCommons.org'un "Katıl" bölümünü temizlemeyi öneriyorum. Yeni veri kümeleri eklemeyle ilgili bir eğitim oluşturacağım. Bu eğitimde, veri kümelerinin nasıl tarandığını ve dataCommons bilgi grafiğine nasıl dahil edildiğini açıklayacağım. Ayrıca, bir veri kümesi sahibi yardım almak için dataCommons yöneticilerine ulaştığında önerilen yaygın çözümler için bir SSS bölümü de ekleyeceğim.
Veri sorgulamaya yönelik mevcut örnek grubuna bakıldığında, dataCommons'un yalnızca dört adet etkileşimli kod örneği sunduğu görülüyor. Bunların tümü de Python not defterleri. Proje kapsamında bu not defterlerini R diline çevireceğim ve ayrıca Google E-Tablolar ve REST API için mevcut örneklerin etkileşimli demo sürümlerini oluşturup bu demoları mevcut belgelere yerleştireceğim.
Son olarak, dokümanlar, dataCommons bilgi grafiğinin yazılımda uygulama oluşturmak için nasıl kullanılabileceğine dair herhangi bir örnek sunmuyor. Bu proje kapsamında, son kullanıcının bilgi grafiğinde bağlı olan herhangi iki miktarla ilgili grafiksel görselleştirmeler oluşturmasını sağlamak için dataCommons API'yi kullanan Python'da bir örnek araç oluşturacak, dağıtacak ve belgeleyeceğim. Örneğin, bu aracı kullanarak hava durumu verilerini ortak işletme kalıplarıyla ilgili bilgilerle ilişkilendiren doğrusal regresyon çizebilirsiniz. Zorlayıcı bir hedef olarak, bu aracı pasta grafikler ve Venn diyagramları gibi diğer görselleştirme türlerini kapsayacak şekilde genişletmeyi umuyorum.
Program Sezon 14 Eylül-30 Kasım tarihleri arasında gerçekleşecektir. Dolayısıyla bu projeyi tamamlama planım şu şekilde olacak:
Eylül: Katıl bölümü yeniden yazmaya başlayın. Bu çalışmayı Eylül ayının sonuna kadar büyük oranda tamamlayın.
Ekim: Katıl bölümüne son verin ve etkileşimli kod örneklerini oluşturun.
Kasım: Örnek görselleştirme aracını oluşturun.