Data Commons projesi

Bu sayfa, Google Dokümanlar Sezonu için kabul edilen bir teknik yazı projesinin ayrıntılarını içerir.

Proje özeti

Açık kaynak kuruluşu:
Data Commons
Teknik yazar:
KilimAnnejaro
Projenin adı:
DataCommons'ı İyileştirme Başlangıç Belgeleri
Proje süresi:
Standart uzunluk (3 ay)

Proje açıklaması

Yazılım mühendisi olarak kariyerimde yeni bir ekibe veya projeye katılma, bir kod deposu alma, onu çalıştırma ve önemli adımlar belgelerde eksikken yazılımın bozulduğunu izleme deneyimimden dolayı sürekli hayal kırıklığına uğradığımı fark ettim. Yazma ve kompozisyona duyduğum hayat boyu tutkumu bu ihtiyaçlara uygulayabileceğimi hemen fark ettim. Tüm bu deneyimler sayesinde, sorunları bilinen yanıtlarla çözmek yerine, birlikte çalıştığım geliştiriciler için teknik yeniliklere ve yaratıcılığa odaklanabilecekleri destekleyici bir ortam oluşturdum.

Toplumun birçok kesiminde, özellikle de kendi sorunlu alanlarında veri kümelerini analiz etmek isteyen devlet liderleri ve sivil toplum kuruluşu liderleri bu teknik yeniliğe ve yaratıcılığa acilen ihtiyaç duyuyor. DataCommons bu verileri hizmet olarak kullanılabilir hale getirerek, kolayca erişilebilen ve rolleri için ihtiyaç duydukları biçime yakın veriler arayan analistlerin girişlerinin önündeki engeli azaltır. DataCommons bunu kullandığı verilerin bir Bilgi Grafiği'ni oluşturur. Bu süreçte, açık kaynak bağlamında veri kalitesi ve yönetimi hakkında ilginç sorular ortaya çıkar. DataCommons kuruluşu için bir teklif sunarak Google Summer of Docs'a başvurarak kamu yararına açık veri alanındaki bu teknik çalışmaları desteklemeyi ve ilerletmeyi umuyorum.

Önerilen Çözümlerle Belgelerdeki Mevcut Zorluklar dataCommons web sitesi dataCommons'a veri kümesi eklemeyle ilgili yönergeler içerse de, veri bağışçısını schema.org işaretlemesini kullanmaya yönlendiren birkaç maddeden oluşan talimatlar çok kısa ve belirsizdir. Bu proje kapsamında dataCommons.org'un "Dahil Olun" bölümünü temizlemeyi öneriyorum. Yeni veri kümeleri eklemeye, veri kümelerinin nasıl kazındığını ve dataCommons bilgi grafiğine nasıl dahil edildiğini açıklayan bir eğitim hazırlayacağım. Ayrıca, bir veri kümesi sahibi yardım almak üzere dataCommons bakım sorumlularına başvurduğunda önerilen yaygın çözümler için bir SSS bölümü de ekleyeceğim.

Veri sorgulamayla ilgili mevcut örnek grubuna bakıldığında, dataCommons hepsi Python not defterleri olmak üzere yalnızca dört etkileşimli kod örneği sunar. Proje kapsamında bu not defterlerini R diline çevireceğim ve ayrıca Google E-Tablolar ve REST API için sunulan örneklerin etkileşimli demo sürümlerini oluşturarak bu demoları mevcut dokümanlara yerleştireceğim.

Son olarak, bu dokümanlarda dataCommons bilgi grafiğinin yazılımda uygulama derlemek için nasıl kullanılabileceği konusunda herhangi bir örnek sunulmuyor. Bu proje kapsamında, son kullanıcının bilgi grafiğinde yer alan herhangi iki miktarla ilgili grafik görselleştirmeler oluşturmasını sağlamak için dataCommons API'yi kullanan Python'da örnek bir araç oluşturacak, dağıtacak ve belgeleyeceğim. Örneğin, bu araç, hava durumu verileriyle yaygın iş modeli bilgileriyle ilişkili doğrusal bir regresyon çizmek için kullanılabilir. Zorlayıcı bir hedef olarak, bu aracı pasta grafikler ve Venn diyagramları gibi diğer görselleştirme türlerini kapsayacak şekilde genişletmeyi umuyorum.

Program Sezon 14 Eylül ile 30 Kasım arasında devam edeceği için bu projeyi tamamlama planım şu şekilde:

Eylül: Dahil Olun bölümünü yeniden yazarak başlayın. Bu çalışmayı çoğunlukla Eylül ayının sonuna kadar bitirin.

Ekim: Dahil Olun bölümünü tamamlayın ve etkileşimli kod örneklerini oluşturun.

Kasım: Örnek görselleştirme aracını oluşturun.