DSPL Hakkında SSS

Bu dokümanda, DSPL veri kümeleri oluşturulurken ve bunları Public Data Explorer'a yüklerken veri sahiplerinin yaşadığı en sık karşılaşılan sorunlar ele alınmaktadır.

İçindekiler

Genel Sorular

DSPL nedir?

DSPL, Veri Kümesi Yayınlama Dili'nin kısaltmasıdır. Bu, hem meta verilerin (veri kümesinin adı ve sağlayıcısı gibi bilgilerin yanı sıra içerdiği ve görüntülediği kavramlar) hem de veri kümelerinin gerçek verileri için sunulan bir temsil biçimidir. Meta veriler XML biçiminde belirtilirken, veriler CSV biçiminde sağlanır.

DSPL kullanmanın temel avantajları nelerdir?

DSPL tepeden tırnağa, Public Data Explorer'daki gibi zengin veri görselleştirmeleri için tasarlanmıştır. Bunları oluşturmak için dilimler, boyutlar ve metrikler hakkında ayrıntılı meta verilerin yanı sıra diğer veri kümesi biçimlerinde iyi desteklenmeyen öğeler gerekir.

DSPL, veri kümesi içe aktarmalarını, kavram hiyerarşilerini de (ör. "Country", "kıta"nın, coğrafi kodlamalı verilerin ve veri keşfi deneyimini iyileştiren diğer birçok benzersiz özelliğin alt öğesidir.

DSPL, veri alışverişi ve/veya analiz için kullanılan diğer biçimlerin yerine geçecek mi?

Genellikle hayır. Önceki yanıtta belirtildiği gibi DSPL, etkileşimli görselleştirme ve keşif için tasarlanmıştır. Genel, "tümünü yap" adlı bir veri değişikliği veya analiz biçimi olarak tasarlanmamıştır.

Sonuç olarak, DSPL'yi diğer biçimlerle tamamlayıcı olarak görüyoruz. Kullanıcılar zengin ve etkileşimli veri görselleştirmeleri oluşturmak amacıyla diğer kaynaklardan DSPL veri kümeleri oluşturabilmelidir.

DSPL veri kümesiyle ne yapabilirim?

Verileri Herkese Açık Veri Gezgini'ne aktarabilir, yayınlayabilir ve diğer kullanıcıların zengin, etkileşimli görselleştirmeler aracılığıyla verileri keşfetmesine izin verebilirsiniz. Yayınlanan veri kümeleri, ayrıca ilgili kullanıcıların bulabilmesi için Herkese Açık Veri Dizini'ne dahil edilebilir.

Şu anda DSPL kullanan tek uygulama budur. Ancak kullanıcıların bunu diğer uygulamalar için kullanmasını öneririz ve benimsenmenin zaman içinde artmasını bekliyoruz.

DSPL için en uygun veri kümesi türleri hangileridir?

DSPL biçimi rastgele tablo koleksiyonlarını destekler. Bu nedenle çok çeşitli veri kümesi türleri için uygundur. Ancak DSPL veri kümelerinin yalnızca bir alt kümesi, Public Data Explorer'da ilgi çekici görselleştirmeler oluşturur. İkinci ürün, özellikle aşağıdakilerin verilerinde en iyi sonucu verir:

  • Niceliksel: Her veri noktasının kendisiyle ilişkilendirilmiş bir veya daha fazla sayısal metriği vardır (ör. "doldurma", "grip vakalarının sayısı", "gelir").
  • Kategorik: Veriler, sınırlı sayıda metinden oluşan kategori (ör. "ülkeler", "cinsiyetler", "yaş grupları").
  • Zaman serisi: Her kategori için veri metrikleri, zamanın bir işlevi olarak farklılık gösterir ve bitişik noktalar en az bir gün uzaklıktadır (Public Data Explorer bir günden daha kısa zaman artışlarını görselleştiremez).
  • Toplu: Her zaman/kategori/metrik kombinasyonu için etkinlik veya bilgi listesi değil, tek bir veri noktası vardır.

Bir DSPL veri kümesi oluşturdum ve diğer kullanıcıların bulabilmesi için bu verilerin Google Public Data Directory'de görünmesini istiyorum. Kiminle iletişim kurmalıyım?

Lütfen bu formu doldurun ve veri kümenizin bağlantısını sağlayın.

DSPL ile ilgili sorun yaşıyorum. Yardım için nereye gidebilirim?

Lütfen sorununuzu DSPL tartışma forumunda yayınlayın.

DSPL Veri Kümesi Dosyaları

XML ve CSV dosyalarımı nasıl kodlamalıyım?

Tüm XML ve CSV dosyalarının UTF-8 olarak kodlanması gerekir. ASCII'nin (bazen "düz metin" olarak da adlandırılır) UTF-8'in bir alt kümesi olduğunu unutmayın. Bu nedenle, bu biçimdeki veri kümeleri de çalışır.

Veri kümesi dosyalarımı oluşturmak ve düzenlemek için hangi yazılımı kullanmalıyım?

Okunabilirlik amacıyla söz dizimi vurgulama özellikli bir düz metin düzenleyici, XML dosyalarınızı düzenlemek için önerilen seçenektir. Platforma özel öneriler için bu makaleye göz atın. XML'nize ek biçimlendirme etiketleri ekleme eğiliminde olduğu için içe aktarma hatalarına neden olabileceğinden, tam özellikli, genel amaçlı kelime işlemcileri kullanmamanızı öneririz.

E-tablo, genellikle veri dosyalarınızı oluşturmanın ve düzenlemenin en kolay yoludur. Bunları doğru biçimde (CSV/virgülle ayrılmış değerler) kaydettiğinizden emin olun.

Excel, SPSS, SAS veya başka bir sistemde verilerim var. Bunları doğrudan Public Data Explorer'a aktarabilir miyim?

Hayır, şimdi değil. Önce verilerinizi CSV biçiminde dışa aktarmanız, uygun XML meta verilerini eklemeniz ve ardından DSPL uyumlu bir veri kümesini Public Data Explorer'a yüklemeniz gerekir.

Dosyalarımı adlandırmam önemli mi?

Veri kümesi XML dosyanızın .xml ile biten bir adı olmalıdır. İlişkili meta veri veri dosyalarının adları, XML meta verilerinizdeki <file> etiketlerinde belirtilen adlarla eşleşmesi şartıyla herhangi bir ada sahip olabilir. Veri kümesini paketlemek ve Public Data Explorer'a aktarmak için kullanılan zip dosyasının adı da olabilir.

CSV dosyalarım sıralanmalı mı?

Evet. CSV dosyalarınızın içeriğini zaman olmayan boyutlara (herhangi bir sırada veya yön) göre ve isteğe bağlı olarak diğer sütunlardan herhangi birine (ör. zaman) göre sıralamanız gerekir.

Örneğin, date, dimension1, dimension2, metric1 ve metric2 sütunlarını içeren bir CSV'niz varsa dimension1 ve dimension2 sıralamasına (herhangi bir sırada) göre sıralama yapmanız gerekir. Tarih/saat sütununa göre de sıralama yapmak isterseniz sıralama ölçütü olarak bu son seçeneği kullanmanız gerekir.

Bu şekilde sıralama yapıldığında her bir zaman serisinin gözlemleri birlikte gruplandırılır. Bu da DSPL içe aktarma sürecinin verimliliğini büyük ölçüde artırır.

XML Modeli ve Söz Dizimi

Neyin bir metrik ve neyin boyut olması gerektiğine nasıl karar veririm?

Boyut, verilerinizi segmentlere ayırmak veya filtrelemek için kullanılan bir varlıktır. Diğer yandan, bir metrik, her bir veri noktasıyla ilişkili gözlemlenen değeri veya değerleri açıklar.

Genellikle boyutlar kategoriktir. Metrikler ise kategorik olmayan, zamanla değişen sayısal değerlerdir. Bunların her birinin prototip amaçlı örneklerinden bazıları şunlardır:

  • Boyutlar: Ülke, eyalet, ilçe, bölge, yıl, ay, cinsiyet, yaş kategorisi, sektör segmenti
  • Metrikler: Nüfus, GSYİH, işsizlik oranı, okuryazarlık, gelir, maliyet, fiyat

Mülk ve özellik arasındaki fark nedir?

Özellikler, her kavramın örneğine eklenir. Örneğin, bir kıta mülkünün farklı ülkeler için farklı değerleri olur. Diğer yandan özellikler, bir bütün olarak kavramla ilişkilendirilir. Örneğin: isParent özelliği tüm kıtalar için doğrudur.

Etiketlerin sırası önemli midir?

Evet. Etiketlerinizi Geliştirici Kılavuzu'nda göründükleri sırayla ekleyin. Örneğin, <topic> kavramın tanımında <type> öncesinde görünmelidir.

Büyük harf kullanımı önemli mi?

Evet, XML etiketinizin ve özellik adlarınızın Geliştirici Kılavuzu'nda göründüğü şekilde büyük harfle yazılması gerekir. Örneğin, bir property etiketinde isParent yerine isparent kullanmak içe aktarma hatasına neden olur.

Bir konseptin iki ebeveyni olabilir mi?

Hayır. Her kavramın yalnızca bir isParent referansı olabilir.

Konsept kendisinden bahsedebilir mi?

Evet. Kendine referans veren bir kavram hiyerarşisi örneği için ABD Perakende Satış veri kümesine bakın.

Veri Biçimlendirme

Tarihleri nasıl biçimlendiririm?

Tarihler, Jdada DateTime standardı ile tanımlanabilecek herhangi bir biçimde yazılabilir. Joda biçimlendirme kodu, ilgili tablo sütunu öğesinde bir format özelliğinde depolanmalıdır.

Bazı popüler tarih biçimleri için Joda biçimlendirme kodları aşağıda listelenmiştir:

Tarih Örneği Joda Biçimi
2010 yyyy
Mayıs 2010 MMM yyyy
21.05.2010 MM/dd/yyyy
5.21.2010 dd/MM/yyyy
2010-05-21 yyyy-MM-dd

Ay karakterlerinin Joda kodunun M değil, m olduğunu unutmayın (dakikayı temsil eder).

Bir günden kısa zaman birimlerini kullanabilir miyim?

Joda DateTime biçimi ve dolayısıyla DSPL, milisaniye cinsinden zaman sınırına kadar zaman değerlerini destekler. Bununla birlikte, Public Data Explorer bir günden daha kısa zaman dilimlerini görselleştiremez.

Standart Kavramları Kullanma

"Standart kavramlar" nedir ve nasıl yararlıdır?

"Standart kavramlar" terimi, diğer veri kümelerinde temel "yapı taşları" olarak tasarlanmış, Google tarafından oluşturulan bir dizi kavramı ifade eder. Kavramlar, ilkini "zaman", "coğrafi" vb. kategoriler halinde gruplandıran altı DSPL veri kümesinde tanımlanır. Bu kavramlara erişim elde etmek için uygun üst veri kümelerini DSPL XML dosyanızın başında içe aktarmanız yeterlidir.

Standart kavramlar, zaman kazandırır (ör. dünyadaki her ülke için enlem ve boylam değerlerini manuel olarak girmek zorunda kalmadan) ve aynı zamanda verilerinizin nasıl görselleştirileceğine işaret etmesi açısından yararlıdır. Örneğin Public Data Explorer, çizgi grafiğin x eksenini biçimlendirmek için time:... kavramlarını kullanır, boyut seçici kullanıcı arayüzü için dizeler oluşturmak amacıyla entity:entity kavramının name özelliğini kullanır ve verileri harita görselleştirmede göstermek için geo:location ve latitude ile longitude özelliklerini kullanır.

Tüm standart kavramlar Public Data Explorer tarafından anlaşıldı mı?

Sağlanan standart kavramların çoğu Public Data Explorer tarafından anlaşılsa da görsel henüz mümkün olmayan birkaç terim vardır. Bu sorunların bazıları önerilen geçici çözümlerle birlikte aşağıda listelenmiştir:

Konsept Geçici çözüm
quantity:index Bunun yerine quantity:ratio veya quantity:magnitude kullanın.
time:quarter DSPL Yemek Kitabı'nda açıklandığı şekilde time:month kullanın.
time:week DSPL Yemek Kitabı'nda açıklandığı şekilde time:day kullanın.

Gelecekte bu kavramların daha iyi desteklenmesi için bizi izlemeye devam edin.

Veri kümesimde standart bir kavramı nasıl kullanabilirim?

Kullanmak istediğiniz belirli bir kavram için belgeleri inceleyin ve en yaygın yönergelerle ilgili ayrıntılı, adım adım talimatlar içeren DSPL Yemek Kitabı'na da göz atın.

Veri Kümelerini İçe Aktarma ve Görselleştirme

Veri kümemi neden başarıyla içe aktaramıyorum?

Public Data Explorer'ın yükleme arayüzü, DSPL veri kümenizi tarar ve hata algılanırsa içe aktarma işlemini engeller. İçe aktarma aracı, XML dosyanızdaki yazım, büyük harf kullanımı ve etiket sırası / yerleşim konusunda olduğu gibi CSV dosyalarınızdaki verilerin de düzeni ve sıralaması konusunda son derece hassas olduğundan, bu işlemleri doğru yapıp veri kümenizi başarılı bir şekilde içe aktarmak için birkaç geçiş gerekebilir.

Bu sorunları çözmek için ilk adım, kullanıcı arayüzünde verilen hata mesajlarını incelemek ve gerekli düzeltme işlemini yapmaktır. Bu mesajların her zaman anlaşılması en kolay türü olmadığından (iyileştirmeye aktif olarak çalıştığımız bir uygulama), en yaygın olanları açıklayan bir tablo hazırladık:

Hata Açıklama
kopya anahtar: ... Konseptinizin tanım tablosunda yinelenen bir kimlik değeri (ör. kavramla aynı ada sahip sütunda değer) var. Bu değerler, konseptin tekil örneklerini benzersiz şekilde tanımlamak için kullanılır. Bu nedenle, kopyaların kullanılmasına izin verilmez.
Verilerdeki birden fazla satır satırında, [...] özelliği kombinasyonundan kaynaklanan veri satırlarının ayrıştırılmasında bir istisna vardır. CSV'niz doğru sıralanmamış. Bunun nasıl yapılacağıyla ilgili talimatlar için yukarıdaki tartışmaya bakın.
"..." içindeki geçersiz biçim: "..." nedeniyle kaynaktan gelen veri satırlarının ayrıştırılmasında istisna var CSV'nizdeki bu değerin (genellikle bir tarih) biçimlendirmesi, XML dosyanızda verilen biçimle tutarlı değildir. Biçimi veya değeri eşleşecek şekilde değiştirin.
Satırdaki öğe sayısının neden olduğu kaynaktan kaynak satırların ayrıştırılmasında istisna (...) şu satır için belirtilen özelliklerin sayısı (...) eşleşmedi: [...] CSV'nizdeki bir satırda çok fazla veya çok az değer var. Bu satırın biçimlendirmesini düzeltin.
Giriş dizesi için şu kaynak nedeniyle veri satırlarını ayrıştırmada istisna oluştu: "..." CSV'nizdeki bir değer (genellikle tam sayı veya kayan), doğru şekilde ayrıştırılmasını engelleyen sayısal olmayan karakterler (ör. dolar simgesi, yüzde işareti vb.) içerir. Bu fazladan karakterleri kaldırın.
Dilim "..." için "..." özelliğinin veri değerinin neden olduğu veri satırlarından ayrıştırılan istisna, başvurulan "..." Kavramı'nın anahtar/değer çifti değil. Dilimlerinizden birinde, tanınmayan bir boyut değeri (ör. ancak ilgili kavram için olası tüm değerler listesinde yoksa. Boyut kavramı tanım tablosuna dönün ve gerekirse değeri ekleyin.
Verilerdeki başlık ("...") tabloda sabit özelliktir CSV'deki sütun başlığı, XML tablosu tanımında tanımlanan sütun kimliğiyle eşleşmiyor. Birini veya diğerini eşleşecek şekilde değiştirin.
XML ayrıştırma hatası ... '...' öğesinden itibaren geçersiz içerik bulundu. '{...}', '{...}', ... için beklenen bir şey var. Başvurulan XML öğesi doğru yerde değil. Siparişin doğru olduğundan ve öğenin doğru üst öğeye sahip olduğundan emin olun (ör. name için info) ücret ödersiniz.
XML ayrıştırma hatası ... "..." özelliğinin "..." öğesinde gösterilmesine izin verilmiyor. Bu XML etiketi özelliğinin yazımı, büyük/küçük harf kullanımı veya konumu hatalı. Uygun kullanım için dokümanları kontrol edin.
XML ayrıştırma hatası. ... "..." öğesinde [child] karakteri bulunamaz. Bunun nedeni, söz konusu öğenin içerik türünün yalnızca öğe olmasıdır. XML dosyanızda eski bir metin var (muhtemelen < veya > içermeyen bir etiketten kaynaklanıyor). Metni düzeltip tekrar deneyin.

Yukarıdaki listede yer almayan bir mesajı anlamakta zorlanıyorsanız lütfen DSPL forumunda mesaj yayınlayın. Size yardımcı olmaya çalışırız.

Veri kümesim başarıyla içe aktarıldı ancak Herkese Açık Veri Gezgini'nde gösterilecek görselleştirmeleri alamıyorum. Neler oluyor?

Bu sorun, veri kümeniz geçerli bir DSPL olduğu halde Herkese Açık Veri Gezgini'nde görselleştirilebilir olan DSPL alt grubunda değilse ortaya çıkar. Bunun birçok olası nedeni vardır. En yaygın nedenler şunlardır:

  • Tablo olmadan bir boyut kavramı tanımlama: Bu bilgiler olmadan Public Data Explorer, kullanıcı arayüzünde hangi seçeneklerin gösterileceğini bilmez.
  • Yalnızca metrikleri içeren bir veri kümesi oluşturma: Public Data Explorer, görselleştirme kullanıcı arayüzünün doğru şekilde yapılandırılması için veri kümesinde herhangi bir yerde tanımlanmış en az bir kategorik (yani zaman olmayan) boyut gerektirir.
  • Dilimlerinize zaman boyutu eklememe: Public Data Explorer yalnızca zaman serisini görselleştirebilir. Zaman olmayan dilimler ürün tarafından yok sayılır.
  • Standart time:... dışında bir zaman boyutu kullanma: Public Data Explorer, üründeki çeşitli görselleştirmeleri düzenlemek ve animasyon eklemek için standart time kavramlarını kullanır.Diğer zaman kavramlarını (ör. kendi veri kümenizin içinde oluşturulanlar) anlamaz.
  • Çok büyük veya çok küçük zaman değerleri kullanma: Public Data Explorer, zaman ayrıntı düzeyleri bir günden kısa olan veri kümelerini henüz görselleştirmez. Söz konusu aracın diğer ucunda, araç çok büyük yıl değerleriyle (ör. on binlerce) sorunlu. Bu ayrıntı düzeylerini gelecekte daha esnek hale getirmeyi umuyoruz.

Görselleştirilmiş veri kümemi web siteme nasıl entegre edebilirim?

Public Data Explorer Yardım Merkezi'ndeki bu makaleye göz atın. İkinci bölümde açıklandığı gibi, yerleştirme URL'sini manuel olarak ayarlayarak bir "tam yerleştirme" (ör. keşif kontrollerini içeren) alabilirsiniz.