Memvisualisasikan data dengan BigQuery dan Datasets API

Dokumen ini memberikan arsitektur referensi dan contoh untuk membuat visualisasi data peta menggunakan data lokasi di BigQuery Google Cloud Platform dan Google Maps Platform Datasets API, seperti menganalisis data kota terbuka, membuat peta cakupan telekomunikasi, atau memvisualisasikan trace pergerakan armada kendaraan seluler.

Visualisasi data peta adalah alat yang canggih untuk melibatkan pengguna dan mengungkap wawasan spasial dalam data lokasi. Data lokasi adalah data yang memiliki fitur titik, garis, atau poligon. Misalnya, peta cuaca membantu konsumen memahami dan merencanakan perjalanan serta bersiap menghadapi badai; peta business intelligence membantu pengguna mengungkap wawasan dari analisis data, dan peta telekomunikasi membantu pengguna memahami cakupan dan kualitas penyedia layanan mereka di area layanan tertentu.

Namun, sulit bagi developer aplikasi untuk membuat visualisasi data peta besar yang berperforma baik dan memberikan pengalaman pengguna yang luar biasa. Data yang besar harus dimuat ke sisi klien memori, sehingga menyebabkan waktu pemuatan peta pertama yang lambat. Visual harus berperforma baik di semua perangkat, termasuk ponsel kelas bawah yang memiliki batasan memori dan GPU. Terakhir, developer harus memilih library rendering data besar yang portabel, andal, dan berperforma tinggi dengan data yang besar.

Arsitektur Referensi

Mengembangkan aplikasi dengan visualisasi data besar membutuhkan dua komponen utama.

  1. Backend pelanggan - semua data & layanan aplikasi backend seperti pemrosesan dan penyimpanan.
  2. Klien pelanggan - Antarmuka pengguna aplikasi Anda dengan komponen visualisasi peta.

Di bawah ini adalah diagram sistem tentang cara kedua komponen ini berinteraksi dengan pengguna aplikasi, Google Cloud, dan Google Maps Platform untuk membuat aplikasi visualisasi data besar.

diagram arsitektur

⭐ Catatan: Maps Datasets API adalah produk pra-GA. Lihat detailnya dalam Persyaratan Layanan.

Pertimbangan desain

Ada sejumlah pertimbangan desain yang harus diikuti untuk membuat visualisasi data yang berperforma baik menggunakan Google Cloud dan Google Maps Platform.

  1. Ukuran data sumber dan frekuensi pembaruan.
    1. Jika data sumber dalam format geojson berukuran <5 mb atau sangat sering diperbarui, misalnya perkiraan radar cuaca langsung, pertimbangkan untuk menyajikan data sebagai sisi klien objek geojson di aplikasi Anda dan merender dengan lapisan deck.gl.
    2. Jika data Anda berukuran lebih dari 5 mb dan pembaruannya tidak lebih cepat dari satu kali per jam, pertimbangkan arsitektur Datasets API dalam dokumen ini.
      1. Set data mendukung file berukuran hingga 350 mb.
      2. Jika data Anda lebih besar dari 350 MB, pertimbangkan untuk memangkas atau menyederhanakan data geometri di file sumber sebelum meneruskannya ke Set Data (lihat Pemangkasan Data di bawah).
  2. Skema & format
    1. Pastikan data Anda memiliki properti ID unik global untuk setiap fitur. ID unik memungkinkan Anda memilih dan menata gaya fitur tertentu atau menggabungkan data ke fitur untuk divisualisasikan, misalnya menata gaya fitur yang dipilih pada peristiwa pengguna “klik”.
    2. Format data Anda sebagai CSV atau GeoJSON sesuai dengan spesifikasi Datasets API dengan nama kolom, jenis data, dan jenis objek GeoJSON yang valid.
    3. Untuk memudahkan pembuatan Set data dari BigQuery, buat kolom bernama wkt dalam ekspor CSV SQL Anda. Set data mendukung impor geometri dari CSV dalam format Well-Known Text (WKT) dari kolom bernama wkt.
    4. Periksa apakah data Anda adalah geometri dan jenis data yang valid. Misalnya, GeoJSON harus berada dalam sistem koordinat WGS84, urutan pelilitan geometri, dll.
    5. Gunakan alat seperti geojson-validate untuk memastikan semua geometri dalam file sumber valid atau ogr2ogr untuk mengubah file sumber antar-format atau sistem koordinat.
  3. Pemangkasan data
    1. Minimalkan jumlah properti fitur. Anda dapat menggabungkan properti tambahan ke fitur saat runtime dengan kunci ID unik (contoh).
    2. Gunakan jenis data bilangan bulat untuk objek properti jika memungkinkan untuk meminimalkan ruang penyimpanan kartu, sehingga menjaga kartu tetap berperforma baik agar dapat dimuat melalui HTTPS di aplikasi klien.
    3. Sederhanakan dan/atau gabungkan geometri fitur yang sangat kompleks; pertimbangkan untuk menggunakan fungsi BigQuery seperti ST_Simplify pada geometri poligon kompleks untuk mengurangi ukuran file sumber dan meningkatkan performa peta.
  4. Petak
    1. Google Maps Datasets API membuat petak peta dari file data sumber untuk digunakan di Maps JS API.
    2. Ubin peta adalah sistem pengindeksan berbasis zoom yang memberikan cara yang lebih efisien untuk memuat data ke dalam aplikasi visual.
    3. Petak peta mungkin menjatuhkan fitur yang padat atau kompleks pada tingkat zoom yang lebih rendah. Saat pengguna memperkecil tampilan ke suatu negara bagian atau negara (misalnya z5-z12) mungkin terlihat berbeda dari saat diperbesar ke kota atau lingkungan (misalnya z13-z18).

Contoh - Kereta Api di London

Dalam contoh ini, kita akan menerapkan arsitektur referensi untuk membuat aplikasi web dengan GCP dan Google Maps yang memvisualisasikan semua jalur kereta api di London dari data Open Street Map (OSM).

Prasyarat

  1. Akses ke Sandbox BigQuery dan Konsol Cloud
  2. Pastikan Anda memiliki project GCP dan pembuatan akun penagihan.

Langkah 1 - Buat kueri data di BigQuery

Buka BigQuery Public Datasets. Set data 'bigquery-public-data' dan tabel geo_openstreetmap.planet_features berisi seluruh data Open Street Map (OSM) senilai seluruh dunia termasuk semua fitur yang memungkinkan. Temukan semua fitur yang tersedia untuk dikueri di Wiki OSM termasuk amenity, road, dan landuse.

Gunakan Cloud Shell atau Konsol Cloud BigQuery(https://console.cloud.google.com) untuk membuat kueri tabel menggunakan SQL. Snip kode di bawah ini menggunakan perintah bq query untuk membuat kueri semua rel kereta api yang difilter hanya ke London dengan menggunakan kotak pembatas dan fungsi ST_Intersects().

Untuk menjalankan kueri ini dari Cloud Shell, jalankan snip kode berikut, dengan memperbarui ID project, set data, dan nama tabel untuk lingkungan Anda.

bq query --use_legacy_sql=false \
--destination_table PROJECTID:DATASET.TABLENAME \
--replace \
'SELECT
osm_id, 
feature_type,
(SELECT value
         FROM   unnest(all_tags)
         WHERE  KEY = "name") AS name,
(SELECT value
         FROM   unnest(all_tags)
         WHERE  KEY = "railway") AS railway,
geometry as wkt
FROM   bigquery-public-data.geo_openstreetmap.planet_features
WHERE ("railway") IN (SELECT key FROM unnest(all_tags)) 
    AND ST_Intersects(
    geometry,
ST_MakePolygon(ST_MakeLine(
      [ST_GeogPoint(-0.549370, 51.725346),
      ST_GeogPoint(-0.549370, 51.2529407),
      ST_GeogPoint(0.3110581, 51.25294),
      ST_GeogPoint(0.3110581, 51.725346),
      ST_GeogPoint(-0.549370, 51.725346)]
    ))
   )' 

Kueri menampilkan:

  1. ID unik untuk setiap fitur osm_id
  2. feature_type, misalnya poin, garis, dll.
  3. name fitur, misalnya Paddington Station
  4. Jenis railway, misalnya, utama, pariwisata, militer, dll
  5. wkt fitur - geometri titik, garis, atau poligon dalam format WKT. WKT adalah format data standar kolom Geografi BigQuery yang ditampilkan dalam kueri.

Catatan - Untuk memvalidasi hasil kueri secara visual sebelum membuat Set Data, Anda dapat dengan cepat memvisualisasikan data di dasbor dari BigQuery menggunakan Looker Studio.

Untuk mengekspor tabel ke file CSV di bucket Google Cloud Storage, gunakan perintah bq extract di Cloud Shell:

bq extract \
--destination_format "CSV" \
--field_delimiter "," \
--print_header=true \
PROJECTID:DATASET.TABLENAME \
gs://BUCKET/FILENAME.csv

Catatan: Anda dapat mengotomatiskan setiap langkah menggunakan Cloud Scheduler untuk mengupdate data secara rutin.

Langkah 2 - Buat Set Data dari file CSV Anda

Selanjutnya, buat set data Google Maps Platform dari output kueri di Google Cloud Storage (GCS). Dengan menggunakan Datasets API, Anda dapat membuat set data, lalu mengupload data ke Set data Anda dari file yang dihosting di GCS.

Untuk memulai, aktifkan Maps Datasets API di project GCP dan tinjau dokumen API. Ada library klien Python dan Node.js untuk memanggil Datasets API dari logika di backend aplikasi Anda. Selain itu, tersedia GUI Set Data untuk membuat Set Data secara manual di Konsol Cloud.

Setelah upload Set data selesai, Anda dapat melihat pratinjau set data di GUI Set Data.

Pratinjau set data

Langkah 4 - Kaitkan Set Data Anda dengan ID Peta

Setelah Set Data dibuat, Anda dapat membuat ID Peta dengan Gaya Peta terkait. Di editor Map Style, Anda dapat mengaitkan mapId dan gaya dengan Dataset. Di sini Anda juga dapat menerapkan Gaya Visual Peta Berbasis Cloud untuk menyesuaikan tampilan dan nuansa peta.

Langkah 5 - Membuat visualisasi peta aplikasi klien

Terakhir, Anda dapat menambahkan set data ke aplikasi visualisasi data sisi klien menggunakan Maps JS API. Lakukan inisialisasi objek peta menggunakan mapID yang terkait dengan set data Anda dari langkah sebelumnya. Kemudian, tetapkan gaya dan interaktivitas lapisan Set data Anda. Lihat panduan lengkap terkait gaya visual berbasis data dengan Set data untuk mengetahui detail selengkapnya.

Anda dapat menyesuaikan gaya, menambahkan pengendali peristiwa untuk mengubah gaya secara dinamis, dan lainnya menggunakan Maps JS API. Lihat contohnya dalam docs. Di bawah ini, kita akan menentukan fungsi setStyle untuk membuat gaya fitur titik dan garis untuk contoh ini berdasarkan atribut “feature_type”.

Catatan - Pastikan untuk menggunakan saluran v=beta untuk penerapan Maps JS API.

function setStyle(params) {
  const map.getDatasetFeatureLayer("your-dataset-id");
  const datasetFeature = params.feature;
  const type = datasetFeature.datasetAttributes["feature_type"];
if (type == "lines") {
           return {
             fillColor: "blue",
             strokeColor: "blue",
             fillOpacity: 0.5,
             strokeWeight: 1,
           }
         } else if (type == "points") {
           return {
             fillColor: "black",
             strokeColor: "black",
             strokeOpacity: 0.5,
             pointRadius: 2,
             fillOpacity: 0.5,
             strokeWeight: 1,
           }
     }
}

Catatan - pastikan untuk selalu menambahkan atribusi untuk Set data ke aplikasi peta Anda. Untuk menambahkan atribusi OSM, ikuti contoh kode atribusi di dokumen dengan mematuhi panduan OSM.

Kode di atas saat diinisialisasi dalam aplikasi web satu halaman menghasilkan visual data peta berikut:

peta london Railway

Dari sini, Anda dapat memperluas visualisasi peta dalam fungsi setStyle() dengan menambahkan logika untuk memfilter fitur, menambahkan gaya visual berdasarkan interaksi pengguna, dan berinteraksi dengan bagian aplikasi lainnya.

Kesimpulan

Dalam artikel ini, kita membahas arsitektur referensi dan contoh implementasi aplikasi visualisasi data besar menggunakan Google Cloud dan Google Maps Platform. Dengan menggunakan arsitektur referensi ini, Anda dapat membuat aplikasi visualisasi data lokasi dari data apa pun di BigQuery GCP yang berperforma baik di perangkat apa pun menggunakan Google Maps Datasets API.

Tindakan Berikutnya

Bacaan lebih lanjut:

Kontributor

Penulis utama:

  • Ryan Baumann, Solutions Engineering Manager Google Maps Platform