Jenis data dan jenis semantik

Saat Anda membuat konektor komunitas, setiap kolom yang Anda definisikan di skema memerlukan suatu jenis data. Jenis data menentukan jenis primitif kolom seperti BOOLEAN, STRING, NUMBER, dll.

Selain jenis data, Looker Studio juga menggunakan jenis semantik. Jenis semantik membantu menjelaskan jenis informasi yang diwakili oleh data. Sebagai misalnya, kolom dengan jenis data NUMBER mungkin secara semantik mewakili mata uang jumlah atau persentase dan kolom dengan jenis data STRING mungkin secara semantik mewakili sebuah kota. Untuk melihat jenis semantik yang tersedia, lihat dokumentasi jenis semantik

Skema Konektor Komunitas dan kolom Looker Studio

Saat menentukan skema untuk konektor komunitas Anda, ada berbagai properti untuk setiap {i>field<i} yang akan menentukan bagaimana {i>field<i} itu direpresentasikan dan yang digunakan di Looker Studio. Contoh:

  • conceptType yang ditentukan dalam skema konektor Anda menggunakan properti conceptType. Ini menentukan apakah kolom diperlakukan sebagai dimensi atau metrik. Penjelasan tentang perbedaan antara metrik dan dimensi dapat ditemukan pada pukul Dimensi dan metrik.
  • Jenis semantik dapat ditentukan dalam skema konektor, atau dapat dideteksi secara otomatis oleh Looker Studio berdasarkan properti jenis data yang ditentukan di konektor dan nilai data yang ditampilkan oleh konektor Anda. Lihat Deteksi jenis semantik otomatis untuk detail tentang bagaimana cara kerjanya.
  • Jenis agregasi menentukan apakah nilai metrik (dimensi diabaikan) dapat digabungkan ulang. Menetapkan semantics.isReaggregatable ke true akan ditetapkan secara default ke agregasi SUM, jika tidak, disetel ke Auto. Anda juga dapat menetapkan jenis agregasi default secara manual untuk kolom yang dapat digabungkan ulang menggunakan defaultAggregationType saat ini.

Saat Anda mengonfigurasi dan terhubung menggunakan konektor di Looker Studio, kolom ini menampilkan skema lengkap untuk konektor berdasarkan cara yang Anda tentukan properti di atas. Jika Anda telah menyertakan jenis semantik, maka jenis itu akan ditampilkan seperti yang Anda tentukan. Jika Anda menggunakan deteksi jenis semantik otomatis, lalu kolom akan ditampilkan seperti yang terdeteksi. Layar Kolom

Menyetel informasi semantik

Ada dua cara untuk menetapkan informasi semantik. Anda bisa menyetel kolom semantik secara manual atau mengandalkan Looker Studio untuk mendeteksi secara otomatis.

Misalnya, jika Anda memiliki Nomor yang secara semantik mewakili Dolar AS, Looker Studio tidak akan dapat mendeteksi jenis semantik ini secara otomatis. Selain itu, deteksi semantik otomatis memerlukan Looker Studio untuk membuat untuk setiap kolom skema Anda. Jika Anda menentukan skema secara manual sebagai gantinya, maka tidak ada panggilan pengambilan data yang akan dilakukan. Jika Anda mengetahui jenis semantik (Mis. mata uang, persen, tanggal, dll.) untuk data Anda, lalu kami sebaiknya tetapkan secara eksplisit hal ini dalam skema untuk akurasi dan performa alasan.

Menetapkan jenis semantik secara manual (Direkomendasikan)

Jika mengetahui jenis semantik, Anda dapat menentukan semantics secara manual untuk setiap kolom schema. Detail lengkap tentang properti yang tersedia untuk Anda yang dapat ditemukan di halaman referensi kolom. Jika Anda memilih untuk mendefinisikan jenis semantik manual, sebaiknya Anda menentukan semanticType dan semanticGroup untuk setiap kolom. Dengan menyediakan , proses deteksi jenis semantik otomatis tidak akan berjalan. Jika Anda menetapkan secara manual beberapa {i>field<i} Anda, tetapi tidak semua, maka yang tidak Anda menentukan default ke Text, Number, atau Boolean bergantung pada dataType yang ditentukan untuk kolom.

Berikut ini contoh skema sederhana yang menetapkan semantik secara manual jenis datanya. Income ditetapkan sebagai Mata Uang, dan Filing Year ditetapkan sebagai tanggal.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

Memecahkan Masalah Jenis Semantik Manual

Jika Anda salah menetapkan jenis semantik untuk data pokok, jenis semantik tersebut akan tidak berfungsi dengan baik. Ini bisa sulit untuk diuji, tetapi ada beberapa hal yang Anda dilakukan untuk membantu menemukan masalah.

  1. Menampilkan 2 atau 3 baris dari data Anda, bukan semuanya, lalu secara manual memeriksanya.
  2. Buat tabel di Looker Studio yang hanya menggunakan kolom yang Anda coba .
  3. Perhatikan kolom Geo dan Date karena keduanya memiliki paling banyak format yang lebih ketat.

Deteksi jenis semantik otomatis

Jika Anda belum menentukan jenis semantik apa pun dalam skema, Looker Studio akan mencoba mendeteksinya secara otomatis berdasarkan data type dan formatnya. nilai data yang ditampilkan oleh konektor Anda.

Langkah-langkah proses deteksi otomatis adalah sebagai berikut:

  1. Minta skema dengan menjalankan Fungsi getSchema dari konektor komunitas.
  2. Melakukan iterasi melalui batch kolom yang ditentukan dalam skema dan masalah konektor getData meminta kolom. Permintaan getData dijalankan dengan parameter sampleExtraction disetel ke true guna menunjukkan bahwa permintaan data ditujukan untuk tujuan semantik deteksi.
  3. Berdasarkan jenis data kolom dan format nilai yang ditampilkan dari getData, identifikasi jenis semantik kolom.

Opsi untuk menangani deteksi jenis semantik otomatis

Saat Looker Studio menjalankan fungsi getData dari konektor komunitas untuk tujuan deteksi semantik, permintaan masuk akan berisi Properti sampleExtraction yang akan ditetapkan ke true. Data yang ditampilkan oleh konektor Anda hanya digunakan oleh Looker Studio untuk mengidentifikasi jenis semantik bidang Anda. Karena nilainya tidak akan digunakan untuk tujuan lain, nilainya tidak memerlukan data aktual dari sumber eksternal Anda.

Ada beberapa cara untuk meningkatkan deteksi jenis semantik dalam kode Anda:

  • Direkomendasikan: Teruskan nilai yang telah ditetapkan
    Menampilkan nilai standar untuk setiap kolom yang paling mewakili semantik untuk kolom tersebut dan diketahui dapat dideteksi dengan benar oleh Looker Studio. Misalnya, jika jenis semantik untuk sebuah kolom adalah Country, tampilkan seperti IT untuk Italia. Manfaat lain dari pendekatan ini adalah jauh lebih cepat karena tidak mengharuskan Anda membuat permintaan HTTP ke layanan pihak ketiga untuk data.

  • Hanya mengembalikan n jumlah data
    Jika layanan pihak ketiga tempat Anda mengambil data mendukung batas baris saat meminta data, tampilkan sebagian kecil baris ke Looker Studio dari {i>dataset<i} lengkap. Fungsi ini akan membatasi jumlah data yang perlu Anda teruskan Looker Studio untuk setiap permintaan deteksi semantik.

  • Minta semua kolom dan simpan respons ke dalam cache
    Jika memungkinkan untuk meminta semua kolom untuk layanan pihak ketiga dari Anda akan mengambil data, kemudian pada permintaan deteksi semantik pertama yang diterima dari Looker Studio, ambil semua kolom dan simpan hasilnya di cache. Sebagai permintaan deteksi semantik berikutnya mengambil nilai kolom dari cache alih-alih membuat permintaan HTTP tambahan ke layanan pihak ketiga.

  • Tidak melakukan hal yang berbeda
    Anda dapat memilih untuk tidak menerapkan akomodasi khusus apa pun untuk permintaan sampleExtraction disetel ke true. Ini akan menyebabkan Deteksi Semantik menjadi lebih lambat karena Looker Studio harus mengambil semua data Proses Deteksi Semantik. Selain itu, hal ini akan mempengaruhi tingkat permintaan untuk sumber data eksternal Anda karena banyak permintaan deteksi semantik akan dijalankan secara paralel.

Format yang dikenali untuk deteksi jenis semantik otomatis

Tanggal & Waktu
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Waktu: epoch untuk detik, mikro, mili, dan nano.
Geo