Google 広告のトラフィック ソース データをできるだけ早くバックフィルする(アナリティクス 360)

BigQuery の毎日(高頻度)エクスポートを使用すると、一部の traffic_source フィールドに Data Not Available が表示されることがあります。このガイドでは、既存のエクスポートで不足しているトラフィック ソース データのほとんどを、利用可能になり次第(通常は毎日午前 5 時までに)自動的にバックフィルする方法について説明します。

バックフィルを自動化する手順は次のとおりです。

  1. BigQuery から毎日完全性シグナルをリッスンします。
  2. BigQuery Export で、トラフィック ソース データがないイベントを特定します。
  3. Google 広告から、それらのイベントの完全なデータをクエリします。
  4. 完全なイベントデータを BigQuery Export と結合します。

Pub/Sub トピックの作成

  1. Google Cloud コンソールの左側のナビゲーション メニューで [Pub/Sub] を開きます。[Pub/Sub] が表示されない場合は、Google Cloud コンソールの検索バー(Pub/Sub を検索する)で検索します。
  2. [トピック] タブで [+ トピックを作成] をクリックします。 [トピックを作成] ボタン
  3. [トピック ID] フィールドに名前を入力します。
  4. [デフォルトのサブスクリプションを追加する] を選択し、他のオプションは空白のままにします。 サブスクリプションを作成するボタン
  5. [作成] をクリックします。

ログルーター シンクを作成する

  1. Google Cloud コンソールで [ログルーター] を開きます。 ログルーター ボタン
  2. [シンクを作成] をクリックします。 シンクの作成ボタン
  3. シンクの名前と説明を入力し、[次へ] をクリックします。
  4. シンクサービスとして [Cloud Pub/Sub トピック] を選択します。
  5. 作成したトピックを選択し、[次へ] をクリックします。
  6. [包含フィルタの作成] に次のコードを入力します。

    logName="projects/YOUR-PROJECT-ID/logs/analyticsdata.googleapis.com%2Ffresh_bigquery_export_status"
    

    YOUR-PROJECT-ID は、Google Cloud コンソール プロジェクトの ID に置き換えます。

  7. [次へ]、[シンクを作成] の順にクリックします。ログをフィルタする必要はありません。

  8. シンクが [ログルーター シンク] の下に表示されていることを確認します。

不足しているデータを結合する

Cloud Run 関数を使用して、Pub/Sub が完全性シグナルを検出したときに、トラフィック ソースデータをバックフィルするコードを自動的に実行します。

  1. Cloud Run 関数を開きます。 Cloud Run functions ボタン
  2. [CREATE FUNCTION] をクリックします。 関数を作成ボタン
  3. [環境] で [Cloud Run 関数] を選択します。
  4. 関数の名前を入力します。
  5. [トリガーのタイプ] として [Cloud Pub/Sub] を選択し、[Cloud Pub/Sub トピック] として作成したトピックを選択します。
  6. [次へ] をクリックし、Google 広告のアトリビューション データと BigQuery エクスポートを結合するコードを入力します。