BigQuery 外部連結

「外部資料來源」是指可以直接透過 BigQuery 查詢的資料來源,即使資料未儲存在 BigQuery 儲存空間中也一樣。例如,您可能有資料在其他 Google Cloud 資料庫、Cloud Storage 的檔案或其他雲端產品中,而且想在不遷移資料的狀況下,在 BigQuery 中進行分析。

外部資料來源的用途包括:

  • 對於擷取-載入-轉換 (ELT) 工作負載,使用 CREATE TABLE ... AS SELECT 查詢,即可一次載入並清理資料,然後將清理後的結果寫入 BigQuery 儲存空間。
  • 彙整 BigQuery 資料表與外部資料來源中變動頻繁的資料。直接查詢外部資料來源,您就不需要在每次資料變更時,重新將資料載入至 BigQuery 儲存空間。

廣告資料中心客戶可以利用這項 BigQuery 功能,輕鬆取得其他來源 (例如 S3 和 Azure) 的第一方資料,並將這些資料彙整到查詢中的 Google 廣告資料。

如需將外部資料來源連結至 BigQuery 的完整詳細資料,請參閱外部資料來源簡介

限制

  • 系統支援下列地區。如果您的 AWS 或 Azure 資料位於不支援的地區,也可以考慮使用 BigQuery 資料移轉服務
    • AWS - 美國東部 (北維吉尼亞州) (aws-us-east-1)
    • Azure - 美國東部 2 (azure-eastus2)
  • 針對 BigQuery 連結資料執行的工作:

Amazon S3

以下概略說明從 Amazon S3 將資料匯出至 BigQuery,以便用於廣告資料中心的必要步驟。詳情請參閱「連結至 Amazon S3」一文。

  1. 為 BigQuery 建立 AWS 身分與存取權管理政策。政策建立後,即可在「政策詳細資料」頁面中找到 Amazon Resource Name (ARN)。
  2. 使用前一個步驟中建立的政策,為 BigQuery 建立 AWS 身分與存取權管理角色。
  3. 在 BigQuery 中建立連結。請在廣告資料中心可存取的 BigQuery 專案中建立連結,例如管理員專案。連結資訊頁面顯示的 BigQuery Google 身分,則會在下個步驟中派上用場。
  4. 為 AWS 角色新增信任關係。在「AWS 身分與存取權管理」頁面中,編輯在先前步驟中建立的角色:
    1. 將工作階段持續時間上限改為 12 小時。
    2. 使用在上一個步驟中建立的 BigQuery Google 身分,為 AWS 角色新增信任政策。
  5. 資料載入至 BigQuery 資料集。
  6. 在廣告資料中心查詢資料。 瞭解如何彙整第一方資料
  7. 選用步驟:排定在 BigQuery 中持續載入資料。

Azure Blob 儲存體

以下概略說明從 Azure Blob 儲存體將資料匯出至 BigQuery,以便用於廣告資料中心的必要步驟。詳情請參閱「連結至 Blob 儲存體」一文。

  1. 在 Azure 用戶群中建立應用程式。
  2. 在 BigQuery 中建立連結。
    • 用戶群 ID 是上一個步驟中的目錄 ID。
    • 聯盟應用程式 (用戶端) ID 是上一個步驟中的應用程式 (用戶端) ID。
    • 下一個步驟會使用 BigQuery Google 身分
  3. 在 Azure 中新增聯盟憑證。
    • 用上一個步驟中的 BigQuery Google 身分,做為「主體 ID」
  4. 將角色指派給 BigQuery 的 Azure 應用程式,授予「儲存體 Blob 資料讀取者」存取權。
  5. 資料載入至 BigQuery 資料集。
  6. 在廣告資料中心查詢資料。 瞭解如何彙整第一方資料
  7. 選用步驟:排定在 BigQuery 中持續載入資料。