「外部資料來源」是指可以直接透過 BigQuery 查詢的資料來源,即使資料未儲存在 BigQuery 儲存空間中也一樣。例如,您可能有資料在其他 Google Cloud 資料庫、Cloud Storage 的檔案或其他雲端產品中,而且想在不遷移資料的狀況下,在 BigQuery 中進行分析。
外部資料來源的用途包括:
- 對於擷取-載入-轉換 (ELT) 工作負載,使用
CREATE TABLE ... AS SELECT
查詢,即可一次載入並清理資料,然後將清理後的結果寫入 BigQuery 儲存空間。 - 彙整 BigQuery 資料表與外部資料來源中變動頻繁的資料。直接查詢外部資料來源,您就不需要在每次資料變更時,重新將資料載入至 BigQuery 儲存空間。
廣告資料中心客戶可以利用這項 BigQuery 功能,輕鬆取得其他來源 (例如 S3 和 Azure) 的第一方資料,並將這些資料彙整到查詢中的 Google 廣告資料。
如需將外部資料來源連結至 BigQuery 的完整詳細資料,請參閱外部資料來源簡介。
限制
- 系統支援下列地區。如果您的 AWS 或 Azure 資料位於不支援的地區,也可以考慮使用 BigQuery 資料移轉服務。
- AWS - 美國東部 (北維吉尼亞州) (
aws-us-east-1
) - Azure - 美國東部 2 (
azure-eastus2
)
- AWS - 美國東部 (北維吉尼亞州) (
- 針對 BigQuery 連結資料執行的工作:
Amazon S3
以下概略說明從 Amazon S3 將資料匯出至 BigQuery,以便用於廣告資料中心的必要步驟。詳情請參閱「連結至 Amazon S3」一文。
- 為 BigQuery 建立 AWS 身分與存取權管理政策。政策建立後,即可在「政策詳細資料」頁面中找到 Amazon Resource Name (ARN)。
- 使用前一個步驟中建立的政策,為 BigQuery 建立 AWS 身分與存取權管理角色。
- 在 BigQuery 中建立連結。請在廣告資料中心可存取的 BigQuery 專案中建立連結,例如管理員專案。連結資訊頁面顯示的 BigQuery Google 身分,則會在下個步驟中派上用場。
- 為 AWS 角色新增信任關係。在「AWS 身分與存取權管理」頁面中,編輯在先前步驟中建立的角色:
- 將工作階段持續時間上限改為 12 小時。
- 使用在上一個步驟中建立的 BigQuery Google 身分,為 AWS 角色新增信任政策。
- 將資料載入至 BigQuery 資料集。
- 在廣告資料中心查詢資料。 瞭解如何彙整第一方資料。
- 選用步驟:排定在 BigQuery 中持續載入資料。
Azure Blob 儲存體
以下概略說明從 Azure Blob 儲存體將資料匯出至 BigQuery,以便用於廣告資料中心的必要步驟。詳情請參閱「連結至 Blob 儲存體」一文。
- 在 Azure 用戶群中建立應用程式。
- 在 BigQuery 中建立連結。
- 用戶群 ID 是上一個步驟中的目錄 ID。
- 聯盟應用程式 (用戶端) ID 是上一個步驟中的應用程式 (用戶端) ID。
- 下一個步驟會使用 BigQuery Google 身分。
- 在 Azure 中新增聯盟憑證。
- 用上一個步驟中的 BigQuery Google 身分,做為「主體 ID」。
- 將角色指派給 BigQuery 的 Azure 應用程式,授予「儲存體 Blob 資料讀取者」存取權。
- 將資料載入至 BigQuery 資料集。
- 在廣告資料中心查詢資料。 瞭解如何彙整第一方資料。
- 選用步驟:排定在 BigQuery 中持續載入資料。