BigQuery harici bağlantıları

Harici veri kaynağı, veriler BigQuery depolama alanında depolanmasa bile doğrudan BigQuery'den sorgulayabileceğiniz bir veri kaynağıdır. Örneğin, farklı bir Google Cloud veritabanında, Cloud Storage'daki dosyalarda veya tamamen farklı bir bulut ürününde yer alan ve BigQuery'de analiz etmek istediğiniz verileriniz olabilir. Ancak bunları taşımak istemiyorsunuzdur.

Harici veri kaynaklarının kullanım alanlarından bazıları şunlardır:

  • Ayıklama-yükleme-dönüşümü (ELT) iş yükleri için verilerinizi tek bir kartta yükleyip temizleme ve temizlenen sonucu BigQuery depolama alanına CREATE TABLE ... AS SELECT sorgusu kullanarak yazma.
  • Harici bir veri kaynağından sık sık değişen verilerle BigQuery tablolarına katılma. Harici veri kaynağını doğrudan sorguladığınızda, her değişiklik için verileri BigQuery depolama alanına yeniden yüklemeniz gerekmez.

Ads Data Hub müşterisi olarak S3 ve Azure gibi diğer kaynaklardan birinci taraf verilerini kolayca getirmek ve bunları sorgularınızdaki Google reklam verilerine eklemek için bu BigQuery özelliğinden yararlanabilirsiniz.

Harici veri kaynaklarını BigQuery'ye bağlama hakkında ayrıntılı bilgi için Harici veri kaynaklarına giriş bölümüne bakın.

Sınırlamalar

  • Aşağıdaki konumlar desteklenir. AWS veya Azure verileriniz desteklenmeyen bir bölgedeyse BigQuery Veri Aktarım Hizmeti'ni de kullanabilirsiniz.
    • AWS - ABD Doğu (Kuzey Virginia) (aws-us-east-1)
    • Azure - Doğu ABD 2 (azure-eastus2)
  • BigQuery bağlantılarından elde edilen veriler üzerinde çalışan işler:

Amazon S3

Aşağıda, Ads Data Hub'da kullanılmak üzere Amazon S3'ten BigQuery'ye veri aktarmak için gereken adımlara üst düzey bir genel bakış verilmiştir. Tüm ayrıntılar için Amazon S3'e bağlanma başlıklı makaleyi inceleyin.

  1. BigQuery için bir AWS IAM politikası oluşturun. Politika oluşturulduktan sonra Amazon Kaynak Adı'nı (ARN), Politika ayrıntıları sayfasında bulabilirsiniz.
  2. Önceki adımda oluşturulan politikayı kullanarak BigQuery için bir AWS IAM rolü oluşturun.
  3. BigQuery'de bağlantı oluşturun. Bir BigQuery projesinde, Ads Data Hub'ın erişebildiği bir bağlantı oluşturun (ör. yönetici projeniz). Bir sonraki adımda kullanılacak olan BigQuery Google kimliği, Bağlantı bilgileri sayfasında gösterilir.
  4. AWS rolüne bir güven ilişkisi ekleyin. AWS IAM sayfasında, önceki adımda oluşturulan rolü düzenleyin:
    1. Maksimum oturum süresini 12 saat olarak değiştirin.
    2. Önceki adımda oluşturulan BigQuery Google kimliğini kullanarak AWS rolüne bir güven politikası ekleyin.
  5. BigQuery veri kümesine veri yükleyin.
  6. Ads Data Hub'da verileri sorgulayın. Birinci taraf verilerini birleştirme hakkında bilgi edinin.
  7. İsteğe bağlı: BigQuery'de sürekli veri yüklemesini planlayın.

Azure Blob Depolama

Aşağıda, Ads Data Hub'da kullanılmak üzere verileri Azure Blob Depolama'dan BigQuery'ye aktarmak için gereken adımlara üst düzey bir genel bakış verilmiştir. Tüm ayrıntılar için Blob Depolama Alanı'na bağlanma bölümüne bakın.

  1. Azure kiracınızda bir uygulama oluşturun.
  2. BigQuery'de bağlantı oluşturun.
    • Kiracı Kimliği, önceki adımdaki dizin kimliğidir.
    • Federated Application (Client) ID (Birleştirilmiş Uygulama (istemci) Kimliği), önceki adımdaki Uygulama (istemci) kimliğidir.
    • Sonraki adımda BigQuery Google kimliği kullanılacaktır.
  3. Azure'da birleşik kimlik bilgisi ekleyin.
    • Konu tanımlayıcısı için önceki adımda yer alan BigQuery Google kimliğini kullanın.
  4. BigQuery'nin Azure uygulamalarına bir rol atayarak Storage Blob Veri Okuyucu erişimi sağlayın.
  5. BigQuery veri kümesine veri yükleyin.
  6. Ads Data Hub'da verileri sorgulayın. Birinci taraf verilerini birleştirme hakkında bilgi edinin.
  7. İsteğe bağlı: BigQuery'de sürekli veri yüklemesini planlayın.