BigQuery के बाहरी कनेक्शन

बाहरी डेटा सोर्स एक ऐसा डेटा सोर्स है जिसे सीधे BigQuery से क्वेरी किया जा सकता है. भले ही, डेटा BigQuery स्टोरेज में सेव न हो. उदाहरण के लिए, हो सकता है कि आपके पास किसी दूसरे Google Cloud डेटाबेस, Cloud Storage की फ़ाइलों या किसी ऐसे क्लाउड प्रॉडक्ट में डेटा हो जिसका विश्लेषण आपको BigQuery में करना है, लेकिन जिस डेटा को माइग्रेट करने के लिए तैयार नहीं है.

बाहरी डेटा सोर्स के इस्तेमाल के उदाहरणों में ये शामिल हैं:

  • एक्सट्रैक्ट-लोड-ट्रांसफ़ॉर्म (ईएलटी) वर्कलोड के लिए, अपने डेटा को एक ही पास में लोड और साफ़ करें. साथ ही, CREATE TABLE ... AS SELECT क्वेरी का इस्तेमाल करके, क्लीन्ड नतीजे को BigQuery स्टोरेज में लिखें.
  • किसी बाहरी डेटा सोर्स से बार-बार डेटा बदलने के साथ BigQuery टेबल को जोड़ना. बाहरी डेटा सोर्स से सीधे क्वेरी करने पर, आपको हर बार BigQuery स्टोरेज में बदलाव होने पर, उसे फिर से लोड करने की ज़रूरत नहीं है.

'मार्केटर के लिए Ads Data Hub' के तौर पर, BigQuery की इस सुविधा का इस्तेमाल करके, S3 और Azure जैसे दूसरे सोर्स से आसानी से पहले पक्ष (ग्राहक) का डेटा हासिल किया जा सकता है. साथ ही, इसे अपनी क्वेरी में Google के विज्ञापन डेटा के साथ जोड़ा जा सकता है.

बाहरी डेटा सोर्स को BigQuery से कनेक्ट करने से जुड़ी पूरी जानकारी के लिए, बाहरी डेटा सोर्स के बारे में जानकारी देखें.

सीमाएं

  • नीचे दी गई जगहों का इस्तेमाल किया जा सकता है. अगर आपका AWS या Azure डेटा ऐसे इलाके में है जहां यह सुविधा काम नहीं करती, तो आपके पास BigQuery डेटा ट्रांसफ़र सेवा का इस्तेमाल करने का भी विकल्प है.
    • AWS - पूर्वी अमेरिका (N. वर्जीनिया) (aws-us-east-1)
    • Azure - पूर्वी अमेरिका 2 (azure-eastus2)
  • BigQuery कनेक्शन के डेटा पर चलने वाली जॉब:

Amazon S3

Ads Data Hub में इस्तेमाल करने के लिए, Amazon S3 से BigQuery में डेटा एक्सपोर्ट करने के तरीके की खास जानकारी नीचे दी गई है. पूरी जानकारी के लिए, Amazon S3 से कनेक्ट करें पर जाएं.

  1. BigQuery के लिए, AWS IAM नीति बनाएं. नीति बनने के बाद, Amazon संसाधन नाम (ARN) को नीति की जानकारी पेज पर देखा जा सकता है.
  2. पिछले चरण में बनाई गई नीति का इस्तेमाल करके, BigQuery के लिए AWS IAM रोल बनाएं.
  3. BigQuery में कनेक्शन बनाएं. ऐसे BigQuery प्रोजेक्ट में कनेक्शन बनाएं जिसका ऐक्सेस Ads Data Hub के पास है—उदाहरण के लिए, आपका एडमिन प्रोजेक्ट. BigQuery Google Identity, जिसका इस्तेमाल अगले चरण में किया जाएगा, कनेक्शन की जानकारी वाले पेज पर दिखाई गई है.
  4. AWS भूमिका में ट्रस्ट रिलेशनशिप जोड़ें. AWS IAM पेज में, पहले के चरण में बनाई गई भूमिका में बदलाव करें:
    1. सेशन की ज़्यादा से ज़्यादा अवधि को बदलकर 12 घंटे करें.
    2. पिछले चरण में बनाई गई BigQuery Google आइडेंटिटी का इस्तेमाल करके, AWS की भूमिका में ट्रस्ट नीति जोड़ें.
  5. BigQuery डेटासेट में डेटा लोड करें.
  6. Ads Data Hub में डेटा के बारे में क्वेरी करें. पहले पक्ष (ग्राहक) के डेटा को शामिल करने के बारे में जानें.
  7. ज़रूरी नहीं: BigQuery में लगातार डेटा लोड शेड्यूल करें.

Azure Blob स्टोरेज

Ads Data Hub में इस्तेमाल करने के लिए, Azure Blob Storage से BigQuery में डेटा एक्सपोर्ट करने के तरीके के बारे में खास जानकारी नीचे दी गई है. पूरी जानकारी के लिए, Blob Storage से कनेक्ट करना देखें.

  1. अपने Azure टेनेंट में ऐप्लिकेशन बनाएं.
  2. BigQuery में कनेक्शन बनाएं.
    • टेनेंट आईडी, पिछले चरण का डायरेक्ट्री आईडी होता है.
    • फ़ेडरेटेड ऐप्लिकेशन (क्लाइंट) आईडी, पिछले चरण का ऐप्लिकेशन (क्लाइंट) आईडी होता है.
    • अगले चरण में, BigQuery Google Identity का इस्तेमाल किया जाएगा.
  3. Azure में फ़ेडरेटेड क्रेडेंशियल जोड़ें.
    • सब्जेक्ट आइडेंटिफ़ायर के लिए, पिछले चरण में बताए गए BigQuery की Google Identity का इस्तेमाल करें.
  4. BigQuery के Azure ऐप्लिकेशन को कोई भूमिका असाइन करें, ताकि स्टोरेज Blob डेटा रीडर को ऐक्सेस मिल सके.
  5. BigQuery डेटासेट में डेटा लोड करें.
  6. Ads Data Hub में डेटा के बारे में क्वेरी करें. पहले पक्ष (ग्राहक) के डेटा को शामिल करने के बारे में जानें.
  7. ज़रूरी नहीं: BigQuery में लगातार डेटा लोड शेड्यूल करें.