أوراق البيانات المرتبطة: تتيح لك هذه الأداة تحليل كمية كبيرة من البيانات مباشرةً في "جداول بيانات Google". يمكنك ربط جداول بياناتك بمستودع بيانات BigQuery أو التحليل باستخدام أدوات "جداول بيانات Google" المألوفة مثل الجداول المحورية والرسومات البيانية والصيغ.
يستخدم هذا الدليل مجموعة البيانات العلنية
Shakespeare
لعرض كيفية استخدام "أوراق البيانات المرتبطة". تحتوي مجموعة البيانات
على المعلومات التالية:
الحقل | النوع | الوصف |
---|---|---|
الكلمة | STRING |
كلمة واحدة فريدة (حيث تكون المسافة البيضاء هي المحدد) المستخرَجة من مجموعة. |
word_count | INTEGER |
عدد مرات ظهور هذه الكلمة في مجموعة النصوص هذه. |
مجموعة | STRING |
العمل الذي تم استخراج هذه الكلمة منه. |
corpus_date | INTEGER |
العام الذي تم فيه نشر هذا المحتوى. |
إذا كان تطبيقك يطلب أي بيانات في "أوراق البيانات المرتبطة"، يجب أن يوفّر رمز OAuth 2.0 المميز الذي يمنح النطاق bigquery.readonly
، بالإضافة إلى النطاقات الأخرى المطلوبة لطلب عادي من Google Sheets API. لمزيد من المعلومات، يُرجى الاطّلاع على اختيار نطاقات واجهة برمجة التطبيقات في "جداول بيانات Google".
إدارة مصدر بيانات
يحدِّد مصدر البيانات موقعًا خارجيًا يمكن العثور فيه على البيانات. ثم يتم ربط مصدر البيانات بجدول البيانات.
إضافة مصدر بيانات BigQuery
لإضافة مصدر بيانات، قدِّم AddDataSourceRequest
باستخدام الطريقة spreadsheets.batchUpdate
. يجب أن يحدّد نص الطلب الحقل dataSource
من النوع
DataSource
.
"addDataSource":{
"dataSource":{
"spec":{
"bigQuery":{
"projectId":"PROJECT_ID",
"tableSpec":{
"tableProjectId":"bigquery-public-data",
"datasetId":"samples",
"tableId":"shakespeare"
}
}
}
}
}
استبدِل "PROJECT_ID" برقم تعريف مشروع صالح على Google Cloud.
بعد إنشاء مصدر بيانات، يتم إنشاء ورقة
DATA_SOURCE
مرتبطة لتوفير معاينة لما يصل إلى 500 صف. لا تتوفر المعاينة
على الفور. يتم تشغيل التنفيذ بشكلٍ غير متزامن لاستيراد بيانات BigQuery.
تحتوي
AddDataSourceResponse
على الحقول التالية:
dataSource
: العنصرDataSource
الذي تم إنشاؤهdataSourceId
هي معرّف فريد على مستوى جدول البيانات. تتم تعبئته والرجوع إليه لإنشاء كل عنصرDataSource
من مصدر البيانات.dataExecutionStatus
: حالة عملية تنفيذ تستورِد بيانات BigQuery في ورقة بيانات المعاينة لمزيدٍ من المعلومات، يُرجى الاطّلاع على القسم حالة تنفيذ البيانات.
تعديل مصدر بيانات أو حذفه
استخدِم طريقة
spreadsheets.batchUpdate
وقدِّم طلبًا
UpdateDataSourceRequest
أو
DeleteDataSourceRequest
وفقًا لذلك.
إدارة عناصر مصدر البيانات
بمجرد إضافة مصدر بيانات إلى جدول البيانات، يمكن إنشاء كائن مصدر بيانات منه. عنصر مصدر البيانات هو أداة عادية في "جداول بيانات Google"، مثل الجداول المحورية والرسومات البيانية والصيغ المدمجة مع "أوراق البيانات المرتبطة" لتعزيز تحليل البيانات.
هناك أربعة أنواع من الكائنات:
- جدول "
DataSource
" DataSource
pivotTable- رسم
DataSource
البياني - صيغة
DataSource
إضافة جدول مصدر بيانات
يُعرف باسم "الاستخراج" في محرر جداول البيانات، ويستورد كائن الجدول تفريغًا ثابتًا للبيانات من مصدر البيانات إلى "جداول البيانات". على غرار الجدول المحوري، يتم تحديد الجدول وتثبيته في الخلية العلوية اليسرى.
يوضّح نموذج الرمز البرمجي التالي كيفية استخدام إجراء
spreadsheets.batchUpdate
وUpdateCellsRequest
لإنشاء جدول مصدر بيانات يصل إلى 1000 صف من عمودَين (word
و
word_count
).
"updateCells":{
"rows":{
"values":[
{
"dataSourceTable":{
"dataSourceId":"DATA_SOURCE_ID",
"columns":[
{
"name":"word"
},
{
"name":"word_count"
}
],
"rowLimit":{
"value":1000
},
"columnSelectionType":"SELECTED"
}
}
]
},
"fields":"dataSourceTable"
}
استبدِل DATA_SOURCE_ID بمعرّف فريد على مستوى جدول البيانات يحدّد مصدر البيانات.
بعد إنشاء جدول مصدر بيانات، لا تتوفّر البيانات على الفور. في محرر جداول البيانات،
يتم عرضه كمعاينة. تحتاج إلى إعادة تحميل جدول
مصدر البيانات لاسترجاع بيانات BigQuery. يمكنك تحديد RefreshDataSourceRequest
ضمن batchUpdate
نفسها. يُرجى العلم أنّ جميع عناصر مصدر البيانات تعمل بالطريقة نفسها.
لمزيد من المعلومات، يُرجى الاطّلاع على مقالة إعادة تحميل عنصر مصدر بيانات.
بعد اكتمال إعادة التحميل واسترجاع بيانات BigQuery، تتم تعبئة جدول مصدر البيانات على النحو الموضّح:
إضافة جدول محوري لمصدر بيانات
على عكس الجدول المحوري التقليدي، يتم دعم الجدول المحوري لمصدر البيانات
بمصدر بيانات ويشير إلى البيانات حسب اسم العمود. يوضّح نموذج الرمز البرمجي التالي كيفية استخدام طريقة spreadsheets.batchUpdate
وUpdateCellsRequest
لإنشاء جدول محوري يعرض إجمالي عدد الكلمات حسب مجموعة الكلمات.
"updateCells":{
"rows":{
"values":[
{
"pivotTable":{
"dataSourceId":"DATA_SOURCE_ID",
"rows":{
"dataSourceColumnReference":{
"name":"corpus"
},
"sortOrder":"ASCENDING"
},
"values":{
"summarizeFunction":"SUM",
"dataSourceColumnReference":{
"name":"word_count"
}
}
}
}
]
},
"fields":"pivotTable"
}
استبدِل DATA_SOURCE_ID بمعرّف فريد على مستوى جدول البيانات يحدّد مصدر البيانات.
بعد استرجاع بيانات BigQuery، تتم تعبئة الجدول المحوري لمصدر البيانات كما هو موضّح:
إضافة رسم بياني لمصدر بيانات
يوضح نموذج الرمز البرمجي التالي كيفية استخدام طريقة spreadsheets.batchUpdate
وAddChartRequest
لإنشاء رسم بياني لمصدر بيانات يحتوي على chartType
لـ COLUMN، ويعرض إجمالي عدد الكلمات حسب مجموعة الكلمات.
"addChart":{
"chart":{
"spec":{
"title":"Corpus by word count",
"basicChart":{
"chartType":"COLUMN",
"domains":[
{
"domain":{
"columnReference":{
"name":"corpus"
}
}
}
],
"series":[
{
"series":{
"columnReference":{
"name":"word_count"
},
"aggregateType":"SUM"
}
}
]
}
},
"dataSourceChartProperties":{
"dataSourceId":"DATA_SOURCE_ID"
}
}
}
استبدِل DATA_SOURCE_ID بمعرّف فريد على مستوى جدول البيانات يحدّد مصدر البيانات.
بعد استرجاع بيانات BigQuery، يتم عرض الرسم البياني لمصدر البيانات على النحو التالي:
إضافة صيغة مصدر بيانات
يوضح نموذج الرمز البرمجي التالي كيفية استخدام طريقة spreadsheets.batchUpdate
وUpdateCellsRequest
لإنشاء صيغة مصدر بيانات لحساب متوسط عدد الكلمات.
"updateCells":{
"rows":[
{
"values":[
{
"userEnteredValue":{
"formulaValue":"=AVERAGE(shakespeare!word_count)"
}
}
]
}
],
"fields":"userEnteredValue"
}
بعد استرجاع بيانات BigQuery، تتم تعبئة صيغة مصدر البيانات على النحو التالي:
إعادة تحميل عنصر مصدر بيانات
يمكنك إعادة تحميل عنصر مصدر بيانات لاسترجاع أحدث البيانات من BigQuery
استنادًا إلى مواصفات مصادر البيانات الحالية وإعدادات العناصر. يمكنك استخدام
طريقة
spreadsheets.batchUpdate
لاستدعاء
RefreshDataSourceRequest
.
بعد ذلك، حدِّد مرجعًا واحدًا أو أكثر من مراجع الكائنات لإعادة التحميل باستخدام الكائن DataSourceObjectReferences
.
يُرجى العلم أنّه يمكنك إنشاء عناصر مصدر البيانات وإعادة تحميلها في طلب
batchUpdate
واحد.
حالة تنفيذ البيانات
عند إنشاء مصادر البيانات أو إعادة تحميل عناصر مصدر البيانات، يتم إنشاء تنفيذ في الخلفية لجلب البيانات من BigQuery وعرض استجابة تحتوي على DataExecutionStatus
.
في حال بدء عملية التنفيذ بنجاح، تكون حالة DataExecutionState
عادةً في حالة RUNNING
.
ولأنّ هذه العملية غير متزامنة، يجب أن ينفِّذ تطبيقك نموذج استقصاء لاسترداد حالة عناصر مصدر البيانات بشكل دوري. استخدِم الإجراء
spreadsheets.get
حتى تعرض الحالة إما الحالة SUCCEEDED
أو FAILED
. يكتمل التنفيذ بسرعة في معظم الحالات، لكن ذلك يعتمد على مدى تعقيد مصدر البيانات. عادةً لا تتجاوز مدة التنفيذ 10 دقائق.
مواضيع ذات صلة
- اختيار نطاقات Google Sheets API
- بدء استخدام بيانات BigQuery في "جداول بيانات Google"
- وثائق BigQuery
- BigQuery: استخدام "أوراق البيانات المرتبطة"
- فيديو تعليمي حول "أوراق البيانات المرتبطة"