أنواع البيانات والدلالية

عند إنشاء موصّل بيانات من إنشاء المنتدى، يتطلّب كل حقل تحدّده في المخطّط نوع بيانات. يحدّد نوع البيانات النوع الأساسي للحقل، مثل BOOLEAN أو STRING أو NUMBER أو غير ذلك.

بالإضافة إلى أنواع البيانات، تستخدم أداة مركز البيانات أيضًا الأنواع الدلالية. تساعد الأنواع الدلالية في وصف نوع المعلومات التي تمثّلها البيانات. على سبيل المثال، قد يمثّل حقل من نوع البيانات NUMBER بشكل دلالي مبلغًا من العملة أو نسبة مئوية، وقد يمثّل حقل من نوع البيانات STRING بشكل دلالي مدينة. للاطّلاع على الأنواع الدلالية المتوفّرة، يُرجى الرجوع إلى مستندات الأنواع الدلالية.

مخطط موصّل البيانات من إنشاء المنتدى وحقول "مركز البيانات"

عند تحديد المخطط الخاص بموصّل بيانات من إنشاء المنتدى، تتوفّر سمات مختلفة لكل حقل تحدّد طريقة تمثيل الحقل واستخدامه في مركز البيانات. على سبيل المثال:

  • يتم تحديد conceptType في مخطط الموصل باستخدام السمة conceptType. تحدّد هذه السمة ما إذا كان سيتم التعامل مع الحقل كسمة أو مقياس. يمكنك الاطّلاع على شرح للفرق بين المقاييس والسمات في مقالة السمات والمقاييس.
  • يمكن تحديد النوع الدلالي في مخطط أداة الربط، أو يمكن أن يرصده "مركز البيانات" تلقائيًا استنادًا إلى خاصية نوع البيانات المحدّدة في أداة الربط وقيم البيانات التي تعرضها أداة الربط. راجِع مقالة التعرّف التلقائي على النوع الدلالي لمعرفة المزيد من التفاصيل حول طريقة عمل هذه الميزة.
  • يحدّد نوع التجميع ما إذا كان يمكن إعادة تجميع قيم المقياس (يتم تجاهل السمات). عند ضبط السمة semantics.isReaggregatable على true، سيتم تلقائيًا استخدام تجميع SUM، وإلا سيتم ضبطها على Auto. يمكنك أيضًا ضبط نوع التجميع التلقائي يدويًا للحقول القابلة لإعادة التجميع باستخدام السمة defaultAggregationType.

عند ضبط عملية الربط باستخدام موصل في مركز البيانات، يعرض محرّر الحقول المخطط الكامل للموصل استنادًا إلى كيفية تحديد الخصائص أعلاه. إذا كنت قد أدرجت الأنواع الدلالية، ستظهر كما حدّدتها. في حال استخدامك الرصد التلقائي للنوع الدلالي، ستظهر الحقول كما تم رصدها. شاشة الحقول

ضبط المعلومات الدلالية

هناك طريقتان لضبط المعلومات الدلالية. يمكنك ضبط دلالات الحقول يدويًا أو الاعتماد على "مركز البيانات من Google" لرصدها تلقائيًا.

على سبيل المثال، إذا كان لديك رقم يمثّل دلاليًا الدولار الأمريكي، لن يتمكّن مركز البيانات من رصد هذا النوع الدلالي تلقائيًا. بالإضافة إلى ذلك، يتطلّب الاكتشاف التلقائي للدلالات أن يطلب مركز البيانات جلب البيانات لكل حقل من حقول المخطط. إذا حدّدت المخطط يدويًا، لن يتم إجراء أي طلبات لجلب البيانات. في حال معرفة النوع الدلالي (مثل العملة أو النسبة المئوية أو التاريخ أو غير ذلك) لبياناتك، ننصحك بتحديد ذلك النوع بشكل صريح في المخطط لأسباب تتعلّق بالدقة والأداء.

ضبط الأنواع الدلالية يدويًا (إجراء يُنصح به)

إذا كنت تعرف أنواعك الدلالية، يمكنك تحديد semantics يدويًا لكل حقل من حقول المخطط. يمكنك الاطّلاع على التفاصيل الكاملة حول الخصائص المتاحة لك في صفحة مرجع الحقول. في حال اختيار تحديد أنواع دلالية يدوية، ننصحك بتحديد semanticType وsemanticGroup لكل حقل. من خلال تقديم هذه الخصائص يدويًا، لن يتم تشغيل عملية التعرّف التلقائي على النوع الدلالي. إذا ضبطت بعض الحقول يدويًا، ولكن ليس كلها، سيتم ضبط الحقول التي لم تحدّدها تلقائيًا على Text أو Number أو Boolean استنادًا إلى dataType المحدّد للحقل.

في ما يلي مثال على مخطط بسيط يضبط الأنواع الدلالية يدويًا. تم ضبط Income كعملة، وتم ضبط Filing Year كتاريخ.

data-studio/semantics.gs
const schema = [
  {
    name: "Income",
    label: "Income (in USD)",
    dataType: "NUMBER",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "CURRENCY",
      semanticType: "CURRENCY_USD",
    },
  },
  {
    name: "Filing Year",
    label: "Year in which you filed the taxes.",
    dataType: "STRING",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "DATE_OR_TIME",
      semanticType: "YEAR",
    },
  },
];

تحديد المشاكل في الأنواع الدلالية اليدوية وحلّها

إذا ضبطت الأنواع الدلالية بشكل غير صحيح للبيانات الأساسية، لن تعمل بشكل سليم. قد يكون من الصعب اختبار ذلك، ولكن هناك بعض الإجراءات التي يمكنك اتّخاذها للمساعدة في العثور على المشاكل.

  1. عرض صفَين أو 3 صفوف من بياناتك بدلاً من عرضها كلها، ثم فحصها يدويًا
  2. أنشئ جدولاً في Looker Studio يستخدم الحقل الذي تحاول التحقّق منه فقط.
  3. انتبه جيدًا إلى الحقلَين Geo وDate لأنّ تنسيقهما هو الأكثر صرامة.

التعرّف التلقائي على النوع الدلالي

إذا لم تحدّد أي أنواع دلالية في المخطط، سيحاول مركز البيانات رصدها تلقائيًا استنادًا إلى السمة نوع البيانات وتنسيق قيم البيانات التي يعرضها الموصل.

في ما يلي خطوات عملية الرصد التلقائي:

  1. اطلب المخطط عن طريق تنفيذ الدالة getSchema الخاصة بموصّل بيانات من إنشاء المنتدى.
  2. كرِّر مجموعات الحقول المحدّدة في مخطط الموصل وأرسِل طلبات getData للحقول. يتم تنفيذ طلبات getData مع ضبط المَعلمة sampleExtraction على true للإشارة إلى أنّ طلبات البيانات مخصّصة لأغراض الرصد الدلالي.
  3. استنادًا إلى نوع بيانات الحقل وتنسيق القيمة التي يتم عرضها من طلب getData، حدِّد النوع الدلالي للحقل.

خيارات للتعامل مع ميزة "التعرّف التلقائي على النوع الدلالي"

عندما ينفّذ "مركز البيانات" الدالة getData لأحد موصّلات بيانات من إنشاء المنتدى بهدف رصد المعنى الدلالي، سيتضمّن الطلب الوارد السمة sampleExtraction التي سيتم ضبطها على true. يستخدم "مركز البيانات" البيانات التي يعرضها الموصّل فقط لتحديد النوع الدلالي للحقل. وبما أنّ القيمة لن تُستخدَم لأي غرض آخر، لا تتطلّب بيانات فعلية من مصدرك الخارجي.

هناك عدة طرق لتحسين رصد النوع الدلالي في الرمز:

  • يُنصح بما يلي: تمرير قيم محدّدة مسبقًا
    يجب عرض قيمة محدّدة مسبقًا لكل حقل تمثّل بشكل أفضل النوع الدلالي للحقل، ويجب أن يكون معروفًا أنّه سيتم رصده بشكل صحيح من خلال مركز البيانات. على سبيل المثال، إذا كان النوع الدلالي لحقل هو البلد، يجب عرض قيمة مثل IT لإيطاليا. من المزايا الأخرى لهذا الأسلوب أنّه أسرع بكثير لأنّه لا يتطلّب منك إرسال طلبات HTTP إلى الخدمة الخارجية للحصول على البيانات.

  • عرض n عدد من السجلات فقط
    إذا كانت الخدمة الخارجية التي تستردّ منها البيانات تتيح وضع حدود على عدد الصفوف عند طلب البيانات، يمكنك عرض مجموعة فرعية صغيرة من الصفوف في مركز البيانات بدلاً من مجموعة البيانات الكاملة. سيؤدي ذلك إلى الحدّ من كمية البيانات التي تحتاج إلى تمريرها إلى مركز البيانات لكل طلب رصد دلالي.

  • طلب جميع الأعمدة وتخزين الرد مؤقتًا
    إذا كان من الممكن طلب جميع الأعمدة للخدمة التابعة لجهة خارجية التي تسترد منها البيانات، اطلب جميع الأعمدة وخزِّن النتائج مؤقتًا عند تلقّي أول طلب رصد دلالي من "مركز البيانات". بالنسبة إلى طلبات الرصد الدلالي اللاحقة، يتم جلب قيم الأعمدة من ذاكرة التخزين المؤقت بدلاً من إرسال طلبات HTTP إضافية إلى الخدمة الخارجية.

  • عدم اتّخاذ أي إجراء مختلف
    يمكنك اختيار عدم اتّخاذ أي إجراء محدّد للطلبات التي تم فيها ضبط قيمة sampleExtraction على true. سيؤدي ذلك إلى إبطاء عملية "الرصد الدلالي" لأنّ "مركز البيانات" سيضطر إلى استرداد جميع البيانات اللازمة لعملية "الرصد الدلالي". بالإضافة إلى ذلك، سيؤثر ذلك في معدّل الطلبات إلى مصدر البيانات الخارجي لأنّه سيتم تنفيذ العديد من طلبات الرصد الدلالي بالتوازي.

التنسيقات المعترف بها للتعرّف التلقائي على النوع الدلالي

التاريخ والوقت
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • الوقت: حقبة يونكس بالثانية والمايكرو ثانية والملّي ثانية والنانو ثانية
الموقع الجغرافي