סוגי נתונים וסוגים סמנטיים

כאשר יוצרים מחבר קהילה, כל שדה שמגדירים סכימה נדרש סוג נתונים. סוג הנתונים מגדיר את הסוג הראשוני של השדה, כגון BOOLEAN, STRING, NUMBER וכו'

בנוסף לסוגי הנתונים, ב-Looker Studio נעשה שימוש גם בסוגים סמנטיים. סוגים סמנטיים עוזרים לתאר את סוג המידע שהנתונים מייצגים. עבור לדוגמה, שדה עם סוג הנתונים NUMBER עשוי לייצג מטבע מבחינה סמנטית סכום או אחוז, ושדה עם סוג נתונים STRING עשוי להיות סמנטי שמייצגים עיר. כדי לראות אילו סוגים סמנטיים זמינים, אפשר לעיין מסמכי תיעוד בנושא סוגים סמנטיים

הסכימה של מחבר הקהילה והשדות ב-Looker Studio

כשמגדירים את הסכימה למחבר הקהילה, יש מספר לכל שדה שיקבעו את אופן הייצוג של השדה שנמצא בשימוש ב-Looker Studio. לדוגמה:

  • השדה conceptType הוא מוגדר בסכימת המחברים באמצעות המאפיין conceptType. הזה קובע אם השדה יטופל כמאפיין או כמדד. בדף הזה תמצאו הסבר על ההבדל בין מדדים למאפיינים על מאפיינים ומדדים.
  • הסוג הסמנטי יכול מוגדרים בסכימת המחבר, או שניתן לזהות אותם באופן אוטומטי ב-Looker Studio לפי המאפיין סוג נתונים מוגדר ב המחבר וערכי הנתונים שהוחזרו על ידי המחבר. צפייה זיהוי אוטומטי של הסוג הסמנטי לקבלת פרטים על איך זה עובד.
  • סוג הצבירה קובע אם ערכי המדדים (מאפיינים) ). הגדרה של semantics.isReaggregatable המאפיין true יוגדר כברירת מחדל לצבירה SUM, אחרת מוגדר ל-Auto. ניתן גם להגדיר ידנית את סוג הצבירה שמוגדר כברירת מחדל עבור בשדות נצברים באמצעות הפונקציה defaultAggregationType לנכס.

כשמגדירים ומתחברים באמצעות מחבר ב-Looker Studio, השדות מציג את הסכימה המלאה עבור המחבר בהתאם לאופן שבו הגדרת את המאפיינים שלמעלה. אם כללתם את הסוגים הסמנטיים, מוצגים כפי שהגדרתם אותם. אם משתמשים זיהוי אוטומטי של סוג סמנטי, ולאחר מכן השדות יוצגו כפי שהם זוהו. מסך השדות

הגדרת מידע סמנטי

יש שתי דרכים להגדיר מידע סמנטי. ניתן להגדיר שדות סמנטיקה באופן ידני או להסתמך על Looker Studio לזיהוי אוטומטי.

לדוגמה, אם יש מספר שמייצג בצורה סמנטית דולר ארה"ב, ל-Looker Studio לא תהיה אפשרות לזהות באופן אוטומטי את הסוג הסמנטי הזה. בנוסף, לזיהוי סמנטי אוטומטי נדרש Looker Studio ליצירת נתונים אחזור קריאות לכל שדה בסכימה. אם מציינים את הסכימה באופן ידני במקום זאת, לא יבוצעו קריאות לאחזור נתונים. אם אתם יודעים הסוג הסמנטי של הנתונים (למשל: מטבע, אחוז, תאריך וכו') מומלץ להגדיר זאת במפורש בסכימה כדי לשפר את הדיוק והביצועים סיבות נוספות.

הגדרה ידנית של סוגים סמנטיים (מומלץ)

אם יודעים מהם הסוגים הסמנטיים, אפשר להגדיר ידנית את semantics לכל אחד מהם השדה של הסכימה. הפרטים המלאים על הנכסים שזמינים לכם בדף העזר של השדה. אם להגדיר סוגים סמנטיים ידניים, מומלץ להגדיר semanticType ו-semanticGroup לכל שדה. אם תספקו את הפרטים האלה באופן ידני מאפיינים, תהליך הזיהוי האוטומטי של הסוג הסמנטי לא יפעל. אם להגדיר באופן ידני חלק מהשדות, אבל לא את כולם, ואז את אלה שלא ברירת המחדל היא Text, Number או Boolean, בהתאם ל-dataType שצוין בשדה.

דוגמה לסכימה פשוטה שמגדירה באופן ידני סמנטי שונים. Income מוגדר כמטבע והערך Filing Year מוגדר כתאריך.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

פתרון בעיות בנוגע לסוגים סמנטיים ידניים

אם תגדירו את הסוגים הסמנטיים של הנתונים הבסיסיים בצורה שגויה, הם לא יפעלו כראוי. יכול להיות קשה לבדוק את זה, אבל יש כמה דברים כדי לעזור באיתור בעיות.

  1. החזרת 2 או 3 שורות מהנתונים במקום את כל השורות, ולאחר מכן באופן ידני לבדוק אותו.
  2. יצירת טבלה ב-Looker Studio שמשתמשת רק בשדה שמנסים לסמן.
  3. מומלץ לשים לב במיוחד לשדות Geo ו-Date, כי הם כוללים את רוב בפורמט מחמיר.

זיהוי אוטומטי של סוג סמנטי

אם לא הגדרתם סוגים סמנטיים בסכימה, אז Looker Studio ינסה לזהות אותם באופן אוטומטי על סמך המאפיין data type והפורמט מערכי הנתונים שהוחזרו על ידי המחבר.

השלבים של תהליך הזיהוי האוטומטי הם:

  1. מבקשים את הסכימה על ידי הרצת הפקודה getSchema מחבר קהילה.
  2. ביצוע איטרציה בין קבוצות שדות שהוגדרו בסכימת המחבר ובבעיה getData מבקש את השדות. הבקשות getData מבוצעות עם הפרמטר sampleExtraction מוגדר ל-true כדי לציין שבקשות הנתונים מיועדות למטרות סמנטיות זיהוי וזיהוי אובייקטים.
  3. על סמך סוג הנתונים בשדה והפורמט של הערך המוחזר בקשה getData, מזהים את הסוג הסמנטי של השדה.

אפשרויות לטיפול בזיהוי אוטומטי של טיפוסים סמנטיים

כש-Looker Studio מריץ את הפונקציה getData של מחבר קהילה עבור למטרת הזיהוי הסמנטי, הבקשה הנכנסת תכיל נכס sampleExtraction שיוגדר כ-true. הנתונים שמחזירים המחבר משמש רק את Looker Studio לזיהוי הסוג הסמנטי של בשדה. הערך לא ישמש לאף מטרה אחרת, ולכן הוא לא לדרוש נתונים ממשיים מהמקור החיצוני.

יש כמה דרכים לשפר את הזיהוי הסמנטי בקוד:

  • מומלץ: העברה של ערכים מוגדרים מראש
    מחזירה ערך מוגדר מראש לכל שדה שמייצג בצורה הטובה ביותר את הסמנטיקה של השדה, וידוע שהוא מזוהה כראוי ב-Looker Studio. לדוגמה, אם הסוג הסמנטי של שדה הוא Country, מוחזר כמו IT לאיטליה. היתרון השני של גישה זו הוא הרבה יותר מהירה כי היא לא מחייבת אתכם לשלוח בקשות HTTP שירות צד שלישי לנתונים.

  • החזרת n מספר רשומות בלבד
    אם שירות הצד השלישי שממנו שולפים נתונים תומך במגבלות שורות כשמבקשים נתונים, מחזירים במקום זאת קבוצת משנה קטנה של שורות ל-Looker Studio של קבוצת הנתונים המלאה. הפעולה הזו תגביל את כמות הנתונים שצריך להעביר אל Looker Studio לכל בקשה לזיהוי סמנטי.

  • מבקשים את כל העמודות ושומרים את התשובה במטמון
    אם אפשר לבקש את כל העמודות של שירות הצד השלישי דרך שבו אתם מאחזרים נתונים, ואז בבקשת הזיהוי הסמנטי הראשונה שהתקבלו מ-Looker Studio, מאחזרים את כל העמודות ושומרים את התוצאות במטמון. עבור הבקשות הבאות לזיהוי סמנטי מאחזרות את ערכי העמודות מהמטמון. במקום לשלוח בקשות HTTP נוספות לשירות הצד השלישי.

  • לא לעשות דבר אחר
    אפשר לבחור שלא ליישם התאמות ספציפיות בבקשות sampleExtraction מוגדר ל-true. זה יגרום לזיהוי הסמנטי יהיה איטי יותר, מכיוון שמערכת Looker Studio תצטרך לאחזר את כל הנתונים תהליך הזיהוי הסמנטי. בנוסף, זה ישפיע על שיעור הבקשות ממקור הנתונים החיצוני, מכיוון שבקשות רבות לזיהוי סמנטי במקביל.

פורמטים מוכרים לזיהוי אוטומטי של טיפוסים סמנטיים

תאריך ושעה
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • זמן: תקופה של זמן מערכת אחת לשנייה, מיקרו, מילי וננו.
Geo