إنشاء مجموعة بيانات وإدارتها

تتيح لك مجموعات البيانات تحميل بيانات جغرافية مكانية من ملف محلي أو من Google Cloud Storage إلى "منصة خرائط Google". ويمكنك بعد ذلك ربط مجموعة بيانات بنمط خريطة واحد أو أكثر في Cloud Console. بعد ربط مجموعة البيانات بنمط الخرائط، استخدِم واجهة برمجة التطبيقات للنمط المستند إلى البيانات لتصميم تطبيق الخرائط ديناميكيًا.

يمكنك أيضًا استخدام واجهة برمجة تطبيقات REST لتحميل بياناتك الجغرافية المكانية إلى مجموعة بيانات. لمزيد من المعلومات، يمكنك الاطّلاع على واجهة برمجة تطبيقات مجموعات البيانات في "خرائط Google"

إعداد الأدوار

لإنشاء مجموعات بيانات وإدارتها في مشروع على Google Cloud، يجب أن يكون لديك دور إدارة الهوية وإمكانية الوصول للمالك أو المحرِّر في المشروع.

بدلاً من ذلك، يمكنك تعيين أدوار إدارة الهوية وإمكانية الوصول التالية إلى حساب مستخدم أو حساب خدمة تستخدمه لإدارة مجموعات البيانات:

  • يمنح الدور Maps Platform Datasets Admin للمستخدم أو حساب الخدمات الإذن بالقراءة/الكتابة إلى مجموعات البيانات في المشروع. يتيح هذا الدور للمستخدم إجراء جميع العمليات على مجموعة البيانات.
  • يمنح الدور Maps Platform Datasets Viewer الإذن بالقراءة فقط إلى مجموعات البيانات في المشروع. يتيح لك هذا الدور تنفيذ عملية قائمة على مجموعة بيانات أو الحصول عليها أو تنزيلها.

لمزيد من المعلومات، يُرجى الاطّلاع على منح دور "إدارة الهوية وإمكانية الوصول" باستخدام وحدة تحكُّم Google Cloud.

مصدر بيانات لمجموعة بيانات

بعد إنشاء مجموعة بيانات، حمِّل البيانات إلى مجموعة البيانات من Google Cloud Storage أو من ملف على الجهاز.
  • عند تحميل البيانات من Cloud Storage، حدِّد مسار الملف إلى المورد الذي يحتوي على البيانات في Cloud Storage. يكون هذا المسار بصيغة gs://GCS_BUCKET/FILE.

    يتطلب المستخدم الذي يقدّم الطلب دور مُشاهد عنصر مساحة التخزين أو أي دور آخر يشمل إذن storage.objects.get. لمزيد من المعلومات حول إدارة الوصول إلى Cloud Storage، يُرجى الاطّلاع على نظرة عامة على التحكّم في الوصول.

  • عند تحميل بيانات من ملف محلي، حدِّد المسار إلى ملف GeoJSON أو KML أو CSV الذي يحتوي على البيانات المطلوب تحميلها.

المتطلّبات الأساسية

عند إنشاء مجموعة بيانات:

  • يجب أن تكون الأسماء المعروضة فريدة ضمن مشروعك على Google Cloud.
  • يجب أن يكون حجم الأسماء المعروضة أقل من 64 بايت (بما أنّ هذه الأحرف ممثلة بترميز UTF-8، يمكن تمثيل كل حرف بعدة بايت في بعض اللغات).
  • يجب أن تكون الأوصاف أقل من 1000 بايت.

عند تحميل البيانات:

  • وأنواع الملفات المتوافقة هي CSV وGeoJSON وKML.
  • الحد الأقصى لحجم الملف المسموح به هو 350 ميغابايت.
  • لا يمكن أن تبدأ أسماء أعمدة السمات بالسلسلة "?_".
  • لا يتم دعم الأشكال الهندسية ثلاثية الأبعاد. ويشمل ذلك اللاحقة "Z" بتنسيق WKT وإحداثيات الارتفاع بتنسيق GeoJSON.

أفضل ممارسات إعداد البيانات

إذا كانت بيانات المصدر معقدة أو كبيرة، مثل النقاط الكثيفة أو السلاسل الخطية أو المضلّعات الطويلة (غالبًا ما تندرج ضمن هذه الفئة أحجام ملفات المصدر الأكبر من 50 ميغابايت)، ننصحك بتبسيط البيانات قبل التحميل لتحقيق أفضل أداء في الخريطة المرئية.

فيما يلي بعض أفضل الممارسات لإعداد بياناتك:

  1. الحدّ من خصائص الميزات: احتفظ فقط بسمات الميزات المطلوبة لتصميم خريطتك، مثل "id" و "category". يمكنك دمج مواقع إضافية مع ميزة في أحد تطبيقات العميل باستخدام الأنماط المستندة إلى البيانات على مفتاح معرّف فريد. على سبيل المثال، راجِع القسم الاطّلاع على بياناتك في الوقت الفعلي باستخدام النمط المستند إلى البيانات.
  2. استخدِم أنواع بيانات بسيطة لعناصر السمات متى أمكن ذلك، مثل الأعداد الصحيحة، لتقليل حجم المربّعات وتحسين أداء الخريطة.
  3. يجب تبسيط الأشكال الهندسية المعقّدة قبل تحميل ملف. يمكنك إجراء ذلك في أداة جغرافية مكانية من اختيارك، مثل الأداة المفتوحة المصدر Mapshaper.org، أو في BigQuery باستخدام ST_Simplify على الأشكال الهندسية للمضلّعات المعقدة.
  4. تجميع نقاط شديدة الكثافة قبل تحميل ملف ويمكنك إجراء ذلك في أداة جغرافية مكانية من اختيارك، مثل دوال التجميع العنقودي Turf.js المفتوحة المصدر، أو في BigQuery باستخدام ST_CLUSTERDBSCAN في الأشكال الهندسية للنقاط الكثيفة.

يمكنك الاطّلاع على إرشادات إضافية حول أفضل ممارسات مجموعات البيانات في مقالة عرض بياناتك بشكل مرئي باستخدام مجموعات البيانات وBigQuery.

متطلبات GeoJSON

تتوافق واجهة برمجة تطبيقات JavaScript للخرائط مع مواصفات GeoJSON الحالية. تتوافق واجهة برمجة تطبيقات JavaScript للخرائط أيضًا مع ملفات GeoJSON التي تحتوي على أي من أنواع الكائنات التالية:

  • العناصر الهندسية: الكائن الهندسي هو شكل مكاني يتم وصفه كاتحاد النقاط والخطوط والمضلّعات التي تحتوي على ثقوب اختيارية.
  • العناصر المميّزة: يحتوي كائن الميزة على شكل هندسي بالإضافة إلى أزواج أسماء/قيم إضافية، والتي يكون معناها خاصًا بالتطبيق.
  • مجموعات الميزات: إنّ مجموعة الميزات هي مجموعة من العناصر المميّزة.

لا تتيح واجهة برمجة تطبيقات JavaScript للخرائط استخدام ملفات GeoJSON التي تتضمّن بيانات في نظام مرجعي للإحداثيات (CRS) بخلاف WGS84.

لمزيد من المعلومات حول GeoJSON، راجِع التوافق مع RFC 7946.

متطلبات KML

تتطلب واجهة برمجة تطبيقات JavaScript للخرائط المتطلبات التالية:

  • يجب أن تكون جميع عناوين URL محلية (أو نسبية) للملف نفسه.
  • يُسمح بأشكال هندسية النقاط والخطوط والمضلّعات.
  • تعتبر جميع تصنيفات البيانات سلاسل.
لا تتوفّر ميزات KML التالية:
  • رموز أو <styleUrl> محددة خارج الملف.
  • روابط الشبكة، مثل <NetworkLink>
  • تراكبات سطح الأرض، مثل <GroundOverlay>
  • الأشكال الهندسية الثلاثية الأبعاد أو أي علامات ذات صلة بالارتفاع، مثل <altitudeMode>
  • مواصفات الكاميرا مثل <LookAt>
  • الأنماط المحددة داخل ملف KML.

متطلبات ملفات CSV

بالنسبة إلى ملفات CSV، يتم إدراج أسماء الأعمدة المتوافقة أدناه بترتيب الأولوية:

  • latitude، longitude
  • lat، long
  • x، y
  • wkt (نص معروف)
  • address وcity وstate وzip
  • address
  • عمود واحد يحتوي على جميع معلومات العنوان، مثل 1600 Amphitheatre Parkway Mountain View, CA 94043

على سبيل المثال، يحتوي ملفك على أعمدة باسم x وy وwkt. بما أنّ السياستَين x وy لهما أولوية أعلى، على النحو المحدّد في ترتيب أسماء الأعمدة المتوافقة في القائمة أعلاه، يتم استخدام القيم في العمودين x وy ويتم تجاهل العمود wkt.

بالإضافة إلى ذلك:

  • يجب أن ينتمي كل اسم عمود إلى عمود واحد. وهذا يعني أنّه لا يمكنك إنشاء عمود باسم xy يحتوي على بيانات الإحداثيَين x وy. يجب أن تكون الإحداثيتان x وy في أعمدة منفصلة.
  • أسماء الأعمدة غير حساسة لحالة الأحرف.
  • لا يهم ترتيب أسماء الأعمدة. على سبيل المثال، إذا كان ملف CSV يحتوي على العمودَين lat وlong، يمكن أن يحدث ذلك بأي ترتيب.

التعامل مع أخطاء تحميل البيانات

عند تحميل البيانات إلى مجموعة بيانات، قد تواجه أحد الأخطاء الشائعة الموضحة في هذا القسم.

أخطاء GeoJSON

تتضمن أخطاء GeoJSON الشائعة ما يلي:

  • يجب إدخال حقل type أو أنّ السمة type ليست سلسلة. ويجب أن يحتوي ملف بيانات GeoJSON الذي تم تحميله على حقل سلسلة باسم type كجزء من كل تعريف لكل عنصر من عناصر الميزة وتعريف الكائن Geometry.

أخطاء KML

تشمل أخطاء KML الشائعة ما يلي:

  • يجب ألا يحتوي ملف البيانات على أي من ميزات KML غير المتوافقة المذكورة أعلاه، وإلّا فقد يتعذّر استيراد البيانات.

أخطاء ملف CSV

في ما يلي بعض الأخطاء الشائعة في ملفات CSV:

  • بعض الصفوف تفتقد إلى قيم لعمود الهندسة. يجب أن تحتوي جميع الصفوف في ملف CSV على قيم غير فارغة للأعمدة الهندسية. وتشمل الأعمدة الهندسية ما يلي:
    • latitude، longitude
    • lat، long
    • x، y
    • wkt
    • address وcity وstate وzip
    • address
    • عمود واحد يحتوي على جميع معلومات العنوان، مثل 1600 Amphitheatre Parkway Mountain View, CA 94043
  • إذا كان x وy هما العمودَين الهندسيَّين، تأكَّد من أنّ الوحدتَين خط الطول وخط العرض. تستخدم بعض مجموعات البيانات العامة أنظمة إحداثيات مختلفة ضمن العنوانَين x وy. في حال استخدام وحدات خاطئة، قد يتم استيراد مجموعة البيانات بنجاح، ولكن يمكن أن تعرض البيانات المعروضة نقاط مجموعة البيانات في مواقع جغرافية غير متوقّعة.

إنشاء مجموعة بيانات

لإنشاء مجموعة بيانات:

  1. في Google Cloud Console، انتقِل إلى صفحة مجموعات البيانات.
  2. انقر على إنشاء مجموعة بيانات.
  3. أدخِل اسم مجموعة البيانات. يجب أن يكون الاسم فريدًا بين جميع مجموعات البيانات.
  4. يمكنك إدخال وصف لمجموعة البيانات اختياريًا.
  5. انقر على متابعة. ستظهر صفحة استيراد البيانات.
  6. اختَر مصدر التحميل للبيانات المستخدَمة لتعبئة مجموعة البيانات على أنّها كمبيوتر مكتبي، أو ملف محلي على نظامك، أو حزمة Google Cloud Storage.
    • في الكمبيوتر المكتبي، انقر على تصفّح ثم اختَر الملف من أداة اختيار الملفات.
    • بالنسبة إلى حزمة Google Cloud Storage، انقر على تصفّح واختَر الحزمة والملف الذي يحتوي على البيانات.
  7. اختَر تنسيق الملف.
  8. انقر على متابعة لمراجعة الإعدادات.
  9. انقر على إنشاء. تظهر صفحة مجموعات البيانات لتعرض مجموعة البيانات الجديدة. يجب أن تكون الحالة جارٍ المعالجة.
  10. انتظِر إلى أن تصبح مجموعة البيانات بالحالة مكتملة.

عرض مجموعة بيانات أو تعديلها

بعد إنشاء مجموعة بيانات بنجاح، تظهر حالتها على أنّها مكتملة. يمكنك بعد ذلك فحص تفاصيل مجموعة البيانات.

لعرض مجموعة البيانات أو تعديلها:

  1. في Google Cloud Console، انتقِل إلى صفحة مجموعات البيانات.
  2. انقر فوق اسم مجموعة البيانات. ستظهر صفحة تفاصيل مجموعة البيانات.
    1. انقر على علامة التبويب التفاصيل للاطّلاع على معلومات عن مجموعة البيانات. في علامة التبويب هذه، يمكنك أيضًا تعديل اسم مجموعة البيانات ووصفها.
    2. انقر على علامة التبويب Preview (معاينة) للاطّلاع على مجموعة البيانات على الخريطة.
    3. انقر على علامة التبويب بيانات الجدول للاطّلاع على جميع سمات مجموعة البيانات. وهذه هي السمات التي يمكنك استخدامها لتصميم مجموعة البيانات على الخريطة.
    4. انقر على الزر تنزيل لتنزيل البيانات إلى ملف محلي.
    5. انقر على الزر حذف لحذف مجموعة البيانات.
    6. انقر على الزر استيراد ملف البيانات لتحميل بيانات جديدة إلى مجموعة البيانات.

      يؤدي تحميل بيانات جديدة إلى مجموعة البيانات إلى إنشاء نسخة جديدة من مجموعة البيانات. في حال تحميل البيانات الجديدة بنجاح:

      • تم ضبط حالة الإصدار الجديد من مجموعة البيانات على مكتملة.
      • ويصبح الإصدار الجديد هو الإصدار "النشط" وهو الإصدار الذي يستخدمه تطبيقك.

      إذا كان هناك خطأ في عملية التحميل:

      • يتم ضبط حالة إصدار مجموعة البيانات الجديد على حالة غير مكتملة. على سبيل المثال، إذا كانت هناك نسخة "نشطة" سابقة، يتم ضبط حالة مجموعة البيانات على REVERTED.
      • تظلّ نسخة مجموعة البيانات "النشطة" السابقة هي النسخة "النشطة"، وهي الإصدار الذي يستخدمه تطبيقك.