مجموعة البيانات

يصبح العثور على مجموعات البيانات أسهل عند تقديم معلومات تدعمها في شكل بيانات منظّمة، مثل الاسم والوصف والمنشئ وتنسيقات التوزيع. يتّبع محرك البحث Google أسلوبًا لاكتشاف مجموعات البيانات يتمثل في الاستفادة من schema.org وغيرها من معايير البيانات الوصفية التي يمكن إضافتها إلى الصفحات التي تصف مجموعات البيانات. ويهدف هذا الترميز إلى تحسين مستوى اكتشاف مجموعات البيانات في المجالات، مثل علوم الحياة والعلوم الاجتماعية وتعلُّم الآلة والبيانات المدنية والحكومية وغيرها المزيد. ويمكنك العثور على مجموعات البيانات باستخدام أداة بحث مجموعة البيانات.

في ما يلي بعض الأمثلة على العناصر التي يمكن اعتبارها مجموعة بيانات:

  • جدول أو ملف CSV به بعض البيانات
  • مجموعة منظَّمة من الجداول
  • ملف بتنسيق يتمتع بملكية خاصة يحتوي على بيانات
  • مجموعة ملفات تشكّل معًا مجموعة بيانات مهمّة
  • كائن منظَّم مع بيانات بتنسيق مختلف قد تحتاج إلى تحميله إلى أداة خاصة لمعالجته
  • صور تتضمّن بيانات
  • ملفات ذات صلة بتعلُّم الآلة، مثل المعلَمات المُدرَّبة أو تعريفات بنية الشبكة العصبونية
  • أي عناصر تبدو لك كمجموعة بيانات

كيفية إضافة البيانات المنظَّمة

البيانات المنظَّمة هي تنسيق موحّد لتقديم معلومات عن صفحة محدّدة وتصنيف محتواها. وإذا كنت لا تزال مبتدئًا في مجال البيانات المنظَّمة، يمكنك الاطّلاع على المزيد من المعلومات حول آلية عمل البيانات المنظَّمة.

إليك نظرة عامة حول كيفية إنشاء بيانات منظَّمة واختبارها وإصدارها. للحصول على دليل مفصّل حول كيفية إضافة بيانات منظَّمة إلى صفحة ويب، يمكنك الاطّلاع على الدرس التطبيقي حول الترميز الخاص بالبيانات المنظَّمة.

  1. أضِف السمات المطلوبة. استنادًا إلى التنسيق الذي تستخدمه، تعرَّف على مكان إدراج البيانات المنظَّمة في الصفحة.
  2. اتّبِع الإرشادات.
  3. تحقّق من صحة الرمز باستخدام اختبار النتائج المنسّقة.
  4. انشر بعض الصفحات التي تتضمّن بياناتك المنظَّمة واستخدِم أداة فحص عنوان URL لاختبار طريقة عرض الصفحة في محرّك البحث Google. تأكّد من إمكانية وصول محرّك البحث Google إلى صفحتك ومن عدم حظرها باستخدام ملف robots.txt أو علامة noindex أو متطلبات تسجيل الدخول. إذا بدت الصفحة جيدة، يمكنك أن تطلب من Google إعادة الزحف إلى عناوين URL الخاصة بك.
  5. لإعلام Google بأي تغييرات لاحقة، ننصحك بإرسال ملف Sitemap. يمكنك برمجة هذا الإجراء باستخدام واجهة برمجة التطبيقات لملف Sitemap في Search Console.

حذف مجموعة بيانات من نتائج "بحث مجموعة البيانات"

إذا كنت لا تريد ظهور مجموعة بيانات في نتائج "بحث مجموعة البيانات"، يمكنك استخدام العلامة الوصفية لبرامج الروبوت للتحكم في كيفية فهرسة مجموعة البيانات. وقد يستغرق ظهور التغييرات في "بحث مجموعة البيانات" بعض الوقت (أيام أو أسابيع، حسب جدول الزحف).

الأسلوب الذي نتّبعه لاكتشاف مجموعات البيانات

يمكننا فهم البيانات المنظَّمة المضافة إلى صفحات الويب حول مجموعات البيانات، والتي تستخدم الترميز Dataset من schema.org أو بنى مكافئة يتم تمثيلها بالتنسيق Data Catalog Vocabulary (DCAT)‎ من W3C. وندرس أيضًا إمكانية إتاحة البيانات المنظَّمة المستندة إلى W3C CSVW بصورة تجريبية، ونتوقّع أن نتمكن من تطوير أسلوبنا وتكييفه بالتزامن مع إصدار أفضل الممارسات لوصف مجموعات البيانات. للحصول على مزيد من المعلومات حول أسلوبنا في اكتشاف مجموعات البيانات، راجِع تسهيل اكتشاف مجموعات البيانات.

أمثلة

في ما يلي مثال على مجموعات بيانات تستخدم بنية JSON-LD وschema.org (وهي بنية مفضّلة) في اختبار النتائج المنسّقة. ويمكن أيضًا استخدام مصطلحات schema.org نفسها في بنية RDFa 1.1 أو بنية البيانات الجزئية. يمكنك أيضًا استخدام مصطلحات W3C DCAT لتوضيح البيانات الوصفية. يستند المثال التالي إلى وصف مجموعة بيانات فعلي.

JSON-LD

في ما يلي مثال على مجموعة بيانات بترميز JSON-LD:


  <html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "isAccessibleForFree" : true,
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 01 creator"
          }
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 02 creator"
          }
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "funder":{
         "@type": "Organization",
         "sameAs": "https://ror.org/00tgqzw13",
         "name": "National Weather Service"
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>
RDFa

في ما يلي مثال على مجموعة بيانات بالترميز RDFa الذي يستخدم مصطلحات DCAT:


<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

الإرشادات

يجب على المواقع الإلكترونية اتّباع إرشادات البيانات المنظَّمة. وبالإضافة إلى إرشادات البيانات المنظّمة، ننصح باتّباع أفضل الممارسات المتعلقة بملفات Sitemap والمصدر والأصل الواردة أدناه.

أفضل الممارسات المتعلقة بملفات Sitemap

استخدِم ملف Sitemap لمساعدة Google في العثور على عناوين URL. ويساعد استخدام ملفات Sitemap والترميز sameAs في توثيق أسلوب نشر أوصاف مجموعات البيانات في موقعك الإلكتروني.

إذا كان لديك مستودع من مجموعات البيانات، لديك على الأرجح نوعان على الأقل من أنواع الصفحات: الصفحات الأساسية ("المقصودة") لكل مجموعة بيانات، والصفحات التي تسرد مجموعات بيانات متعددة (مثل نتائج البحث أو بعض مجموعات البيانات الفرعية). وننصحك بإضافة البيانات المنظَّمة المتعلقة بمجموعة البيانات إلى الصفحات الأساسية. ويمكنك استخدام الخاصية sameAs لإنشاء رابط يؤدي إلى الصفحة الأساسية في حال إضافة بيانات منظَّمة إلى عدّة نُسخ من مجموعة البيانات، مثل بطاقات البيانات الواردة ضمن صفحات نتائج البحث.

أفضل الممارسات المتعلّقة بالمصدر والأصل

يشيع إعادة نشر مجموعات البيانات المفتوحة وتجميعها واستنادها إلى مجموعات بيانات أخرى. في ما يلي مخطط مبدئي لأسلوبنا في تمثيل المواقف التي تكون فيها مجموعة البيانات نسخة من مجموعة أخرى أو مستندة إليها بشكل آخر.

  • استخدِم الخاصية sameAs للإشارة إلى معظم عناوين URL الأساسية للأصل في الحالات التي تكون فيها مجموعة البيانات أو الوصف عبارة عن إعادة نشر لمواد منشورة في مكان آخر. يجب أن تشير قيمة sameAs بوضوح إلى هوية مجموعة البيانات. وبعبارة أخرى، يجب ألا تستخدم مجموعتا بيانات مختلفتان عنوان URL نفسه بالقيمة sameAs.
  • استخدِم الخاصية isBasedOn في الحالات التي طرأ فيها تغيير كبير على قاعدة البيانات المعاد نشرها (بما في ذلك بياناتها الوصفية).
  • استخدِم الخاصية isBasedOn عندما تكون مجموعة البيانات مشتقّة من عدة أصول أو مجمّعة منها.
  • استخدِم الخاصية identifier لإرفاق معرّفات الكائنات الرقمية (DOI) ذات الصلة أو المعرّفات المضغوطة. إذا كانت مجموعة البيانات تحتوي على أكثر من معرّف، يمكنك استخدام الخاصية identifier مجددًا. وعند استخدام JSON-LD، يمكن تمثيل ذلك باستخدام بنية قائمة JSON.

ونأمل في تحسين اقتراحاتنا استنادًا إلى التعليقات الواردة إلينا، لا سيما في ما يخص وصف الأصل ومنح أرقام للإصدارات والتواريخ المرتبطة بنشر السلاسل الزمنية. يرجى الانضمام إلى مناقشات المنتدى.

توصيات الخصائص النصية

ننصح بألا تتجاوز جميع الخصائص النصية حد 5000 حرف. يستخدم "بحث مجموعة البيانات من Google" أول 5000 حرف فقط من أي خاصية نصية. وعادة ما تكون الأسماء والعناوين مكونة من كلمات قليلة أو جملة قصيرة.

الأخطاء والتحذيرات المعروفة

قد تواجه أخطاء أو تحذيرات في أداة اختبار البيانات المنظَّمة من Google وأنظمة التحقق الأخرى. قد تقترح أنظمة التحقق على وجه التحديد أن تكون للمؤسسات معلومات اتصال تتضمن الخاصية contactType. ويُذكر أن من بين القيم المفيدة كلاً من customer service وemergency وjournalist وnewsroom وpublic engagement. ويمكنك كذلك تجاهل الأخطاء بأن csvw:Table قيمة غير متوقعة للخاصية mainEntity.

تعريفات أنواع البيانات المنظّمة

يجب تضمين الخصائص المطلوبة حتى يصبح المحتوى مؤهلاً للعرض على شكل نتيجة منسّقة. ويمكنك تضمين الخصائص المقترَحة لإضافة المزيد من المعلومات المتعلقة بالمحتوى، ما يؤدي إلى تحسين تجربة المستخدم.

يمكنك استخدام أداة اختبار البيانات المنظَّمة للتحقق من صحة الترميز.

ينصب التركيز على وصف معلومات عن مجموعة البيانات (بياناتها الوصفية) وتمثيل محتواها. على سبيل المثال، تذكر البيانات الوصفية لمجموعة البيانات الموضوع الذي تتناوله المجموعة والمتغيرات التي تقيسها ومنشئها ومعلومات أخرى. ولا تحتوي مثلاً على قيم معيّنة للمتغيّرات.

Dataset

يتوفَّر تعريف Dataset الكامل على schema.org/Dataset.

يمكنك وصف معلومات إضافية عن نشر مجموعة البيانات، مثل الترخيص أو وقت نشرها أو معرّف الكائن الرقمي لها أو الخاصية sameAs التي توجِّه إلى نسخة أساسية من مجموعة البيانات في مستودع مختلف. أضِف identifier وlicense وsameAs لمجموعات البيانات التي تقدّم معلومات عن الأصل والترخيص.

الخصائص المطلوبة
description Text

تمثّل هذه الخاصية ملخّصًا قصيرًا يصف مجموعة البيانات.

الإرشادات

  • يجب أن يتراوح طول الملخص بين 50 حرفًا و5000 حرف.
  • ويمكن أن يشتمل على بنية Markdown. يجب أن تستخدم الصور المضمّنة عناوين URL لمسارات مطلقة (بدلاً من المسارات النسبية).
  • عند استخدام تنسيق JSON-LD، يمكنك الإشارة إلى الأسطر الجديدة باستخدام \n (حرفان: شرطة مائلة للخلف وحرف n صغير).
name Text

تمثّل هذه الخاصية اسمًا وصفيًا لمجموعة بيانات، مثل "عمق الثلج في نصف الكرة الشمالي".

الإرشادات

  • استخدِم أسماء فريدة لمجموعات البيانات المميزة إذا أمكن.
  • الخصائص المقترَحة: "Snow depth in the Northern Hemisphere" و"Snow depth in the Southern Hemisphere" لمجموعتَي بيانات مختلفتَين

    الخصائص غير المقترَحة: "Snow depth" و"Snow depth" لمجموعتَي بيانات مختلفتَين

الخصائص المقترَحة
alternateName Text

الأسماء البديلة التي تم استخدامها للإشارة إلى مجموعة البيانات هذه، مثل الأسماء المستعارة أو الاختصارات. مثال (بتنسيق JSON-LD):


"name": "The Quick, Draw! Dataset"
"alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
creator Person أو Organization

تمثّل هذه الخاصية منشئ مجموعة البيانات هذه أو مؤلِّفها. لتحديد الأفراد بطريقة فريدة، استخدِم معرّف ORCID باعتباره قيمة الخاصية sameAs من النوع Person. ولتحديد المؤسسات والمنظمات بطريقة فريدة، استخدِم معرّف ROR. مثال (بتنسيق JSON-LD):


"creator": [
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0000",
        "givenName": "Jane",
        "familyName": "Foo",
        "name": "Jane Foo"
    },
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0001",
        "givenName": "Jo",
        "familyName": "Bar",
        "name": "Jo Bar"
    },
    {
        "@type": "Organization",
        "sameAs": "http://ror.org/xxxxxxxxx",
        "name": "Fictitious Research Consortium"
    }
]
citation Text أو CreativeWork

للإشارة إلى المقالات الأكاديمية التي يوصي مقدّم البيانات بالإشارة إليها إلى جانب مجموعة البيانات نفسها. يمكنك تقديم معلومات المقالة لمجموعة البيانات نفسها مع خصائص أخرى، مثل خصائص name وidentifier وcreator وpublisher. على سبيل المثال، يمكن لهذه الخاصية تمييز منشور أكاديمي ذي صلة، مثل أداة توصيف بيانات أو ورقة بيانات أو مقالة تمثل مجموعة البيانات هذه مادة أساسية فيها. على سبيل المثال، (بتنسيق JSON-LD):


"citation": "https://doi.org/10.1111/111"

"citation": "https://identifiers.org/pubmed:11111111"

"citation": "https://identifiers.org/arxiv:0111.1111v1"

"citation":
 "Doe J (2014) Influence of X ... https://doi.org/10.1111/111"

إرشادات إضافية

  • لا تستخدم هذه الخاصية لتقديم معلومات المقالة لمجموعة البيانات نفسها، ذلك أن الهدف منها تحديد المقالات الأكاديمية ذات الصلة، وليست مجموعة البيانات نفسها. لتقديم المعلومات اللازمة للإشارة إلى مجموعة البيانات نفسها، استخدِم الخصائص name وidentifier وcreator وpublisher كخيار بديل.
  • عند تعبئة خاصية معلومات المقالة بمقتطف معلومات مقالة، عليك إدراج معرّف المقالة (مثل DOI) متى أمكن ذلك.

    مُقترَح: "Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"

    غير مُقترَح: "Doe J (2014) Influence of X. Biomics 1(1)."

hasPart أو isPartOf URL أو Dataset

إذا كانت مجموعة البيانات تضم مجموعات بيانات أصغر، استخدِم خاصية hasPart للإشارة إلى هذه العلاقة. وعلى العكس من ذلك، إذا كانت مجموعة البيانات جزءًا من مجموعة بيانات أكبر، استخدِم isPartOf. ويمكن أن تكون كلتا الخاصيتَين على شكل عنوان URL أو مثال Dataset. في حال استخدام Dataset كقيمة، يجب أن تتضمن جميع الخصائص المطلوبة لعنصر Dataset مستقل. أمثلة:


"hasPart" : [
  {
    "@type": "Dataset",
    "name": "Sub dataset 01",
    "description": "Informative description of the first subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  },
  {
    "@type": "Dataset",
    "name": "Sub dataset 02",
    "description": "Informative description of the second subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  }
]

"isPartOf" : "https://example.com/aggregate_dataset"
identifier URL أو Text أو PropertyValue

معرّف، مثل DOI أو معرّف مضغوط. إذا كانت مجموعة البيانات تحتوي على أكثر من معرّف، استخدِم الخاصية identifier مجددًا. وعند استخدام JSON-LD، يمكن تمثيل ذلك باستخدام بنية قائمة JSON.

keywords Text

تمثّل هذه الخاصية الكلمات الرئيسية التي تلخص مجموعة البيانات.

license URL أو CreativeWork

تمثّل هذه الخاصية ترخيصًا يتم بموجبه توزيع مجموعة البيانات. مثل:


"license" : "https://creativecommons.org/publicdomain/zero/1.0/"

"license" : {
  "@type": "CreativeWork",
  "name": "Custom license",
  "url": "https://example.com/custom_license"
  }

إرشادات إضافية

  • يجب توفير عنوان URL يعرّف بوضوح إصدارًا محددًا من الترخيص المُستخدَم.

    مقترَح

    
    "license" : "https://creativecommons.org/licenses/by/4.0"

    الخصائص غير المقترَحة

    
    "license" : "https://creativecommons.org/licenses/by"
measurementTechnique Text أو URL

التقنية أو التكنولوجيا أو المنهجية المستخدمة في مجموعة بيانات، والتي يمكن أن تتوافق مع المتغيرات الموضّحة في variableMeasured.

sameAs URL

تمثّل هذه الخاصية عنوان URL لصفحة ويب مرجعية تشير بوضوح إلى هوية مجموعة البيانات.

spatialCoverage Text أو Place

يمكنك توفير نقطة واحدة تصف الجانب المكاني لمجموعة البيانات. وتُستخدَم هذه الخاصية فقط إذا كان للمجموعة بُعد مكاني. على سبيل المثال، نقطة واحدة يتم فيها تجميع كل القياسات أو إحداثيات مربع الإحاطة بمنطقة.

النقاط


"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 39.3280,
    "longitude": 120.1633
  }
}

الأشكال

يمكنك استخدام GeoShape لوصف المناطق ذات الأشكال المختلفة، مثل تحديد مربع الإحاطة.


"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoShape",
    "box": "39.3280 120.1633 40.445 123.7878"
  }
}

يجب التعبير عن النقاط داخل الخصائص box أو circle أو line أو polygon باعتبارها أزواجًا من القيم تفصل بينها مسافات وتشير إلى خط العرض وخط الطول (بهذا الترتيب).

المواقع الجغرافية التي لها أسماء


"spatialCoverage:" "Tahoe City, CA"
temporalCoverage Text

تغطي البيانات الموجودة في مجموعة البيانات فاصلاً زمنيًا محددًا. وتُستخدَم هذه الخاصية فقط إذا كان للمجموعة بُعد زماني. يستخدم مخطط Schema.org المعيار ISO 8601 لوصف الفواصل الزمنية والنقاط الزمنية. يمكنك وصف التواريخ بشكل مختلف تبعًا للفاصل الزمني لمجموعة البيانات. أشِر إلى الفواصل الزمنية المفتوحة بنقطتين عشريتين (..).

تاريخ واحد


"temporalCoverage" : "2008"

فترة زمنية


"temporalCoverage" : "1950-01-01/2013-12-18"

فترة زمنية مفتوحة


"temporalCoverage" : "2013-12-19/.."
variableMeasured Text أو PropertyValue

تمثّل هذه الخاصية المتغيّر الذي تقيسه مجموعة البيانات، مثل درجة الحرارة أو الضغط.

version Text أو Number

تمثّل هذه الخاصية رقم إصدار مجموعة البيانات.

url URL

تمثّل هذه الخاصية مكان صفحة تصف مجموعة البيانات.

DataCatalog

يتوفَّر تعريف DataCatalog الكامل على schema.org/DataCatalog.

غالبًا ما يتم نشر مجموعات البيانات في مستودعات تحتوي على الكثير من مجموعات البيانات الأخرى. لذلك يمكن تضمين مجموعة البيانات نفسها في أكثر من مستودع واحد. ويمكن الإشارة إلى كتالوج البيانات الذي تنتمي إليه مجموعة البيانات هذه من خلال الإشارة إليها مباشرة.

الخصائص المقترَحة
includedInDataCatalog DataCatalog

تمثّل هذه الخاصية القائمة التي تنتمي إليها مجموعة البيانات.

DataDownload

يتوفَّر تعريف DataDownload الكامل على schema.org/DataDownload. إلى جانب خصائص "مجموعة البيانات"، أضِف الخصائص التالية لمجموعات البيانات التي توفر خيارات للتنزيل.

تصف الخاصية distribution طريقة الحصول على مجموعة البيانات نفسها لأن عنوان URL غالبًا ما يوجّه إلى الصفحة المقصودة التي تصف مجموعة البيانات. تصف الخاصية distribution مكان البيانات وتنسيقها. يمكن أن تكون لهذه الخاصية عدة قيم: مثل نسخة ملف CSV لها عنوان URL واحد ونسخة ملف Excel متاحة على عنوان مختلف.

الخصائص المطلوبة
distribution.contentUrl URL

تمثل هذه الخاصية رابط التنزيل.

الخصائص المقترَحة
distribution DataDownload

تمثّل هذه الخاصية وصفًا للمكان الذي سيتم فيه تنزيل مجموعة البيانات وتنسيق الملف المُراد تنزيله.

distribution.encodingFormat Text أو URL

تمثل هذه الخاصية تنسيق الملف المُراد توزيعه.

مجموعة البيانات الجدولية

مجموعة البيانات الجدولية هي مجموعة بيانات يتم تنظيمها أساسًا في شكل شبكة من الصفوف والأعمدة. بالنسبة إلى الصفحات التي تتضمن مجموعات بيانات جدولية، يمكنك أيضًا إنشاء ترميز أكثر وضوحًا استنادًا إلى الأسلوب الأساسي الموضح أعلاه. في الوقت الحالي، نفهم صيغة من CSVW ("ملف CSV على الويب"، راجع W3C)، ويتم توفيرها بالتوازي مع المحتوى الجدولي الموجَّه للمستخدِمين على صفحة HTML.

في ما يلي مثال يوضّح جدولاً صغيرًا تم ترميزه بالتنسيق CSVW JSON-LD. يعرض اختبار النتائج المنسّقة بعض الأخطاء المعروفة.

مراقبة النتائج المنسّقة باستخدام Search Console

Search Console هي أداة تساعدك في مراقبة مستوى أداء صفحاتك في "بحث Google". وليس عليك الاشتراك في Search Console لإدراج موقعك الإلكتروني ضمن نتائج "بحث Google"، ولكن تساعدك هذه الأداة في التعرّف على شكل موقعك كما يراه محرّك البحث Google وتحسين هذا الشكل. ننصح بالتحقق من Search Console في الحالات التالية:

  1. بعد نشر بيانات منظَّمة للمرة الأولى
  2. بعد إصدار نماذج جديدة أو تعديل الترميز
  3. تحليل الزيارات بشكل دوري

بعد نشر بيانات منظَّمة للمرة الأولى

بعد أن ينتهي محرّك البحث Google من فهرسة الصفحات، ابحث عن المشاكل باستخدام تقرير "حالة النتائج المنسّقة" المناسب. في العادة، من المفترض أن ترى زيادة في الصفحات الصالحة وليس في عدد الأخطاء أو التحذيرات. إذا عثرت على مشاكل في بياناتك المنظَّمة:

  1. أصلِح الأخطاء.
  2. افحص عنوان URL مباشر لمعرفة ما إذا كانت المشكلة مستمرّة.
  3. اطلب إجراء تحقق باستخدام تقرير الحالة.

بعد إصدار نماذج جديدة أو تعديل الترميز

عند إجراء تغييرات كبيرة على موقعك الإلكتروني، راقِب الزيادات في عدد أخطاء البيانات المنظَّمة والتحذيرات.
  • إذا لاحظت زيادة في عدد الأخطاء، قد يكون السبب أنك طرحت نموذجًا جديدًا لا يعمل أو أنّ موقعك الإلكتروني يتفاعل مع النموذج الحالي على نحو جديد وغير صالح.
  • إذا لاحظت انخفاضًا في العناصر الصالحة (لا يقابله زيادة في عدد الأخطاء)، من الممكن أنك توقّفت عن تضمين بيانات منظَّمة في صفحاتك. استخدِم أداة فحص عنوان URL للاطّلاع على سبب المشكلة.

تحليل الزيارات بشكل دوري

يمكنك تحليل الزيارات إلى صفحتك في "بحث Google" باستخدام تقرير الأداء. ستعرض لك البيانات عدد مرات ظهور صفحتك كنتيجة منسّقة في "بحث Google" وعدد المرات التي نقر فيها المستخدمون عليها ومتوسط موضع ظهور صفحتك في نتائج البحث. يمكنك أيضًا عرض هذه النتائج تلقائيًا باستخدام واجهة برمجة التطبيقات لخدمة Search Console.

تحديد المشاكل وحلّها

إذا كنت تواجه مشكلة في تنفيذ البيانات المنظَّمة أو تصحيح الأخطاء فيها، إليك بعض المراجع التي قد تساعدك.

لا تظهر مجموعة بيانات محددة في نتائج "بحث مجموعة البيانات".

سبب المشكلة: لا يحتوي موقعك الإلكتروني على بيانات منظَّمة في الصفحة التي تصف مجموعات البيانات أو لم يتم الزحف إلى الصفحة بعد.

حلّ المشكلة

  1. انسخ رابط الصفحة التي تتوقّع رؤيتها في نتائج "بحث مجموعة البيانات"، والصقه في اختبار النتائج المنسّقة. إذا ظهرت الرسالة "الصفحة غير مؤهّلة للنتائج المنسّقة المعروفة في هذا الاختبار" أو "ليس كل الترميز مؤهّلاً للحصول على النتائج المنسّقة"، هذا يعني أنه ليس هناك ترميز لمجموعة البيانات في الصفحة أو أنّ الترميز غير صحيح. يمكنك إصلاح هذه المشكلة من خلال الرجوع إلى القسم كيفية إضافة بيانات منظَّمة.
  2. إذا كان هناك ترميز على الصفحة، ربما لم يتم الزحف إليها بعد. يمكنك التحقق من حالة الزحف باستخدام Search Console.

شعار الشركة غير متوفّر أو لا يظهر بشكل صحيح في النتائج.

سبب المشكلة: ربما تفتقد صفحتك إلى ترميز schema.org لشعارات المؤسسة أو أنّ نشاطك التجاري لم يتم ربطه بحساب Google.

حلّ المشكلة

  1. إضافة بيانات الشعار المنظَّمة إلى صفحتك
  2. إضافة تفاصيل نشاطك التجاري إلى Google