Datos estructurados del conjunto de datos (`Dataset`, `DataCatalog`, `DataDownload`)

Resulta mucho más fácil encontrar en la herramienta Búsqueda de Datasets cuando proporcionas información complementaria, como su nombre, descripción, creador y formatos de distribución, como datos estructurados. El enfoque de Google en cuanto a la detección de conjuntos de datos usa schema.org y otros estándares de metadatos que se pueden agregar a páginas que describen los conjuntos de datos. El fin de este lenguaje de marcado es mejorar la detección de conjuntos de datos en campos como ciencias de la vida, ciencias sociales, aprendizaje automático, datos cívicos y gubernamentales, etc.

A continuación puedes ver algunos ejemplos de qué califica como conjunto de datos:

Una tabla o un archivo CSV con datos
Una colección organizada de tablas
Un archivo en formato propio que contiene datos
Una colección de archivos que conforman un conjunto de datos coherente
Un objeto estructurado con datos en algún otro formato que podrías querer cargar en una herramienta especial para su procesamiento
Imágenes con captura de datos
Archivos relacionados con el aprendizaje automático, como parámetros entrenados o definiciones de estructura de una red neuronal

Cómo agregar datos estructurados

Los datos estructurados son un formato estandarizado para proporcionar información sobre una página y clasificar su contenido. Si aún no estás familiarizado con los datos estructurados, obtén más información sobre su funcionamiento.

A continuación, presentamos una descripción general para aprender a compilar, probar y actualizar datos estructurados.

Agrega las propiedades obligatorias. Según el formato que uses, obtén información sobre las ubicaciones donde puedes insertar datos estructurados en la página.
¿Usas un CMS? Es posible que sea más fácil usar un complemento integrado en el CMS.
¿Usas JavaScript? Descubre cómo generar datos estructurados con JavaScript.
Sigue los lineamientos.
Valida tu código con la Prueba de resultados enriquecidos y corrige cualquier error crítico. Procura también corregir los problemas no críticos que puedan marcarse en la herramienta, ya que pueden ayudar a mejorar la calidad de los datos estructurados (sin embargo, esto no es necesario para que se muestren los resultados enriquecidos).
Implementa algunas páginas que incluyan tus datos estructurados y utiliza la Herramienta de inspección de URLs para probar el modo en el que Google ve la página. Asegúrate de que Google pueda acceder a la página y que no esté bloqueada por un archivo robots.txt, una etiqueta noindex ni requisitos de acceso. Si la página se ve bien, puedes pedirle a Google que vuelva a rastrear tus URLs.
Nota: Espera el tiempo suficiente para que se vuelvan a realizar el rastreo y la indexación. No olvides que pueden transcurrir varios días después de publicar una página para que Google la encuentre y la rastree.
Para mantener informado a Google sobre los cambios futuros, te recomendamos que envíes un mapa del sitio. Puedes automatizar este proceso con la API de Search Console Sitemap.

Borra un conjunto de datos de los resultados de la Búsqueda de Datasets

Si no quieres que un conjunto de datos se muestre en los resultados de la Búsqueda de Datasets, usa la etiqueta robots meta para controlar cómo se indexa tu conjunto de datos. Ten en cuenta que los cambios pueden tardar un tiempo (días o semanas, en función de la programación de rastreo) en reflejarse en la Búsqueda de Datasets.

Nuestro enfoque de detección de conjuntos de datos

Podemos comprender los datos estructurados sobre conjuntos de datos en las páginas web mediante el lenguaje de marcado de Dataset de schema.org, o estructuras equivalentes representadas en el formato de vocabulario del catálogo de datos (DCAT) de W3C. También estamos explorando la compatibilidad experimental para datos estructurados basados en W3C CSVW y esperamos desarrollar y adaptar nuestro enfoque a medida que surjan prácticas recomendadas para la descripción de conjuntos de datos. Para obtener más información sobre nuestro enfoque respecto de la detección de conjuntos de datos, consulta Making it easier to discover datasets.

Ejemplos

A continuación, verás un ejemplo de conjuntos de datos que usan JSON-LD y sintaxis de schema.org (preferido) en la Prueba de resultados enriquecidos. El vocabulario de schema.org también se puede usar en la sintaxis de RDFa 1.1 o de microdatos. Asimismo, puedes usar el vocabulario de DCAT de W3C para describir los metadatos. El siguiente ejemplo se basa en la descripción de un conjunto de datos tomada de un caso real.

JSON-LD

Este es un ejemplo de un conjunto de datos en JSON-LD:

<html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "isAccessibleForFree" : true,
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 01 creator"
          }
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 02 creator"
          }
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "funder":{
         "@type": "Organization",
         "sameAs": "https://ror.org/00tgqzw13",
         "name": "National Weather Service"
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"https://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"https://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>

<html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "isAccessibleForFree" : true,
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 01 creator"
          }
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
          "creator":{
             "@type":"Organization",
             "name": "Sub dataset 02 creator"
          }
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "funder":{
         "@type": "Organization",
         "sameAs": "https://ror.org/00tgqzw13",
         "name": "National Weather Service"
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"https://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"https://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>

RDFa

Este es un ejemplo de un conjunto de datos en RDFa que usa el vocabulario de DCAT (no se admite en la prueba de resultados enriquecidos):

<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

Lineamientos

Los sitios deben seguir los lineamientos de datos estructurados. Además de los lineamientos de datos estructurados, sugerimos seguir las prácticas recomendadas para mapas del sitio y fuentes.

Recomendaciones relativas a mapas del sitio

Utiliza un archivo de mapa del sitio para ayudar a Google a encontrar tus URLs. El uso de esos archivos y de lenguaje de marcado sameAs permite documentar la manera en que se publican en tu sitio las descripciones de los conjuntos de datos.

Si tienes un repositorio de conjuntos de datos, es probable que cuentes con al menos dos tipos de páginas: las canónicas ("de destino") para cada conjunto de datos y las que indican varios conjuntos de datos (por ejemplo, resultados de la búsqueda o algún subconjunto de conjuntos de datos). Te recomendamos agregar datos estructurados acerca de un conjunto de datos a las páginas canónicas. Usa la propiedad sameAs para vincular la página canónica si agregas datos estructurados a varias copias del conjunto de datos, como fichas de páginas de resultados de búsqueda.

Prácticas recomendadas relativas a las fuentes

Es común que los conjuntos de datos abiertos se vuelvan a publicar, se agreguen y se basen en otros conjuntos de datos. A continuación se incluye un bosquejo inicial de nuestro enfoque para representar situaciones en las que un conjunto de datos se copia de otro o se basa en otro.

Usa la propiedad sameAs para indicar las URLs más canónicas respecto del original en los casos en que el conjunto de datos o la descripción sea una simple republicación de materiales publicados en otro lugar. El valor de sameAs debe indicar inequívocamente la identidad del conjunto de datos; en otras palabras, no uses el mismo valor de sameAs para dos conjuntos de datos diferentes.
Utiliza la propiedad isBasedOn en los casos en que se haya modificado de manera significativa el conjunto de datos republicado (incluidos sus metadatos).
Usa la propiedad isBasedOn cuando un conjunto de datos derive de varios originales o agregue varios de ellos.
Usa la propiedad identifier para adjuntar identificadores de objeto digital (DOI) o identificadores compactos relevantes. Si el conjunto de datos tiene más de un identificador, repite la propiedad identifier. Si usas JSON-LD, esto se representa mediante una sintaxis de lista de JSON.

Esperamos mejorar nuestras recomendaciones con comentarios recibidos, en particular en cuanto a la descripción de las fuentes, el control de versiones y las fechas asociadas con la publicación de series temporales. Únete a los debates de la comunidad.

Recomendaciones de propiedades textuales

Recomendamos limitar todas las propiedades textuales a 5,000 caracteres o menos. Google Búsqueda de Datasets solo usa los primeros 5,000 caracteres de una propiedad textual. Por lo general, los nombres y títulos consisten en algunas palabras o una oración breve.

Errores conocidos y advertencias

Es posible que se muestren mensajes de error o advertencias en la Prueba de resultados enriquecidos de Google y en otros sistemas de validación. Concretamente, los sistemas de validación podrían sugerir que las organizaciones tengan información de contacto que incluya contactType; algunos valores útiles son customer service, emergency, journalist, newsroom y public engagement. También puedes ignorar los errores de csvw:Table, ya que es un valor no esperado de la propiedad mainEntity.

Definiciones de tipos de datos estructurados

Debes incluir las propiedades obligatorias a fin de que tu contenido sea apto para aparecer como resultado enriquecido. También puedes incluir las propiedades recomendadas para agregar más información sobre tu contenido, lo que podría brindar una mejor experiencia del usuario.

Puedes usar la Prueba de resultados enriquecidos para validar tu lenguaje de marcado.

La idea es describir la información de un conjunto de datos (sus metadatos) y representar su contenido. Por ejemplo, los metadatos de un conjunto de datos indican de qué se trata el conjunto de datos, qué variables mide, quién lo creó, etc., pero no incluyen valores específicos para las variables.

`Dataset`

La definición completa de Dataset está disponible en schema.org/Dataset.

Puedes describir información adicional sobre la publicación del conjunto de datos, como la licencia, cuándo se publicó, su identificador de objeto digital o una propiedad sameAs que apunte a la versión canónica del conjunto de datos incluido en un otro repositorio. Agrega identifier, license y sameAs para los conjuntos de datos que proporcionen información sobre la fuente y la licencia.

Las propiedades compatibles con Google son las siguientes:

Propiedades obligatorias

Propiedades obligatorias
`description`	`Text` Breve resumen que describe un conjunto de datos. Lineamientos El resumen debe tener entre 50 y 5,000 caracteres. El resumen puede incluir sintaxis de Markdown. Las imágenes incorporadas deben usar URLs de rutas absolutas (en lugar de ruta de acceso relativa). Cuando uses el formato JSON-LD, denota líneas nuevas con `\n` (dos caracteres: barra inversa y la letra "n" minúscula).
`name`	`Text` Es un nombre descriptivo del conjunto de datos. Por ejemplo, "Profundidad de la nieve en el hemisferio norte". Lineamientos Siempre que sea posible, usa nombres únicos para conjuntos de datos diferentes. Se recomienda: `"Snow depth in the Northern Hemisphere"` y `"Snow depth in the Southern Hemisphere"` para dos conjuntos de datos distintos. No se recomienda: `"Snow depth"` y `"Snow depth"` para dos conjuntos de datos distintos.

description

Text

Breve resumen que describe un conjunto de datos.

Lineamientos

El resumen debe tener entre 50 y 5,000 caracteres.
El resumen puede incluir sintaxis de Markdown. Las imágenes incorporadas deben usar URLs de rutas absolutas (en lugar de ruta de acceso relativa).
Cuando uses el formato JSON-LD, denota líneas nuevas con \n (dos caracteres: barra inversa y la letra "n" minúscula).

name

Text

Es un nombre descriptivo del conjunto de datos. Por ejemplo, "Profundidad de la nieve en el hemisferio norte".

Lineamientos

Siempre que sea posible, usa nombres únicos para conjuntos de datos diferentes.

Se recomienda: "Snow depth in the Northern Hemisphere" y "Snow depth in the Southern Hemisphere" para dos conjuntos de datos distintos.

No se recomienda: "Snow depth" y "Snow depth" para dos conjuntos de datos distintos.

Propiedades recomendadas
`alternateName`	`Text` Nombres alternativos que se usan para referirse a este conjunto de datos, como alias o abreviaciones. Ejemplo (en formato JSON-LD): "name": "The Quick, Draw! Dataset" "alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
`creator`	`Person` o `Organization` Es el creador o autor de este conjunto de datos. Para identificar de forma exclusiva a las personas, usa ORCID ID como valor de la propiedad `sameAs` del tipo `Person`. Para identificar instituciones y organizaciones de forma exclusiva, usa ROR ID. Ejemplo (en formato JSON-LD): "creator": [ { "@type": "Person", "sameAs": "https://orcid.org/0000-0000-0000-0000", "givenName": "Jane", "familyName": "Foo", "name": "Jane Foo" }, { "@type": "Person", "sameAs": "https://orcid.org/0000-0000-0000-0001", "givenName": "Jo", "familyName": "Bar", "name": "Jo Bar" }, { "@type": "Organization", "sameAs": "https://ror.org/xxxxxxxxx", "name": "Fictitious Research Consortium" } ]
`citation`	`Text` o `CreativeWork` Identifica artículos académicos que el proveedor de datos recomienda citar además del conjunto de datos. Proporciona la cita del conjunto de datos con otras propiedades como `name`, `identifier`, `creator` y `publisher`. Por ejemplo, esta propiedad puede identificar de manera única una publicación académica relacionada, como un descriptor de datos, un artículo de datos o un artículo para el que este conjunto de datos es material complementario. Ejemplos (en formato JSON-LD): "citation": "https://doi.org/10.1111/111" "citation": "https://identifiers.org/pubmed:11111111" "citation": "https://identifiers.org/arxiv:0111.1111v1" "citation": "Doe J (2014) Influence of X ... https://doi.org/10.1111/111" Lineamientos adicionales No uses esta propiedad a fin de proporcionar información para citar el conjunto de datos en sí. Se utiliza para identificar artículos académicos relacionados y no el propio conjunto de datos. Si quieres proporcionar información necesaria para citar el conjunto de datos, usa las propiedades `name`, `identifier`, `creator` y `publisher` en su lugar. Siempre que sea posible, cuando propagues la propiedad de citas con un fragmento de una cita, proporciona el identificador del artículo (como un DOI). Se recomienda: `"Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"` No se recomienda: `"Doe J (2014) Influence of X. Biomics 1(1)."`
`funder`	`Person` o `Organization` Una persona o una organización que proporciona asistencia financiera para este conjunto de datos. Para identificar de forma exclusiva a las personas, usa ORCID ID como valor de la propiedad `sameAs` del tipo `Person`. Para identificar instituciones y organizaciones de forma exclusiva, usa ROR ID. Ejemplo (en formato JSON-LD): "funder": [ { "@type": "Person", "sameAs": "https://orcid.org/0000-0000-0000-0002", "givenName": "Jane", "familyName": "Funder", "name": "Jane Funder" }, { "@type": "Organization", "sameAs": "https://ror.org/yyyyyyyyy", "name": "Fictitious Funding Organization" } ]
`hasPart` o `isPartOf`	`URL` o `Dataset` Si el conjunto de datos es una colección de conjuntos de datos más pequeños, usa la propiedad `hasPart` para denotar esa relación. Por el contrario, si el conjunto de datos es parte de otro conjunto más grande, usa `isPartOf`. Ambas propiedades pueden convertirse en una URL o en una instancia de `Dataset`. Si se usa `Dataset` como valor, debe incluir todas las propiedades requeridas para un `Dataset` independiente. Ejemplos: "hasPart" : [ { "@type": "Dataset", "name": "Sub dataset 01", "description": "Informative description of the first subdataset...", "license": "https://creativecommons.org/publicdomain/zero/1.0/", "creator": { "@type":"Organization", "name": "Sub dataset 01 creator" } }, { "@type": "Dataset", "name": "Sub dataset 02", "description": "Informative description of the second subdataset...", "license": "https://creativecommons.org/publicdomain/zero/1.0/", "creator": { "@type":"Organization", "name": "Sub dataset 02 creator" } } ] "isPartOf" : "https://example.com/aggregate_dataset"
`identifier`	`URL`, `Text` o `PropertyValue` Es un identificador, como un DOI o un identificador compacto. Si el conjunto de datos tiene más de un identificador, repite la propiedad `identifier`. Si usas JSON-LD, se representará mediante una sintaxis de lista de JSON.
`isAccessibleForFree`	`Boolean` Indica si el acceso al conjunto de datos puede ser sin cargo.
`keywords`	`Text` Palabras clave que resumen el conjunto de datos.
`license`	`URL` o `CreativeWork` Es la licencia en virtud de la cual se distribuye el conjunto de datos. Por ejemplo: "license" : "https://creativecommons.org/publicdomain/zero/1.0/" "license" : { "@type": "CreativeWork", "name": "Custom license", "url": "https://example.com/custom_license" } Lineamientos adicionales Proporciona una URL que identifique inequívocamente una versión específica de la licencia utilizada. Se recomienda "license" : "https://creativecommons.org/licenses/by/4.0" No se recomienda "license" : "https://creativecommons.org/licenses/by"
`measurementTechnique`	`Text` o `URL` Es la técnica, tecnología o metodología que se usa en un conjunto de datos, que puede corresponder a las variables descritas en `variableMeasured`. Se propuso la propiedad `measurementTechnique` en schema.org y su estandarización se encuentra pendiente. Alentamos a los publicadores a compartir comentarios sobre esta propiedad con la comunidad de schema.org.
`sameAs`	`URL` Corresponde a la URL de una página web de referencia que indica inequívocamente la identidad del conjunto de datos.
`spatialCoverage`	`Text` o `Place` Puedes proporcionar un punto único que describa el aspecto espacial del conjunto de datos. Incluye esta propiedad solo si el conjunto de datos tiene una dimensión espacial. Por ejemplo, un punto único donde se hayan obtenido todas las mediciones o las coordenadas de un cuadro de límite de un área. Puntos "spatialCoverage:" { "@type": "Place", "geo": { "@type": "GeoCoordinates", "latitude": 39.3280, "longitude": 120.1633 } } Formas Usa `GeoShape` para describir áreas de diferentes formas. Por ejemplo, para especificar un cuadro de límite. "spatialCoverage:" { "@type": "Place", "geo": { "@type": "GeoShape", "box": "39.3280 120.1633 40.445 123.7878" } } Los puntos dentro de las propiedades `box`, `circle`, `line` o `polygon` se deben expresar como par de valores separados por un espacio correspondientes a la latitud y la longitud (en ese orden). Ubicaciones nombradas "spatialCoverage:" "Tahoe City, CA"
`temporalCoverage`	`Text` Los datos del conjunto de datos abarcan un intervalo de tiempo específico. Incluye esta propiedad solo si el conjunto de datos tiene una dimensión temporal. Schema.org usa el estándar ISO 8601 para describir los intervalos de tiempo y los puntos en el tiempo. Puedes describir las fechas de manera diferente, según el intervalo del conjunto de datos. Indica intervalos abiertos con dos puntos decimales (`..`). Fecha única "temporalCoverage" : "2008" Período "temporalCoverage" : "1950-01-01/2013-12-18" Período de tiempo abierto "temporalCoverage" : "2013-12-19/.."
`variableMeasured`	`Text` o `PropertyValue` Es la variable que mide este conjunto de datos. Por ejemplo, la temperatura o la presión. Se propuso la propiedad `variableMeasured` en schema.org y su estandarización se encuentra pendiente. Alentamos a los publicadores a compartir comentarios sobre esta propiedad con la comunidad de schema.org.
`version`	`Text` o `Number` Es el número de versión del conjunto de datos.
`url`	`URL` Ubicación de la página que describe el conjunto de datos.

`DataCatalog`

La definición completa de DataCatalog está disponible en schema.org/DataCatalog.

A menudo los conjuntos de datos se publican en repositorios que contienen muchos otros conjuntos de datos. El mismo conjunto de datos puede estar incluido en más de un repositorio. Puedes hacer referencia directamente a un catálogo de datos al que pertenece el conjunto de datos. Para ello, haz referencia directamente a él con las siguientes propiedades:

Propiedades recomendadas

Propiedades recomendadas
`includedInDataCatalog`	`DataCatalog` Catálogo al que pertenece el conjunto de datos.

includedInDataCatalog

DataCatalog

Catálogo al que pertenece el conjunto de datos.

`DataDownload`

La definición completa de DataDownload está disponible en schema.org/DataDownload. Además de las propiedades del conjunto de datos, agrega las siguientes propiedades para los conjuntos de datos que ofrezcan opciones de descarga.

La propiedad distribution describe cómo obtener el conjunto de datos en sí, ya que la URL suele apuntar a la página de destino que describe el conjunto de datos. La propiedad distribution describe dónde obtener los datos y en qué formato. Esta propiedad puede tener varios valores: por ejemplo, una versión CSV tiene una URL, y una versión de Excel está disponible en otra URL.

Propiedades obligatorias
`distribution.contentUrl`	`URL` Vínculo para la descarga.

Propiedades recomendadas

Propiedades recomendadas
`distribution`	`DataDownload` Es la descripción de la ubicación del conjunto de datos para la descarga y el formato de archivo para la descarga.
`distribution.encodingFormat`	`Text` o `URL` Es el formato de archivo de la distribución.

distribution

DataDownload

Es la descripción de la ubicación del conjunto de datos para la descarga y el formato de archivo para la descarga.

distribution.encodingFormat

Text o URL

Es el formato de archivo de la distribución.

Conjuntos de datos tabulares

Un conjunto de datos tabular se organiza principalmente en una cuadrícula de filas y columnas. En el caso de páginas que incluyan conjuntos de datos tabulares, también puedes crear lenguaje de marcado más explícito, basado en el enfoque básico. En este momento, comprendemos una variación de CSVW ("CSV en la Web", consulta W3C), que se proporciona en paralelo al contenido tabular orientado al usuario en la página HTML.

A continuación se incluye un ejemplo que muestra una pequeña tabla codificada en formato CSVW JSON-LD. Hay algunos errores conocidos en la Prueba de resultados enriquecidos.

<html>
  <head>
    <title>American Humane Association</title>
    <script type="application/ld+json">
    {
      "@context": ["https://schema.org", {"csvw": "https://www.w3.org/ns/csvw#"}],
      "@type": "Dataset",
      "name":"AMERICAN HUMANE ASSOCIATION",
      "description": "ProPublica's Nonprofit Explorer lets you view summaries of 2.2 million tax returns from tax-exempt organizations and see financial details such as their executive compensation and revenue and expenses. You can browse raw IRS data released since 2013 and access over 9.4 million tax filing documents going back as far as 2001.",
      "publisher": {
        "@type": "Organization",
        "name": "ProPublica"
      },
      "mainEntity" : {
        "@type" : "csvw:Table",
        "csvw:tableSchema": {
          "csvw:columns": [
            {
              "csvw:name": "Year",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "2024",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "2024",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization name",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization address",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization NTEE Code",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Total functional expenses ($)",
              "csvw:datatype": "integer",
              "csvw:cells": [
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2024"
                }]
            }]
        }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>

<html>
  <head>
    <title>American Humane Association</title>
    <script type="application/ld+json">
    {
      "@context": ["https://schema.org", {"csvw": "https://www.w3.org/ns/csvw#"}],
      "@type": "Dataset",
      "name":"AMERICAN HUMANE ASSOCIATION",
      "description": "ProPublica's Nonprofit Explorer lets you view summaries of 2.2 million tax returns from tax-exempt organizations and see financial details such as their executive compensation and revenue and expenses. You can browse raw IRS data released since 2013 and access over 9.4 million tax filing documents going back as far as 2001.",
      "publisher": {
        "@type": "Organization",
        "name": "ProPublica"
      },
      "mainEntity" : {
        "@type" : "csvw:Table",
        "csvw:tableSchema": {
          "csvw:columns": [
            {
              "csvw:name": "Year",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "2024",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "2024",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization name",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "AMERICAN HUMANE ASSOCIATION",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization address",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "1400 16TH STREET NW",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Organization NTEE Code",
              "csvw:datatype": "string",
              "csvw:cells": [
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "D200",
                  "csvw:notes": "Animal Protection and Welfare",
                  "csvw:primaryKey": "2024"
                }]
            },
            {
              "csvw:name": "Total functional expenses ($)",
              "csvw:datatype": "integer",
              "csvw:cells": [
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2024"
                },
                {
                  "csvw:value": "13800212",
                  "csvw:primaryKey": "2024"
                }]
            }]
        }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>

Cómo supervisar resultados enriquecidos con Search Console

Search Console es una herramienta que te ayuda a supervisar el rendimiento de tus páginas en la Búsqueda de Google. Si bien no es necesario que te registres en Search Console para que se incluya tu contenido en los resultados de la Búsqueda de Google, puede ayudarte a comprender y mejorar la forma en que Google ve tu sitio. Te recomendamos que revises Search Console en los siguientes casos:

Después de implementar datos estructurados por primera vez
Después de lanzar plantillas nuevas o actualizar código
Para analizar tráfico periódicamente

Después de implementar datos estructurados por primera vez

Después de que Google haya indexado tus páginas, busca problemas con el informe de estado de resultados enriquecidos relevante. Lo ideal es que haya un aumento de los elementos válidos y no de los elementos no válidos. Si encuentras problemas en los datos estructurados, haz lo siguiente:

Corrige los elementos no válidos.
Inspecciona una URL publicada para verificar si persiste el problema.
Solicita una validación desde el informe de estado.

Después de lanzar plantillas nuevas o actualizar código

Cuando realices cambios significativos en tu sitio web, supervisa los aumentos en los elementos no válidos de datos estructurados.

Si notas un aumento en la cantidad de elementos no válidos, tal vez se deba a que implementaste una plantilla que no funciona o a que tu sitio interactúa con la plantilla actual de una forma diferente e incorrecta.
Si notas una disminución de los elementos válidos (que no coincide con un aumento en la cantidad de elementos no válidos), es posible que ya no estés incorporando datos estructurados en tus páginas. Usa la Herramienta de inspección de URLs para saber cuál es la causa del problema.

Cómo analizar tráfico periódicamente

Analiza el tráfico de la Búsqueda de Google con el Informe de rendimiento. Los datos te mostrarán con qué frecuencia tu página aparece como resultado enriquecido en la Búsqueda, con qué frecuencia los usuarios hacen clic en ella y cuál es la posición promedio en la que apareces en los resultados de la búsqueda. También puedes extraer esos resultados automáticamente con la API de Search Console.

Solución de problemas

Si tienes problemas para implementar o depurar datos estructurados, te brindamos algunos recursos que podrían resultarte útiles.

Si usas un sistema de administración de contenido (CMS), o si alguien más se encarga de tu sitio, pídele que te ayude. Asegúrate de reenviarle cualquier mensaje de Search Console que detalle el problema.
Google no garantiza que se muestren en los resultados de la búsqueda las funciones que consumen datos estructurados. Para obtener una lista de los motivos comunes por los que Google podría no mostrar tu contenido en un resultado enriquecido, consulta los Lineamientos generales de datos estructurados.
Es posible que haya un error en los datos estructurados. Consulta la lista de errores de datos estructurados y el Informe de datos estructurados que no se pueden analizar.
Si recibiste una acción manual de datos estructurados en tu página, estos datos se ignorarán (aunque la página puede seguir apareciendo en los resultados de la Búsqueda de Google). Para solucionar los problemas con datos estructurados, usa el Informe de acciones manuales.
Vuelve a consultar los lineamientos para determinar si tu contenido no cumple con ellos. El problema puede deberse a contenido generador de spam o a un uso fraudulento del lenguaje de marcado. Sin embargo, es posible que no sea un problema de sintaxis, por lo que la prueba de resultados enriquecidos no podrá identificar estos problemas.
Soluciona problemas de resultados enriquecidos faltantes o disminución del total de resultados enriquecidos.
Espera un tiempo suficiente para que se vuelvan a realizar el rastreo y la indexación. No olvides que pueden transcurrir varios días después de publicar una página para que Google la encuentre y la rastree. Si tienes preguntas generales sobre el rastreo y la indexación, consulta las Preguntas frecuentes sobre el rastreo y la indexación de la Búsqueda de Google.
Publica una pregunta en el foro de la Central de la Búsqueda de Google.

Un conjunto de datos específico no aparece en los resultados de la Búsqueda de Datasets

Qué provocó el problema: Tu sitio no tiene datos estructurados en la página que describe los conjuntos de datos, o bien todavía no se rastreó la página.

Cómo solucionarlo

Copia el vínculo de la página que esperas ver en los resultados de la Búsqueda de Datasets y colócalo en la Prueba de resultados enriquecidos. Si aparece el mensaje "La página no es apta para los resultados enriquecidos que detecta esta prueba" o "No todo el lenguaje de marcado es apto para los resultados enriquecidos", significa que no hay lenguaje de marcado de conjunto de datos en la página, o bien, que es incorrecto. Para solucionarlo, consulta la sección Cómo agregar datos estructurados.
Si la página incluye lenguaje de marcado, es posible que todavía no se haya rastreado. Puedes comprobar el estado del rastreo con Search Console.

El logotipo de la empresa no aparece o no se muestra de manera correcta en los resultados

Qué provocó el problema: Es posible que tu página no incluya el lenguaje de marcado de schema.org para los logotipos de organizaciones, o bien que tu empresa no esté asociada a Google.