获取数据集

创建数据集并向其上传数据后,您可以使用 HTTP GET 请求 访问数据集的权限。本页面介绍了如何列出您的所有数据集, 如何获取有关特定数据集的信息,以及如何下载数据 提取特征。

数据集版本简介

数据上传成功后,数据集的状态将设置为 STATE_COMPLETED,并且该数据集会成为活跃版本。这意味着 即可在您的应用中使用。如需确定数据集的 state,请执行以下操作: 您可以列出所有数据集或获取特定的数据集。

您可以将新数据上传到数据集,以创建 数据集:

  • 如果新数据上传成功,新版本就会变为“有效”版本 version,即您的应用使用的版本。

  • 如果上传过程中出错,系统将显示先前成功创建的数据集版本 仍保持为“有效”version,即您的应用使用的版本。

如需详细了解如何创建数据集的新版本,请参阅 将新数据上传到数据集

列出所有数据集

将 HTTP GET 请求发送到 listDataset 端点:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

此请求会返回有关所有数据集最新版本的信息, 无论版本是否为有效版本如果您只想 列出每个数据集的有效版本,附加 tag=active 查询参数 添加到请求中:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets?tag=active

例如,此调用会返回所有 数据集:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"

此调用会返回以下形式的响应:

{
  "datasets": [
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
      "displayName": "My Test Dataset",
      "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "gcsSource": {
        "inputUri": "gs://mybucket/my.csv",
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:47:37.308977Z",
      "updateTime": "2023-03-24T14:48:05.053114Z",
      "versionCreateTime": "2023-03-24T14:48:05.053114Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    },
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/2c8ae479-96704-89c6435ca959",
      "displayName": "My Other Test Dataset",
      "versionId": "0d2e3-b9da-47cc-819f-7ac67562",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "localFileSource": {
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:41:52.579755Z",
      "updateTime": "2023-03-24T14:42:56.784122Z",
      "versionCreateTime": "2023-03-24T14:42:56.784122Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    }
  ]
}

获取数据集的相关信息

要获取有关特定数据集的信息,请将 HTTP GET 请求发送到 getDataset端点, 包含数据集的 ID:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID

此请求会返回有关最新版本的数据集的信息, 无论版本是否为有效版本如果您想了解 数据集的有效版本,请将 @active 标记附加到 请求:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@active

例如:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46@active"

此请求以如下形式返回响应:

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
  "displayName": "My Test Dataset",
  "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "gcsSource": {
    "inputUri": "gs://mybucket/my.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2023-03-24T14:47:37.308977Z",
  "updateTime": "2023-03-24T14:48:05.053114Z",
  "versionCreateTime": "2023-03-24T14:48:05.053114Z",
  "status": {
    "state": "STATE_COMPLETED"
  }
}

下载数据集

如需从最新版本的数据集下载数据,请发送 HTTP GET下载数据集 还包含数据集 ID 的端点:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:download?alt=media

例如:

curl -X GET -L \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
--output LOCAL_LOCATION_TO_OUTPUT \
"https://mapsplatformdatasets.googleapis.com/download/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46:download?alt=media"

在此示例中,您将使用 cURL --output 选项指定 文件,其中包含下载的数据。例如,以下 --output 标志 指定将数据集下载到名为 myjson.json 的 用于运行 cURL 命令的目录:

--output myjson.json

或者使用以下标志将数据下载到 /tmp 中的 myjson.json 目录:

--output /tmp/myjson.json