Tải tập dữ liệu

Sau khi tạo một tập dữ liệu và tải dữ liệu lên, bạn có thể sử dụng yêu cầu HTTP GET để truy cập vào tập dữ liệu đó. Trang này mô tả cách liệt kê tất cả các tập dữ liệu của bạn, cách lấy thông tin về một tập dữ liệu cụ thể và cách tải dữ liệu xuống từ một tập dữ liệu.

Giới thiệu về các phiên bản tập dữ liệu

Sau khi tải dữ liệu lên thành công, trạng thái của tập dữ liệu được đặt thành STATE_COMPLETED và tập dữ liệu đó sẽ trở thành phiên bản đang hoạt động. Điều đó có nghĩa là tập dữ liệu đã sẵn sàng để sử dụng trong ứng dụng của bạn. Để xác định state của tập dữ liệu, bạn có thể liệt kê tất cả các tập dữ liệu hoặc nhận một tập dữ liệu cụ thể.

Bạn có thể tải dữ liệu mới lên tập dữ liệu để tạo phiên bản mới của tập dữ liệu:

  • Nếu tải dữ liệu mới lên thành công, thì phiên bản mới sẽ trở thành phiên bản "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

  • Nếu có lỗi khi tải lên, thì phiên bản tập dữ liệu thành công trước đó vẫn là phiên bản "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

Để biết thêm thông tin về cách tạo phiên bản mới của tập dữ liệu, hãy xem phần Tải dữ liệu mới lên tập dữ liệu.

Liệt kê tất cả tập dữ liệu

Liệt kê tất cả tập dữ liệu bằng cách gửi yêu cầu HTTP GET đến điểm cuối danh sách tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

Yêu cầu này trả về thông tin về phiên bản mới nhất của tất cả tập dữ liệu, bất kể phiên bản đó có phải là phiên bản đang hoạt động hay không. Nếu bạn chỉ muốn liệt kê phiên bản đang hoạt động của mỗi tập dữ liệu, hãy thêm tham số truy vấn tag=active vào yêu cầu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets?tag=active

Ví dụ: lệnh gọi này trả về thông tin về phiên bản mới nhất của tất cả các tập dữ liệu:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

Lệnh gọi này trả về phản hồi trong biểu mẫu:

{
  "datasets": [
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
      "displayName": "My Test Dataset",
      "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "gcsSource": {
        "inputUri": "gs://mybucket/my.csv",
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:47:37.308977Z",
      "updateTime": "2023-03-24T14:48:05.053114Z",
      "versionCreateTime": "2023-03-24T14:48:05.053114Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    },
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/2c8ae479-96704-89c6435ca959",
      "displayName": "My Other Test Dataset",
      "versionId": "0d2e3-b9da-47cc-819f-7ac67562",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "localFileSource": {
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:41:52.579755Z",
      "updateTime": "2023-03-24T14:42:56.784122Z",
      "versionCreateTime": "2023-03-24T14:42:56.784122Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    }
  ]
}

Nhận thông tin về một tập dữ liệu

Để nhận thông tin về một tập dữ liệu cụ thể, hãy gửi yêu cầu HTTP GET đến điểm cuối nhận tập dữ liệu cũng bao gồm mã nhận dạng của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID

Yêu cầu này trả về thông tin về phiên bản mới nhất của tập dữ liệu, bất kể phiên bản đó có phải là phiên bản đang hoạt động hay không. Nếu bạn muốn thông tin về phiên bản đang hoạt động của tập dữ liệu, hãy thêm thẻ @active vào yêu cầu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@active

Ví dụ:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46@active

Yêu cầu này trả về phản hồi trong biểu mẫu:

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
  "displayName": "My Test Dataset",
  "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "gcsSource": {
    "inputUri": "gs://mybucket/my.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2023-03-24T14:47:37.308977Z",
  "updateTime": "2023-03-24T14:48:05.053114Z",
  "versionCreateTime": "2023-03-24T14:48:05.053114Z",
  "status": {
    "state": "STATE_COMPLETED"
  }
}

Tải tập dữ liệu xuống

Để tải dữ liệu xuống từ phiên bản mới nhất của tập dữ liệu, hãy gửi yêu cầu HTTP GET đến điểm cuối tải tập dữ liệu xuống. Điểm cuối này cũng chứa mã nhận dạng của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:download?alt=media

Ví dụ:

curl -X GET -L \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
--output LOCAL_LOCATION_TO_OUTPUT \
https://mapsplatformdatasets.googleapis.com/download/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46:download?alt=media

Trong ví dụ này, bạn sử dụng tuỳ chọn cURL --output để chỉ định tên của tệp chứa dữ liệu đã tải xuống. Ví dụ: cờ --output sau đây chỉ định tải tập dữ liệu xuống một tệp có tên myjson.json trong cùng thư mục dùng để chạy lệnh cURL:

--output myjson.json

Bạn cũng có thể sử dụng cờ sau để tải dữ liệu xuống myjson.json trong thư mục /tmp:

--output /tmp/myjson.json