Tải tập dữ liệu

Sau khi tạo một tập dữ liệu và tải dữ liệu lên tập dữ liệu đó, bạn có thể sử dụng các yêu cầu HTTP GET để truy cập vào tập dữ liệu. Trang này mô tả cách liệt kê tất cả các tập dữ liệu, cách lấy thông tin về một tập dữ liệu cụ thể và cách tải dữ liệu xuống từ một tập dữ liệu.

Giới thiệu về phiên bản tập dữ liệu

Sau khi tải dữ liệu lên thành công, trạng thái của tập dữ liệu sẽ được đặt thành STATE_COMPLETED và tập dữ liệu đó sẽ trở thành phiên bản đang hoạt động. Điều đó có nghĩa là tập dữ liệu đã sẵn sàng để sử dụng trong ứng dụng của bạn. Để xác định state của tập dữ liệu, bạn có thể liệt kê tất cả tập dữ liệu hoặc lấy một tập dữ liệu cụ thể.

Bạn có thể tải dữ liệu mới lên tập dữ liệu để tạo phiên bản mới của tập dữ liệu:

  • Nếu dữ liệu mới tải lên thành công, phiên bản mới sẽ trở thành phiên bản "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

  • Nếu quá trình tải lên gặp lỗi, thì phiên bản tập dữ liệu thành công trước đó sẽ vẫn là phiên bản "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

Để biết thêm thông tin về cách tạo phiên bản mới của tập dữ liệu, hãy xem phần Tải dữ liệu mới lên tập dữ liệu.

Liệt kê tất cả tập dữ liệu

Liệt kê tất cả tập dữ liệu bằng cách gửi yêu cầu GET HTTP đến điểm cuối liệt kê tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

Yêu cầu này trả về thông tin về phiên bản mới nhất của tất cả các tập dữ liệu, bất kể phiên bản đó có phải là phiên bản đang hoạt động hay không. Nếu bạn chỉ muốn liệt kê phiên bản đang hoạt động của mỗi tập dữ liệu, hãy thêm tham số truy vấn tag=active vào yêu cầu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets?tag=active

Ví dụ: lệnh gọi này trả về thông tin về phiên bản mới nhất của tất cả tập dữ liệu:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"

Lệnh gọi này trả về một phản hồi ở dạng:

{
  "datasets": [
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
      "displayName": "My Test Dataset",
      "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "gcsSource": {
        "inputUri": "gs://mybucket/my.csv",
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:47:37.308977Z",
      "updateTime": "2023-03-24T14:48:05.053114Z",
      "versionCreateTime": "2023-03-24T14:48:05.053114Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    },
    {
      "name": "projects/PROJECT_NUMBER_OR_ID/datasets/2c8ae479-96704-89c6435ca959",
      "displayName": "My Other Test Dataset",
      "versionId": "0d2e3-b9da-47cc-819f-7ac67562",
      "usage": [
        "USAGE_DATA_DRIVEN_STYLING"
      ],
      "localFileSource": {
        "fileFormat": "FILE_FORMAT_CSV"
      },
      "createTime": "2023-03-24T14:41:52.579755Z",
      "updateTime": "2023-03-24T14:42:56.784122Z",
      "versionCreateTime": "2023-03-24T14:42:56.784122Z",
      "status": {
        "state": "STATE_COMPLETED"
      }
    }
  ]
}

Xem thông tin về một tập dữ liệu

Để nhận thông tin về một tập dữ liệu cụ thể, hãy gửi yêu cầu GET HTTP đến điểm cuối get dataset (lấy tập dữ liệu) cũng bao gồm mã nhận dạng của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID

Yêu cầu này trả về thông tin về phiên bản mới nhất của tập dữ liệu, bất kể phiên bản đó có phải là phiên bản đang hoạt động hay không. Nếu bạn muốn biết thông tin về phiên bản đang hoạt động của tập dữ liệu, hãy thêm thẻ @active vào yêu cầu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@active

Ví dụ:

curl -X GET \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
"https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46@active"

Yêu cầu này trả về một phản hồi ở dạng:

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46",
  "displayName": "My Test Dataset",
  "versionId": "5fb34e-1405-4ecd-8f81-31f1c07",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "gcsSource": {
    "inputUri": "gs://mybucket/my.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2023-03-24T14:47:37.308977Z",
  "updateTime": "2023-03-24T14:48:05.053114Z",
  "versionCreateTime": "2023-03-24T14:48:05.053114Z",
  "status": {
    "state": "STATE_COMPLETED"
  }
}

Tải tập dữ liệu xuống

Để tải dữ liệu xuống từ phiên bản mới nhất của một tập dữ liệu, hãy gửi yêu cầu GET HTTP đến điểm cuối tải tập dữ liệu xuống, trong đó cũng có mã nhận dạng của tập dữ liệu:

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:download?alt=media

Ví dụ:

curl -X GET -L \
-H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
-H 'Authorization: Bearer $TOKEN' \
--output LOCAL_LOCATION_TO_OUTPUT \
"https://mapsplatformdatasets.googleapis.com/download/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e8a9e4f9fc46:download?alt=media"

Trong ví dụ này, bạn sử dụng tuỳ chọn cURL --output để chỉ định tên của tệp chứa dữ liệu đã tải xuống. Ví dụ: cờ --output sau đây chỉ định tải tập dữ liệu xuống một tệp có tên myjson.json trong cùng thư mục dùng để chạy lệnh cURL:

--output myjson.json

Hoặc sử dụng cờ sau để tải dữ liệu xuống myjson.json trong thư mục /tmp:

--output /tmp/myjson.json