สร้างชุดข้อมูล

การสร้างชุดข้อมูลเป็นกระบวนการที่มี 2 ขั้นตอน ดังนี้

  1. ส่งคําขอสร้างชุดข้อมูล

  2. ส่งคำขอเพื่ออัปโหลดข้อมูลไปยังชุดข้อมูล

หลังจากอัปโหลดข้อมูลครั้งแรกแล้ว คุณสามารถอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้

สร้างชุดข้อมูล

สร้างชุดข้อมูลโดยการส่งคําขอ POST ไปยังปลายทาง datasets

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

ส่งเนื้อหา JSON ไปยังคำขอที่กําหนดชุดข้อมูล คุณต้องปฏิบัติดังนี้

  • ระบุ displayName ของชุดข้อมูล ค่าของ displayName สำหรับชุดข้อมูลทั้งหมดต้องไม่ซ้ำกัน

  • ตั้งค่า usage เป็น USAGE_DATA_DRIVEN_STYLING

เช่น

curl -X POST -d '{
    "displayName": "My Test Dataset", 
    "usage": "USAGE_DATA_DRIVEN_STYLING"
  }' \
  -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
  -H 'Content-Type: application/json' \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"

การตอบกลับจะมีรหัสของชุดข้อมูลในรูปแบบ projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID พร้อมด้วยข้อมูลเพิ่มเติม ใช้รหัสชุดข้อมูลเมื่อส่งคำขออัปเดตหรือแก้ไขชุดข้อมูล

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
  "displayName": "My Test Dataset",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "createTime": "2022-08-15T17:50:00.189682Z",
  "updateTime": "2022-08-15T17:50:00.189682Z" 
}

อัปโหลดข้อมูลไปยังชุดข้อมูล

หลังจากที่สร้างชุดข้อมูลแล้ว ให้อัปโหลดข้อมูลจาก Google Cloud Storage หรือจากไฟล์ในเครื่องไปยังชุดข้อมูล

การดำเนินการอัปโหลดจะเป็นแบบไม่พร้อมกัน หลังจากที่อัปโหลดข้อมูลแล้ว ระบบจะ นำเข้าและประมวลผลข้อมูล ซึ่งหมายความว่าคุณต้องส่งคําขอ HTTP GET เพื่อตรวจสอบสถานะชุดข้อมูลเพื่อดูว่าชุดข้อมูลพร้อมใช้งานเมื่อใดหรือมีข้อผิดพลาดใดๆ เกิดขึ้นหรือไม่ ดูข้อมูลเพิ่มเติมได้ที่ดูสถานะการประมวลผลข้อมูล

อัปโหลดข้อมูลจาก Cloud Storage

คุณอัปโหลดจาก Cloud Storage ไปยังชุดข้อมูลโดยการส่งคำขอ POST ไปยังปลายทางชุดข้อมูลที่มีรหัสของชุดข้อมูลดังนี้

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import

ในส่วนเนื้อหาคำขอ JSON

  • ใช้ inputUri เพื่อระบุเส้นทางของไฟล์ไปยังทรัพยากรที่มีข้อมูลใน Cloud Storage เส้นทางนี้อยู่ในรูปแบบ gs://GCS_BUCKET/FILE

    ผู้ใช้ที่ส่งคำขอต้องมีบทบาทผู้ดูออบเจ็กต์พื้นที่เก็บข้อมูล หรือบทบาทอื่นๆ ที่มีสิทธิ์ storage.objects.get ดูข้อมูลเพิ่มเติมเกี่ยวกับการจัดการสิทธิ์เข้าถึง Cloud Storage ได้ที่ภาพรวมการควบคุมการเข้าถึง

  • ใช้ fileFormat เพื่อระบุรูปแบบไฟล์ของข้อมูลเป็น FILE_FORMAT_GEOJSON (ไฟล์ GeoJson), FILE_FORMAT_KML (ไฟล์ KML) หรือ FILE_FORMAT_CSV (ไฟล์ CSV)

เช่น

curl -X POST  -d '{
    "gcs_source":{
      "inputUri": "gs://my_bucket/my_csv_file",
      "fileFormat": "FILE_FORMAT_CSV"
    }
  }' \
  -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
  -H "content-type: application/json" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"

คำตอบอยู่ในรูปแบบ

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER"
}

อัปโหลดข้อมูลจากไฟล์

หากต้องการอัปโหลดข้อมูลจากไฟล์ ให้ส่งPOSTคําขอ HTTP ไปยังปลายทาง datasets ที่มีรหัสของชุดข้อมูลด้วย ดังนี้

https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import

คำขอประกอบด้วย:

  • ตั้งค่าส่วนหัว Goog-Upload-Protocol เป็น multipart

  • พร็อพเพอร์ตี้ metadata ที่ระบุเส้นทางไปยังไฟล์ที่ระบุประเภทข้อมูลที่จะอัปโหลด เป็น FILE_FORMAT_GEOJSON (ไฟล์ GeoJSON), FILE_FORMAT_KML (ไฟล์ KML) หรือ FILE_FORMAT_CSV (ไฟล์ CSV)

    เนื้อหาของไฟล์นี้มีรูปแบบดังนี้

    {"local_file_source": {"file_format": "FILE_FORMAT_GEOJSON"}}
  • พร็อพเพอร์ตี้ rawdata ที่ระบุเส้นทางไปยังไฟล์ GeoJSON, KML หรือ CSV ที่มีข้อมูลที่จะอัปโหลด

คำขอต่อไปนี้ใช้ตัวเลือก curl -F เพื่อระบุเส้นทางไปยังทั้ง 2 ไฟล์

curl -X POST \
  -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
  -H "Authorization: Bearer $TOKEN" \
  -H "X-Goog-Upload-Protocol: multipart" \
  -F "metadata=@csv_metadata_file" \
  -F "rawdata=@csv_data_file" \
  "https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"

คำตอบจะอยู่ในรูปแบบดังนี้

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER"
}

รับสถานะการประมวลผลข้อมูล

การดำเนินการอัปโหลดเป็นแบบไม่พร้อมกัน ซึ่งหมายความว่าหลังจากการเรียก API เพื่ออัปโหลดข้อมูลไปยังชุดข้อมูลที่แสดงผล คุณจะต้องสำรวจชุดข้อมูลเพื่อระบุว่าการส่งผ่านข้อมูลและประมวลผลข้อมูลสำเร็จหรือล้มเหลว

หากต้องการระบุ state ของชุดข้อมูล ให้ใช้รับชุดข้อมูล เช่น ขณะที่ประมวลผลข้อมูล ระบบจะตั้งค่า state เป็น STATE_PROCESSING เมื่อชุดข้อมูลพร้อมใช้งานในแอป state จะตั้งค่าเป็น STATE_COMPLETED

ตัวอย่างเช่น เรียก GET บนชุดข้อมูลดังนี้

curl -X GET \
  -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46"

state ของชุดข้อมูลคือ STATE_COMPLETED เพื่อให้อัปโหลดได้สำเร็จ

{
  "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
  "displayName": "My Test Dataset",
  "description": " ",
  "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "localFileSource": {
    "filename": "Parks_Properties_20240529.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2024-05-30T16:41:11.130816Z",
  "updateTime": "2024-05-30T16:41:14.416130Z",
  "versionCreateTime": "2024-05-30T16:41:14.416130Z",
  "status": {
    "state": "STATE_COMPLETED",
  },
  "sizeBytes": "6916924",
  "downloadable": true
}

เมื่อการประมวลผลข้อมูลล้มเหลว state จะถูกตั้งค่าเป็นค่าอื่นที่ไม่ใช่ STATE_COMPLETED เช่น STATE_PUBLISHING_FAILED หรือสถานะใดๆ ที่ลงท้ายด้วยสตริง _FAILED

เช่น คุณอัปโหลดข้อมูลไปยังชุดข้อมูลแล้วส่งคำขอ GET เพื่อรับรายละเอียดชุดข้อมูล นอกเหนือจากพร็อพเพอร์ตี้ state แล้ว คำตอบยังมีพร็อพเพอร์ตี้ errorMessage รายการเดียวที่มีคำอธิบายข้อผิดพลาดด้วย

{
  "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
  "displayName": "My Test Dataset",
  "description": " ",
  "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "localFileSource": {
    "filename": "Parks_Properties_20240529.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2024-05-30T16:41:11.130816Z",
  "updateTime": "2024-05-30T16:41:14.416130Z",
  "versionCreateTime": "2024-05-30T16:41:14.416130Z",
  "status": {
    "state": "STATE_PUBLISHING_FAILED",
    "errorMessage": "INVALID_ARGUMENT: Skipping row because address could not be geocoded: 5521 18 AVENUE (from line 79)"
  },
  "sizeBytes": "6916924",
  "downloadable": true
}

รับข้อผิดพลาดในการประมวลผลข้อมูล

เมื่อการนำเข้าและการประมวลผลข้อมูลไม่สําเร็จ พร็อพเพอร์ตี้ errorMessage จะมีข้อความเดียวที่อธิบายข้อผิดพลาด อย่างไรก็ตาม ข้อความแสดงข้อผิดพลาดรายการเดียวอาจให้ข้อมูลไม่เพียงพอในการระบุและแก้ไขปัญหา

หากต้องการดูข้อมูลข้อผิดพลาดทั้งหมด ให้เรียกใช้ API ของ fetchDatasetErrors API นี้จะแสดงข้อผิดพลาดในการประมวลผลข้อมูลทั้งหมดที่เกี่ยวข้องกับชุดข้อมูล:

curl -X GET \
  -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors"

การตอบกลับจะมีอาร์เรย์ errors อาร์เรย์นี้มีข้อผิดพลาดประเภท Status สูงสุด 50 รายการต่อการเรียก และรองรับข้อผิดพลาดทั้งหมดสูงสุด 500 รายการ ดังนี้

{
  "nextPageToken": "cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj",
  "errors": [
    {
      "code": 3,
      "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 631)"
    },
    {
      "code": 3,
      "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 457)"
    },
    {
      "code": 3,
      "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 31)"
    },
    ...
  ]
}

หากมีข้อผิดพลาดมากกว่า 50 รายการ หมายความว่ามีข้อผิดพลาดมากกว่า 1 หน้า การตอบกลับจะมีโทเค็นของหน้าในช่อง nextPageToken โปรดส่งค่าดังกล่าวในพารามิเตอร์การค้นหา pageToken ของการเรียกครั้งต่อๆ ไปเพื่อรับข้อผิดพลาดหน้าถัดไป เมื่อ nextPageToken ว่างเปล่า ระบบจะไม่มีหน้าเพิ่มเติม

เช่น หากต้องการดูข้อผิดพลาดหน้าถัดไปโดยใช้โทเค็นจากการตอบกลับก่อนหน้า ให้ทำดังนี้

curl -X GET \
  -H "content-type: application/json" \
  -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors?pageToken=cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj"

โดยค่าเริ่มต้น การตอบกลับจะมีข้อผิดพลาดได้สูงสุด 50 รายการต่อหน้า ใช้พารามิเตอร์การค้นหา pageSize เพื่อควบคุมขนาดหน้า

อัปโหลดข้อมูลใหม่ไปยังชุดข้อมูล

หลังจากสร้างชุดข้อมูลและอัปโหลดข้อมูลเริ่มต้นเรียบร้อยแล้ว ระบบจะตั้งค่าสถานะของชุดข้อมูลเป็น STATE_COMPLETED ซึ่งหมายความว่าชุดข้อมูลพร้อมใช้งานในแอปแล้ว หากต้องการดู state ของชุดข้อมูล ให้ดูรับชุดข้อมูล

คุณยังอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้อีกด้วย หากต้องการอัปโหลดข้อมูลใหม่ ให้ใช้กระบวนการเดียวกับที่ใช้อัปโหลดข้อมูลจาก Cloud Storage หรืออัปโหลดข้อมูลจากไฟล์ แล้วระบุข้อมูลใหม่ที่จะอัปโหลด

หากข้อมูลใหม่อัปโหลดสำเร็จ

  • สถานะของชุดข้อมูลเวอร์ชันใหม่ได้รับการตั้งค่าเป็น STATE_COMPLETED

  • เวอร์ชันใหม่จะกลายเป็นเวอร์ชัน "ใช้งานอยู่" และเป็นเวอร์ชันที่แอปของคุณใช้

หากการอัปโหลดมีข้อผิดพลาด ให้ทำดังนี้

  • สถานะของชุดข้อมูลเวอร์ชันใหม่ได้รับการตั้งค่าเป็นสถานะอย่างใดอย่างหนึ่งต่อไปนี้

    • STATE_IMPORT_FAILED
    • STATE_PROCESSING_FAILED
    • STATE_PUBLISHING_FAILED
    • STATE_DELETION_FAILED
  • ชุดข้อมูลเวอร์ชันก่อนหน้าที่สำเร็จจะยังคงเป็นเวอร์ชัน "ใช้งาน" และเป็นเวอร์ชันที่แอปของคุณใช้