สร้างชุดข้อมูล

การสร้างชุดข้อมูลเป็นกระบวนการ 2 ขั้นตอน ดังนี้

  1. ส่งคําขอสร้างชุดข้อมูล

  2. ส่งคําขออัปโหลดข้อมูลไปยังชุดข้อมูล

หลังจากอัปโหลดข้อมูลครั้งแรกแล้ว คุณสามารถอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้

สร้างชุดข้อมูล

สร้างชุดข้อมูลโดยการส่งคําขอ POST ไปยังปลายทาง datasets

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets

ส่งเนื้อหา JSON ไปยังคำขอที่กําหนดชุดข้อมูล คุณต้องปฏิบัติดังนี้

  • ระบุ displayName ของชุดข้อมูล ค่าของ displayName ต้องไม่ซ้ำกันสำหรับชุดข้อมูลทั้งหมด

  • ตั้งค่า usage เป็น USAGE_DATA_DRIVEN_STYLING

เช่น

curl -X POST -d '{
    "displayName": "My Test Dataset", 
    "usage": "USAGE_DATA_DRIVEN_STYLING"
  }' \
  -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
  -H 'Content-Type: application/json' \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"

การตอบกลับจะมีรหัสของชุดข้อมูลในรูปแบบ projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID พร้อมด้วยข้อมูลเพิ่มเติม ใช้รหัสชุดข้อมูลเมื่อส่งคำขออัปเดตหรือแก้ไขชุดข้อมูล

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
  "displayName": "My Test Dataset",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "createTime": "2022-08-15T17:50:00.189682Z",
  "updateTime": "2022-08-15T17:50:00.189682Z" 
}

อัปโหลดข้อมูลไปยังชุดข้อมูล

หลังจากสร้างชุดข้อมูลแล้ว ให้อัปโหลดข้อมูลจาก Google Cloud Storage หรือจากไฟล์ในเครื่องไปยังชุดข้อมูล

การดำเนินการอัปโหลดเป็นแบบไม่พร้อมกัน หลังจากอัปโหลดข้อมูลแล้ว ระบบจะส่งผ่านและประมวลผลข้อมูล ซึ่งหมายความว่าคุณต้องส่งคําขอ HTTP GET เพื่อตรวจสอบสถานะชุดข้อมูลเพื่อดูว่าชุดข้อมูลพร้อมใช้งานเมื่อใด หรือหากมีข้อผิดพลาด ดูข้อมูลเพิ่มเติมได้ที่ดูสถานะการประมวลผลข้อมูล

อัปโหลดข้อมูลจาก Cloud Storage

คุณอัปโหลดจาก Cloud Storage ไปยังชุดข้อมูลได้โดยส่งPOSTคําขอไปยังปลายทางชุดข้อมูลที่มีรหัสของชุดข้อมูลด้วย

https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import

ในส่วนเนื้อหาคำขอ JSON

  • ใช้ inputUri เพื่อระบุเส้นทางไฟล์ไปยังทรัพยากรที่มีข้อมูลใน Cloud Storage เส้นทางนี้จะอยู่ในรูปแบบ gs://GCS_BUCKET/FILE

    ผู้ใช้ที่ส่งคำขอต้องมีบทบาทผู้ดูออบเจ็กต์พื้นที่เก็บข้อมูล หรือบทบาทอื่นๆ ที่มีสิทธิ์ storage.objects.get ดูข้อมูลเพิ่มเติมเกี่ยวกับการจัดการสิทธิ์เข้าถึง Cloud Storage ได้ที่ภาพรวมการควบคุมการเข้าถึง

  • ใช้ fileFormat เพื่อระบุรูปแบบไฟล์ของข้อมูลเป็น FILE_FORMAT_GEOJSON (ไฟล์ GeoJson), FILE_FORMAT_KML (ไฟล์ KML) หรือ FILE_FORMAT_CSV (ไฟล์ CSV)

เช่น

curl -X POST  -d '{
    "gcs_source":{
      "inputUri": "gs://my_bucket/my_csv_file",
      "fileFormat": "FILE_FORMAT_CSV"
    }
  }' \
  -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
  -H "content-type: application/json" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"

คำตอบอยู่ในรูปแบบ

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER"
}

อัปโหลดข้อมูลจากไฟล์

หากต้องการอัปโหลดข้อมูลจากไฟล์ ให้ส่งคําขอ HTTP POST ไปยังปลายทาง datasets ที่มีรหัสของชุดข้อมูลด้วย

https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import

คำขอประกอบด้วยข้อมูลต่อไปนี้

  • ตั้งค่าส่วนหัว Goog-Upload-Protocol เป็น multipart

  • พร็อพเพอร์ตี้ metadata ที่ระบุเส้นทางไปยังไฟล์ที่ระบุประเภทข้อมูลที่จะอัปโหลด ซึ่งอาจเป็น FILE_FORMAT_GEOJSON (ไฟล์ GeoJSON), FILE_FORMAT_KML (ไฟล์ KML) หรือ FILE_FORMAT_CSV (ไฟล์ CSV)

    เนื้อหาของไฟล์นี้มีรูปแบบดังนี้

    {"local_file_source": {"file_format": "FILE_FORMAT_GEOJSON"}}
  • พร็อพเพอร์ตี้ rawdata ที่ระบุเส้นทางไปยังไฟล์ GeoJSON, KML หรือ CSV ซึ่งมีข้อมูลที่จะอัปโหลด

คําขอต่อไปนี้ใช้ตัวเลือก curl -F เพื่อระบุเส้นทางไปยังไฟล์ 2 ไฟล์

curl -X POST \
  -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \
  -H "Authorization: Bearer $TOKEN" \
  -H "X-Goog-Upload-Protocol: multipart" \
  -F "metadata=@csv_metadata_file" \
  -F "rawdata=@csv_data_file" \
  "https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"

คำตอบอยู่ในรูปแบบ

{
  "name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER"
}

รับสถานะการประมวลผลข้อมูล

การดำเนินการอัปโหลดเป็นแบบไม่พร้อมกัน ซึ่งหมายความว่าหลังจากการเรียก API เพื่ออัปโหลดข้อมูลไปยังชุดข้อมูลแสดงผลแล้ว คุณต้องตรวจสอบชุดข้อมูลเพื่อดูว่าการนำเข้าและประมวลผลข้อมูลสําเร็จหรือไม่

หากต้องการระบุ state ของชุดข้อมูล ให้ใช้รับชุดข้อมูล เช่น ขณะที่ประมวลผลข้อมูล ระบบจะตั้งค่า state เป็น STATE_PROCESSING เมื่อชุดข้อมูลพร้อมใช้งานในแอป state จะตั้งค่าเป็น STATE_COMPLETED

เช่น เรียกใช้ GET ในชุดข้อมูล

curl -X GET \
  -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46"

state ของชุดข้อมูลจะเท่ากับ STATE_COMPLETED ในกรณีอัปโหลดสําเร็จ

{
  "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
  "displayName": "My Test Dataset",
  "description": " ",
  "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "localFileSource": {
    "filename": "Parks_Properties_20240529.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2024-05-30T16:41:11.130816Z",
  "updateTime": "2024-05-30T16:41:14.416130Z",
  "versionCreateTime": "2024-05-30T16:41:14.416130Z",
  "status": {
    "state": "STATE_COMPLETED",
  },
  "sizeBytes": "6916924",
  "downloadable": true
}

เมื่อการประมวลผลข้อมูลไม่สำเร็จ ระบบจะตั้งค่า state เป็นค่าอื่นที่ไม่ใช่ STATE_COMPLETED เช่น STATE_PUBLISHING_FAILED หรือสถานะใดก็ตามที่ลงท้ายด้วยสตริง _FAILED

เช่น คุณอัปโหลดข้อมูลไปยังชุดข้อมูล แล้วส่งคําขอ GET เพื่อรับรายละเอียดชุดข้อมูล นอกเหนือจากพร็อพเพอร์ตี้ state แล้ว คำตอบยังมีพร็อพเพอร์ตี้ errorMessage รายการเดียวที่มีคำอธิบายข้อผิดพลาดด้วย

{
  "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46",
  "displayName": "My Test Dataset",
  "description": " ",
  "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218",
  "usage": [
    "USAGE_DATA_DRIVEN_STYLING"
  ],
  "localFileSource": {
    "filename": "Parks_Properties_20240529.csv",
    "fileFormat": "FILE_FORMAT_CSV"
  },
  "createTime": "2024-05-30T16:41:11.130816Z",
  "updateTime": "2024-05-30T16:41:14.416130Z",
  "versionCreateTime": "2024-05-30T16:41:14.416130Z",
  "status": {
    "state": "STATE_PUBLISHING_FAILED",
    "errorMessage": "INVALID_ARGUMENT: Skipping row because address could not be geocoded: 5521 18 AVENUE (from line 79)"
  },
  "sizeBytes": "6916924",
  "downloadable": true
}

รับข้อผิดพลาดในการประมวลผลข้อมูล

เมื่อการนำเข้าและการประมวลผลข้อมูลไม่สําเร็จ พร็อพเพอร์ตี้ errorMessage จะมีข้อความเดียวที่อธิบายข้อผิดพลาด อย่างไรก็ตาม ข้อความแสดงข้อผิดพลาดรายการเดียวอาจให้ข้อมูลไม่เพียงพอในการระบุและแก้ไขปัญหา

หากต้องการดูข้อมูลข้อผิดพลาดทั้งหมด ให้เรียกใช้ API ของ fetchDatasetErrors API นี้จะแสดงข้อผิดพลาดในการประมวลผลข้อมูลทั้งหมดที่เชื่อมโยงกับชุดข้อมูล

curl -X GET \
  -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors"

การตอบกลับมีอาร์เรย์ errors อาร์เรย์นี้มีข้อผิดพลาดประเภท Status ไม่เกิน 50 รายการต่อการเรียกใช้ และรองรับข้อผิดพลาดทั้งหมดได้สูงสุด 500 รายการ

{
  "nextPageToken": "cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj",
  "errors": [
    {
      "code": 3,
      "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 631)"
    },
    {
      "code": 3,
      "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 457)"
    },
    {
      "code": 3,
      "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 31)"
    },
    ...
  ]
}

หากมีข้อผิดพลาดมากกว่า 50 ข้อ ซึ่งหมายความว่ามีข้อผิดพลาดมากกว่า 1 หน้า การตอบกลับจะมีโทเค็นหน้าเว็บในช่อง nextPageToken ส่งค่านั้นในพารามิเตอร์การค้นหา pageToken ของคอลที่เรียกใช้ครั้งถัดไปเพื่อรับหน้าถัดไปของข้อผิดพลาด เมื่อ nextPageToken ว่างเปล่า แสดงว่าไม่มีหน้าเว็บอีก

ตัวอย่างเช่น หากต้องการดูหน้าถัดไปของข้อผิดพลาดโดยใช้โทเค็นจากคำตอบก่อนหน้า ให้ทำดังนี้

curl -X GET \
  -H "content-type: application/json" \
  -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \
  -H "Authorization: Bearer $TOKEN" \
  "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors?pageToken=cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj"

โดยค่าเริ่มต้น การตอบกลับจะมีข้อผิดพลาดได้สูงสุด 50 รายการต่อหน้า ใช้พารามิเตอร์การค้นหา pageSize เพื่อควบคุมขนาดหน้า

อัปโหลดข้อมูลใหม่ไปยังชุดข้อมูล

หลังจากสร้างชุดข้อมูลและอัปโหลดข้อมูลเริ่มต้นเรียบร้อยแล้ว ระบบจะตั้งค่าสถานะของชุดข้อมูลเป็น STATE_COMPLETED ซึ่งหมายความว่าชุดข้อมูลพร้อมใช้งานในแอปแล้ว หากต้องการดู state ของชุดข้อมูล ให้ดูที่หัวข้อรับชุดข้อมูล

นอกจากนี้ คุณยังอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้ด้วย หากต้องการอัปโหลดข้อมูลใหม่ ให้ใช้กระบวนการเดียวกับที่ใช้อัปโหลดข้อมูลจาก Cloud Storage หรืออัปโหลดข้อมูลจากไฟล์ แล้วระบุข้อมูลใหม่ที่จะอัปโหลด

หากอัปโหลดข้อมูลใหม่สำเร็จ ให้ทำดังนี้

  • สถานะของชุดข้อมูลเวอร์ชันใหม่คือ STATE_COMPLETED

  • เวอร์ชันใหม่จะกลายเป็นเวอร์ชัน "ใช้งานอยู่" และเป็นเวอร์ชันที่แอปของคุณใช้

หากการอัปโหลดมีข้อผิดพลาด ให้ทำดังนี้

  • สถานะของชุดข้อมูลเวอร์ชันใหม่ได้รับการตั้งค่าเป็นสถานะอย่างใดอย่างหนึ่งต่อไปนี้

    • STATE_IMPORT_FAILED
    • STATE_PROCESSING_FAILED
    • STATE_PUBLISHING_FAILED
    • STATE_DELETION_FAILED
  • เวอร์ชันชุดข้อมูลก่อนหน้าที่อัปเดตสำเร็จจะยังคงเป็นเวอร์ชัน "ที่ใช้งานอยู่" และเป็นเวอร์ชันที่แอปของคุณใช้