การสร้างชุดข้อมูลเป็นกระบวนการที่มี 2 ขั้นตอน ดังนี้
ส่งคําขอสร้างชุดข้อมูล
ส่งคำขอเพื่ออัปโหลดข้อมูลไปยังชุดข้อมูล
หลังจากอัปโหลดข้อมูลครั้งแรกแล้ว คุณสามารถอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้
สร้างชุดข้อมูล
สร้างชุดข้อมูลโดยการส่งคําขอ POST
ไปยังปลายทาง datasets
https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets
ส่งเนื้อหา JSON ไปยังคำขอที่กําหนดชุดข้อมูล คุณต้องปฏิบัติดังนี้
ระบุ
displayName
ของชุดข้อมูล ค่าของdisplayName
สำหรับชุดข้อมูลทั้งหมดต้องไม่ซ้ำกันตั้งค่า
usage
เป็นUSAGE_DATA_DRIVEN_STYLING
เช่น
curl -X POST -d '{ "displayName": "My Test Dataset", "usage": "USAGE_DATA_DRIVEN_STYLING" }' \ -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \ -H 'Content-Type: application/json' \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets"
การตอบกลับจะมีรหัสของชุดข้อมูลในรูปแบบ projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID
พร้อมด้วยข้อมูลเพิ่มเติม ใช้รหัสชุดข้อมูลเมื่อส่งคำขออัปเดตหรือแก้ไขชุดข้อมูล
{ "name": "projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46", "displayName": "My Test Dataset", "usage": [ "USAGE_DATA_DRIVEN_STYLING" ], "createTime": "2022-08-15T17:50:00.189682Z", "updateTime": "2022-08-15T17:50:00.189682Z" }
อัปโหลดข้อมูลไปยังชุดข้อมูล
หลังจากที่สร้างชุดข้อมูลแล้ว ให้อัปโหลดข้อมูลจาก Google Cloud Storage หรือจากไฟล์ในเครื่องไปยังชุดข้อมูล
การดำเนินการอัปโหลดจะเป็นแบบไม่พร้อมกัน หลังจากที่อัปโหลดข้อมูลแล้ว ระบบจะ นำเข้าและประมวลผลข้อมูล ซึ่งหมายความว่าคุณต้องส่งคําขอ HTTP GET เพื่อตรวจสอบสถานะชุดข้อมูลเพื่อดูว่าชุดข้อมูลพร้อมใช้งานเมื่อใดหรือมีข้อผิดพลาดใดๆ เกิดขึ้นหรือไม่ ดูข้อมูลเพิ่มเติมได้ที่ดูสถานะการประมวลผลข้อมูล
อัปโหลดข้อมูลจาก Cloud Storage
คุณอัปโหลดจาก Cloud Storage ไปยังชุดข้อมูลโดยการส่งคำขอ POST
ไปยังปลายทางชุดข้อมูลที่มีรหัสของชุดข้อมูลดังนี้
https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import
ในส่วนเนื้อหาคำขอ JSON
ใช้
inputUri
เพื่อระบุเส้นทางของไฟล์ไปยังทรัพยากรที่มีข้อมูลใน Cloud Storage เส้นทางนี้อยู่ในรูปแบบgs://GCS_BUCKET/FILE
ผู้ใช้ที่ส่งคำขอต้องมีบทบาทผู้ดูออบเจ็กต์พื้นที่เก็บข้อมูล หรือบทบาทอื่นๆ ที่มีสิทธิ์
storage.objects.get
ดูข้อมูลเพิ่มเติมเกี่ยวกับการจัดการสิทธิ์เข้าถึง Cloud Storage ได้ที่ภาพรวมการควบคุมการเข้าถึงใช้
fileFormat
เพื่อระบุรูปแบบไฟล์ของข้อมูลเป็นFILE_FORMAT_GEOJSON
(ไฟล์ GeoJson),FILE_FORMAT_KML
(ไฟล์ KML) หรือFILE_FORMAT_CSV
(ไฟล์ CSV)
เช่น
curl -X POST -d '{ "gcs_source":{ "inputUri": "gs://my_bucket/my_csv_file", "fileFormat": "FILE_FORMAT_CSV" } }' \ -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \ -H "content-type: application/json" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"
คำตอบอยู่ในรูปแบบ
{ "name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER" }
อัปโหลดข้อมูลจากไฟล์
หากต้องการอัปโหลดข้อมูลจากไฟล์ ให้ส่งPOST
คําขอ HTTP ไปยังปลายทาง datasets ที่มีรหัสของชุดข้อมูลด้วย ดังนี้
https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID:import
คำขอประกอบด้วย:
ตั้งค่าส่วนหัว
Goog-Upload-Protocol
เป็นmultipart
พร็อพเพอร์ตี้
metadata
ที่ระบุเส้นทางไปยังไฟล์ที่ระบุประเภทข้อมูลที่จะอัปโหลด เป็นFILE_FORMAT_GEOJSON
(ไฟล์ GeoJSON),FILE_FORMAT_KML
(ไฟล์ KML) หรือFILE_FORMAT_CSV
(ไฟล์ CSV)เนื้อหาของไฟล์นี้มีรูปแบบดังนี้
{"local_file_source": {"file_format": "FILE_FORMAT_GEOJSON"}}
พร็อพเพอร์ตี้
rawdata
ที่ระบุเส้นทางไปยังไฟล์ GeoJSON, KML หรือ CSV ที่มีข้อมูลที่จะอัปโหลด
คำขอต่อไปนี้ใช้ตัวเลือก curl -F
เพื่อระบุเส้นทางไปยังทั้ง 2 ไฟล์
curl -X POST \ -H 'X-Goog-User-Project: PROJECT_NUMBER_OR_ID' \ -H "Authorization: Bearer $TOKEN" \ -H "X-Goog-Upload-Protocol: multipart" \ -F "metadata=@csv_metadata_file" \ -F "rawdata=@csv_data_file" \ "https://mapsplatformdatasets.googleapis.com/upload/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:import"
คำตอบจะอยู่ในรูปแบบดังนี้
{ "name": "projects/PROJECT_NUMBER_OR_ID/datasets/DATASET_ID@VERSION_NUMBER" }
รับสถานะการประมวลผลข้อมูล
การดำเนินการอัปโหลดเป็นแบบไม่พร้อมกัน ซึ่งหมายความว่าหลังจากการเรียก API เพื่ออัปโหลดข้อมูลไปยังชุดข้อมูลที่แสดงผล คุณจะต้องสำรวจชุดข้อมูลเพื่อระบุว่าการส่งผ่านข้อมูลและประมวลผลข้อมูลสำเร็จหรือล้มเหลว
หากต้องการระบุ state
ของชุดข้อมูล ให้ใช้รับชุดข้อมูล เช่น ขณะที่ประมวลผลข้อมูล ระบบจะตั้งค่า state
เป็น STATE_PROCESSING
เมื่อชุดข้อมูลพร้อมใช้งานในแอป state
จะตั้งค่าเป็น STATE_COMPLETED
ตัวอย่างเช่น เรียก GET บนชุดข้อมูลดังนี้
curl -X GET \ -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46"
state
ของชุดข้อมูลคือ STATE_COMPLETED
เพื่อให้อัปโหลดได้สำเร็จ
{ "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46", "displayName": "My Test Dataset", "description": " ", "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218", "usage": [ "USAGE_DATA_DRIVEN_STYLING" ], "localFileSource": { "filename": "Parks_Properties_20240529.csv", "fileFormat": "FILE_FORMAT_CSV" }, "createTime": "2024-05-30T16:41:11.130816Z", "updateTime": "2024-05-30T16:41:14.416130Z", "versionCreateTime": "2024-05-30T16:41:14.416130Z", "status": { "state": "STATE_COMPLETED", }, "sizeBytes": "6916924", "downloadable": true }
เมื่อการประมวลผลข้อมูลล้มเหลว state
จะถูกตั้งค่าเป็นค่าอื่นที่ไม่ใช่ STATE_COMPLETED
เช่น STATE_PUBLISHING_FAILED
หรือสถานะใดๆ ที่ลงท้ายด้วยสตริง _FAILED
เช่น คุณอัปโหลดข้อมูลไปยังชุดข้อมูลแล้วส่งคำขอ GET เพื่อรับรายละเอียดชุดข้อมูล นอกเหนือจากพร็อพเพอร์ตี้ state
แล้ว คำตอบยังมีพร็อพเพอร์ตี้ errorMessage
รายการเดียวที่มีคำอธิบายข้อผิดพลาดด้วย
{ "name": "projects/119757857/datasets/f57074a0-a8b6-403e-9df1-e9fc46", "displayName": "My Test Dataset", "description": " ", "versionId": "837c5a9e-c885-4a5f-a462-7e35673e5218", "usage": [ "USAGE_DATA_DRIVEN_STYLING" ], "localFileSource": { "filename": "Parks_Properties_20240529.csv", "fileFormat": "FILE_FORMAT_CSV" }, "createTime": "2024-05-30T16:41:11.130816Z", "updateTime": "2024-05-30T16:41:14.416130Z", "versionCreateTime": "2024-05-30T16:41:14.416130Z", "status": { "state": "STATE_PUBLISHING_FAILED", "errorMessage": "INVALID_ARGUMENT: Skipping row because address could not be geocoded: 5521 18 AVENUE (from line 79)" }, "sizeBytes": "6916924", "downloadable": true }
รับข้อผิดพลาดในการประมวลผลข้อมูล
เมื่อการนำเข้าและการประมวลผลข้อมูลไม่สําเร็จ พร็อพเพอร์ตี้ errorMessage
จะมีข้อความเดียวที่อธิบายข้อผิดพลาด อย่างไรก็ตาม ข้อความแสดงข้อผิดพลาดรายการเดียวอาจให้ข้อมูลไม่เพียงพอในการระบุและแก้ไขปัญหา
หากต้องการดูข้อมูลข้อผิดพลาดทั้งหมด ให้เรียกใช้ API ของ fetchDatasetErrors
API นี้จะแสดงข้อผิดพลาดในการประมวลผลข้อมูลทั้งหมดที่เกี่ยวข้องกับชุดข้อมูล:
curl -X GET \ -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors"
การตอบกลับจะมีอาร์เรย์ errors
อาร์เรย์นี้มีข้อผิดพลาดประเภท Status
สูงสุด 50 รายการต่อการเรียก และรองรับข้อผิดพลาดทั้งหมดสูงสุด 500 รายการ ดังนี้
{ "nextPageToken": "cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj", "errors": [ { "code": 3, "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 631)" }, { "code": 3, "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 457)" }, { "code": 3, "message": "INVALID_ARGUMENT: No address was derived from fields 2. (from line 31)" }, ... ] }
หากมีข้อผิดพลาดมากกว่า 50 รายการ หมายความว่ามีข้อผิดพลาดมากกว่า 1 หน้า การตอบกลับจะมีโทเค็นของหน้าในช่อง nextPageToken
โปรดส่งค่าดังกล่าวในพารามิเตอร์การค้นหา pageToken
ของการเรียกครั้งต่อๆ ไปเพื่อรับข้อผิดพลาดหน้าถัดไป เมื่อ nextPageToken
ว่างเปล่า ระบบจะไม่มีหน้าเพิ่มเติม
เช่น หากต้องการดูข้อผิดพลาดหน้าถัดไปโดยใช้โทเค็นจากการตอบกลับก่อนหน้า ให้ทำดังนี้
curl -X GET \ -H "content-type: application/json" \ -H "X-Goog-User-Project: PROJECT_NUMBER_OR_ID" \ -H "Authorization: Bearer $TOKEN" \ "https://mapsplatformdatasets.googleapis.com/v1/projects/PROJECT_NUMBER_OR_ID/datasets/f57074a0-a8b6-403e-9df1-e9fc46:fetchDatasetErrors?pageToken=cigKJkIkMTU3MzM0NjQtYzlmMy00YzYxLWIxM2YtYmVkYjFjYjRkYzRj"
โดยค่าเริ่มต้น การตอบกลับจะมีข้อผิดพลาดได้สูงสุด 50 รายการต่อหน้า ใช้พารามิเตอร์การค้นหา pageSize
เพื่อควบคุมขนาดหน้า
อัปโหลดข้อมูลใหม่ไปยังชุดข้อมูล
หลังจากสร้างชุดข้อมูลและอัปโหลดข้อมูลเริ่มต้นเรียบร้อยแล้ว ระบบจะตั้งค่าสถานะของชุดข้อมูลเป็น STATE_COMPLETED
ซึ่งหมายความว่าชุดข้อมูลพร้อมใช้งานในแอปแล้ว หากต้องการดู state
ของชุดข้อมูล ให้ดูรับชุดข้อมูล
คุณยังอัปโหลดข้อมูลใหม่ไปยังชุดข้อมูลเพื่อสร้างชุดข้อมูลเวอร์ชันใหม่ได้อีกด้วย หากต้องการอัปโหลดข้อมูลใหม่ ให้ใช้กระบวนการเดียวกับที่ใช้อัปโหลดข้อมูลจาก Cloud Storage หรืออัปโหลดข้อมูลจากไฟล์ แล้วระบุข้อมูลใหม่ที่จะอัปโหลด
หากข้อมูลใหม่อัปโหลดสำเร็จ
สถานะของชุดข้อมูลเวอร์ชันใหม่ได้รับการตั้งค่าเป็น
STATE_COMPLETED
เวอร์ชันใหม่จะกลายเป็นเวอร์ชัน "ใช้งานอยู่" และเป็นเวอร์ชันที่แอปของคุณใช้
หากการอัปโหลดมีข้อผิดพลาด ให้ทำดังนี้
สถานะของชุดข้อมูลเวอร์ชันใหม่ได้รับการตั้งค่าเป็นสถานะอย่างใดอย่างหนึ่งต่อไปนี้
STATE_IMPORT_FAILED
STATE_PROCESSING_FAILED
STATE_PUBLISHING_FAILED
STATE_DELETION_FAILED
ชุดข้อมูลเวอร์ชันก่อนหน้าที่สำเร็จจะยังคงเป็นเวอร์ชัน "ใช้งาน" และเป็นเวอร์ชันที่แอปของคุณใช้