Tạo và quản lý tập dữ liệu

Các tập dữ liệu cho phép bạn tải dữ liệu không gian địa lý lên từ một tệp cục bộ hoặc từ Google Cloud Storage lên Nền tảng Google Maps. Sau đó, bạn có thể liên kết một tập dữ liệu với một hoặc nhiều kiểu bản đồ trong Cloud Console. Sau khi liên kết tập dữ liệu với kiểu bản đồ, hãy sử dụng API định kiểu dựa trên dữ liệu để tự động tạo kiểu cho ứng dụng bản đồ.

Bạn cũng có thể sử dụng API REST để tải dữ liệu không gian địa lý lên tập dữ liệu. Để biết thêm thông tin, hãy xem bài viết API Tập dữ liệu Maps

Định cấu hình vai trò

Để tạo và quản lý tập dữ liệu trong một dự án trên Google Cloud, bạn phải có vai trò IAM của chủ sở hữu hoặc người chỉnh sửa đối với dự án.

Ngoài ra, bạn có thể chỉ định các vai trò IAM sau đây cho tài khoản người dùng hoặc tài khoản dịch vụ mà bạn dùng để quản lý tập dữ liệu:

  • Vai trò Maps Platform Datasets Admin cấp cho người dùng hoặc tài khoản dịch vụ quyền đọc/ghi đối với các tập dữ liệu trong dự án. Vai trò này cho phép người dùng thực hiện tất cả các thao tác trên một tập dữ liệu.
  • Vai trò Maps Platform Datasets Viewer cấp quyền chỉ có thể đọc vào các tập dữ liệu trong dự án. Vai trò này cho phép bạn thực hiện thao tác danh sách, lấy hoặc tải xuống đối với một tập dữ liệu.

Để biết thêm thông tin, hãy xem bài viết Cấp vai trò IAM bằng bảng điều khiển Google Cloud.

Nguồn dữ liệu cho một tập dữ liệu

Sau khi bạn tạo tập dữ liệu, hãy tải dữ liệu lên tập dữ liệu đó từ Google Cloud Storage hoặc từ một tệp cục bộ.
  • Khi tải dữ liệu lên từ Cloud Storage, hãy chỉ định đường dẫn tệp đến tài nguyên chứa dữ liệu trong Cloud Storage. Đường dẫn này có dạng gs://GCS_BUCKET/FILE.

    Người dùng đưa ra yêu cầu cần có vai trò Người xem đối tượng bộ nhớ hoặc bất kỳ vai trò nào khác có quyền storage.objects.get. Để biết thêm thông tin về cách quản lý quyền truy cập vào Cloud Storage, hãy xem bài viết Tổng quan về việc kiểm soát quyền truy cập.

  • Khi tải dữ liệu lên từ một tệp cục bộ, hãy chỉ định đường dẫn đến tệp GeoJSON, KML hoặc CSV chứa dữ liệu cần tải lên.

Điều kiện tiên quyết

Khi tạo tập dữ liệu:

  • Tên hiển thị không được trùng lặp trong dự án của bạn trên Google Cloud.
  • Tên hiển thị phải nhỏ hơn 64 byte (Vì các ký tự này được biểu thị bằng UTF-8, nên trong một số ngôn ngữ, mỗi ký tự có thể được biểu thị bằng nhiều byte).
  • Nội dung mô tả phải nhỏ hơn 1000 byte.

Khi tải dữ liệu lên:

  • Các loại tệp được hỗ trợ là CSV, GeoJSON và KML.
  • Kích thước tệp tối đa được hỗ trợ là 350 MB.
  • Tên cột thuộc tính không được bắt đầu bằng chuỗi "?_".
  • Hình ba chiều không được hỗ trợ. Dữ liệu này bao gồm hậu tố "Z" ở định dạng WKT và toạ độ độ cao ở định dạng GeoJSON.

Yêu cầu về GeoJSON

API JavaScript của Maps hỗ trợ thông số kỹ thuật của GeoJSON hiện tại. API JavaScript của Maps cũng hỗ trợ các tệp GeoJSON chứa bất kỳ loại đối tượng nào sau đây:

  • Đối tượng hình học. Đối tượng hình học là một hình dạng không gian, được mô tả dưới dạng một sự kết hợp của các điểm, đường kẻ và đa giác có các lỗ tuỳ chọn.
  • Đối tượng tính năng. Đối tượng tính năng chứa một hình cùng với các cặp tên/giá trị khác, có ý nghĩa dành riêng cho ứng dụng.
  • Bộ sưu tập tính năng. Bộ sưu tập đối tượng là một tập hợp các đối tượng đối tượng.

API JavaScript của Maps không hỗ trợ các tệp GeoJSON có dữ liệu trong hệ thống tham chiếu toạ độ (CRS) ngoài WGS84.

Để biết thêm thông tin về GeoJSON, hãy xem nội dung tuân thủ RFC 7946.

Yêu cầu về KML

API JavaScript của Maps có các yêu cầu sau:

  • Tất cả URL phải là URL cục bộ (hoặc có liên quan) với chính tệp đó.
  • Hỗ trợ hình học điểm, đường và đa giác.
  • Mọi thuộc tính dữ liệu đều được xem là chuỗi.
Các tính năng KML sau đây không được hỗ trợ:
  • Biểu tượng hoặc <styleUrl> được xác định bên ngoài tệp.
  • Đường liên kết mạng, chẳng hạn như <NetworkLink>
  • Lớp phủ mặt đất, chẳng hạn như <GroundOverlay>
  • Hình học 3D hoặc bất kỳ thẻ liên quan đến độ cao nào như <altitudeMode>
  • Các thông số kỹ thuật của máy ảnh như <LookAt>
  • Kiểu được xác định bên trong tệp KML.

Yêu cầu đối với tệp CSV

Đối với tệp CSV, tên cột được hỗ trợ được liệt kê dưới đây theo thứ tự ưu tiên:

  • latitude, longitude
  • lat, long
  • x, y
  • wkt (Văn bản quen thuộc)
  • address, city, state, zip
  • address
  • Một cột duy nhất chứa tất cả thông tin địa chỉ, chẳng hạn như 1600 Amphitheatre Parkway Mountain View, CA 94043

Ví dụ: tệp của bạn chứa các cột có tên x, ywkt. Vì xy có mức độ ưu tiên cao hơn, như được xác định theo thứ tự của các tên cột được hỗ trợ trong danh sách trên, nên các giá trị trong cột xy sẽ được dùng và cột wkt sẽ bị bỏ qua.

Ngoài ra:

  • Mỗi tên cột phải thuộc một cột duy nhất. Điều đó có nghĩa là bạn không thể tạo một cột có tên là xy chứa cả dữ liệu toạ độ x và y. Toạ độ x và y phải nằm trong các cột riêng biệt.
  • Tên cột không phân biệt chữ hoa chữ thường.
  • Thứ tự của các tên cột không quan trọng. Ví dụ: nếu tệp CSV của bạn chứa cột latlong, các cột này có thể xuất hiện theo thứ tự bất kỳ.

Xử lý lỗi tải lên dữ liệu

Khi tải dữ liệu lên một tập dữ liệu, bạn có thể gặp một trong các lỗi phổ biến được mô tả trong phần này.

Lỗi GeoJSON

Các lỗi GeoJSON thường gặp bao gồm:

  • Thiếu trường type hoặc type không phải là một chuỗi. Tệp dữ liệu GeoJSON mà bạn tải lên phải chứa một trường chuỗi có tên type trong mỗi định nghĩa đối tượng Tính năng và đối tượng Hình học.

Lỗi KML

Các lỗi KML phổ biến bao gồm:

  • Tệp dữ liệu không được chứa bất kỳ tính năng KML nào không được hỗ trợ nêu trên, nếu không, bạn có thể không nhập được dữ liệu.

Lỗi CSV

Các lỗi CSV thường gặp bao gồm:

  • Một số hàng thiếu giá trị cho một cột hình. Tất cả các hàng trong tệp CSV phải chứa giá trị không được trống cho các cột hình học. Các cột hình học bao gồm:
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state, zip
    • address
    • Một cột duy nhất chứa tất cả thông tin địa chỉ, chẳng hạn như 1600 Amphitheatre Parkway Mountain View, CA 94043
  • Nếu xy là các cột hình học, hãy đảm bảo đơn vị là kinh độ và vĩ độ. Một số tập dữ liệu công khai sử dụng các hệ thống toạ độ khác nhau dưới tiêu đề xy. Nếu bạn sử dụng sai đơn vị, tập dữ liệu có thể được nhập thành công, nhưng dữ liệu được kết xuất có thể hiển thị các điểm tập dữ liệu ở những vị trí không mong muốn.

Tạo tập dữ liệu

Cách tạo tập dữ liệu:

  1. Trong Google Cloud Console, hãy chuyển đến trang Tập dữ liệu.
  2. Nhấp vào Tạo tập dữ liệu.
  3. Nhập tên tập dữ liệu. Tên không được trùng lặp trong tất cả các tập dữ liệu.
  4. Nhập Nội dung mô tả tập dữ liệu (không bắt buộc).
  5. Nhấp vào Tiếp tục. Trang Nhập dữ liệu xuất hiện.
  6. Chọn Upload source (Nguồn tải lên) của dữ liệu dùng để điền vào tập dữ liệu dưới dạng Desktop (Máy tính), nghĩa là một tệp cục bộ trên hệ thống của bạn, hoặc Google Cloud Storage (Bộ chứa Google Cloud Storage).
    • Đối với Desktop (Máy tính), hãy nhấp vào Browse (Duyệt qua) rồi chọn tệp trong trình chọn tệp.
    • Đối với bộ chứa Google Cloud Storage, hãy nhấp vào Duyệt qua rồi chọn bộ chứa và tệp chứa dữ liệu.
  7. Chọn Định dạng tệp.
  8. Nhấp vào Tiếp tục để xem lại các chế độ cài đặt của bạn.
  9. Nhấp vào Tạo. Trang Tập dữ liệu xuất hiện và cho thấy tập dữ liệu mới của bạn. Trạng thái sẽ là Đang xử lý.
  10. Chờ cho đến khi tập dữ liệu của bạn có trạng thái Đã hoàn tất.

Xem hoặc sửa đổi tập dữ liệu

Sau khi bạn tạo thành công một tập dữ liệu, trạng thái của tập dữ liệu đó sẽ là Đã hoàn tất. Sau đó, bạn có thể kiểm tra các chi tiết của tập dữ liệu.

Cách xem tập dữ liệu:

  1. Trong Google Cloud Console, hãy chuyển đến trang Tập dữ liệu.
  2. Nhấp vào tên của tập dữ liệu. Trang Thông tin chi tiết về tập dữ liệu sẽ xuất hiện.
    1. Nhấp vào thẻ Chi tiết để xem thông tin về tập dữ liệu. Trên thẻ này, bạn cũng có thể chỉnh sửa tên và nội dung mô tả tập dữ liệu.
    2. Nhấp vào thẻ Xem trước để xem tập dữ liệu của bạn trên bản đồ.
    3. Nhấp vào thẻ Dữ liệu trong bảng để xem một nhóm nhỏ dữ liệu được liên kết với tập dữ liệu.
    4. Nhấp vào nút Download (Tải xuống) để tải dữ liệu xuống một tệp cục bộ.
    5. Nhấp vào nút Delete (Xoá) để xoá tập dữ liệu.