Tạo và quản lý tập dữ liệu

Chọn nền tảng: Android iOS JavaScript

Tập dữ liệu cho phép bạn tải dữ liệu không gian địa lý lên từ một tệp cục bộ hoặc từ Google Cloud Storage Nền tảng Google Maps. Sau đó, bạn có thể liên kết tập dữ liệu với một hoặc nhiều kiểu bản đồ trong bảng điều khiển Cloud. Sau khi liên kết tập dữ liệu với kiểu bản đồ, hãy sử dụng thuộc tính API định kiểu dựa trên dữ liệu để tạo kiểu linh động cho ứng dụng bản đồ của bạn.

Bạn cũng có thể sử dụng API REST để tải dữ liệu không gian địa lý lên một tập dữ liệu. Để biết thêm thông tin, xem API Tập dữ liệu Maps

Định cấu hình vai trò

Để tạo và quản lý tập dữ liệu trong một dự án trên Google Cloud, bạn phải có Vai trò quản lý danh tính và quyền truy cập (IAM) là chủ sở hữu hoặc Người chỉnh sửa cho dự án này.

Ngoài ra, bạn có thể chỉ định các vai trò IAM sau đây cho một tài khoản người dùng hoặc tài khoản dịch vụ mà bạn sử dụng để quản lý tập dữ liệu:

  • Vai trò Maps Platform Datasets Admin cấp tài khoản người dùng hoặc tài khoản dịch vụ quyền đọc/ghi vào các tập dữ liệu trong dự án. Vai trò này cho phép người dùng thực hiện tất cả thao tác trên một tập dữ liệu.
  • Vai trò Maps Platform Datasets Viewer cấp quyền chỉ có thể đọc cho các tập dữ liệu trong dự án. Vai trò này cho phép bạn tạo một danh sách, tải hoặc tải xuống trên tập dữ liệu.

Để biết thêm thông tin, hãy xem Cấp vai trò IAM bằng cách sử dụng bảng điều khiển Google Cloud.

Nguồn dữ liệu cho một tập dữ liệu

Sau khi bạn tạo tập dữ liệu, hãy tải dữ liệu lên tập dữ liệu từ Bộ nhớ Google Cloud hoặc từ một tệp cục bộ.
  • Khi tải dữ liệu lên từ Cloud Storage, hãy chỉ định đường dẫn tệp đến tài nguyên chứa dữ liệu trong Cloud Storage. Đường dẫn này có trong biểu mẫu gs://GCS_BUCKET/FILE.

    Người dùng đưa ra yêu cầu cần có Trình xem đối tượng lưu trữ hoặc bất kỳ vai trò nào khác có quyền storage.objects.get. Để biết thêm thông tin về cách quản lý quyền truy cập vào Cloud Storage, hãy xem Tổng quan về kiểm soát quyền truy cập.

  • Khi tải dữ liệu lên từ một tệp cục bộ, hãy chỉ định đường dẫn đến tệp GeoJSON, KML hoặc CSV chứa dữ liệu cần tải lên.

Điều kiện tiên quyết

Khi tạo tập dữ liệu:

  • Tên hiển thị phải là duy nhất trong dự án Google Cloud của bạn.
  • Tên hiển thị phải nhỏ hơn 64 byte (Vì các ký tự này được biểu thị bằng UTF-8, ở một số ngôn ngữ, mỗi ký tự có thể được biểu thị bằng nhiều byte).
  • Nội dung mô tả phải nhỏ hơn 1000 byte.

Khi tải dữ liệu lên:

  • Các loại tệp được hỗ trợ là CSV, GeoJSON và KML.
  • Kích thước tệp tối đa được hỗ trợ là 500 MB.
  • Tên cột thuộc tính không được bắt đầu bằng chuỗi "?_".
  • Hình học 3 chiều không được hỗ trợ. bao gồm cả "Z" hậu tố ở định dạng WKT, và toạ độ cao độ ở định dạng GeoJSON.

Các phương pháp hay nhất để chuẩn bị dữ liệu

Nếu dữ liệu nguồn của bạn phức tạp hoặc lớn, chẳng hạn như các điểm dày đặc, chuỗi đường dài hoặc đa giác (thường có kích thước tệp nguồn lớn hơn 50 MB thuộc danh mục này), hãy cân nhắc đơn giản hoá dữ liệu trước khi tải lên để đạt được hiệu suất tốt nhất trong bản đồ trực quan.

Dưới đây là một số phương pháp hay nhất để chuẩn bị dữ liệu:

  1. Giảm thiểu các thuộc tính của tính năng. Chỉ giữ lại các thuộc tính của đối tượng cần thiết để tạo kiểu bản đồ của bạn, ví dụ: "id" và "category". Bạn có thể kết hợp các thuộc tính khác với một đối tượng trong ứng dụng bằng cách sử dụng các kiểu theo hướng dữ liệu trên một khoá nhận dạng duy nhất. Ví dụ: hãy xem Xem dữ liệu của bạn theo thời gian thực bằng tính năng Tạo kiểu dựa trên dữ liệu.
  2. Sử dụng các kiểu dữ liệu đơn giản cho đối tượng thuộc tính nếu có thể, chẳng hạn như số nguyên, để giảm thiểu kích thước ô và cải thiện hiệu suất của bản đồ.
  3. Đơn giản hoá các hình học phức tạp trước khi tải tệp lên. Bạn có thể thực hiện việc này trong công cụ không gian địa lý mà bạn chọn, chẳng hạn như mã nguồn mở Tiện ích Mapshaper.org hoặc trong BigQuery sử dụng ST_Simplify trên hình học đa giác phức tạp.
  4. Nhóm các điểm rất dày đặc trước khi tải tệp lên. Bạn có thể thực hiện việc này trong công cụ không gian địa lý mà bạn chọn, chẳng hạn như mã nguồn mở hàm cụm turf.js hoặc trong BigQuery sử dụng ST_CLUSTERDBSCAN trên hình học điểm dày đặc.

Xem thêm hướng dẫn về các phương pháp hay nhất về tập dữ liệu trong Trực quan hoá dữ liệu bằng Tập dữ liệu và BigQuery.

Yêu cầu về GeoJSON

SDK bản đồ dành cho Android hỗ trợ Quy cách GeoJSON. SDK bản đồ dành cho Android cũng hỗ trợ các tệp GeoJSON chứa bất kỳ loại đối tượng nào sau đây:

  • Đối tượng hình học. Đối tượng hình học là một hình dạng không gian, được mô tả là một điểm hợp nhất gồm các điểm, đường và đa giác có lỗ tuỳ chọn.
  • Đối tượng đối tượng. Đối tượng đối tượng chứa một hình học cộng thêm các cặp tên/giá trị, có ý nghĩa dành riêng cho ứng dụng.
  • Bộ sưu tập tính năng. Tập hợp tính năng là một tập hợp các đối tượng tính năng.

SDK bản đồ dành cho Android không hỗ trợ các tệp GeoJSON có dữ liệu trong hệ thống tham chiếu toạ độ (CRS) khác với WGS84.

Để biết thêm thông tin về GeoJSON, hãy xem Tuân thủ RFC 7946.

Yêu cầu đối với KML

SDK Bản đồ dành cho Android có các yêu cầu sau:

  • Tất cả URL phải cục bộ (hoặc tương đối) với chính tệp đó.
  • Các hình học điểm, đường và đa giác được hỗ trợ.
  • Tất cả thuộc tính dữ liệu đều được coi là chuỗi.
Các tính năng KML sau đây không được hỗ trợ:
  • Các biểu tượng hoặc <styleUrl> được xác định bên ngoài tệp.
  • Đường liên kết mạng, chẳng hạn như <NetworkLink>
  • Lớp phủ mặt đất, chẳng hạn như <GroundOverlay>
  • Hình học 3D hoặc bất kỳ thẻ nào liên quan đến độ cao như <altitudeMode>
  • Thông số kỹ thuật của camera, chẳng hạn như <LookAt>
  • Kiểu được xác định trong tệp KML.

Yêu cầu về tệp CSV

Đối với tệp CSV, tên cột được hỗ trợ được liệt kê theo mức độ ưu tiên bên dưới:

  • latitude, longitude
  • lat, long
  • x, y
  • wkt (Văn bản dễ biết)
  • address, city, state, zip
  • address
  • Một cột chứa tất cả thông tin về địa chỉ, chẳng hạn như 1600 Amphitheatre Parkway Mountain View, CA 94043

Ví dụ: tệp của bạn chứa các cột có tên x, ywkt. Vì xy có mức độ ưu tiên cao hơn, như được xác định theo thứ tự của tên cột được hỗ trợ trong danh sách ở trên, giá trị trong cột xy được sử dụng và cột wkt bị bỏ qua.

Ngoài ra:

  • Mỗi tên cột phải thuộc về một cột duy nhất. Tức là bạn không thể có cột có tên xy chứa cả dữ liệu toạ độ x và y. Toạ độ x và y phải nằm trong các cột riêng biệt.
  • Tên cột không phân biệt chữ hoa chữ thường.
  • Thứ tự tên cột không quan trọng. Ví dụ: nếu tệp CSV của bạn chứa latlong, các cột này có thể xuất hiện theo thứ tự bất kỳ.

Xử lý lỗi tải dữ liệu lên

Khi tải dữ liệu lên một tập dữ liệu, bạn có thể gặp phải một trong những lỗi phổ biến như mô tả trong bài viết này .

Lỗi GeoJSON

Các lỗi GeoJSON phổ biến bao gồm:

  • Thiếu trường type hoặc type không phải là một chuỗi. URL được tải lên Tệp dữ liệu GeoJSON phải chứa một trường chuỗi có tên type trong mỗi chuỗi Định nghĩa đối tượng đối tượng và đối tượng Hình học.

Lỗi KML

Các lỗi KML phổ biến bao gồm:

  • Tệp dữ liệu không được chứa bất kỳ đối tượng KML nào không được hỗ trợ nêu trên, nếu không có thể không nhập được dữ liệu.

Lỗi CSV

Các lỗi CSV thường gặp bao gồm:

  • Một số hàng bị thiếu giá trị cho một cột hình học. Tất cả các hàng trong tệp CSV phải chứa giá trị không trống cho các cột hình học. Các cột hình học bao gồm:
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state, zip
    • address
    • Một cột chứa tất cả thông tin về địa chỉ, chẳng hạn như 1600 Amphitheatre Parkway Mountain View, CA 94043
  • Nếu xy là cột hình học, hãy đảm bảo các đơn vị kinh độ và vĩ độ. Một số tập dữ liệu công khai sử dụng các hệ thống toạ độ khác nhau dưới các tiêu đề xy. Nếu sử dụng sai đơn vị, tập dữ liệu có thể nhập nhưng dữ liệu hiển thị có thể cho thấy các điểm tập dữ liệu ở những vị trí không mong muốn.

Tạo tập dữ liệu

Cách tạo tập dữ liệu:

  1. Trong Google Cloud Console, hãy truy cập vào trang Tập dữ liệu.
  2. Nhấp vào Tạo tập dữ liệu.
  3. Nhập tên tập dữ liệu. Tên phải là duy nhất trong số tất cả các tập dữ liệu.
  4. Nhập Mô tả tập dữ liệu (không bắt buộc).
  5. Nhấp vào Tiếp tục. Trang Nhập dữ liệu xuất hiện.
  6. Chọn Nguồn tải lên của dữ liệu được dùng để điền tập dữ liệu dưới dạng Desktop (Máy tính), nghĩa là một tệp cục bộ trên hệ thống của bạn, hoặc Bộ chứa Google Cloud Storage.
    • Đối với Desktop (Máy tính), hãy nhấp vào Browse (Duyệt qua) rồi chọn tệp trong trình chọn tệp.
    • Đối với bộ chứa Google Cloud Storage, hãy nhấp vào Browse (Duyệt qua) rồi chọn nhóm và tệp chứa dữ liệu.
  7. Chọn Định dạng tệp.
  8. Nhấp vào Tiếp tục để xem lại các chế độ cài đặt của bạn.
  9. Nhấp vào Tạo. Trang Tập dữ liệu xuất hiện cho thấy tập dữ liệu. Trạng thái sẽ là Đang xử lý.

    Nếu tải dữ liệu lên thành công:

    • Trạng thái của tập dữ liệu được đặt thành COMPLETED (ĐÃ HOÀN TẤT).
    • Tập dữ liệu trở thành trạng thái "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

    Nếu có lỗi khi tải lên:

    • Trạng thái của phiên bản tập dữ liệu mới được đặt thành một trạng thái không phải là ĐÃ HOÀN TẤT.

Xem hoặc sửa đổi tập dữ liệu

Sau khi tạo tập dữ liệu, bạn có thể xem hoặc sửa đổi tập dữ liệu đó:

  1. Trong Google Cloud Console, hãy truy cập vào trang Tập dữ liệu.
  2. Nhấp vào tên của tập dữ liệu. Trang Thông tin chi tiết về tập dữ liệu sẽ xuất hiện.
    1. Nhấp vào thẻ Chi tiết để xem thông tin về tập dữ liệu. Trên thẻ này bạn cũng có thể chỉnh sửa tên tập dữ liệu và nội dung mô tả.
    2. Nhấp vào tab Xem trước để xem tập dữ liệu của bạn trên bản đồ (tập dữ liệu có trạng thái chỉ là COMPLETED hoặc REVERTED).
    3. Nhấp vào tab Dữ liệu bảng để xem tất cả các thuộc tính của tập dữ liệu (tập dữ liệu) có trạng thái là COMPLETED (ĐÃ HOÀN TẤT) hoặc chỉ REVERTED (ĐÃ HOÀN TẤT). Đây là các thuộc tính mà bạn có thể sử dụng để tạo kiểu cho tập dữ liệu trên bản đồ.
    4. Nhấp vào nút Tải xuống để tải dữ liệu xuống tệp cục bộ.
    5. Nhấp vào nút Xoá để xoá tập dữ liệu.
    6. Nhấp vào nút Nhập tệp dữ liệu để tải dữ liệu mới lên tập dữ liệu.

      Khi bạn tải dữ liệu mới lên tập dữ liệu này, một phiên bản mới của tập dữ liệu sẽ được tạo ra. Nếu dữ liệu mới tải lên thành công:

      • Trạng thái của phiên bản mới của tập dữ liệu sẽ được đặt thành COMPLETED (ĐÃ HOÀN TẤT).
      • Phiên bản mới sẽ trở thành "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.

      Nếu có lỗi khi tải lên:

      • Trạng thái của phiên bản tập dữ liệu mới được đặt thành một trạng thái không phải là ĐÃ HOÀN TẤT. Ví dụ: nếu có lượt chuyển đổi "đang hoạt động" trước đó phiên bản, thuộc tính trạng thái của tập dữ liệu được đặt thành REVERTED.
      • Trạng thái "đang hoạt động" trước đây phiên bản của tập dữ liệu vẫn là trạng thái "đang hoạt động" và là phiên bản mà ứng dụng của bạn sử dụng.