Bắt đầu

Khi bạn làm việc với bộ phận bán hàng hoặc bộ phận hỗ trợ để thiết lập quyền truy cập vào Chuyển dữ liệu phiên bản 2.0, bạn sẽ được cung cấp tên bộ chứa. Bạn cần cung cấp cho người liên hệ phụ trách bán hàng của mình một Nhóm Google để có thể kiểm soát quyền truy cập vào các tệp dữ liệu trong Google Cloud Storage.

Bạn có thể chọn truy cập vào dữ liệu của mình bằng một tiện ích hoặc bạn có thể tự viết mã.

Truy cập dữ liệu bằng OneRoster

Công cụ gsutil là một ứng dụng dòng lệnh, được viết bằng Python, cho phép bạn truy cập vào dữ liệu của mình mà không cần lập trình. Bạn có thể sử dụng WorkManager dưới dạng một phần của tập lệnh hoặc tệp hàng loạt thay vì tạo các ứng dụng tuỳ chỉnh.

Để bắt đầu sử dụng OneRoster, hãy đọc Báo cáo của bạn . Công cụ sẽ nhắc bạn cung cấp thông tin đăng nhập lần đầu tiên bạn sử dụng rồi lưu trữ để sử dụng sau này.

Ví dụ về gsutil

Bạn có thể liệt kê tất cả tệp bằng gsutil như sau:

gsutil ls gs://[bucket_name]/[object name/file name]

gsutil sử dụng nhiều cú pháp giống như UNIX, bao gồm cả dấu hoa thị ký tự đại diện (*), vì vậy, bạn có thể liệt kê tất cả tệp NetworkImpression:

gsutil ls gs://[bucket_name]/dcm_account6837_impression_*

Bạn cũng có thể dễ dàng tải tệp xuống:

gsutil cp gs://[bucket_name]/dcm_account6837_impression_2015120100.log.gz

Bạn có thể sao chép các tệp trong những bộ chứa DT Google đã phân tán vào bộ chứa GCS của Google API bằng cách sử dụng tập lệnh môi trường Unix, có hai lựa chọn:

  • Trong PolicyBytes, nếu bạn đang sử dụng Hệ thống Unix, hãy chạy lệnh sau cho tất cả các nhóm của bạn hằng ngày:

    $ day=$(date --date="1 days ago" +"%m-%d-%Y")
    $ gsutil -m cp gs://{<dcmhashid_A>,<dcmhashid_B>,etc.}/*$day*.log.gz gs://<client_bucket>/
  • Ngoài ra, một giải pháp phức tạp hơn là sử dụng tệp bash:

    #!/bin/bash
    
    set -x
    
    buckets={dfa_-hasid_A dfa_-hashid_B,...} #include all hash ids
    day=$(date --date="1 days ago" +"%m-%d-%Y")
    for b in ${buckets[@]}; do /
        gsutil -m cp gs://$b/*$day*.log.gz gs:/// /
    done

Truy cập dữ liệu theo phương thức lập trình

Google Cloud Storage có các API và mẫu cho nhiều ngôn ngữ lập trình, cho phép bạn truy cập vào dữ liệu theo cách lập trình. Dưới đây là các bước cụ thể đối với tính năng Chuyển dữ liệu phiên bản 2.0 mà bạn phải thực hiện để tạo tích hợp hoạt động.

Tạo tài khoản dịch vụ

Để bắt đầu sử dụng tính năng Chuyển dữ liệu phiên bản 2.0, trước tiên, bạn cần sử dụng công cụ thiết lập. Công cụ này sẽ hướng dẫn bạn tạo dự án trong Google API Console, bật API và tạo thông tin đăng nhập.

Để thiết lập tài khoản dịch vụ mới, hãy làm như sau:

  1. Nhấp vào Tạo thông tin xác thực > Khoá tài khoản dịch vụ.
  2. Chọn xem có tải khoá công khai/riêng tư của tài khoản dịch vụ xuống dưới dạng tệp P12 chuẩn hoặc dưới dạng tệp JSON mà ứng dụng Google API có thể tải thư viện của bạn.

Cặp khóa công khai/riêng tư mới của bạn sẽ được tạo và tải xuống máy của bạn; đây là bản sao duy nhất của khóa này. Bạn có trách nhiệm lưu trữ dữ liệu này một cách an toàn.

Hãy nhớ luôn mở cửa sổ này, bạn sẽ cần email tài khoản dịch vụ trong bước tiếp theo.

Thêm một tài khoản dịch vụ vào nhóm của bạn

  • Truy cập vào Google Groups
  • Nhấp vào Nhóm của tôi rồi chọn nhóm mà bạn dùng để quản lý quyền truy cập vào Bộ chứa DT v2.0 Cloud Storage của bạn
  • Nhấp vào Quản lý
  • Đừng nhấp vào Mời thành viên!
  • Nhấp vào Trực tiếp thêm thành viên
  • Sao chép email tài khoản dịch vụ ở bước trước vào hộp hội viên
  • Chọn Không có email
  • Nhấp vào nút Thêm

Tôi vô tình nhấp vào Mời thành viên

Phạm vi

Mọi phạm vi được truyền đến Cloud Storage đều phải ở chế độ Chỉ có thể đọc

Ví dụ: khi sử dụng thư viện ứng dụng Java, phạm vi chính xác để sử dụng là:

StorageScopes.DEVSTORAGE_READ_ONLY