Bắt đầu

Khi làm việc với bộ phận bán hàng hoặc bộ phận hỗ trợ để thiết lập quyền truy cập vào tính năng Chuyển dữ liệu phiên bản 2.0, bạn sẽ được cung cấp tên nhóm. Bạn cần cung cấp cho một Nhóm Google có liên hệ bán hàng để cho phép bạn kiểm soát quyền truy cập vào các tệp dữ liệu của mình trong Google Cloud Storage.

Bạn có thể chọn truy cập dữ liệu của mình bằng cách sử dụng một tiện ích hoặc bạn có thể viết của riêng mình.

Truy cập dữ liệu bằng gsutil

Công cụ gsutil là một ứng dụng dòng lệnh, được viết bằng Python, cho phép bạn truy cập dữ liệu của mình mà không cần phải lập trình. Ví dụ: bạn có thể sử dụng gsutil dưới dạng một phần của tập lệnh hoặc tệp hàng loạt thay vì tạo ứng dụng tùy chỉnh.

Để bắt đầu sử dụng gsutil, hãy đọc tài liệu về gsutil. Công cụ này sẽ nhắc bạn về thông tin đăng nhập của bạn vào lần đầu tiên bạn sử dụng, sau đó lưu trữ thông tin đăng nhập đó để dùng sau này.

Ví dụ về gsutil

Bạn có thể liệt kê tất cả các tệp bằng gsutil như sau:

gsutil ls gs://[bucket_name]/[object name/file name]

gsutil sử dụng nhiều cú pháp giống như UNIX, bao gồm dấu hoa thị ký tự đại diện (*), vì vậy, bạn có thể liệt kê tất cả các tệp NetworkImpression:

gsutil ls gs://[bucket_name]/dcm_account6837_impression_*

Việc tải tệp xuống cũng dễ dàng:

gsutil cp gs://[bucket_name]/dcm_account6837_impression_2015120100.log.gz

Bạn có thể sao chép tệp từ các bộ chứa Google DT phân tán vào Bộ chứa GCS của Google API của riêng mình bằng cách sử dụng tập lệnh shell Unix, có hai tùy chọn:

  • Trong gsutil, nếu bạn đang sử dụng Hệ thống Unix, hãy chạy nội dung sau cho tất cả các bộ chứa của bạn hằng ngày:

    $ day=$(date --date="1 days ago" +"%m-%d-%Y")
    $ gsutil -m cp gs://{<dcmhashid_A>,<dcmhashid_B>,etc.}/*$day*.log.gz gs://<client_bucket>/
    
  • Ngoài ra, một giải pháp phức tạp hơn một chút là sử dụng tệp bash:

    #!/bin/bash
    
    set -x
    
    buckets={dfa_-hasid_A dfa_-hashid_B,...} #include all hash ids
    day=$(date --date="1 days ago" +"%m-%d-%Y")
    for b in ${buckets[@]}; do /
        gsutil -m cp gs://$b/*$day*.log.gz gs:/// /
    done
    

Truy cập dữ liệu theo cách lập trình

Google Cloud Storage có các API và mẫu cho nhiều ngôn ngữ lập trình, cho phép bạn truy cập vào dữ liệu của mình theo cách có lập trình. Dưới đây là các bước cụ thể cho tính năng Chuyển dữ liệu phiên bản 2.0 mà bạn phải thực hiện để tạo một công cụ tích hợp đang hoạt động.

Tạo tài khoản dịch vụ

Để bắt đầu sử dụng tính năng Chuyển dữ liệu phiên bản 2.0, trước tiên bạn cần dùng công cụ thiết lập. Công cụ này sẽ hướng dẫn bạn trong quy trình tạo dự án trong Google API Console, bật API và tạo bằng chứng xác thực.

Để thiết lập một tài khoản dịch vụ mới, hãy làm như sau:

  1. Nhấp vào Tạo thông tin xác thực và gt; khóa tài khoản dịch vụ.
  2. Chọn tải khoá công khai/riêng tư của tài khoản dịch vụ xuống dưới dạng tệp P12 chuẩn, hoặc dưới dạng tệp JSON mà thư viện ứng dụng API của Google có thể tải.

Cặp khóa công khai/riêng tư mới của bạn sẽ được tạo và tải xuống máy của bạn; đây là bản sao duy nhất của khóa này. Bạn có trách nhiệm lưu trữ an toàn.

Hãy nhớ giữ cửa sổ này mở, bạn sẽ cần email tài khoản dịch vụ trong bước tiếp theo.

Thêm tài khoản dịch vụ vào nhóm của bạn

  • Truy cập vào Nhóm Google
  • Nhấp vào Nhóm của tôi và chọn nhóm bạn dùng để quản lý quyền truy cập vào Nhóm bộ nhớ trên đám mây DT v2.0
  • Nhấp vào Quản lý
  • Đừng nhấp vào Mời thành viên!
  • Nhấp vào Thêm thành viên trực tiếp
  • Sao chép email tài khoản dịch vụ từ bước trước vào hộp thành viên
  • Chọn Không gửi email
  • Nhấp vào nút Thêm

Tôi vô tình nhấp vào Mời thành viên

Phạm vi

Bất kỳ phạm vi nào được chuyển vào Cloud Storage đều phải ở chế độ Chỉ đọc

Ví dụ: khi sử dụng thư viện ứng dụng Java, phạm vi chính xác cần sử dụng là:

StorageScopes.DEVSTORAGE_READ_ONLY