Trang tính liên kết

Trang tính liên kết cho phép bạn phân tích nhiều petabyte dữ liệu ngay trong Google Trang tính. Bạn có thể kết nối bảng tính với kho dữ liệu BigQuery hoặc Looker và phân tích bằng các công cụ quen thuộc của Trang tính như bảng tổng hợp, biểu đồ và công thức.

Quản lý nguồn dữ liệu BigQuery

Phần này sử dụng tập dữ liệu công khai Shakespeare của BigQuery để hướng dẫn cách sử dụng Trang tính liên kết. Tập dữ liệu này chứa các thông tin sau:

Trường Loại Mô tả
word STRING Một từ duy nhất (trong đó khoảng trắng là dấu phân cách) được trích xuất từ một tập hợp văn bản.
word_count INTEGER Số lần từ này xuất hiện trong tập hợp văn bản này.
tập hợp văn bản STRING Tác phẩm mà từ này được trích xuất.
corpus_date INTEGER Năm xuất bản tập hợp văn bản này.

Nếu yêu cầu bất kỳ dữ liệu nào trong Trang tính được liên kết với BigQuery, thì ứng dụng của bạn phải cung cấp mã thông báo OAuth 2.0 cấp quyền truy cập vào phạm vi bigquery.readonly, ngoài các phạm vi khác cần thiết cho một yêu cầu API Google Trang tính thông thường. Để biết thêm thông tin, hãy xem phần Chọn phạm vi API Google Trang tính.

Nguồn dữ liệu chỉ định một vị trí bên ngoài nơi tìm thấy dữ liệu. Sau đó, nguồn dữ liệu sẽ được kết nối với bảng tính.

Thêm nguồn dữ liệu BigQuery

Để thêm nguồn dữ liệu, hãy cung cấp một AddDataSourceRequest bằng phương thức spreadsheets.batchUpdate. Nội dung yêu cầu phải chỉ định trường dataSource thuộc loại đối tượng DataSource.

"addDataSource":{
   "dataSource":{
      "spec":{
         "bigQuery":{
            "projectId":"PROJECT_ID",
            "tableSpec":{
               "tableProjectId":"bigquery-public-data",
               "datasetId":"samples",
               "tableId":"shakespeare"
            }
         }
      }
   }
}

Thay thế PROJECT_ID bằng mã dự án hợp lệ trên Google Cloud.

Sau khi tạo nguồn dữ liệu, một trang tính DATA_SOURCE liên kết sẽ được tạo để cung cấp bản xem trước gồm tối đa 500 hàng. Bạn sẽ không thể xem trước ngay lập tức. Một quá trình thực thi được kích hoạt không đồng bộ để nhập dữ liệu BigQuery.

AddDataSourceResponse chứa các trường sau:

  • dataSource: Đối tượng DataSource đã tạo. dataSourceId là một mã nhận dạng duy nhất trong phạm vi bảng tính. Mảng này được điền sẵn và tham chiếu để tạo từng đối tượng DataSource từ nguồn dữ liệu.

  • dataExecutionStatus: Trạng thái của một quá trình thực thi nhập dữ liệu BigQuery vào trang xem trước. Để biết thêm thông tin, hãy xem phần Trạng thái thực thi dữ liệu.

Cập nhật hoặc xoá nguồn dữ liệu BigQuery

Sử dụng phương thức spreadsheets.batchUpdate và cung cấp yêu cầu UpdateDataSourceRequest hoặc DeleteDataSourceRequest tương ứng.

Quản lý các đối tượng nguồn dữ liệu BigQuery

Sau khi thêm nguồn dữ liệu vào bảng tính, bạn có thể tạo đối tượng nguồn dữ liệu từ nguồn dữ liệu đó. Đối tượng nguồn dữ liệu là một công cụ thông thường trên Trang tính, chẳng hạn như bảng tổng hợp, biểu đồ và công thức được tích hợp với Trang tính được liên kết để hỗ trợ hoạt động phân tích dữ liệu của bạn.

Có 4 loại đối tượng:

  • Bảng DataSource
  • DataSource pivotTable
  • Biểu đồ DataSource
  • Công thức DataSource

Thêm bảng nguồn dữ liệu BigQuery

Được gọi là "tệp trích xuất" trong trình chỉnh sửa Trang tính, đối tượng bảng nhập một tệp kết xuất dữ liệu tĩnh từ nguồn dữ liệu vào Trang tính. Tương tự như bảng tổng hợp, bảng này được chỉ định và neo vào ô trên cùng bên trái.

Mã mẫu sau đây cho biết cách sử dụng phương thức spreadsheets.batchUpdateUpdateCellsRequest để tạo bảng nguồn dữ liệu có tối đa 1.000 hàng gồm 2 cột (wordword_count).

"updateCells":{
   "rows":{
      "values":[
         {
            "dataSourceTable":{
               "dataSourceId":"DATA_SOURCE_ID",
               "columns":[
                  {
                     "name":"word"
                  },
                  {
                     "name":"word_count"
                  }
               ],
               "rowLimit":{
                  "value":1000
               },
               "columnSelectionType":"SELECTED"
            }
         }
      ]
   },
   "fields":"dataSourceTable"
}

Thay thế DATA_SOURCE_ID bằng mã nhận dạng duy nhất trong phạm vi bảng tính giúp xác định nguồn dữ liệu.

Sau khi tạo bảng nguồn dữ liệu, dữ liệu sẽ không có sẵn ngay lập tức. Trong trình chỉnh sửa Trang tính, nội dung này sẽ xuất hiện dưới dạng bản xem trước. Bạn cần làm mới bảng nguồn dữ liệu để tìm nạp dữ liệu BigQuery. Bạn có thể chỉ định một RefreshDataSourceRequest trong cùng một batchUpdate. Xin lưu ý rằng tất cả đối tượng nguồn dữ liệu đều hoạt động tương tự nhau. Để biết thêm thông tin, hãy xem phần Làm mới đối tượng nguồn dữ liệu.

Sau khi quá trình làm mới hoàn tất và dữ liệu BigQuery được tìm nạp, bảng nguồn dữ liệu sẽ được điền như sau:

Bảng nguồn dữ liệu cho thấy dữ liệu từ tập dữ liệu công khai của Shakespeare.

Thêm bảng tổng hợp nguồn dữ liệu BigQuery

Không giống như bảng tổng hợp thông thường, bảng tổng hợp nguồn dữ liệu được nguồn dữ liệu hỗ trợ và tham chiếu dữ liệu theo tên cột. Mã mẫu sau đây cho biết cách sử dụng phương thức spreadsheets.batchUpdateUpdateCellsRequest để tạo một bảng tổng hợp cho biết tổng số từ theo ngữ liệu.

"updateCells":{
   "rows":{
      "values":[
         {
            "pivotTable":{
               "dataSourceId":"DATA_SOURCE_ID",
               "rows":{
                  "dataSourceColumnReference":{
                     "name":"corpus"
                  },
                  "sortOrder":"ASCENDING"
               },
               "values":{
                  "summarizeFunction":"SUM",
                  "dataSourceColumnReference":{
                     "name":"word_count"
                  }
               }
            }
         }
      ]
   },
   "fields":"pivotTable"
    }

Thay thế DATA_SOURCE_ID bằng mã nhận dạng duy nhất trong phạm vi bảng tính giúp xác định nguồn dữ liệu.

Sau khi dữ liệu BigQuery được tìm nạp, bảng tổng hợp nguồn dữ liệu sẽ được điền như sau:

Bảng tổng hợp nguồn dữ liệu cho thấy dữ liệu từ tập dữ liệu công khai của Shakespeare.

Thêm biểu đồ nguồn dữ liệu BigQuery

Mã mẫu sau đây cho biết cách sử dụng phương thức spreadsheets.batchUpdateAddChartRequest để tạo biểu đồ nguồn dữ liệu có chartType là CỘT, cho biết tổng số từ theo kho từ vựng.

"addChart":{
   "chart":{
      "spec":{
         "title":"Corpus by word count",
         "basicChart":{
            "chartType":"COLUMN",
            "domains":[
               {
                  "domain":{
                     "columnReference":{
                        "name":"corpus"
                     }
                  }
               }
            ],
            "series":[
               {
                  "series":{
                     "columnReference":{
                        "name":"word_count"
                     },
                     "aggregateType":"SUM"
                  }
               }
            ]
         }
      },
      "dataSourceChartProperties":{
         "dataSourceId":"DATA_SOURCE_ID"
      }
   }
}

Thay thế DATA_SOURCE_ID bằng mã nhận dạng duy nhất trong phạm vi bảng tính giúp xác định nguồn dữ liệu.

Sau khi dữ liệu BigQuery được tìm nạp, biểu đồ nguồn dữ liệu sẽ hiển thị như sau:

Biểu đồ nguồn dữ liệu cho thấy dữ liệu từ tập dữ liệu công khai của Shakespeare.

Thêm công thức nguồn dữ liệu BigQuery

Mã mẫu sau đây cho biết cách sử dụng phương thức spreadsheets.batchUpdateUpdateCellsRequest để tạo công thức nguồn dữ liệu nhằm tính số từ trung bình.

"updateCells":{
   "rows":[
      {
         "values":[
            {
               "userEnteredValue":{
                  "formulaValue":"=AVERAGE(shakespeare!word_count)"
               }
            }
         ]
      }
   ],
   "fields":"userEnteredValue"
}

Sau khi dữ liệu BigQuery được tìm nạp, công thức nguồn dữ liệu sẽ được điền như sau:

Công thức nguồn dữ liệu cho thấy dữ liệu từ tập dữ liệu công khai của Shakespeare.

Làm mới đối tượng nguồn dữ liệu BigQuery

Bạn có thể làm mới đối tượng nguồn dữ liệu để tìm nạp dữ liệu mới nhất từ BigQuery dựa trên thông số kỹ thuật và cấu hình đối tượng của nguồn dữ liệu hiện tại. Bạn có thể sử dụng phương thức spreadsheets.batchUpdate để gọi RefreshDataSourceRequest. Sau đó, hãy chỉ định một hoặc nhiều tham chiếu đối tượng để làm mới bằng đối tượng DataSourceObjectReferences.

Xin lưu ý rằng bạn có thể vừa tạo vừa làm mới các đối tượng nguồn dữ liệu trong một yêu cầu batchUpdate.

Quản lý nguồn dữ liệu Looker

Hướng dẫn này sẽ hướng dẫn bạn cách thêm, cập nhật hoặc xoá nguồn dữ liệu Looker, tạo bảng tổng hợp trên nguồn dữ liệu đó và làm mới nguồn dữ liệu.

Ứng dụng của bạn yêu cầu bất kỳ dữ liệu nào trong Trang tính được kết nối với Looker sẽ sử dụng lại Đường liên kết Tài khoản Google hiện có với Looker.

Thêm nguồn dữ liệu Looker

Để thêm nguồn dữ liệu, hãy cung cấp một AddDataSourceRequest bằng phương thức spreadsheets.batchUpdate. Nội dung yêu cầu phải chỉ định trường dataSource thuộc loại đối tượng DataSource.

"addDataSource":{
   "dataSource":{
      "spec":{
         "looker":{
            "instance_uri":"INSTANCE_URI",
            "model":"MODEL",
            "explore":"EXPLORE"
         }
      }
   }
}

Thay thế INSTANCE_URI, MODELEXPLORE lần lượt bằng URI thực thể Looker, tên mô hình và tên dữ liệu khám phá hợp lệ.

Sau khi tạo nguồn dữ liệu, một trang tính DATA_SOURCE liên kết sẽ được tạo để cung cấp bản xem trước cấu trúc của Bản dữ liệu khám phá đã chọn, bao gồm chế độ xem, phương diện, chỉ số và mọi nội dung mô tả trường.

AddDataSourceResponse chứa các trường sau:

  • dataSource: Đối tượng DataSource đã tạo. dataSourceId là một mã nhận dạng duy nhất trong phạm vi bảng tính. Mảng này được điền sẵn và tham chiếu để tạo từng đối tượng DataSource từ nguồn dữ liệu.

  • dataExecutionStatus: Trạng thái của một quá trình thực thi nhập dữ liệu BigQuery vào trang tính xem trước. Để biết thêm thông tin, hãy xem phần Trạng thái thực thi dữ liệu.

Cập nhật hoặc xoá nguồn dữ liệu Looker

Sử dụng phương thức spreadsheets.batchUpdate và cung cấp yêu cầu UpdateDataSourceRequest hoặc DeleteDataSourceRequest tương ứng.

Quản lý đối tượng nguồn dữ liệu Looker

Sau khi thêm nguồn dữ liệu vào bảng tính, bạn có thể tạo đối tượng nguồn dữ liệu từ nguồn dữ liệu đó. Đối với nguồn dữ liệu Looker, bạn chỉ có thể tạo đối tượng pivotTable DataSource từ nguồn dữ liệu đó.

Không thể tạo công thức, bản trích xuất và biểu đồ DataSource từ các nguồn dữ liệu Looker.

Làm mới đối tượng nguồn dữ liệu Looker

Bạn có thể làm mới đối tượng nguồn dữ liệu để tìm nạp dữ liệu mới nhất từ Looker dựa trên thông số kỹ thuật nguồn dữ liệu và cấu hình đối tượng hiện tại. Bạn có thể sử dụng phương thức spreadsheets.batchUpdate để gọi RefreshDataSourceRequest. Sau đó, hãy chỉ định một hoặc nhiều tham chiếu đối tượng để làm mới bằng đối tượng DataSourceObjectReferences.

Xin lưu ý rằng bạn có thể vừa tạo vừa làm mới các đối tượng nguồn dữ liệu trong một yêu cầu batchUpdate.

Trạng thái thực thi dữ liệu

Khi bạn tạo nguồn dữ liệu hoặc làm mới các đối tượng nguồn dữ liệu, một quá trình thực thi trong nền sẽ được tạo để tìm nạp dữ liệu từ BigQuery hoặc Looker và trả về một phản hồi chứa DataExecutionStatus. Nếu quá trình thực thi bắt đầu thành công, thì DataExecutionState thường ở trạng thái RUNNING.

Vì quy trình này không đồng bộ, nên ứng dụng của bạn phải triển khai mô hình thăm dò ý kiến để định kỳ truy xuất trạng thái cho các đối tượng nguồn dữ liệu. Sử dụng phương thức spreadsheets.get cho đến khi trạng thái trả về trạng thái SUCCEEDED hoặc FAILED. Quá trình thực thi sẽ hoàn tất nhanh chóng trong hầu hết các trường hợp, nhưng điều này còn tuỳ thuộc vào độ phức tạp của nguồn dữ liệu. Thông thường, quá trình thực thi không vượt quá 10 phút.