BigQuery 是 Google 推出的 PB 级数据仓储解决方案。Looker Studio 以原生方式与 BigQuery 集成,可用于分析和直观呈现 BigQuery 数据。
实现步骤
您可以通过多种方式将 BigQuery 数据导入 Looker Studio:
- 在 Looker Studio 界面中使用原生 BigQuery 连接器
- 开发和使用社区连接器
在 Looker Studio 界面中使用原生 BigQuery 连接器
用户可以使用 Looker Studio 中的原生 BigQuery 连接器来直观呈现 BigQuery 表或特定查询。您可以从 Looker Studio 中提取整个表或在 BigQuery 上运行自定义查询。您还可以使用 Looker Studio 探索器功能来完成对 BigQuery 数据的探索性分析。
如果您的用户属于以下情况,则此方法很有帮助:
- 正在进行探索性分析。
- 熟悉 SQL 并且可以编写自己的查询。
- 熟悉数据并且知道如何从头开始直观呈现数据。
示例:通过 BigQuery 查询出生率数据
本指南介绍了最终用户如何在 Looker Studio 界面中使用 Looker Studio 的原生 BigQuery 连接器来直观呈现 BigQuery 数据。此示例查询 BigQuery natality示例表,并将整个表提取到 Looker Studio 中。
示例:使用 BigQuery、App Engine 和 Looker Studio 构建商业智能信息中心
如何使用 Looker Studio 和 BigQuery 构建商业智能信息中心一文介绍了如何使用 App Engine 预汇总 BigQuery 数据,然后使用 Looker Studio 直观呈现这些数据。
开发和使用社区连接器
您可以开发一个会从 BigQuery 中提取数据的社区连接器。与使用原生连接器相比,此方法具有以下优势:
- 您可以将现有查询整合到连接器中。您的用户无需编写自己的 SQL 或复制/粘贴 SQL 代码段即可获取确切的查询。此外,您可以对查询进行参数化处理,并让用户通过连接器配置提供输入以自定义查询。
- 您可以使用服务账号来集中结算。您的用户将无需访问 GCP 结算账号。
- 您的用户可以从现成的模板报告着手来处理自己的数据。
- 您可以实现自己的缓存层来控制 BigQuery 费用。
在社区连接器中,您可以通过三种不同的方式访问 BigQuery 数据:
下表总结了这三种方式的优缺点:
Looker Studio 高级服务 | Apps 脚本 BigQuery 服务 | BigQuery REST API | |
---|---|---|---|
参考文档 | Looker Studio 高级服务 | Apps 脚本 BigQuery 服务 | BigQuery REST API |
数据流 | BigQuery > Looker Studio | BigQuery > Apps 脚本 > Looker Studio | BigQuery > Apps 脚本 > Looker Studio |
可通过 getschema 支持计算字段 |
是 | 是 | 是 |
可与服务帐号/自定义访问权限控制搭配使用 | 是 | 否(强制执行有效用户凭据) | 是 |
系统会自动将过滤器 | 是 | 否 | 否 |
getData 中需要的其他数据转换 |
否 | 是 | 是 |
可以在 Apps 脚本中访问提取的数据 (您可以执行其他转换) |
否 | 是 | 是 |
支持自定义缓存 | 否 | 是 | 是 |
已应用 UrlfetchApp 配额 | 否 | 否 | 是 |
实现示例 | 世界银行数据连接器 | Apps 脚本 BigQuery 服务 | Chrome 用户体验连接器 |
除非您需要转换从 BigQuery 提取的数据或需要自定义缓存,否则在大多数情况下,可以使用 Looker Studio 高级服务。