[GA4] BigQuery Export 架构

本文介绍了 Google Analytics 4 媒体资源和 Google Analytics for Firebase 中的数据在导出至 BigQuery 时所采用的格式和架构。

数据集

对于每个关联到 BigQuery 的 Google Analytics 4 媒体资源和 Firebase 项目,系统都会在 BigQuery 项目中添加一个名为“analytics_<property_id>”的数据集。“媒体资源 ID”是指您的 Google Analytics 媒体资源 ID,可以在 Google Analytics 4 媒体资源的“媒体资源设置”以及 Firebase 中的“应用分析设置”下找到。任何 Google Analytics 4 媒体资源和应用在启用了 BigQuery Export 之后,其数据都会导出到与之对应的数据集中。

如果启用了“每天”导出选项,系统会每天在每个数据集中创建一个名为 events_YYYYMMDD 的表。

如果启用了“流式”导出选项,系统会创建一个名为 events_intraday_YYYYMMDD 的表。此表会随着全天事件的记录而不断填充。一旦 events_YYYYMMDD 完成,此表将在每天结束时删除。

并非所有设备都会在触发事件的同一天将其数据发送给 Google Analytics。考虑到这种延迟,Google Analytics 会在更新每天汇成的表 (events_YYYYMMDD) 时,填入在事件触发日期后最多三天内的事件。无论相应数据是否延迟,事件都会有正确的时间戳。系统不会记录在这三天过后才收到的事件。

如果您使用的是 BigQuery 沙盒,系统不会在当日导入事件,并且还需遵循其他限制

如果您想在当日导入,请从沙盒升级

events_YYYYMMDD 表中的每一列代表一个针对特定事件的参数。请注意,有些参数会嵌套在 RECORD 中,而且有些 RECORD(例如 itemsevent_params)是可重复的。下面介绍了表中的各列。

单个事件的数据可能以一行或多行的形式呈现,具体取决于其中是否包含重复的 RECORD。例如,包含多个 page_viewpage_view 事件会类似于下表。初始行包含事件名称、日期、时间戳和其他非重复数据项。系统会对与该事件关联的每个参数重复 event_params RECORD,并直接在事件初始行下的后续行中填充这些重复的 RECORD。

event_date event_timestamp event_name event_params.key event_params_value.string_value
20220222 1643673600483790 page_view page_location https://example.com
      page_title Home
      引荐
      source google
      page_referrer https://www.google.com
      <parameters...> <values...>

此事件数据在 GA4 界面中显示如下。

该内容对您有帮助吗?

您有什么改进建议?
4768194180125523711
true
搜索支持中心
true
true
true
true
true
69256
搜索
清除搜索内容
关闭搜索框
主菜单
false
false
false