马尔可夫链分析

马尔可夫链统计函数使用概率方法来为各个广告接触点分配功劳,具体取决于这些接触点对用户转化可能性的贡献(根据模型估算得出)。此实验性函数的输出可能有助于为指定的广告渠道、广告系列或其他接触点分配功劳,具体取决于这些接触点对转化事件的贡献(根据模型估算得出)

运作方式

马尔可夫链统计函数使用您的广告数据来创建马尔可夫链,其中有向图中的每个顶点都代表一个接触点,而每条边都提供了向下一接触点转移的概率(取决于目前所在的接触点)。它假定只有当前接触点会影响转移概率。随后,系统会计算每个接触点的贡献,具体方法是从图表中移除接触点,然后计算移除相应接触点后根据模型估算的转化概率。

隐私保护方面的限制

接触点必须至少包含 50 位已转化用户和 50 位未转化用户,才不会被隐私权过滤条件移除。此外,还可能会滤除对接触点贡献的功劳过大或过小的离群用户。因此,马尔可夫链模型的输出可能会缺少输入接触点表中的一些接触点。

隐私权消息在马尔可夫链模型每次迭代后显示。这些消息中包含已滤除的用户和接触点的相关信息。

马尔可夫链值计算方式概览

  1. 创建接触点表和功劳表:
    1. touchpoint_temp_table
    2. user_credit_temp_table
  2. 使用上述临时表作为参数来调用 ADH.TOUCHPOINT_ANALYSIS 表值函数。

创建接触点表和功劳表

创建接触点表

接触点表中定义了与接触点相关的用户事件。示例数据可能包括但不限于:campaign_idcreative_idplacement_idsite_id

该表必须包含以下列:

列名称 类型
touchpoint string
任意接触点名称(不得为 NULL 或包含逗号)。
user_id string
访问接触点的用户的 ID(不得为 NULL 或 0)。
event_time int
用户访问接触点的时间(不得为 NULL)。

用于创建表的示例代码:

CREATE TABLE touchpoint_temp_table
AS (
  SELECT user_id, event.event_time, CAST(event.site_id AS STRING) AS touchpoint
  FROM adh.cm_dt_impressions
  WHERE
    event.event_type IN ('VIEW')
    AND user_id <> '0'
    AND event.campaign_id IN UNNEST(@campaign_ids)

  UNION ALL

    SELECT
      user_id, event.event_time, CAST(event.site_id AS STRING) AS touchpoint
    FROM adh.cm_dt_clicks
    WHERE
      event.event_type IN ('CLICK')
      AND user_id <> '0'
      AND event.campaign_id IN UNNEST(@campaign_ids)
);

创建用户功劳表

用户功劳表中定义了转化事件。转化后发生的事件会被视为非转化事件。

该表必须包含以下列:

列名称 类型
user_id string
访问接触点的用户的 ID(不得为 NULL 或 0)。
event_time int
贡献事件发生的时间(不得为 NULL)。
credit integer
用户贡献的功劳,可以是要分析的任何功劳,例如转化价值、转化次数等。该值必须介于 1 到 100 之间。

用于创建表的示例代码:


CREATE TABLE user_credit_temp_table AS (
  SELECT
    user_id,
    MAX(event.event_time) AS event_time,
    1 AS credit
  FROM adh.cm_dt_activities_attributed
  WHERE user_id <> '0'
    AND event.campaign_id IN UNNEST(@campaign_ids)
    AND DATE(TIMESTAMP_MICROS(event.event_time)) BETWEEN @start_date AND @end_date
    AND event.activity_id IN UNNEST (@activity_ids)
  GROUP BY user_id
);

表值函数

表值函数是一种将表作为结果返回的函数。因此,您可以像查询普通表一样查询表值函数。

语法

ADH.TOUCHPOINT_ANALYSIS(TABLE touchpoints_tmp_table_name, TABLE credits_tmp_table_name, STRING model_name)

参数

名称
touchpoints_tmp_table_name 客户创建的临时接触点表的名称。该表必须采用包含 touchpointuser_idevent_time 列的架构。
credits_tmp_table_name 客户创建的临时用户功劳表的名称。该表必须具有包含 user_idcreditconversion_time 列的架构。
model string
该值必须为 MARKOV_CHAINS。

输出表

输出表将包含以下架构:

列名称 类型
touchpoint string
接触点名称。
score integer
针对此接触点计算得出的马尔可夫链得分。

使用表值函数的示例代码

SELECT *
FROM ADH.TOUCHPOINT_ANALYSIS(
  TABLE tmp.touchpoint_temp_table,
  TABLE tmp.user_credit_temp_table,
  'MARKOV_CHAINS')