贝叶斯推理

Meridian 采用贝叶斯回归模型,将先验知识与从数据中获得的信号相结合,以估计媒体效应并量化不确定性。先验知识通过先验分布纳入模型中,而先验分布可以通过实验数据、行业经验或以前的媒体组合模型获得。

贝叶斯马尔可夫链蒙特卡洛 (MCMC) 抽样方法用于联合估计所有模型系数和形参。这包括非线性媒体转换函数的形参,例如 Adstock 和回报递减曲线。在为投资回报率和其他关键数据洞见计算点估计值和可信区间时,系统会考虑到所有形参和相应的不确定性。

贝叶斯定理

贝叶斯定理说明了如何使用可观测数据对不可观测形参进行推理,可用以下等式表示:

$$ P(\theta|data)\ =\ \dfrac{ P(data|\theta)P(\theta) }{ \int \! P(data|\theta)P(\theta) \, \mathrm{d}\theta } $$

其中:

  • \(\theta\) 是不可观测的相关形参
  • \(P(\theta|data)\) 是后验,是贝叶斯方程的输出结果
  • \(P(data|\theta)\) 是似然
  • \(P(\theta)\) 是先验

必须指定似然和先验,才能对后验执行推理。

似然、先验和后验

似然是模型规范。它是一种分布,规定了在给定的模型形参值\(\theta\)条件下数据值出现的概率。进行贝叶斯分析后,系统会对形参 \(\theta\)进行推理和估计。似然的复杂度范围很广。Meridian 的似然基于分层回归模型。如需详细了解 Meridian 似然,请参阅模型规范

先验表示在考虑数据之前,对形参概率分布的信念。贝叶斯量化不确定性的方法需要纳入先验知识。在 Meridian 中,先验分布表示在看到数据之前对营销渠道效果的信念。信息量充足的先验表示对 \(\theta\)有高度的确定性,这需要大量数据证据来改变这种信念。信息量较少的先验表示对 \(\theta\) 的值知之甚少,因此该先验的影响很小。Meridian 模型提供了具有默认值的合理先验。您可以自定义先验,例如用于投资回报率校准的先验。

后验是一种分布,表示在考虑数据后,对 \(\theta\) 的不同可能值的信念强度。根据贝叶斯定理,后验基于先验、数据和似然。如果数据中的信息很少,后验会更偏重于先验。如果数据中包含大量信息,后验则更偏重于数据。

Meridian 模型会生成所有模型形参的联合后验分布,以及每个估计指标,例如投资回报率、边际投资回报率和响应曲线。后验分布表示在观察到数据的情况下,对营销渠道效果的最新信念。

MCMC 收敛

利用马尔可夫链蒙特卡洛 (MCMC) 方法,后验抽样会收敛到目标分布。若要评估模型收敛性,可以运行多个 MCMC 链,并检查所有链是否达到相同的目标分布。

Meridian 采用 MCMC No U-Turn Sampler (NUTS) 抽样方法。形参值从概率分布中抽取,其中当前值的分布取决于前一次迭代的值。这些值形成一条链,其中每次迭代都是一组完整的模型形参值。多条链独立运行,以评估收敛性。当达到收敛时,每条链都代表目标后验分布的一个样本。然后,这些链可以合并,以进行后验推理。

检查 R-hat 值以评估 MCMC 收敛性至关重要。这些值作为模型输出的一部分提供。我们建议为所有形参获取小于 1.2 的 R-hat 值,但这并非严格的阈值。如果 R-hat 值略大于 1.2,通常可以通过运行更长的链来实现收敛。如果 R-hat 值大得多(如 2.0 或更大),或许可以通过运行更长的链来实现收敛。不过,计算时间和内存限制可能会成为障碍,因此可能有必要调整模型才能实现收敛。