Cómo estimar el resultado incremental utilizando una regresión

Conforme a los supuestos de intercambiabilidad y coherencia, la expectativa condicional de cualquier resultado potencial \(\overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(\ast)} \right\}\right) }\) puede expresarse como una expectativa condicional que se puede estimar por medio de un modelo de regresión, en el que\(x_{g,t,i}^{(\ast)}\) representa el conjunto de variables de tratamiento intervenibles: de medios, de medios orgánicos y que no son de medios. Para esta demostración, suponemos que los canales de medios pagados y orgánicos se basan en impresiones, aunque esto también se aplica a los canales basados en el alcance y la frecuencia.

Según las definiciones que se describen en Datos de entrada, esto se puede formular de la siguiente manera:

$$ \begin{align*} \overset \sim Y_{g,t} &= u_{g,t}^{[Y]} \overset {\cdot \cdot} Y_{g,t} \\ &= u_{g,t}^{[Y]}L_{g,t}^{[Y]-1}(Y_{g,t}) \end{align*} $$

Meridian también se basa en el hecho de que la función de transformación de KPI previa al modelado \(L_{g,t}^{[Y]}(\cdot)\) es lineal y, por lo tanto, se puede pasar fuera del operador de la expectativa condicional. Esto da lugar a la siguiente ecuación, en la que el resultado es una cantidad que se puede estimar por medio de un modelo de regresión, como el modelo de Meridian:

$$ \begin{align*} E\left(\overset \sim Y_{g,t}^{(\left\{ x_{g,t,i}^{(\ast)} \right\})} \Big| \bigl\{ z_{g,t,i} \bigr\} \right) &= E\left( \overset \sim Y_{g,t} \Big| \bigl\{x_{g,t,i}^{(\ast)}\bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \\ &= E\left( u_{g,t}^{[Y]}L_{g,t}^{[Y]-1}(Y_{g,t}) \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \\ &= u_{g,t}^{[Y]}L_{g,t}^{[Y]-1} E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \end{align*} $$

Tomando eso como base, la regresión se puede usar para estimar el KPI incremental entre dos situaciones contrafácticas \(\left\{ x_{g,t,i}^{(1)} \right\}\)y \(\left\{ x_{g,t,i}^{(0)} \right\}\):

$$ \begin{align*} \text{IncrementalOutcome} \left( \bigl\{ x_{g,t,i}^{(1)} \bigr\}, \bigl\{ x_{g,t,i}^{(0)} \bigr\} \right) &= E\left( \sum\limits_{g,t}\left( \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(1)} \right\} \right) } - \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(0)} \right\} \right) } \right) \Bigg| \bigl\{ z_{g,t,i} \bigr\} \right) \\ &= \sum\limits_{g,t}u_{g,t}^{[Y]}L_g^{[Y]-1} \left( E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(1)} \bigr\}, \bigl\{ z_{g,t,i} \bigr\} \right)\right) - \sum\limits_{g,t}u_{g,t}^{[Y]}L_{g,t}^{[Y]-1} \left( E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(0)} \bigr\}, \bigl\{ z_{g,t,c} \bigr\} \right) \right) \end{align*} $$

En las especificaciones del modelo Meridian:

$$ \begin{align*} E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{ z_{g,t,i} \bigr\} \right) = \mu_t &+ \tau_g + \sum\limits_{i=1}^{N_C} \gamma^{[C]}_{g,i}z_{g,t,i} \\ &+ \sum\limits_{i=1}^{N_N} \gamma^{[N]}_{g,i}x^{[N] (\ast)}_{g,t,i} \\ &+ \sum\limits_{i=1}^{N_M} \beta^{[M]}_{g,i} \text{HillAdstock} \left( \bigl\{ x^{[M] (\ast)}_{g,t-s,i} \bigr\}^L_{s=0};\ \alpha^{[M]}_i, ec^{[M]}_i, \text{slope}^{[M]}_i \right) \\ &+ \sum\limits_{i=1}^{N_{OM}} \beta^{[OM]}_{g,i} \text{HillAdstock} \left( \bigl\{ x^{[OM] (\ast)}_{g,t-s,i} \bigr\}^L_{s=0};\ \alpha^{[OM]}_i, ec^{[OM]}_i, \text{slope}^{[OM]}_i \right) \end{align*} $$

Esta cantidad es una función de los parámetros del modelo y, por lo tanto, tiene una distribución a posteriori que Meridian puede muestrear con el método de Monte Carlo basado en cadenas de Markov (MCMC). El ROI, el mROI y las curvas de respuesta se pueden calcular según la definición de resultado incremental, y cada una de estas cantidades también posee una distribución a posteriori.