Le résultat est la métrique d'intérêt principale selon laquelle Meridian mesure l'effet causal des variables de traitement. Il s'agit généralement des revenus, mais lorsque le KPI ne correspond pas aux revenus et que les données revenue_per_kpi
ne sont pas disponibles, Meridian définit alors le résultat comme étant le KPI lui-même.
En langage courant, le retour sur investissement (ROI) peut être défini comme le résultat incrémental généré par un canal média divisé par son coût. Cela implique que le média a un effet causal sur le résultat que vous souhaitez estimer. Pour ce faire de manière raisonnée, vous devez définir un résultat incrémental à l'aide du langage d'inférence causale.
À des fins de démonstration, imaginons que les données de couverture et de fréquence ne soient disponibles pour aucun canal média, qu'il soit payant ou naturel. En utilisant la notation des données d'entrée, vous disposez d'un tableau observé d'unités média transformées \(\{x^{[M]}_{g,t,i}\}\), d'unités média naturel\(\{x^{[OM]}_{g,t,i}\}\)et de traitements non média \(\{x^{[N]}_{g,t,i}\}\), dont l'ensemble est désigné par \(\{x_{g,t,i}\}\). Cet ensemble inclut des valeurs pour tous les canaux média payant et naturel, ainsi que des traitements non média pour tous les \(g=1,\dots G \)et \(t=-\infty,\dots,T \), bien qu'en pratique, vous ne deviez vous soucier que de \(t=1-L,2-L,\dots T\) , où \(L\) correspond au décalage maximal supposé des effets média. (Pour les besoins de cette discussion, reportez-vous aux unités sur l'échelle transformée \(x_{g,t,i}\) plutôt que sur l'échelle brute \(\overset{\cdot \cdot}{x}_{g,t,m}\). Il existe une correspondance un à un entre les unités brutes et transformées, ce qui ne fait aucune différence pratique.)
Même si l'exécution réelle d'un annonceur était \(\{x_{g,t,i}\}\), vous pouvez imaginer ce que le résultat aurait pu être si l'annonceur avait exécuté à la place un autre tableau média, tel que \(\{x^{(\ast)}_{g,t,i}\}\). Vous pouvez désigner ce résultat comme l'ensemble de variables aléatoires \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\). Dans la littérature sur l'inférence causale, l'ensemble \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\) est appelé résultats potentiels, et l'ensemble de valeurs \(\{ x^{(\ast)}_{g,t,i} \}\) est appelé scénario contrefactuel.
Dans la littérature sur l'inférence causale, il est courant de voir des notations telles que\(Y^{(1)}\) et \(Y^{(0)}\) représentant des résultats potentiels dans les scénarios contrefactuels de traitement et de contrôle. La MMM est semblable, mais légèrement plus complexe, car les résultats potentiels sont un tableau bidimensionnel de valeurs, et le traitement est un tableau tridimensionnel de valeurs. Notez que tous les résultats potentiels du tableau \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\) ne dépendent pas de toutes les valeurs du tableau \(\{ x^{(\ast)}_{g,t,i} \}\). Par exemple, le média d'une période donnée ne peut pas avoir d'incidence sur les ventes passées. Toutefois, cette notation est préférable, car elle est plus simple que d'essayer de déterminer exactement les valeurs média dont dépend chaque résultat potentiel pour chaque période.
Pour deux scénarios média contrefactuels, tels que \(\{ x^{(1)}_{g,t,i} \}\) et \(\{ x^{(0)}_{g,t,i} \}\), vous pouvez définir le résultat incrémental réel comme suit :
Toutefois, cette quantité n'est pas estimable, car les données ne peuvent fournir aucune information sur la distribution conjointe de \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(1)} \}) }\) et \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(0)} \}) }\). Il n'est possible d'observer qu'un seul résultat potentiel, à savoir \(\overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i} \right\}\right) }\). (Notez qu'intuitivement, lorsque \(\{ x^{(1)}_{g,t,i} \}\) se rapproche arbitrairement de \(\{ x^{(0)}_{g,t,i} \}\), les résultats potentiels \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(1)} \}) }\) et \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(0)} \}) }\) devraient approcher la même valeur, mais cette intuition ne suffit pas à spécifier la distribution conjointe de manière plus générale.)
À la place, pour deux scénarios média contrefactuels donnés, \(\{ x^{(1)}_{g,t,i} \}\) et \(\{ x^{(0)}_{g,t,i} \}\), définissez le résultat incrémental comme suit :
où \(\{z_{g,t,i}\}\) désigne les valeurs observées pour un ensemble de variables de contrôle. Cette notation abrégée permet d'indiquer que le résultat attendu est conditionné par le fait que les variables aléatoires de contrôle prennent ces valeurs. À l'aide d'un modèle de régression MMM et d'un ensemble de variables de contrôle soigneusement sélectionné, cette attente conditionnelle peut être estimée. Pour en savoir plus, consultez ROI, ROIm et courbes de réponse.
En général, la somme est obtenue à partir de \(g=1,\dots G\) et \(t=1,\dots T\). Toutefois, vous pouvez également définir un résultat incrémental pour n'importe quel sous-ensemble de ces valeurs.