Definir o parâmetro "max_lag"

O modelo do Meridian permite que a mídia no tempo \(t\) afete o KPI nos períodos\(t, t + 1, \dots , t + L\) em que o número inteiro \(L\) é um hiperparâmetro definido pelo usuário com o parâmetro max_lag de ModelSpec. A mídia pode ter um efeito de longo prazo que vai além de max_lag. No entanto, o Meridian pressupõe que os efeitos defasados diminuem monotonicamente em direção a zero, tornando-se pequenos. Por motivos práticos, fizemos o truncamento do efeito no valor max_lag.

Compensações do max_lag

Valores menores de max_lag geralmente levam a uma melhoria na convergência entre modelos e maior rapidez no tempo de execução deles. Valores menores de max_lag também podem reduzir a variância de modelos. Com valores altos de max_lag, a quantidade de dados disponíveis geralmente é insuficiente para que os modelos do Meridian estimem com precisão os efeitos defasados, o que aumenta a variância. Por outro lado, valores maiores de max_lag aumentam a duração dos efeitos defasados, o que pode ser benéfico para modelos em que são esperados efeitos de longo prazo.

Aumentar o max_lag não significa necessariamente que as estimativas de ROI também vão subir. Isso acontece porque, se a mídia no tempo \(t\) pode afetar o KPI no tempo \(t+L\), é possível remover o efeito da mídia nos tempos\(t+1, \dots , t+L\) no KPI no tempo \(t+L\).

Orientação prática para definir max_lag

As duas funções de decaimento de Adstock disponíveis no Meridian, geométrica e binomial, equilibram as compensações do max_lag de maneiras diferentes.

Ao usar o decaimento geométrico

Com o decaimento geométrico, definir max_lag no intervalo de 2 a 10 leva a um bom equilíbrio de modelagem dos efeitos defasados da mídia, minimizando as possíveis desvantagens de uma defasagem máxima muito grande. A curva de decaimento geométrico reduz em direção a zero muito rapidamente para a maioria dos valores de \(\alpha\). Portanto, definir max_lag como um valor muito grande tem um efeito insignificante na verossimilhança do modelo.

Ao usar o decaimento binomial

No entanto, com o decaimento binomial, a curva é uma função da defasagem máxima: ela é esticada para cobrir a janela de efeito, já que a interceptação no eixo x está sempre em\(L + 1\). Como resultado, a preocupação com a diminuição dos retornos não se aplica mais, e você pode usar o decaimento binomial com um valor maior que max_lag. Porém, a convergência e os tempos de execução do modelo ainda podem piorar com o aumento do max_lag. Essa tensão precisa ser equilibrada com os possíveis benefícios de aumentar max_lag. Nesse caso, recomendamos selecionar um valor de max_lag entre 4 e 20.

Ao usar uma combinação de distribuição geométrica e binomial

Decidir aumentar o valor de max_lag pode ser complicado se você estiver usando diferentes funções de decaimento para canais distintos. Se estiver usando predominantemente uma função com um pequeno número de exceções, siga a recomendação da função predominante. Se estiver usando uma combinação mais equilibrada, recomendamos selecionar um max_lag entre 4 e 20. Assim, há um bom equilíbrio na modelagem de efeito defasado binomial, evitando-se as desvantagens de usar a distribuição geométrica com um max_lag grande.

Função de decaimento de Adstock Recomendação de defasagem máxima
Geométrica 2 a 10 períodos.
Binomial 4 a 20 períodos.
Combinação geométrica/binomial 4 a 20 períodos.

Para mais detalhes sobre as funções de decaimento e a distribuição a priori Alfa, consulte Definir o parâmetro adstock_decay_spec.