Como trabalhar com ruídos

Saiba como trabalhar, considerar e reduzir o impacto do ruído nos relatórios agregáveis.

Antes de começar

Antes de continuar, para entender melhor o que é o ruído e o impacto dele, consulte Noções básicas sobre ruído em relatórios de resumo.

Seus controles de ruído

Embora não seja possível controlar diretamente o ruído adicionado aos relatórios agregáveis, você pode seguir algumas etapas para minimizar os efeitos. As seções a seguir explicam essas estratégias.

Escalonar verticalmente para o orçamento de contribuição

Como explicado em "Noções básicas sobre ruído", o ruído aplicado ao valor do resumo de cada chave é baseado na escala de 0 a 65.536 (0 a CONTRIBUTION_BUDGET).

A distribuição de ruído é baseada no orçamento.

Por isso, para maximizar o sinal em relação ao ruído, aumente cada valor antes de defini-lo como um valor agregável, ou seja, multiplique cada valor por um determinado fator de escalonamento, garantindo que ele permaneça dentro do orçamento de contribuição.

Ruído relativo com e sem dimensionamento.

Como calcular um fator de escalonamento

O fator de escalonamento representa o quanto você quer escalonar um determinado valor agregável. O valor deve ser o orçamento de contribuição dividido pelo valor agregável máximo de uma determinada chave.

Determinar o fator de escalonamento com base no orçamento de contribuição.

Por exemplo, vamos supor que os anunciantes queiram saber o valor total da compra. Você sabe que o valor máximo esperado de compra de qualquer compra individual é de US $2.000, exceto alguns valores atípicos que você decide ignorar:

  • Calcule o fator de escalonamento:
    • Para maximizar a proporção sinal-ruído, você precisa aumentar esse valor para 65.536 (o orçamento de contribuição).
    • Isso resulta em um fator de escalonamento 65.536 / 2.000 de aproximadamente 32x. Na prática, é possível arredondar esse fator para cima ou para baixo.
  • Aumente os valores antes da agregação. Para cada R$1 de compra, aumente o valor da métrica rastreada em 32. Por exemplo, para uma compra de R$120, defina um valor agregável de 120*32 = 3.840.
  • Reduzir os valores após a agregação. Depois de receber o relatório de resumo com o valor de compra somado de vários usuários, reduza o valor do resumo usando o fator de escalonamento usado antes da agregação. No exemplo, usamos um fator de escalonamento de 32 pré-agregação, então precisamos dividir o valor do resumo recebido no relatório de resumo por 32. Portanto, se o valor da compra resumida para uma determinada chave no relatório do resumo for 76.800, o valor da compra do resumo (com ruído) será 76.800/32 = US $2.400.

Dividir o orçamento

Se você tiver várias metas de medição (por exemplo, contagem e valor da compra), divida o orçamento entre elas.

Nesse caso, seus fatores de escalonamento serão diferentes para diferentes valores agregáveis, dependendo do máximo esperado de um determinado valor agregável.

Confira mais detalhes em Noções básicas sobre chaves de agregação.

Por exemplo, vamos supor que você esteja acompanhando a contagem e o valor da compra e que decida alocar seu orçamento igualmente.

65.536 / 2 = 32.768 podem ser alocados por tipo de medição e por origem.

  • Contagem de compras:
    • Você está acompanhando somente uma compra, portanto, o número máximo de compras para uma determinada conversão é 1.
    • Portanto, você decide definir o fator de dimensionamento da contagem de compras como 32.768 / 1 = 32.768.
  • Valor de compra:
    • Vamos supor que o valor máximo esperado de compra de qualquer compra individual seja de US $2.000.
    • Portanto, você decide definir o fator de dimensionamento do valor de compra como 32.768 / 2.000 = 16,384 ou aproximadamente 16.

Chaves de agregação mais grossas melhoram a relação sinal-ruído

Como as chaves aproximadas capturam mais eventos de conversão do que as granulares, elas geralmente levam a valores de resumo mais altos.

Valores de resumo mais altos são menos afetados pelo ruído do que valores mais baixos. o ruído nesses valores provavelmente será menor em relação a esse valor.

Os valores coletados com chaves mais aproximadas provavelmente serão relativamente menos ruidosos do que os coletados com chaves mais granulares.

Exemplo

Se o restante for mantido igual, uma chave que rastreia o valor de compra globalmente (somada em todos os países) vai gerar um valor de compra resumido mais alto (e uma contagem de conversões resumidas mais alta) do que uma chave que rastreia conversões no nível de um país.

Portanto, o ruído relativo no valor total de compra de um país específico é maior do que o ruído relativo no valor total de compra de todos os países.

Da mesma forma, em todo o restante, o valor de compra total de sapatos é menor do que o valor total de compra de todos os itens (incluindo sapatos).

Portanto, o ruído relativo no valor total de compra de sapatos será maior do que o ruído relativo no valor total de compra de todos os itens.

Impacto de ruído com teclas granulares ou aproximadas.

Somar os valores de resumo (agrupamentos) também soma o ruído.

Ao somar os valores de resumo dos relatórios de resumo para acessar dados de nível mais alto, você também soma o ruído desses valores resumidos.

O grau de ruído com chaves granulares com consolidações em comparação com chaves aproximadas sem consolidações.

Vejamos duas abordagens diferentes: - Abordagem A: você inclui um ID de geografia nas suas chaves. Os relatórios de resumo expõem chaves no nível do ID geográfico, cada uma associada ao valor da compra do resumo em um nível específico do ID geográfico. - Abordagem B: você não inclui o ID de geografia nas suas chaves. Os relatórios de resumo expõem diretamente o valor da compra resumido para todos os IDs / locais de regiões geográficas.

Para acessar o valor de compra no nível do país: - Com a abordagem A, você soma os valores de resumo no nível do ID geográfico e, portanto, também soma o ruído. É provável que isso faça mais ruído adicionado ao valor de compra final no nível do ID geográfico. - Na abordagem B, você analisa diretamente os dados expostos nos relatórios resumidos. O ruído foi adicionado apenas uma vez a esses dados.

Portanto, o valor resumido de compra para um determinado ID de localização geográfica provavelmente será mais ruidoso com a abordagem A.

Da mesma forma, incluir uma dimensão no nível do CEP nas suas chaves provavelmente levará a resultados com mais ruído do que usar chaves mais aproximadas com uma dimensão no nível da região.

A agregação em períodos mais longos aumenta a relação sinal-ruído

Solicitar relatórios de resumo com menos frequência significa que cada valor de resumo provavelmente será maior do que se você solicitou relatórios com mais frequência; é provável que mais conversões aconteçam em períodos mais longos.

Como mencionado anteriormente, quanto maior o valor de resumo, menor será o ruído relativo. Portanto, solicitar relatórios de resumo com menos frequência leva a uma proporção de indicador/ruído mais alta (melhor).

Solicitar relatórios de resumo com menos frequência leva a uma proporção maior entre o indicador e o ruído

Aqui está um exemplo para ilustrar:

  • Se você solicitar relatórios de resumo por hora durante 24 horas e somar o valor do resumo de cada um deles para acessar dados diários, o ruído será adicionado 24 vezes.
  • Em um relatório de resumo diário, o ruído é adicionado apenas uma vez.

Épsilon maior, menor ruído

Quanto maior o valor de épsilon, menor o ruído e menor a proteção de privacidade.

Como aproveitar a filtragem e a eliminação de duplicação

Uma parte importante da alocação de orçamento entre chaves diferentes é entender quantas vezes um determinado evento pode ocorrer. Por exemplo, um anunciante pode ter interesse em apenas uma compra para cada clique, mas pode ter interesse em até três "visualizações de página do produto" e conversões. Para oferecer suporte a esses casos de uso, você também pode aproveitar os seguintes recursos de API que permitem controlar quantos relatórios são gerados e quais conversões são contadas:

Experimentando com épsilon

As adtechs podem definir épsilon como um valor maior que 0 e até 64, inclusive. Esse intervalo permite testes flexíveis. Valores mais baixos de épsilon oferecem maior proteção de privacidade. Recomendamos que você comece com épsilon=10.

Recomendações para testar

Recomendamos o seguinte: - Comece com épsilon = 10. - Caso isso cause problemas importantes nos utilitários, aumente o épsilon gradualmente. - Compartilhe seu feedback sobre pontos de inflexão específicos que você possa encontrar em relação à usabilidade dos dados.

Interaja e compartilhe feedback

Participe e experimente essa API.

Próximas etapas