Utilisation de Google Analytics avec R

Andy Granowitz, porte-parole des développeurs Google Analytics – septembre 2014

L'objectif de cet article est d'encourager les grands statisticiens, chercheurs et data scientists qui utilisent actuellement le langage R à se tourner vers Google Analytics comme un ensemble de données utile, et à inciter les utilisateurs de Google Analytics à exploiter R pour traiter leurs principaux besoins en traitement de données. Cet article présente un exemple qui montre comment mesurer la valeur à long terme de campagnes marketing à l'aide des données Google Analytics dans le langage R.

Présentation

R, le langage de programmation courant pour les calculs statistiques, est un outil puissant pour analyser des données et en tirer des insights. Lorsque vous combinez R avec vos données Google Analytics, vous pouvez effectuer des analyses statistiques et générer des visualisations de données afin de mieux comprendre et d'améliorer votre activité.

Le reste de cet article décrit les étapes nécessaires pour générer des données et des graphiques utiles à l'aide de la bibliothèque Google Analytics avec R.

Préparation

La bibliothèque RGoogleAnalytics vous permet de récupérer des données Google Analytics de manière native à partir de R. Pour commencer :

  1. Vérifier que vous avez accès à un compte Google Analytics contenant des données pouvant être utilisées à des fins d'analyse
  2. Installer R
  3. Installer le package RGoogleAnalytics
  4. Suivez l' exemple de code sur GitHub pour vous assurer que vous pouvez accéder aux données Google Analytics dans le langage R

Pour obtenir des ressources de configuration supplémentaires, consultez le guide de configuration de RGoogleAnalytics.

Question

Quelle est la valeur à long terme de mes campagnes marketing ?

Les rapports standards de Google Analytics peuvent vous aider à déterminer si les campagnes marketing génèrent des conversions à court terme. Toutefois, il peut être difficile de déterminer la valeur des campagnes à long terme, car cela nécessite d'effectuer une analyse cumulative.

Analyse

Pour déterminer la valeur à long terme des campagnes marketing, vous pouvez utiliser R pour générer des graphiques de revenus et de transactions cumulés pour des cohortes données. De cette façon, vous pourrez voir le nombre de transactions réalisées par un groupe de clients à partir d'une campagne marketing donnée au cours d'une période plus longue. En revanche, une analyse plus standard vous permet de déterminer si un client ayant visité votre propriété à partir d'une campagne marketing a effectué un achat immédiatement.

La requête

Pour effectuer cette analyse, vous pouvez modifier l' exemple de requête RGoogleAnalytics. La requête ci-dessous extrait les transactions et les revenus de tous les utilisateurs qui ont visité le site pour la première fois de la campagne A entre le 1er et le 7 septembre 2014, et qui ont effectué un achat entre le 1er et le 29 novembre.

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

Si le segment est omis, cette requête extrait les transactions et les revenus de tous les utilisateurs par date. L'ajout du segment n'inclut que les utilisateurs qui ont visité le site pour la première fois et ont effectué une transaction entre les périodes spécifiées.

Comprendre le segment

Le segment est composé de quelques conditions de séquence:

  1. Le segment sélectionne users:: afin d'inclure non seulement les sessions qui correspondent aux conditions, mais aussi toutes les sessions des utilisateurs qui remplissent les conditions.
  2. Le préfixe sequence:: permet de sélectionner un ensemble d'utilisateurs ayant effectué un ensemble d'étapes spécifié. Dans ce cas, la première étape consiste à effectuer une visite à partir d'une campagne donnée au cours d'une période donnée. La deuxième étape consiste à effectuer un achat.
  3. Le préfixe ^ devant ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 garantit que les conditions "Date de la session", "Campagne" et "Type d'utilisateur" sont vraies pour le premier appel de la première session de la période donnée.
  4. ->>perSession::ga:transactions>0 spécifie la deuxième étape d'un achat à un moment donné.

Si vous souhaitez modifier ce segment ou créer le vôtre, consultez le Guide du développeur de segments pour en savoir plus sur les segments possibles et sur leur syntaxe.

Analyse des résultats

Le résultat de cette requête est le nombre de transactions et le revenu quotidien pour le groupe d'utilisateurs spécifié. Les transactions quotidiennes ou incrémentielles et les revenus par jour peuvent être convertis en nombres cumulés dans R à l'aide de la fonction cumsum. Ces données peuvent ensuite être représentées graphiquement à l'aide de la fonction plot ou du package ggplot2.

Alors qu'un graphique de transactions incrémentielles indique le nombre de transactions qui ont eu lieu à chaque date, un graphique de transactions cumulatives indique le nombre total de transactions qui ont eu lieu jusqu'à chaque date (incluse). Par conséquent, le graphique des transactions cumulées nous permet de déterminer la valeur à plus long terme de chaque campagne:

Résultat

En analysant ces deux campagnes, nous constatons que même si les clients acquis via la campagne A ont effectué plus de transactions que ceux acquis via la campagne B pendant les quatre premières semaines, à long terme, les clients de la campagne B ont effectué plus de transactions cumulées. Si vous n'examineriez que les transactions qui se sont produites juste après une visite de la campagne A ou B, vous auriez pu conclure à tort que la campagne A était plus efficace.

la comparaison entre la campagne A et la campagne B au fil du temps. La campagne A enregistre de meilleures performances que la campagne B dans un premier temps, mais pas sur les neuf semaines

Nous espérons que cela vous a donné envie d'analyser les données Google Analytics dans le langage R. Consultez le forum consacré à l'API Reporting de Google Analytics pour partager certaines des analyses intéressantes que vous effectuez.

Vidéo de présentation

La vidéo ci-dessous présente l'exemple présenté dans cet article. Deux autres cas d'utilisation de R avec Google Analytics sont également présentés.