Использование Google Analytics с R

Энди Грановиц , адвокат разработчиков Google Analytics, сентябрь 2014 г.

Цель этой статьи — побудить великих статистиков, исследователей и специалистов по обработке данных, которые в настоящее время используют R, рассматривать Google Analytics как полезный набор данных, а также побудить пользователей Google Analytics использовать R для своих серьезных задач по обработке данных. В этой статье рассматривается пример, демонстрирующий, как измерить долгосрочную ценность маркетинговых кампаний с использованием данных Google Analytics в R.

Введение

R , популярный язык программирования для статистических вычислений, является мощным инструментом для анализа и извлечения информации из данных. Объединив R с данными Google Analytics, вы сможете выполнять статистический анализ и создавать визуализации данных, чтобы лучше понять и улучшить свой бизнес.

Оставшаяся часть этой статьи описывает шаги, необходимые для создания некоторых полезных данных и графиков с использованием библиотеки Google Analytics с R.

Настраивать

Библиотека RGoogleAnalytics позволяет получать данные Google Analytics непосредственно из R. Для начала:

  1. Убедитесь, что у вас есть доступ к учетной записи Google Analytics, содержащей данные, которые можно использовать для анализа.
  2. Установить Р
  3. Установите пакет RGoogleAnalytics.
  4. Следуйте примеру кода на Github, чтобы убедиться, что вы можете получить доступ к данным Google Analytics в R.

Дополнительные ресурсы по настройке можно найти в руководстве по настройке RGoogleAnalytics .

Вопрос

Какова долгосрочная ценность моих маркетинговых кампаний?

Стандартные отчеты в Google Analytics могут помочь вам определить, приводят ли маркетинговые кампании к конверсиям в краткосрочной перспективе, но определить долгосрочную ценность кампаний может быть сложно, поскольку для этого требуется выполнять совокупный анализ.

Анализ

Чтобы определить долгосрочную ценность маркетинговых кампаний, вы можете использовать R для создания графиков совокупного дохода и транзакций для заданных когорт. Таким образом, вы сможете увидеть, сколько транзакций совершила группа клиентов, привлеченных в результате конкретной маркетинговой кампании, в течение более длительного периода времени. Это отличается от более стандартного анализа, при котором вы можете наблюдать, сделал ли клиент, посетивший ваш объект в рамках маркетинговой кампании, сразу же покупку или нет.

Запрос

Чтобы выполнить этот анализ, можно изменить образец запроса RGoogleAnalytics . Следующий запрос ниже извлекает транзакции и доходы для всех пользователей, которые впервые посетили сайт из кампании А в период с 1 по 7 сентября 2014 г. и совершили покупку в какой-то момент между 1 сентября и 29 ноября.

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

Если сегмент опущен, этот запрос извлекает транзакции и доходы для всех пользователей по дате. При добавлении сегмента учитываются только пользователи, которые впервые посетили сайт и совершили транзакцию между указанными периодами времени.

Понимание сегмента

Сегмент состоит из нескольких условий последовательности:

  1. Сегмент выбирает users:: для того, чтобы включить не только сеансы, соответствующие условиям, но и все сеансы среди пользователей, соответствующих условиям.
  2. Префикс sequence:: позволяет выбрать набор пользователей, выполнивших указанный набор шагов. В этом случае первым шагом является посещение определенной кампании в заданный период времени, а вторым шагом — совершение покупки.
  3. Префикс ^ перед ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 гарантирует, что условия «Дата сеанса», «Кампания» и «Тип пользователя» верны для первого обращения первого сеанса. в указанном диапазоне дат.
  4. ->>perSession::ga:transactions>0 указывает второй этап совершения покупки в определенный момент.

Обратитесь к Руководству разработчика сегментов для получения более подробной информации о возможных сегментах для создания и подробностях синтаксиса, если вы хотите изменить этот сегмент или создать свой собственный.

Работа с результатами

Результатом этого запроса являются транзакции и доход в день для указанной группы пользователей. Ежедневные или дополнительные транзакции и доход за день можно превратить в совокупные числа в R с помощью функции cumsum . Затем эти данные можно отобразить в виде графика с помощью функции plot или пакета ggplot2 .

В то время как график дополнительных транзакций показывает количество транзакций, произошедших на каждую дату, график совокупных транзакций показывает общее количество транзакций, произошедших до каждой даты включительно. Таким образом, график совокупных транзакций позволяет нам увидеть долгосрочную ценность каждой кампании:

Исход

Анализируя эти две кампании, мы видим, что хотя клиенты, привлеченные в рамках кампании А, за первые четыре недели совершили больше транзакций, чем клиенты, привлеченные в рамках кампании Б, в долгосрочной перспективе клиенты из кампании Б совершили больше совокупных транзакций. Если рассматривать только транзакции, которые произошли сразу после посещения кампании А или Б, можно было бы сделать неверный вывод о том, что кампания А была более эффективной.

Кампания А против кампании Б с течением времени. Кампания А превосходит кампанию Б изначально, но не за все 9 недель.

Надеемся, это пробудило у вас интерес к анализу данных Google Analytics в R. Посетите форум Google Analytics Reporting API, чтобы поделиться интересными результатами анализа, которые вы проводите.

Видеообзор

В видео ниже показан пример из этой статьи. Кроме того, представлены два других варианта использования R с Google Analytics.