Używanie Google Analytics z R

Andy Granowitz, przedstawiciel ds. kontaktu z deweloperami w Google Analytics, wrzesień 2014 r.

Ten artykuł ma zachęcić wybitnych statystyków, badaczy danych i badaczy danych, którzy obecnie korzystają z funkcji R, do postrzegania Google Analytics jako przydatnego zbioru danych, a także do zachęcenia użytkowników Google Analytics do używania R w przypadku ważnych zadań związanych z analizą danych. W tym artykule przedstawiamy przykład, który pokazuje, jak mierzyć długoterminową wartość kampanii marketingowych za pomocą danych Google Analytics w modelu R.

Wstęp

R, popularny język programowania do obliczeń statystycznych, to zaawansowane narzędzie do analizowania danych i wyciągania z nich wniosków. Dzięki połączeniu R z danymi Google Analytics możesz przeprowadzać analizy statystyczne i generować wizualizacje danych, aby lepiej zrozumieć i ulepszyć swoją działalność.

W pozostałej części tego artykułu opisujemy czynności, które trzeba wykonać, aby wygenerować przydatne dane i wykresy za pomocą biblioteki Google Analytics z klasyfikacją R.

Konfiguracja

Biblioteka RGoogleAnalytics umożliwia natywne pobieranie danych Google Analytics z R. Aby rozpocząć:

  1. Sprawdź, czy masz dostęp do konta Google Analytics zawierającego dane, których można użyć do analizy
  2. Zainstaluj R
  3. Zainstaluj pakiet RGoogleAnalytics
  4. Skorzystaj z przykładowego kodu w GitHubie, aby mieć pewność, że masz dostęp do danych Google Analytics w R

Dodatkowe materiały na temat konfiguracji znajdziesz w przewodniku po konfiguracji RGoogle Analytics.

Pytanie

Jaka jest długoterminowa wartość moich kampanii marketingowych?

Raporty standardowe w Google Analytics pomogą Ci ustalić, czy kampanie marketingowe prowadzą do konwersji w krótkim terminie, ale określenie długoterminowej wartości kampanii może być trudne, ponieważ wymaga to analizy skumulowanej.

Analiza

Aby określić długoterminową wartość kampanii marketingowych, możesz użyć R do wygenerowania wykresów łącznych przychodów i transakcji dla określonych kohort. Dzięki temu dowiesz się, ile transakcji dokonanych przez grupę klientów pozyskanych dzięki danej kampanii marketingowej udało się zrealizować w dłuższym okresie. Jest to w przeciwieństwie do bardziej standardowej analizy, która umożliwia sprawdzanie, czy klient, który odwiedził Twoją usługę w ramach kampanii marketingowej, dokonał zakupu od razu.

Zapytanie

Aby przeprowadzić tę analizę, można zmodyfikować przykładowe zapytanie RGoogleAnalytics. Podane niżej zapytanie gromadzi dane o transakcjach i przychodach w przypadku wszystkich użytkowników, którzy po raz pierwszy odwiedzili witrynę z kampanii A między 1 a 7 września 2014 r., a dokonali zakupu w okresie od 1 do 29 listopada.

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

Jeśli pominiesz segment, to zapytanie wyodrębni transakcje i przychody dla wszystkich użytkowników według daty. Dodanie segmentu uwzględnia tylko użytkowników, którzy odwiedzili witrynę po raz pierwszy i zrealizowali transakcję w określonych przedziałach czasu.

Informacje o segmencie

Segment składa się z kilku warunków w sekwencji:

  1. Segment wybiera users::, by uwzględnić nie tylko sesje spełniające warunki, ale też wszystkie sesje użytkowników, którzy spełniają te warunki.
  2. Prefiks sequence:: pozwala wybrać zbiór użytkowników, którzy wykonali określony zestaw kroków. W tym przypadku pierwszym krokiem jest wizyta w ramach danej kampanii w określonym czasie, a drugim to zakup.
  3. Prefiks ^ przed ciągiem ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 gwarantuje, że warunki daty sesji, kampanii i typu użytkownika są spełnione w przypadku pierwszego działania, które nastąpi podczas pierwszej sesji w danym zakresie dat.
  4. ->>perSession::ga:transactions>0 określa w pewnym momencie drugi etap dokonywania zakupu.

Jeśli chcesz zmodyfikować ten segment lub utworzyć własny, zapoznaj się z przewodnikiem po segmentach dla programistów, aby dowiedzieć się więcej o możliwych segmentach i szczegółach składni.

Praca z wynikami

Wynikiem tego zapytania są transakcje i dzienne przychody dla określonej grupy użytkowników. Dzienne lub przyrostowe transakcje i przychody dzienne można przekształcić w skumulowane liczby w punkcie R za pomocą funkcji cumsum. Te dane można następnie wyświetlić na wykresie za pomocą funkcji plot lub pakietu ggplot2.

Przyrostowy wykres transakcji przedstawia liczbę transakcji mających miejsce każdego dnia, natomiast wykres skumulowany zawiera liczbę wszystkich transakcji, które nastąpiły do każdej daty włącznie. Dlatego wykres skumulowanych transakcji pozwala nam poznać długookresową wartość każdej kampanii:

Wynik

Analizując te 2 kampanie, zauważamy, że chociaż klienci pozyskani dzięki kampanii A zrealizowali więcej transakcji przez pierwsze cztery tygodnie niż klienci pozyskani w kampanii B, w dłuższej perspektywie klienci z kampanii B zrealizowali więcej transakcji łącznie. Analiza tylko transakcji, które wystąpiły bezpośrednio po wizycie z kampanii A lub B, doprowadziłaby do błędnego wniosku, że kampania A jest bardziej skuteczna.

Kampania A w porównaniu z kampanią B na przestrzeni czasu. Kampania A uzyskuje lepsze wyniki od kampanii B początkowo, ale nie przez całe 9 tygodni

Mam nadzieję, że zainteresowało Cię to analizowaniem danych Google Analytics w wersji R. Odwiedź forum interfejsu API do raportowania Google Analytics, aby podzielić się swoimi ekscytującymi analizami.

Film z omówieniem

Poniższy film przedstawia przykład z tego artykułu. Poza tym przedstawione są 2 inne przypadki użycia R w połączeniu z Google Analytics.