Sử dụng Google Analytics bằng R

Andy Granowitz, Người hỗ trợ nhà phát triển Google Analytics – Tháng 9 năm 2014

Mục tiêu của bài viết này là khuyến khích các nhà thống kê, nhà nghiên cứu và nhà khoa học dữ liệu tuyệt vời hiện đang sử dụng R để xem Google Analytics như một tập dữ liệu hữu ích. Tương tự như vậy, để khuyến khích người dùng Google Analytics sử dụng R cho những nhu cầu xử lý dữ liệu nghiêm túc của họ. Bài viết này trình bày một ví dụ minh hoạ cách đo lường giá trị lâu dài của các chiến dịch tiếp thị bằng dữ liệu Google Analytics bằng ngôn ngữ R.

Giới thiệu

R, ngôn ngữ lập trình phổ biến cho tính toán thống kê, là một công cụ mạnh mẽ để phân tích và lấy thông tin chi tiết từ dữ liệu. Khi kết hợp R với dữ liệu Google Analytics, bạn có thể phân tích thống kê và tạo hình ảnh trực quan về dữ liệu để hiểu rõ hơn và cải thiện công việc kinh doanh của mình.

Phần còn lại của bài viết này mô tả các bước cần thiết để tạo một số dữ liệu và biểu đồ chi tiết bằng thư viện Google Analytics với R.

Thiết lập

Thư viện RGoogleAnalytics cho phép bạn truy xuất dữ liệu Google Analytics nguyên gốc từ R. Cách bắt đầu:

  1. Xác minh rằng bạn có quyền truy cập vào tài khoản Google Analytics chứa dữ liệu có thể dùng để phân tích
  2. Cài đặt R
  3. Cài đặt gói RGoogleAnalytics
  4. Làm theo mã mẫu trên GitHub để đảm bảo bạn có thể truy cập vào dữ liệu Google Analytics trong R

Để xem các tài nguyên khác về cách thiết lập, hãy truy cập vào hướng dẫn thiết lập RGoogleAnalytics.

Câu hỏi

Giá trị lâu dài của các chiến dịch tiếp thị là gì?

Báo cáo chuẩn trong Google Analytics có thể giúp bạn xác định xem chiến dịch tiếp thị có dẫn đến lượt chuyển đổi trong ngắn hạn hay không, nhưng có thể khó xác định giá trị dài hạn của chiến dịch vì bạn phải thực hiện phân tích tích luỹ.

Phân tích

Để xác định giá trị lâu dài của các chiến dịch tiếp thị, bạn có thể sử dụng R để tạo biểu đồ giao dịch và doanh thu tích luỹ cho các nhóm thuần tập nhất định. Bằng cách này, bạn sẽ có thể xem số lượng giao dịch mà một nhóm khách hàng thu nạp được thông qua một chiến dịch tiếp thị nhất định trong một khoảng thời gian dài hơn. Điều này trái ngược với cách phân tích chuẩn hơn, trong đó bạn có thể quan sát xem liệu một khách hàng đã truy cập vào cơ sở lưu trú của bạn từ một chiến dịch tiếp thị có mua hàng ngay lập tức hay không.

Truy vấn

Để thực hiện việc phân tích này, bạn có thể sửa đổi truy vấn mẫu của RGoogleAnalytics. Truy vấn sau đây cho biết giao dịch và doanh thu của tất cả người dùng đã truy cập vào trang web thông qua Chiến dịch A lần đầu tiên từ ngày 1 tháng 9 đến ngày 7 tháng 9 năm 2014 và thực hiện giao dịch mua tại một thời điểm nào đó trong khoảng thời gian từ ngày 1 đến ngày 29 tháng 11.

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

Nếu phân đoạn này bị bỏ qua, truy vấn này sẽ trích xuất giao dịch và doanh thu của tất cả người dùng theo ngày. Bạn chỉ được thêm phân khúc này qua những người dùng đã truy cập vào trang web lần đầu tiên và đã thực hiện giao dịch trong khoảng thời gian đã chỉ định.

Tìm hiểu Phân khúc

Phân khúc này bao gồm một số điều kiện theo trình tự:

  1. Phân đoạn này chọn users:: để bao gồm không chỉ các phiên phù hợp với điều kiện, mà còn bao gồm tất cả các phiên của những người dùng phù hợp với điều kiện.
  2. Tiền tố sequence:: cho phép lựa chọn một nhóm người dùng đã hoàn thành một nhóm các bước được chỉ định. Trong trường hợp này, bước đầu tiên là truy cập từ một chiến dịch nhất định trong một khoảng thời gian nhất định, và bước thứ hai là mua hàng.
  3. Tiền tố ^ đứng trước ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 đảm bảo rằng các điều kiện Ngày của phiên, Chiến dịch và Loại người dùng là đúng cho lượt truy cập đầu tiên của phiên đầu tiên trong phạm vi ngày đã chọn.
  4. ->>perSession::ga:transactions>0 chỉ định bước thứ hai của quá trình mua hàng vào một thời điểm nào đó.

Hãy tham khảo Hướng dẫn cho nhà phát triển phân khúc để biết thêm chi tiết về phân khúc có thể tạo và cú pháp chi tiết nếu bạn muốn sửa đổi phân khúc này hoặc tạo phân khúc của riêng bạn.

Xử lý kết quả

Kết quả của truy vấn này là số giao dịch và doanh thu mỗi ngày cho nhóm người dùng được chỉ định. Bạn có thể chuyển đổi doanh thu và giao dịch hằng ngày hoặc gia tăng mỗi ngày thành số tích luỹ trong R bằng cách sử dụng hàm cumsum. Sau đó, bạn có thể lập biểu đồ dữ liệu này bằng hàm plot hoặc gói ggplot2.

Biểu đồ giao dịch gia tăng cho thấy số lượng giao dịch xảy ra mỗi ngày, còn biểu đồ giao dịch tích luỹ lại cho biết tổng số giao dịch đã xảy ra tính đến mỗi ngày. Do đó, biểu đồ giao dịch tích luỹ cho phép chúng ta thấy được giá trị dài hạn hơn của từng chiến dịch:

Kết quả

Khi phân tích hai chiến dịch này, chúng ta thấy rằng mặc dù những khách hàng thu nạp được từ Chiến dịch A đã hoàn thành nhiều lượt giao dịch hơn so với số khách hàng thu nạp được từ Chiến dịch B trong 4 tuần đầu tiên, nhưng về lâu dài, khách hàng của Chiến dịch B đã hoàn thành nhiều lượt giao dịch tích luỹ hơn. Nếu chỉ xem xét các giao dịch xảy ra ngay sau khi người dùng truy cập vào Chiến dịch A hoặc Chiến dịch B, bạn sẽ có thể kết luận không chính xác rằng Chiến dịch A hiệu quả hơn.

Chiến dịch A so với chiến dịch B theo thời gian. Chiến dịch A ban đầu hoạt động tốt hơn Chiến dịch B, nhưng không phải trong 9 tuần

Hy vọng rằng điều này sẽ thôi thúc bạn phân tích dữ liệu Google Analytics bằng R. Truy cập vào diễn đàn API Báo cáo Google Analytics để chia sẻ một số bản phân tích thú vị mà bạn đang thực hiện.

Video giới thiệu tổng quan

Video dưới đây trình bày ví dụ trong bài viết này. Ngoài ra, chúng tôi cũng trình bày hai trường hợp sử dụng R khác với Google Analytics.