การใช้ Google Analytics กับ R

Andy Granowitz ผู้ประสานงานนักพัฒนาซอฟต์แวร์ Google Analytics – กันยายน 2014

เป้าหมายของบทความนี้คือการส่งเสริมนักสถิติ นักวิจัย และนักวิทยาศาสตร์ข้อมูลที่ยอดเยี่ยมที่กำลังใช้ R ให้มอง Google Analytics เป็นชุดข้อมูลที่มีประโยชน์ และในทำนองเดียวกันก็กระตุ้นให้ผู้ใช้ Google Analytics ใช้ R ตอบสนองความต้องการที่ขาดแคลนข้อมูลมากๆ บทความนี้กล่าวถึงตัวอย่างที่สาธิตวิธีวัดมูลค่าระยะยาวของแคมเปญการตลาดโดยใช้ข้อมูล Google Analytics ใน R.

เกริ่นนำ

R เป็นภาษาโปรแกรมยอดนิยมสำหรับการประมวลผลทางสถิติ เป็นเครื่องมือที่มีประสิทธิภาพในการวิเคราะห์และดึงข้อมูลเชิงลึกจากข้อมูล เมื่อรวม R เข้ากับข้อมูล Google Analytics คุณจะทำการวิเคราะห์ทางสถิติและสร้างภาพข้อมูลเพื่อทำความเข้าใจและปรับปรุงธุรกิจของคุณได้ดีขึ้น

ส่วนที่เหลือของบทความนี้อธิบายขั้นตอนที่จำเป็นในการสร้างข้อมูลและกราฟข้อมูลเชิงลึกบางอย่างโดยใช้ไลบรารี Google Analytics ที่มี R.

ตั้งค่า

ไลบรารี RGoogleAnalytics ช่วยให้คุณดึงข้อมูล Google Analytics จาก R. โดยทำดังนี้

  1. ยืนยันว่าคุณมีสิทธิ์เข้าถึงบัญชี Google Analytics ที่มีข้อมูลที่สามารถใช้วิเคราะห์ได้
  2. ติดตั้ง R
  3. ติดตั้งแพ็กเกจ RGoogleAnalytics
  4. ทำตาม โค้ดตัวอย่างใน GitHub เพื่อให้แน่ใจว่าคุณจะเข้าถึงข้อมูล Google Analytics ได้ภายใน R

ดูแหล่งข้อมูลการตั้งค่าเพิ่มเติมได้ในคู่มือการตั้งค่า RGoogleAnalytics

คำถาม

มูลค่าระยะยาวของแคมเปญการตลาดของฉันคืออะไร

รายงานมาตรฐานใน Google Analytics ช่วยให้คุณทราบว่าแคมเปญการตลาดทําให้เกิด Conversion ในระยะสั้นหรือไม่ แต่การกําหนดมูลค่าในระยะยาวของแคมเปญอาจทําได้ยากเนื่องจากคุณต้องทำการวิเคราะห์แบบสะสม

การวิเคราะห์

หากต้องการกำหนดมูลค่าระยะยาวของแคมเปญการตลาด คุณสามารถใช้ R เพื่อสร้างกราฟรายได้และธุรกรรมสะสมสำหรับกลุ่มประชากรตามรุ่นที่กำหนด วิธีนี้จะช่วยให้ดูจำนวนธุรกรรมที่กลุ่มลูกค้าได้รับจากแคมเปญการตลาดหนึ่งๆ ในระยะเวลาที่ยาวนานขึ้นได้ ซึ่งตรงกันข้ามกับการวิเคราะห์มาตรฐานมากกว่า ซึ่งคุณสังเกตได้ว่าลูกค้าที่เข้าชมที่พักของคุณจากแคมเปญการตลาดได้ทำการซื้อทันทีหรือไม่

ข้อความค้นหา

หากต้องการทำการวิเคราะห์นี้ คุณจะแก้ไข การค้นหาตัวอย่าง RGoogleAnalytics ได้ ข้อความค้นหาต่อไปนี้ด้านล่างดึงข้อมูลธุรกรรมและรายได้ของผู้ใช้ทุกคนที่เข้าชมเว็บไซต์เป็นครั้งแรกจากแคมเปญ A ระหว่างวันที่ 1 กันยายน - 7 กันยายน 2014 และได้ทำการซื้อในช่วงวันที่ 1 กันยายน - 29 พฤศจิกายน

query.list <- Init(start.date = "2014-09-01",
        end.date = "2014-11-29",
        dimensions = "ga:date",
        metrics = "ga:transactions,ga:transactionRevenue",
        segment = "users::sequence::^ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07;ga:campaign==Campaign%20A;->>perSession::ga:transactions>0",
        max.results = 10000,
        sort = "ga:date",
        table.id = tableId)

หากละเว้นกลุ่ม การค้นหานี้จะดึงข้อมูลธุรกรรมและรายได้ของผู้ใช้ทั้งหมดตามวันที่ การเพิ่มกลุ่มจะรวมเฉพาะผู้ใช้ที่เข้าชมเว็บไซต์เป็นครั้งแรกและทำธุรกรรมระหว่างระยะเวลาที่กำหนด

ทำความเข้าใจเกี่ยวกับกลุ่ม

กลุ่มประกอบด้วยเงื่อนไขลำดับ 2-3 ข้อดังนี้

  1. กลุ่มจะเลือก users:: เพื่อรวมเซสชันที่ตรงกับเงื่อนไขและเซสชันทั้งหมดจากผู้ใช้ที่ตรงกับเงื่อนไขด้วย
  2. คำนำหน้า sequence:: ช่วยให้เลือกกลุ่มผู้ใช้ที่ดำเนินการตามชุดขั้นตอนที่ระบุได้ ในกรณีนี้ ขั้นตอนแรกคือการเข้าชมจากแคมเปญนั้นๆ ในช่วงเวลาที่ระบุ และขั้นตอนที่ 2 คือการซื้อ
  3. คำนำหน้า ^ ที่อยู่หน้า ga:userType==New%20Visitor;dateOfSession<>2014-09-01_2014-09-07 ช่วยให้แน่ใจว่าเงื่อนไขวันที่ของเซสชัน แคมเปญ และประเภทผู้ใช้เป็นจริงสำหรับ Hit แรกของเซสชันแรกในช่วงวันที่ที่ระบุ
  4. ->>perSession::ga:transactions>0 จะระบุขั้นตอนที่ 2 ของการซื้อ ณ จุดใดจุดหนึ่ง

โปรดดู คู่มือนักพัฒนาซอฟต์แวร์เกี่ยวกับกลุ่มสำหรับรายละเอียดเพิ่มเติมเกี่ยวกับกลุ่มที่เป็นไปได้ที่ควรสร้างและรายละเอียดไวยากรณ์ หากคุณต้องการแก้ไขกลุ่มนี้หรือสร้างกลุ่มเป้าหมายของคุณเอง

การทำงานกับผลลัพธ์

ผลลัพธ์ของข้อความค้นหานี้คือ ธุรกรรมและรายได้ต่อวันสำหรับกลุ่มผู้ใช้ที่ระบุ ธุรกรรมรายวันหรือรายได้ที่เพิ่มขึ้นต่อวันจะเปลี่ยนเป็นตัวเลขสะสมใน R ได้โดยใช้ฟังก์ชัน cumsum จากนั้นก็จะสร้างกราฟข้อมูลโดยใช้ฟังก์ชัน plot หรือแพ็กเกจ ggplot2 ได้

แม้ว่าพล็อตธุรกรรมที่เพิ่มขึ้นจะแสดงจำนวนธุรกรรมที่เกิดขึ้นในแต่ละวัน แต่ผังธุรกรรมแบบสะสมจะแสดงจำนวนธุรกรรมทั้งหมดที่เกิดขึ้นจนถึงวันที่แต่ละวัน ดังนั้น แผนธุรกรรมสะสมจึงช่วยให้เราเห็นมูลค่าในระยะยาวของแต่ละแคมเปญ ดังนี้

ผลลัพธ์

เมื่อวิเคราะห์ 2 แคมเปญนี้ เราพบว่าแม้ลูกค้าที่มาจากแคมเปญ A จะทำธุรกรรมมากกว่าลูกค้าที่ได้รับจากแคมเปญ B ในช่วง 4 สัปดาห์แรก แต่ในระยะยาวลูกค้าจากแคมเปญ B ทำธุรกรรมสะสมมากกว่า การดูเฉพาะธุรกรรมที่เกิดขึ้นทันทีหลังจากการเข้าชมจากแคมเปญ A หรือ B อาจนำไปสู่ข้อสรุปที่ไม่ถูกต้องว่าแคมเปญ A มีประสิทธิภาพมากกว่า

แคมเปญ A เทียบกับแคมเปญ B เมื่อเวลาผ่านไป แคมเปญ A มีประสิทธิภาพสูงกว่าแคมเปญ B ในตอนแรก แต่ไม่เกิน 9 สัปดาห์

เราหวังว่าข้อมูลนี้จะทำให้คุณอยาก วิเคราะห์ข้อมูล Google Analytics ใน R. ไปที่ ฟอรัม Google Analytics Reporting API เพื่อแชร์การวิเคราะห์อันน่าตื่นเต้นที่คุณกําลังทําอยู่

วิดีโอภาพรวม

วิดีโอด้านล่างแสดงตัวอย่างในบทความนี้ นอกจากนี้ ยังมีกรณีการใช้งานอื่นๆ อีก 2 กรณีสำหรับการใช้ R กับ Google Analytics