Xuất dữ liệu hàng loạt: một cách thức mới và hiệu quả để truy cập dữ liệu Search Console

Thứ Ba, ngày 21 tháng 2 năm 2023

Hôm nay, chúng tôi xin giới thiệu tính năng xuất dữ liệu hàng loạt. Đây là một tính năng mới cho phép bạn liên tục xuất dữ liệu từ Search Console sang Google BigQuery. (Xin lưu ý rằng quá trình phát hành sẽ mất khoảng một tuần, do đó, bạn có thể chưa truy cập được ngay lập tức.)

Bạn có thể định cấu hình quy trình xuất dữ liệu trong Search Console để nhận dữ liệu hằng ngày vào dự án BigQuery. Dữ liệu này bao gồm tất cả dữ liệu về hiệu suất (trừ các cụm từ tìm kiếm ẩn danh được lọc ra vì lý do bảo mật). Nói cách khác, quy trình xuất dữ liệu hàng loạt sẽ không bị ảnh hưởng bởi giới hạn hàng dữ liệu hằng ngày. Nhờ vậy, bạn có thể khai thác tối đa dữ liệu của mình, kết hợp dữ liệu đó với nhiều nguồn dữ liệu khác và sử dụng các kỹ thuật phân tích và trực quan hoá nâng cao.

Tính năng xuất dữ liệu này có thể đặc biệt hữu ích đối với những trang web quy mô lớn có hàng chục nghìn trang hoặc những trang web nhận lưu lượng truy cập từ hàng chục nghìn cụm từ tìm kiếm mỗi ngày (hoặc cả hai!). Các trang web quy mô vừa và nhỏ đã có quyền truy cập vào tất cả dữ liệu thông qua giao diện người dùng, trình kết nối Looker Studio (trước đây là Data Studio) hoặc API Search Analytics.

Thiết lập quy trình xuất dữ liệu hàng loạt mới

Để định cấu hình báo cáo mới, bạn cần cài đặt cho tài khoản BigQuery nhận dữ liệu và thiết lập thông tin chi tiết trong chế độ cài đặt Search Console. Hãy truy cập vào Trung tâm trợ giúp nếu bạn muốn xem hướng dẫn từng bước. Nhìn chung, quy trình này được chia thành hai giai đoạn:

  1. Chuẩn bị dự án Cloud (bên trong Google Cloud Console): giai đoạn này bao gồm việc bật API BigQuery cho dự án và cấp quyền cho tài khoản dịch vụ Search Console của bạn.
  2. Đặt điểm đến của quy trình xuất (bên trong Search Console): giai đoạn này bao gồm việc cung cấp mã dự án trên Google Cloud và chọn một vị trí tập dữ liệu. Lưu ý: chỉ chủ sở hữu tài sản mới có thể thiết lập quy trình xuất dữ liệu hàng loạt.

Trang cài đặt xuất dữ liệu hàng loạt trong Search Console

Sau khi bạn gửi thông tin đến Search Console, Search Console sẽ bắt đầu mô phỏng quy trình xuất. Nếu xuất thành công, chúng tôi sẽ gửi thông báo qua email cho tất cả chủ sở hữu tài sản và bắt đầu quá trình xuất trong vòng 48 giờ sau đó. Nếu mô phỏng xuất không thành công, bạn sẽ ngay lập tức nhận được cảnh báo về vấn đề chúng tôi phát hiện được. Sau đây là danh sách các lỗi có thể xảy ra khi xuất dữ liệu.

Dữ liệu đã xuất hiện trong quy trình xuất dữ liệu hàng loạt

Sau khi thiết lập thành công quy trình xuất dữ liệu hàng loạt, bạn có thể đăng nhập vào tài khoản BigQuery và bắt đầu truy vấn dữ liệu.

Bạn có thể xem nguyên tắc và tài liệu tham khảo chi tiết về bảng trong trung tâm trợ giúp và nội dung giải thích sự khác biệt giữa tổng hợp dữ liệu theo tài sản với tổng hợp dữ liệu theo trang để hiểu rõ hơn về dữ liệu. Dưới đây là phần mô tả ngắn gọn về ba bảng mà bạn dùng được:

  • searchdata_site_impression: Bảng này chứa dữ liệu được tổng hợp theo tài sản (bao gồm cụm từ tìm kiếm, quốc gia, loại và thiết bị).
  • searchdata_url_impression: Bảng này chứa dữ liệu được tổng hợp theo URL để giúp bạn hiểu chi tiết hơn về cụm từ tìm kiếm và kết quả nhiều định dạng.
  • ExportLog: Bảng này ghi nhận những dữ liệu đã được lưu vào ngày đó. Những lượt xuất dữ liệu không thành công sẽ không được ghi nhận tại đây.
Bảng xuất dữ liệu hàng loạt xuất hiện trong giao diện BigQuery

Nếu bạn cần hỗ trợ để bắt đầu truy vấn dữ liệu, hãy tham khảo các truy vấn mẫu được phát hành trong trung tâm trợ giúp. Bạn có thể thiết lập và khởi chạy những truy vấn này. Sau đây là một ví dụ về trường hợp chúng tôi tổng hợp số cụm từ tìm kiếm theo tổ hợp URL cho những trang có ít nhất 100 lượt hiển thị kết quả nhiều định dạng cho câu hỏi thường gặp trong hai tuần qua.

SELECT
  url,
  query,
  sum(impressions) AS impressions,
  sum(clicks) AS clicks,
  sum(clicks) / sum(impressions) AS ctr,
  /* Added one below, because position is zero-based */
  ((sum(sum_position) / sum(impressions)) + 1.0) AS avg_position
/* Remember to update the table name to your table */
FROM searchconsole.searchdata_url_impression
WHERE search_type = 'WEB'
  AND is_tpf_faq = true
  AND data_date BETWEEN DATE_SUB(CURRENT_DATE(), INTERVAL 14 day) AND CURRENT_DATE()
  AND clicks > 100
GROUP BY 1,2
ORDER BY clicks
LIMIT 1000

Chúng tôi hy vọng rằng với nguồn dữ liệu bổ sung của Google Tìm kiếm, các chủ sở hữu trang web và chuyên gia SEO sẽ có được nhiều cơ hội cải thiện nội dung hơn nhờ phân tích các cụm từ tìm kiếm dài. Việc này cũng giúp bạn dễ dàng kết hợp thông tin cấp trang từ các hệ thống nội bộ với kết quả trên Tìm kiếm một cách hiệu quả và toàn diện hơn.

Như thường lệ, nếu bạn có câu hỏi hoặc thắc mắc, vui lòng liên hệ qua Cộng đồng Trung tâm Google Tìm kiếm hoặc qua Twitter.