일괄 데이터 내보내기: Search Console 데이터에 액세스하는 새롭고 강력한 방법

2023년 2월 21일 화요일

오늘 Google은 Search Console에서 Google BigQuery로 데이터를 지속적으로 내보낼 수 있는 새로운 기능인 일괄 데이터 내보내기를 발표합니다. 배포에는 1주일 정도 소요되므로 바로 이 기능을 사용하지 못할 수도 있습니다.

Search Console에서 내보내기를 구성하여 매일 BigQuery 프로젝트로 데이터 덤프를 가져올 수 있습니다. 이러한 데이터에는 개인 정보 보호를 위해 필터링으로 제외된 익명처리된 쿼리 이외의 모든 성능 데이터가 포함됩니다. 다시 말해 일괄 데이터 내보내기는 일일 데이터 행 한도의 영향을 받지 않습니다. 즉, 데이터를 최대한 활용하여 다른 데이터 소스와 결합하고 고급 분석 및 시각화 기법을 사용하는 것이 가능합니다.

이 데이터 내보내기는 페이지가 수만 개에 달하는 대규모 웹사이트나 하루에 수만 개의 쿼리에 대한 트래픽을 수신하는 웹사이트(또는 둘 다)에 특히 유용합니다. 중소 규모의 사이트에서는 사용자 인터페이스, Looker Studio 커넥터(이전 명칭: 데이터 스튜디오), Search Analytics API를 통해 전체 데이터에 액세스할 수 있습니다.

새 일괄 데이터 내보내기 설정

새 보고서를 구성하려면 데이터를 수신할 BigQuery 계정을 준비한 다음 Search Console 설정에서 세부정보를 설정해야 합니다. 고객센터에서 단계별 가이드를 확인하세요. 일반적으로 절차는 두 단계로 나뉩니다.

  1. Cloud 프로젝트 준비(Google Cloud Console 내): 프로젝트에 BigQuery API를 사용 설정하고 Search Console 서비스 계정에 권한을 부여하는 작업이 포함됩니다.
  2. 내보내기 대상 설정(Search Console 내): Google Cloud 프로젝트 ID를 제공하고 데이터 세트 위치를 선택하는 작업이 포함됩니다. 속성 소유자만 일괄 데이터 내보내기를 설정할 수 있습니다.

Search Console 일괄 데이터 내보내기 설정 페이지

Search Console에 정보를 제출하면 내보내기가 시뮬레이션됩니다. 내보내기에 성공하면 모든 속성 소유자에게 이메일이 전송되며, 내보내기는 48시간 이내에 시작됩니다. 내보내기 시뮬레이션에 실패하면 문제가 감지된 즉시 알림을 받게 됩니다. 발생 가능한 내보내기 오류 목록을 참고하세요.

일괄 데이터 내보내기에서 사용 가능한 데이터

일괄 데이터 내보내기가 성공적으로 설정되면 BigQuery 계정에 로그인하여 데이터 쿼리를 시작할 수 있습니다.

고객센터에서 자세한 표 가이드라인 및 참조를 확인할 수 있습니다. 속성별 및 페이지별 데이터 집계의 차이점에 대한 설명도 확인하세요. 데이터를 이해하는 데 도움이 됩니다 이때 제공되는 표 3개에 대한 간략한 설명은 다음과 같습니다.

  • searchdata_site_impression: 이 표에는 쿼리, 국가, 유형, 기기 등 속성별로 집계된 데이터가 포함되어 있습니다.
  • searchdata_url_impression: 이 표에는 URL별로 집계된 데이터가 포함되어 있어 검색어 및 리치 결과를 더 자세히 확인할 수 있습니다.
  • ExportLog: 이 테이블에는 특정 날짜에 저장된 데이터에 관한 기록이 표시됩니다. 실패한 내보내기는 여기에 기록되지 않습니다.
BigQuery 인터페이스에 표시된 일괄 데이터 내보내기 표

데이터 쿼리를 시작하는 데 도움이 필요한 경우 고객센터에 게시된 샘플 쿼리를 확인하면 쿼리를 준비하고 실행하는 데 도움이 됩니다. 다음 예에서는 지난 2주간 FAQ 리치 결과 노출수가 100회 이상인 페이지의 URL 조합별로 총 쿼리를 가져왔습니다.

SELECT
  url,
  query,
  sum(impressions) AS impressions,
  sum(clicks) AS clicks,
  sum(clicks) / sum(impressions) AS ctr,
  /* Added one below, because position is zero-based */
  ((sum(sum_position) / sum(impressions)) + 1.0) AS avg_position
/* Remember to update the table name to your table */
FROM searchconsole.searchdata_url_impression
WHERE search_type = 'WEB'
  AND is_tpf_faq = true
  AND data_date BETWEEN DATE_SUB(CURRENT_DATE(), INTERVAL 14 day) AND CURRENT_DATE()
  AND clicks > 100
GROUP BY 1,2
ORDER BY clicks
LIMIT 1000

Google은 더 많은 Google 검색 데이터를 제공함으로써 웹사이트 소유자와 검색엔진 최적화 전문업체가 롱테일 검색어를 분석하여 더 많은 콘텐츠 기회를 찾을 수 있기를 바랍니다. 더 많은 Google 검색 데이터를 제공하면 내부 시스템의 페이지 수준 정보를 Google 검색결과에 더 쉽고 포괄적으로 통합할 수도 있게 됩니다.

궁금한 점이나 우려되는 사항이 있으면 Google 검색 센터 커뮤니티트위터를 통해 문의해 주시기 바랍니다.