Импорт данных: руководство для разработчиков

Management API обеспечивает программный доступ к функции импорта данных в Google Analytics.

Введение

Management API позволяет загружать, перечислять, удалять и извлекать файлы, а также составлять списки наборов данных. Подробнее о преимуществах функции импорта данных читайте в Справочном центре.

При импорте данных используется два ресурса:

  • Пользовательский источник данных (набор данных в веб-интерфейсе), который выступает в качестве контейнера для загружаемых файлов. В коллекции таких ресурсов представлены все наборы данных, связанные с ресурсом Google Analytics.
  • Ресурс Upload, который представляет загружаемый файл. В коллекции таких ресурсов представлены все файлы, загруженные в набор данных.

Варианты использования

Для функции импорта данных определено три категории верхнего уровня, каждая из которых используется для своих целей. Вот их структура:

Импорт данных обращений

Данные о возврате средств

В Google Analytics можно загружать транзакции электронной торговли, по которым частично или полностью выполнялся возврат средств. Это позволяет автоматизировать согласование данных в отчетах.

Подробнее…

Импорт расширенных данных

Данные о пользователях

Анонимные (не позволяющие идентифицировать личность) данные о пользователях из внешних систем управления взаимодействием с клиентами можно использовать для создания аудиторий ремаркетинга Google AdWords по наиболее ценным сегментам.

Подробнее об этом вы узнаете из следующих статей:

Данные о кампании

Сведения о кампаниях можно импортировать и использовать для детального анализа эффективности.

Подробнее…

Геоданные

Вы можете импортировать идентификаторы геоданных для регионов, чтобы составлять отчеты Google Analytics для определенных территорий. Например, в США это могут быть восточные, центральные или западные штаты, а в Европе – северные, центральные или южные страны. При импорте данных поддерживаются следующие ключи: ga:regionId, ga:cityId, ga:countryIsoCode и ga:subContinentCode. Идентификаторы городов и стран перечислены в таблице геотаргетинга. Коды ISO стран и субконтинентов представлены соответственно в таблицах ISO-3166-1 alpha-2 и UN M.49.

Подробнее…

Данные о контенте

Метаданные контента, например сведения об авторе и теме, используются в Google Analytics для углубленного анализа статей, опубликованных на сайте.

Подробнее…

Данные о товарах

Импортируя данные о товарах в Google Analytics, вы можете уменьшить объем данных электронной торговли, отправляемых с обращениями, такими как просмотры страниц или события. В качестве параметров и показателей отчетов в этом случае можно использовать идентификаторы или коды отдельных товаров.

Подробнее…

Импорт сводных данных

Данные о расходах

Импорт данных о расходах на кампании, проводимые вне Google, позволяет анализировать рентабельность инвестиций и сравнивать эффективность кампаний в разных рекламных и маркетинговых системах.

Подробнее…

Основные понятия

Статус обработки

После загрузки файла ему присваивается статус PENDING, который изменяется на COMPLETED после его обработки и успешного завершения всех проверок.

Если во время обработки возникают проблемы, загрузка получает статус FAILED, и возвращается список всех ошибок, которые необходимо исправить. Пример:

{
  id: "YU4DersR_ORzyzXC_AoWw",
  kind: "analytics#upload",
  accountId: "12345",
  customDataSourceId: "poaU7EPcR4WGU-dkNghYKQ",
  status: "FAILED",
  errors:
  [
    "Invalid cell data 12.99 at row 1 column 6. expected data type LONG.",
    "Invalid cell data 12.99 at row 2 column 6. expected data type LONG.",
    "Invalid cell data 23.81 at row 3 column 6. expected data type LONG.",
    "Invalid cell data 199.99 at row 4 column 6. expected data type LONG."
  ]
}

Суммирование и перезапись данных о расходах

При создании пользовательского источника или набора данных о расходах вы можете задать способ обработки файлов со строками, ключи которых (дата, источник, канал) совпадают с существующими. Доступны следующие варианты:

  • summation (по умолчанию) – новые данные добавляются в соответствующую строку, а показатели суммируются.
  • overwrite – существующие данные заменяются новыми.

Чтобы узнать заданный способ обработки, вызовите метод list для пользовательского источника данных и проверьте значение свойства importBehavior (OVERWRITE или SUMMATION).

Суммирование и перезапись данных на уровне строк

Чтобы настроить переопределение для всех загружаемых файлов, добавьте столбец ga:importBehavior в заголовок и укажите в нем для каждой строки значение SUMMATION или OVERWRITE.

Например, приведенный ниже код перезаписывает существующие данные о расходах для строк Facebook/cpc и Yahoo/cpc, однако в строку Bing/cpc данные о расходах с такими же датой и источником/каналом будут добавляться без перезаписи.

ga:date,ga:source, ga:medium,ga:adCost,ga:importBehavior
20140604,facebook,cpc,12.23,OVERWRITE
20140604,bing,cpc,3.23,SUMMATION
20140604,yahoo,cpc,11.23,OVERWRITE

Формат и ограничения

Данные, которые загружаются в Google Analytics, должны быть представлены в формате CSV. В этом разделе описываются ограничения, действующие в отношении импорта данных.

Если какие-либо требования не будут соблюдены или не удастся произвести синтаксический анализ файла, запрос на загрузку не будет выполнен. В этом случае появится сообщение об ошибке. Чтобы пользователям было проще устранять проблемы, один ответ API может содержать до десяти ошибок.

Требования к файлу

  • Кодировка: UTF-8.
  • Максимальный размер: 1 ГБ.

Требования к заголовку

  • Первая строка (заголовок столбца) является обязательной. В заголовке должны определяться параметры и показатели, содержащиеся в столбце.

Требования к строкам

  • Максимальный размер строки: 1 МБ.

Формат ячеек

  • Ячейки не должны содержать более 2048 символов.
  • Начальные и конечные пробелы удаляются.
  • Чтобы поставить запятую в ячейке, необходимо заключить значение в двойные кавычки: source1,"medium,ether",group1,100 (значение второй ячейки – medium,ether).
  • Чтобы указать дополнительные двойные кавычки в ячейке, поставьте рядом с двойными кавычками ещё один такой же знак: source1,"medium""ether",group1,100 (значение второй ячейки – medium"ether).