샤딩 피드 파일

인벤토리에 따라 샤딩 (또는 피드를 여러 파일로 분할)이 필요할 수 있습니다.

샤딩을 사용해야 하는 경우

  • gzip으로 압축한 후 파일 1개의 피드가 200MB를 초과합니다.

    • 예: 생성된 가용성 피드는 1GB입니다. 5개 이상의 개별 파일 (또는 샤드)로 샤딩해야 합니다.
  • 파트너 인벤토리는 시스템 및/또는 리전에 분배되므로 인벤토리를 조정하기가 어렵습니다.

    • 예: 파트너에게 미국 및 EU 인벤토리가 있고 별도 시스템에 있습니다. 피드는 2개의 파일(또는 샤드)으로 생성될 수 있습니다. 하나는 미국용이고 다른 하나는 1개(noncegeneration_timestamp은 동일)입니다.

일반 규칙

  • 각 샤드는 gzip 압축 후 파일 1개에 대해 200MB를 초과할 수 없습니다.
  • 피드당 샤드는 20개 이하로 설정하는 것이 좋습니다. 이보다 더 많은 비즈니스 타당성이 필요한 경우 지원팀에 문의하여 추가 안내를 받으세요.
  • 개별 레코드 (예: Merchant 객체 1개)는 하나의 샤드에서 전송되어야 하며 여러 샤드로 분할될 수 없습니다. 그러나 향후 피드에는 동일한 shard_number를 사용하여 샤드에서 전송할 필요가 없습니다.
  • 성능을 향상하려면 데이터가 샤드 간에 균등하게 분할되어 모든 샤딩된 파일의 크기가 유사해야 합니다.

피드를 샤딩하는 방법

각 파일 (또는 샤드)에 대해 FeedMetadata을 다음과 같이 설정합니다.

  • processing_instruction에서 PROCESS_AS_COMPLETE로 설정합니다.
  • shard_number를 피드의 현재 샤드로 설정(0에서 total_shards - 1 사이에 중단 없음)
  • total_shards를 피드의 총 샤드 수로 설정합니다 (1부터 시작).
  • nonce동일한 피드의 모든 샤드에서 동일하지만 다른 피드의 값과 다른 고유한 식별자로 설정합니다.
  • generation_timestamp은 Unix 및 EPOCH 형식의 타임스탬프입니다. 이는 피드의 모든 샤드에서 동일해야 합니다.

권장: 각 파일 (또는 샤드)에 대해 피드 유형, 타임스탬프, 샤드 번호, 총 샤드 수를 표시하도록 파일 이름을 설정합니다. 샤드 크기는 대략 동일해야 하며 모든 샤드가 업로드되면 처리됩니다.

  • Example: 'availability_feed_1574117613_001_of_002.json.gz'

샤딩된 재고 피드의 예

샤드 0

{
  "metadata": {
    "processing_instruction": "PROCESS_AS_COMPLETE",
    "shard_number": 0,
    "total_shards": 3,
    "nonce": "111111",
    "generation_timestamp": 1524606581
  },
  "service_availability": [
    {
      "availability": [
        {
          "spots_total": 1,
          "spots_open": 1,
          "duration_sec": 3600,
          "service_id": "1000",
          "start_sec": 1577275200,
          "merchant_id": "merchant1",
          "confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
        }
      ]
    }
  ]
}

샤드 1

{
  "metadata": {
    "processing_instruction": "PROCESS_AS_COMPLETE",
    "shard_number": 1,
    "total_shards": 3,
    "nonce": "111111",
    "generation_timestamp": 1524606581
  },
  "service_availability": [
    {
      "availability": [
        {
          "spots_total": 1,
          "spots_open": 1,
          "duration_sec": 3600,
          "service_id": "1000",
          "start_sec": 1577620800,
          "merchant_id": "merchant2",
          "confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
        }
      ]
    }
  ]
}

샤드 2

{
  "metadata": {
    "processing_instruction": "PROCESS_AS_COMPLETE",
    "shard_number": 2,
    "total_shards": 3,
    "nonce": "111111",
    "generation_timestamp": 1524606581
  },
  "service_availability": [
    {
      "availability": [
        {
          "spots_total": 1,
          "spots_open": 1,
          "duration_sec": 3600,
          "service_id": "1000",
          "start_sec": 1576670400,
          "merchant_id": "merchant3",
          "confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
        }
      ]
    }
  ]
}

파트너 분산 인벤토리에 샤딩 사용

파트너가 여러 시스템 또는 리전에 분산된 인벤토리를 단일 피드로 통합하기가 어려울 수 있습니다. 샤딩은 각 분산 시스템의 인벤토리 세트와 일치하도록 각 샤드를 설정하여 조정 문제를 해결하는 데 사용할 수 있습니다.

예를 들어 파트너의 인벤토리가 2개의 리전 (미국 및 EU 인벤토리)으로 분리되어 있으며 이 리전은 2개의 개별 시스템에 위치해 있습니다.

파트너는 각 피드를 파일 2개 (또는 샤드)로 나눌 수 있습니다.

  • 판매자 피드: 미국의 경우 샤드 1개, EU의 경우 샤드 1개
  • 서비스 피드: 미국의 경우 샤드 1개, EU의 경우 샤드 1개
  • 이용 가능 여부 피드: 미국 샤드 1개, EU 샤드 1개

피드가 제대로 처리되는지 확인하려면 다음 단계를 따르세요.

  1. 업로드 일정을 정하고 일정을 따르도록 각 인벤토리 인스턴스를 구성합니다.
  2. 각 인스턴스에 고유한 샤드 번호를 할당합니다 (예: US = N, EU = N + 1). total_shards를 총 샤드 수로 설정합니다.
  3. 예약된 업로드 시간마다 generation_timestampnonce를 결정합니다. FeedMetadata에서 모든 인스턴스가 이 두 필드에 동일한 값을 보유하도록 설정합니다.
    • generation_timestamp는 현재 또는 과거여야 합니다. 파트너의 Read-at 데이터베이스 타임스탬프가 좋습니다.
  4. 모든 샤드가 업로드되면 Google은 generation_timestampnonce를 통해 샤드를 그룹화합니다.

Google은 각 샤드가 파트너 인벤토리의 서로 다른 리전을 나타내고 generation_timestamp가 모든 샤드에서 동일한 경우 하루 중 다른 시간에 업로드될 수 있더라도 피드를 하나로 처리합니다.

지역별 샤딩된 가용성 피드 예시

샤드 0 - 미국 인벤토리

{
  "metadata": {
    "processing_instruction": "PROCESS_AS_COMPLETE",
    "shard_number": 0,
    "total_shards": 2,
    "nonce": "111111",
    "generation_timestamp": 1524606581
  },
  "service_availability": [
    {
      "availability": [
        {
          "spots_total": 1,
          "spots_open": 1,
          "duration_sec": 3600,
          "service_id": "1000",
          "start_sec": 1577275200,
          "merchant_id": "US_merchant_1",
          "confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
        }
      ]
    }
  ]
}

샤드 1 - EU 인벤토리

{
  "metadata": {
    "processing_instruction": "PROCESS_AS_COMPLETE",
    "shard_number": 1,
    "total_shards": 2,
    "nonce": "111111",
    "generation_timestamp": 1524606581
  },
  "service_availability": [
    {
      "availability": [
        {
          "spots_total": 1,
          "spots_open": 1,
          "duration_sec": 3600,
          "service_id": "1000",
          "start_sec": 1577620800,
          "merchant_id": "EU_merchant_1",
          "confirmation_mode": "CONFIRMATION_MODE_SYNCHRONOUS"
        }
      ]
    }
  ]
}