Tạo nguồn cấp dữ liệu

Nguồn cấp dữ liệu nội dung nghe nhìn là đối tượng JSON chứa tập hợp các thực thể đại diện cho nội dung đa phương tiện trong danh mục của bạn, chẳng hạn như Phim truyền hình, Phim, Bài hát, Album, v.v. Bước đầu tiên trong quá trình tham gia là bắt đầu phát triển nguồn cấp dữ liệu của bạn. Khi các tệp đã sẵn sàng, bạn cần lưu trữ nguồn cấp dữ liệu bằng một trong những phương thức lưu trữ được hỗ trợ để Google tìm nạp thường xuyên.

Yêu cầu về định dạng tệp nguồn cấp dữ liệu

Sau đây là các yêu cầu đối với(các) tệp nguồn cấp dữ liệu:

  • Tệp nguồn cấp dữ liệu phải có phần mở rộng tên tệp .json.
  • Không mã hoá tệp nguồn cấp dữ liệu.
  • Mã hoá tệp nguồn cấp dữ liệu bằng UTF-8 (kiểm tra chế độ cài đặt của trình chỉnh sửa tệp).

    alt_text

  • Chia tệp thành nhiều tệp nếu tệp nguồn cấp dữ liệu của bạn lớn hơn 1 GB (không nén).

  • Bạn nên tạo tệp cho mỗi loại thực thể (ví dụ: tvseries.json, tvseasons.json, tvepisodes.json, movies.json, v.v.).

    • Nếu tệp bất kỳ trong số này vượt quá 1 GB, hãy tách các thực thể thành nhiều tệp (ví dụ: tvepisodes_01.json, tvepisodes_02.json, v.v.).
    • Miễn là kích thước tệp nhỏ hơn 1 GB, sẽ không có giới hạn về số lượng thực thể bạn có thể đưa vào một tệp.
  • Đảm bảo tệp được mã hoá mà không có BOM theo quy cách JSON. Để kiểm tra hệ điều hành linux, hexdump file.json | head -n 1 không được bắt đầu bằng BBEF ở địa chỉ 0x00.

Các loại nguồn cấp dữ liệu

Nguồn cấp dữ liệu sản xuất

  • Điều này đại diện cho tập hợp(các) tệp nguồn cấp dữ liệu json đại diện cho toàn bộ danh mục của bạn mà bạn muốn khởi chạy trên Google. Bạn có thể tìm hiểu cách tạo nguồn cấp dữ liệu trong phần dưới đây.
  • Đây là nguồn cấp dữ liệu duy nhất bạn cần nếu đây là lần đầu tiên tích hợp với Google.
  • Sau khi được gửi đến Google, nguồn cấp dữ liệu này sẽ được phân tích nhiều lần và lặp lại vài lần để đạt được thanh chất lượng cao hơn trước lượng thông tin được thu thập và độ chính xác của thông tin đó trước khi được nhập và ra mắt.

Nguồn cấp dữ liệu sắp xếp

  • Trong một số trường hợp sử dụng, bạn cần mở rộng nguồn cấp dữ liệu chính thức. Sau đây là một vài ví dụ về những trường hợp như vậy:
    • Mở rộng nguồn cấp dữ liệu để bao gồm cả các loại thực thể mới, chưa được ra mắt trước đó.
    • Mở rộng nguồn cấp dữ liệu để bao gồm một số lượng lớn thực thể/siêu dữ liệu mới để ra mắt theo ngôn ngữ mới.
    • Mở rộng nguồn cấp dữ liệu sang các loại nền tảng mới. Ví dụ: khi nguồn cấp dữ liệu chính thức chỉ mới ra mắt trên Google Tìm kiếm và bây giờ, bạn muốn mở rộng phạm vi ra mắt sang Google TV.
  • Trong những trường hợp như vậy, bạn cần phải có một nguồn cấp dữ liệu thử nghiệm. Nguồn cấp dữ liệu này là bản sao của nguồn cấp dữ liệu chính thức, ngoại trừ nguồn cấp dữ liệu này có siêu dữ liệu bổ sung, ví dụ: đường liên kết sâu cho một nền tảng mới, siêu dữ liệu cho ngôn ngữ mới, v.v.
  • Tương tự như với nguồn cấp dữ liệu chính thức, thông tin này sẽ được phân tích và lặp lại nhiều lần để đạt được thanh chất lượng cao hơn dựa trên lượng thông tin đang được thu thập và độ chính xác. Sau khi đạt được thanh chất lượng, nguồn cấp dữ liệu này sẽ thay thế nguồn cấp dữ liệu sản xuất hiện tại để trở thành nguồn cấp dữ liệu sản xuất mới.
  • Nguồn cấp dữ liệu này cho phép chúng tôi tách lần khởi chạy ban đầu khỏi lần ra mắt bổ sung, thực hiện mọi thử nghiệm bắt buộc mà không ảnh hưởng đến nguồn cấp dữ liệu chính thức. Điều này giúp đảm bảo trải nghiệm người dùng cuối không bị gián đoạn.

Làm việc với người đại diện của Google để làm rõ mọi thắc mắc mà bạn có thể có ở trên.

Tạo tệp nguồn cấp dữ liệu

Hãy làm theo các phương pháp hay nhất sau đây khi tạo nguồn cấp dữ liệu:

  1. Tạo nguồn cấp dữ liệu mẫu bằng một nhóm nhỏ các thực thể

    Trước khi xây dựng một nguồn cấp dữ liệu chứa tất cả nội dung trong danh mục của mình, bạn nên tạo một nguồn cấp dữ liệu mẫu chỉ với một nhóm nhỏ các thực thể. Trong quá trình xử lý nguồn cấp dữ liệu, có thể bạn sẽ gặp phải các vấn đề. Bằng cách giới hạn quy mô của nhóm thực thể, bạn có thể gỡ lỗi và cảnh báo này dễ dàng hơn.

  2. Xác thực nguồn cấp dữ liệu mẫu

    Chúng tôi cung cấp các công cụ đảm bảo rằng nguồn cấp dữ liệu của bạn tuân thủ quy cách. Bạn nên sử dụng các công cụ này để giải quyết tất cả các lỗi và cảnh báo có trong nguồn cấp dữ liệu mẫu.

  3. Tạo nguồn cấp dữ liệu sản xuất

    Sau khi xác minh rằng bạn có một cấu trúc tốt cho nhóm nhỏ các thực thể, hãy phát triển một nguồn cấp dữ liệu cho toàn bộ danh mục của mình.

Tạo nguồn cấp dữ liệu mẫu

  1. Chọn một pháp nhân đại diện từ danh mục của bạn. Hãy chọn một thực thể có cấu trúc phức tạp hợp lý, nhưng vẫn là điển hình cho một thực thể trong danh mục.
  2. Hãy dùng công cụ Xác thực nguồn cấp dữ liệu để kiểm tra lỗi cú pháp và thiếu các thuộc tính bắt buộc. (Xem phần tiếp theo để biết chi tiết).

    Ví dụ về nguồn cấp dữ liệu có một thực thể Movie

    {
      "@context": "http://schema.org",
      "@type": "DataFeed",
      "dateModified": "2018-07-20T00:44:51Z",
      "dataFeedElement": [
        {
          "@context": ["http://schema.org", {"@language": "en"}],
          "@type": "Movie",
          "@id": "http://www.example.com/my_favorite_movie",
          "url": "http://www.example.com/my_favorite_movie",
          "name": "My Favorite Movie",
          "potentialAction": {
            "@type": "WatchAction",
            "target": {
              "@type": "EntryPoint",
              "urlTemplate": "http://www.example.com/my_favorite_movie?autoplay=true",
              "inLanguage": "en",
              "actionPlatform": [
                "http://schema.org/DesktopWebPlatform",
                "http://schema.org/MobileWebPlatform",
                "http://schema.org/AndroidPlatform",
                "http://schema.org/AndroidTVPlatform",
                "http://schema.org/IOSPlatform",
                "http://schema.googleapis.com/GoogleVideoCast"
              ]
            },
            "actionAccessibilityRequirement": {
              "@type": "ActionAccessSpecification",
              "category": "subscription",
              "requiresSubscription": {
                "@type": "MediaSubscription",
                "name": "Example Package",
                "commonTier": true,
                "@id": "[partner determined string]"
              },
              "availabilityStarts": "2018-07-21T10:35:29Z",
              "availabilityEnds": "2019-10-21T10:35:29Z",
              "eligibleRegion": [
                {
                  "@type": "Country",
                  "name": "US"
                },
                {
                  "@type": "Country",
                  "name": "CA"
                }
              ]
            }
          },
          "sameAs": "https://en.wikipedia.org/wiki/my_favorite_movie",
          "releasedEvent": {
            "@type": "PublicationEvent",
            "startDate": "2008-01-20",
            "location": {
              "@type": "Country",
              "name": "US"
            }
          },
          "description": "This is my favorite movie.",
          "actor": [
            {
              "@type": "Person",
              "name": "John Doe",
              "sameAs": "https://en.wikipedia.org/wiki/John_Doe"
            },
            {
              "@type": "Person",
              "name": "Jane Doe",
              "sameAs": "https://en.wikipedia.org/wiki/Jane_Doe"
            }
          ],
          "identifier": [
            {
              "@type": "PropertyValue",
              "propertyID": "IMDB_ID",
              "value":  "tt0123456"
            }
          ]
        }
      ]
    }
    

Xác thực nguồn cấp dữ liệu mẫu

Bạn có thể sử dụng các công cụ sau để xác thực nguồn cấp dữ liệu mẫu theo quy cách dữ liệu có cấu trúc của Google dành cho nguồn cấp dữ liệu đa phương tiện.

  • Công cụ xác thực nguồn cấp dữ liệu

    Công cụ xác thực nguồn cấp dữ liệu có thể xác thực một thực thể tại một thời điểm. Hãy dùng công cụ này để xác thực một thực thể mẫu trong danh mục của bạn nhằm tìm các lỗi cấu trúc và lỗi nội dung thường gặp. Bạn có thể xem thêm thông tin chi tiết về công cụ này tại đây.

  • Công cụ xác thực giản đồ JSON

    Công cụ xác thực giản đồ JSON có thể xác thực tất cả các tệp trong nguồn cấp dữ liệu. Hãy sử dụng công cụ này trong quá trình phát triển nguồn cấp dữ liệu để tránh các lỗi cấu trúc thường gặp. Bạn có thể xem thêm thông tin chi tiết về công cụ này tại đây.

Tạo nguồn cấp dữ liệu sản xuất

  1. Sau khi khắc phục tất cả lỗi và cảnh báo trong nguồn cấp dữ liệu mẫu, hãy mở rộng nguồn cấp dữ liệu để thêm tất cả các thực thể vào danh mục của bạn.
  2. Bạn thường xuyên sử dụng Công cụ xác thực nguồn cấp dữ liệu để xác thực một số lượng nhỏ thực thể trong nguồn cấp dữ liệu tại một thời điểm (Dán một số lượng lớn thực thể trên công cụ này có thể khiến trình duyệt web bị treo). Xác nhận rằng nguồn cấp dữ liệu của bạn bao gồm tất cả các thực thể trong danh mục bằng cách so sánh số lượng thực thể trong nguồn cấp dữ liệu với số lượng mặt hàng trong danh mục.