Bắt đầu với kết xuất động

Hiện tại, thật khó để xử lý JavaScript và không phải tất cả trình thu thập dữ liệu của các công cụ tìm kiếm đều có thể xử lý JavaScript thành công hoặc ngay lập tức. Trong tương lai, chúng tôi hy vọng rằng vấn đề này có thể được khắc phục, nhưng trong thời gian này, bạn nên sử dụng tính năng kết xuất động để khắc phục vấn đề này. Kết xuất động nghĩa là chuyển đổi giữa nội dung do ứng dụng kết xuất và nội dung kết xuất từ trước đối với các tác nhân người dùng cụ thể.

Các trang web nên sử dụng tính năng kết xuất động

Kết xuất động rất phù hợp với nội dung được tạo bằng JavaScript, công khai, có thể lập chỉ mục và thay đổi nhanh chóng hoặc nội dung sử dụng các tính năng JavaScript không được các trình thu thập dữ liệu hỗ trợ mà bạn quan tâm. Không phải tất cả các trang web đều cần sử dụng tính năng kết xuất động, và bạn nên lưu ý rằng kết xuất động là một giải pháp tạm thời cho các trình thu thập dữ liệu.

Hiểu cách hoạt động của tính năng kết xuất động

Kết xuất động yêu cầu máy chủ web của bạn phát hiện các trình thu thập dữ liệu (ví dụ: bằng cách kiểm tra tác nhân người dùng). Yêu cầu từ trình thu thập dữ liệu được chuyển đến trình kết xuất, còn yêu cầu từ người dùng được phân phát bình thường. Khi cần, trình kết xuất động sẽ phân phát một phiên bản nội dung phù hợp với trình thu thập dữ liệu, ví dụ: trình này có thể phân phát phiên bản HTML tĩnh. Bạn có thể chọn bật trình kết xuất động cho tất cả các trang hoặc trên mỗi trang.

Một sơ đồ cho thấy cách hoạt động của tính năng kết xuất động. Sơ đồ cho thấy máy chủ phân phát nội dung HTML và JavaScript ban đầu trực tiếp cho trình duyệt. Ngược lại, sơ đồ này cho thấy máy chủ phân phát HTML và JavaScript ban đầu cho trình kết xuất. Trình này sẽ chuyển đổi HTML và JavaScript ban đầu thành HTML tĩnh. Khi đã chuyển đổi xong nội dung, trình kết xuất sẽ cung cấp HTML tĩnh cho trình thu thập dữ liệu.

Triển khai tính năng kết xuất động

Để thiết lập tính năng kết xuất động cho nội dung của bạn, hãy làm theo nguyên tắc chung của chúng tôi. Bạn sẽ cần tham khảo chi tiết cấu hình cụ thể của mình, vì các chi tiết này sẽ khác nhau rất nhiều giữa các lần triển khai.

  1. Cài đặt và định cấu hình một trình kết xuất động để chuyển đổi nội dung của bạn thành HTML tĩnh giúp trình thu thập dữ liệu xử lý dễ dàng hơn. Một số trình kết xuất động phổ biến là Puppeteer, Rendertronprerender.io.
  2. Chọn tác nhân người dùng mà bạn nghĩ sẽ nhận được HTML tĩnh của mình và tham khảo chi tiết cấu hình cụ thể của bạn về cách cập nhật hoặc thêm tác nhân người dùng. Dưới đây là ví dụ về danh sách các tác nhân người dùng phổ biến trong phần mềm trung gian Rendertron:
    export const botUserAgents = [
      'googlebot',
      'google-structured-data-testing-tool',
      'bingbot',
      'linkedinbot',
      'mediapartners-google',
    ];
  3. Nếu bước kết xuất trước làm chậm máy chủ của bạn hoặc bạn thấy một số lượng lớn yêu cầu kết xuất trước, hãy cân nhắc việc triển khai bộ nhớ đệm cho nội dung kết xuất trước hoặc xác minh rằng các yêu cầu đó đến từ các trình thu thập dữ liệu hợp lệ.
  4. Xác định xem các tác nhân người dùng yêu cầu nội dung cho máy tính để bàn hay thiết bị di động. Sau đó, hãy sử dụng tính năng phân phát động để cung cấp phiên bản phù hợp cho máy tính để bàn hoặc thiết bị di động. Dưới đây là ví dụ về cách một cấu hình có thể xác định xem tác nhân người dùng yêu cầu nội dung cho máy tính để bàn hay thiết bị di động:
    isPrerenderedUA = userAgent.matches(botUserAgents)
    isMobileUA = userAgent.matches(['mobile', 'android'])
    
    if (!isPrerenderedUA) { } else { servePreRendered(isMobileUA) }
  5. Định cấu hình máy chủ của bạn để phân phối HTML tĩnh đến các trình thu thập dữ liệu mà bạn đã chọn. Bạn có thể làm điều này theo một số cách tùy thuộc vào công nghệ bạn sử dụng. Sau đây là một số ví dụ:
    • Yêu cầu proxy từ trình thu thập dữ liệu đến trình kết xuất động.
    • Kết xuất trước trong quy trình triển khai của bạn và làm cho máy chủ của bạn phân phát HTML tĩnh cho trình thu thập dữ liệu.
    • Chèn kết xuất động vào mã máy chủ tùy chỉnh của bạn.
    • Phân phát nội dung tĩnh từ dịch vụ kết xuất trước đến trình thu thập dữ liệu.
    • Sử dụng một phần mềm trung gian cho máy chủ của bạn (ví dụ: phần mềm trung gian Rendertron .

Xác minh cấu hình của bạn

Sau khi bạn hoàn thành việc triển khai kết xuất động, hãy xác minh rằng mọi thứ hoạt động như mong đợi bằng cách kiểm tra URL thông qua các quy trình sau:

  1. Kiểm tra nội dung cho thiết bị di động của bạn bằng công cụ Kiểm tra tính thân thiện với thiết bị di động để đảm bảo Google có thể thấy nội dung của bạn.

    done Thành công: Nội dung cho thiết bị di động trùng khớp với nội dung bạn muốn người dùng sẽ thấy.

    error Thử lại: Nếu nội dung bạn thấy không khớp với nội dung bạn mong đợi, hãy xem phần khắc phục sự cố.

  2. Kiểm tra nội dung cho máy tính để bàn của bạn bằng công cụ Kiểm tra URL để đảm bảo rằng nội dung cho máy tính để bàn cũng hiển thị trên trang đã kết xuất (trang đã kết xuất chính là cách Googlebot nhìn thấy trang của bạn).

    done Thành công: Nội dung cho máy tính để bàn trùng khớp với nội dung bạn muốn người dùng sẽ thấy.

    error Thử lại: Nếu nội dung bạn thấy không khớp với nội dung bạn mong đợi, hãy xem phần khắc phục sự cố.

  3. Nếu bạn sử dụng dữ liệu có cấu trúc, hãy kiểm tra xem dữ liệu có cấu trúc của bạn có kết xuất đúng cách hay không bằng Công cụ kiểm tra dữ liệu có cấu trúc.

    done Thành công: Dữ liệu có cấu trúc hiển thị đúng như bạn mong đợi.

    error Thử lại: Nếu dữ liệu có cấu trúc không hiển thị như bạn mong đợi, hãy xem phần khắc phục sự cố.

Khắc phục sự cố

Nếu nội dung của bạn hiển thị lỗi trong quá trình Kiểm tra tính thân thiện với thiết bị di động hoặc nếu nội dung không xuất hiện trong kết quả Google Tìm kiếm, hãy thử giải quyết các vấn đề thường gặp nhất được liệt kê bên dưới. Nếu bạn vẫn gặp sự cố, hãy đăng một chủ đề mới trong Diễn đàn quản trị trang web.

Nội dung không đầy đủ hoặc hiển thị theo cách khác nhau

error Nguyên nhân gây ra sự cố: Trình kết xuất của bạn có thể bị định cấu hình sai cách hoặc có thể ứng dụng web của bạn không tương thích với giải pháp kết xuất mà bạn sử dụng. Đôi khi, thời gian chờ cũng có thể khiến nội dung không được kết xuất chính xác.

done Khắc phục sự cố: Tham khảo tài liệu về giải pháp kết xuất cụ thể của bạn để khắc phục sự cố với cách thiết lập kết xuất động của bạn.

Thời gian phản hồi lâu

error Nguyên nhân gây ra sự cố: Việc sử dụng trình duyệt không có giao diện người dùng để hiển thị các trang theo yêu cầu thường gây ra thời gian phản hồi lâu, điều này có thể khiến trình thu thập dữ liệu hủy yêu cầu và không lập chỉ mục nội dung của bạn. Thời gian phản hồi lâu cũng có thể dẫn đến việc trình thu thập dữ liệu giảm tốc độ khi thu thập dữ liệu và lập chỉ mục nội dung của bạn.

done Khắc phục sự cố

  1. Thiết lập bộ nhớ đệm cho HTML được kết xuất trước hoặc tạo phiên bản HTML tĩnh cho nội dung của bạn trong quy trình xây dựng.
  2. Đảm bảo kích hoạt bộ nhớ đệm trong cấu hình của bạn (ví dụ: bằng cách chỉ dẫn trình thu thập dữ liệu truy cập bộ nhớ đệm của bạn).
  3. Kiểm tra xem trình thu thập dữ liệu có truy cập được nội dung của bạn một cách nhanh chóng không bằng cách sử dụng các công cụ kiểm tra như Kiểm tra tính thân thiện với thiết bị di động hoặc webpagetest (với một chuỗi tác nhân người dùng tùy chỉnh từ danh sách tác nhân người dùng Google Crawler). Yêu cầu của bạn không được hết thời gian.

Dữ liệu có cấu trúc bị thiếu

error Nguyên nhân gây ra sự cố: Việc thiếu tác nhân người dùng dữ liệu có cấu trúc hoặc không bao gồm các thẻ tập lệnh JSON-LD trong đầu ra có thể gây ra lỗi với dữ liệu có cấu trúc.

done Khắc phục sự cố

  1. Sử dụng Công cụ kiểm tra dữ liệu có cấu trúc để đảm bảo dữ liệu có cấu trúc hiện diện trên trang. Sau đó, hãy định cấu hình tác nhân người dùng cho Công cụ kiểm tra dữ liệu có cấu trúc để kiểm tra nội dung được kết xuất trước.
  2. Đảm bảo bao gồm các thẻ tập lệnh JSON-LD trong HTML được kết xuất động của nội dung của bạn. Hãy tham khảo tài liệu về giải pháp kết xuất của bạn để biết thêm thông tin.

Gửi phản hồi về...