Kiểm soát những gì bạn chia sẻ với Google

Google hỗ trợ nhiều cách giúp chủ sở hữu trang web kiểm soát nội dung xuất hiện trong kết quả tìm kiếm của Google. Hầu hết mọi người đều tập trung vào việc lập chỉ mục các trang của mình, nhưng đôi khi điều quan trọng lại ngược lại: ngăn nội dung xuất hiện trên Tìm kiếm. Có một vài lý do có thể khiến bạn muốn ẩn nội dung khỏi Google:

  • Để hạn chế dữ liệu: Có thể trang web của bạn lưu trữ những dữ liệu mà bạn chỉ muốn cung cấp cho những người dùng từng truy cập. Bạn có thể ngăn Google thu thập những dữ liệu như vậy để những dữ liệu đó không xuất hiện trong kết quả tìm kiếm.
    Ngoài ra, hãy lưu ý rằng có thể một số tệp được xuất bản trên trang web của bạn có chứa siêu dữ liệu có thể xuất hiện trên Tìm kiếm. Tìm hiểu thêm về cách ngăn thông tin bị che khuất xuất hiện trên Tìm kiếm.
  • Để ẩn nội dung mang lại ít giá trị cho người dùng: Có thể trang web của bạn có nội dung chất lượng thấp và không nên xuất hiện trên Tìm kiếm. Ví dụ: nếu trang web của bạn cho phép người dùng tạo nội dung, thì có thể một số nội dung trong đó có chất lượng thấp hoặc thậm chí là nội dung rác. Việc cho phép lập chỉ mục những nội dung như vậy có thể ảnh hưởng tiêu cực đến thứ hạng của trang web của bạn trong kết quả tìm kiếm của Google.
  • Để Google tập trung vào nội dung quan trọng của bạn: Nếu bạn có một trang web rất lớn (trên hàng trăm nghìn URL) trong đó có những trang không quan trọng lắm, hoặc có nhiều nội dung trùng lặp, thì bạn nên ngăn Google thu thập dữ liệu trên các trang trùng lặp hoặc ít quan trọng để tập trung vào những nội dung quan trọng.

Cách chặn nội dung

Sau đây là một số cách chính để ngăn nội dung xuất hiện trên Google:

Phương pháp

Xoá nội dung khỏi trang web của bạn

Áp dụng: mọi loại nội dung

Xoá nội dung khỏi trang web là cách tốt nhất để đảm bảo nội dung đó sẽ không xuất hiện trên Google Tìm kiếm và những nơi khác trên Internet.

Bảo vệ tệp bằng mật khẩu

Áp dụng: mọi loại nội dung

Nếu có nội dung bí mật hoặc riêng tư trên trang web của mình, bạn cần bảo vệ nội dung đó bằng mật khẩu để đảm bảo chỉ những người dùng được uỷ quyền mới truy cập được nội dung đó. Việc này sẽ ngăn nội dung đó xuất hiện trên Google Tìm kiếm; hoặc nếu đã xuất hiện thì cuối cùng nội dung đó cũng sẽ bị xoá khỏi kết quả tìm kiếm của chúng tôi.

Quy tắc noindex

Áp dụng: mọi loại nội dung

Thẻ meta robots noindex là một quy tắc yêu cầu Google không lập chỉ mục nội dung của bạn hay cho phép nội dung đó xuất hiện trong kết quả tìm kiếm trên Google. Nội dung của bạn vẫn có thể được liên kết đến và truy cập thông qua các trang khác, hoặc người dùng có đường liên kết vẫn có thể truy cập trực tiếp. Tuy vậy, các trang đó sẽ không xuất hiện trong kết quả tìm kiếm trên Google.

Dùng tệp robots.txt để không cho phép thu thập dữ liệu

Áp dụng: hình ảnh và video

Google chỉ lập chỉ mục hình ảnh và video mà Googlebot được phép thu thập dữ liệu. Để ngăn Googlebot truy cập tệp nội dung đa phương tiện của bạn, hãy dùng các quy tắc trong tệp robots.txt để chặn tệp đó.

Chọn không xuất hiện trên một số sản phẩm của Google

Áp dụng: trang web

Bạn có thể yêu cầu Google không đưa nội dung trên trang web của mình vào một số sản phẩm cụ thể của Google, chẳng hạn như Google Mua sắm, mục nhà nghỉ dưỡng cho thuê và khách sạn trên Google.

Xoá nội dung hiện có khỏi Google

Nếu nội dung được lưu trữ trên trang web của bạn đã xuất hiện trên Google, bạn có thể yêu cầu xoá những kết quả đó. Tìm hiểu cách Xoá khỏi Google một trang được lưu trữ trên trang web của bạn.