Kiểm soát những nội dung bạn chia sẻ với Google

Kiểm soát thông tin Google thấy trên trang web của bạn cũng như nội dung xuất hiện trong kết quả tìm kiếm. Có một vài lý do có thể khiến bạn muốn ẩn nội dung khỏi Google:

  • Để bảo vệ dữ liệu ở chế độ riêng tư: Trang web của bạn có thể đang lưu trữ những dữ liệu riêng tư mà bạn không muốn người dùng khác truy cập. Bạn có thể ngăn Google thu thập những dữ liệu như vậy để những dữ liệu đó không xuất hiện trong kết quả tìm kiếm.
  • Để ẩn nội dung mang lại ít giá trị cho người dùng:

    Trang web của bạn có thể chứa nội dung giống nhau ở nhiều vị trí. Tình trạng này có thể ảnh hưởng tiêu cực đến thứ hạng của trang trên Google Tìm kiếm. Một ví dụ điển hình về nơi có thể xuất hiện nội dung trùng lặp là chức năng tìm kiếm toàn trang web để giúp người dùng khám phá nội dung trên trang web. Một số chức năng tìm kiếm sẽ tạo và hiển thị trang kết quả tìm kiếm tuỳ chỉnh mỗi lần người dùng nhập một cụm từ tìm kiếm. Google có thể lần lượt thu thập dữ liệu của tất cả những trang kết quả tìm kiếm tuỳ chỉnh đó nếu những trang này không bị chặn. Kết quả là Google sẽ thấy trang web có nhiều trang tương tự nhau và có thể phân loại nội dung trùng lặp đó là mánh khóe tăng thứ hạng. Việc này có thể làm giảm thứ hạng của các trang trên Google Tìm kiếm.

    Trang web của bạn có thể chia sẻ thông tin do các nguồn bên thứ ba khác tạo ra và những thông tin như vậy cũng có tại các nơi khác trên web. Google coi việc đưa các trang có chứa lượng lớn nội dung trùng lặp vào kết quả của Google Tìm kiếm là không mang lại nhiều giá trị. Bạn có thể chặn nội dung sao chép để cải thiện nội dung mà Google nhìn thấy và tăng thứ hạng của trang trên Google Tìm kiếm.

  • Để Google tập trung vào nội dung quan trọng của bạn: Nếu bạn có một trang web rất lớn (gồm hàng nghìn URL) trong đó có những trang không quan trọng lắm, hoặc có nhiều nội dung trùng lặp, thì bạn nên ngăn Google thu thập dữ liệu trên các trang trùng lặp hoặc ít quan trọng để tập trung vào những nội dung quan trọng.

Cách chặn nội dung

Sau đây là một số cách chính để ngăn nội dung xuất hiện trên Google:

Phương pháp

Xoá nội dung

Dành cho mọi loại nội dung

Xoá nội dung khỏi trang web của bạn là cách tốt nhất để đảm bảo nội dung đó không xuất hiện trên Google Tìm kiếm hay bất cứ đâu. Nếu thông tin đó đã xuất hiện trên Google rồi thì có thể bạn phải thực hiện thêm một số bước để xoá vĩnh viễn thông tin đó.

Bảo vệ tệp bằng mật khẩu

Dành cho mọi loại nội dung

Nếu bạn có nội dung bí mật hoặc riêng tư và không muốn nội dung đó xuất hiện trong kết quả tìm kiếm trên Google, thì cách đơn giản và hiệu quả nhất để ngăn các URL riêng tư xuất hiện là lưu trữ những URL đó trong một thư mục được bảo vệ bằng mật khẩu trên máy chủ của trang web. Googlebot và mọi trình thu thập dữ liệu web khác đều không thể truy cập nội dung trong các thư mục được bảo vệ bằng mật khẩu.

Người dùng trình độ nâng cao: Nếu đang dùng máy chủ web Apache, bạn có thể chỉnh sửa tệp .htaccess để bảo vệ thư mục trên máy chủ bằng mật khẩu. Có nhiều công cụ trên web có thể giúp bạn thực hiện việc này.

Tệp robots.txt và/hoặc yêu cầu xoá hình ảnh khẩn cấp

Dành cho hình ảnh

Dùng các quy tắc trong tệp robots.txt để chặn hình ảnh.

Lệnh noindex

Dành cho trang web

noindex là một kỹ thuật để yêu cầu Google không đọc trang của bạn hoặc không hiển thị trang đó trong kết quả tìm kiếm trên Google. Trang của bạn vẫn có thể được liên kết đến và truy cập thông qua các trang khác, hoặc người dùng có đường liên kết vẫn có thể truy cập trực tiếp. Tuy vậy, các trang đó sẽ không xuất hiện trong kết quả tìm kiếm trên Google. Phương pháp này đòi hỏi chuyên môn kỹ thuật và có thể không thực hiện được nếu bạn đang dùng một hệ thống quản lý nội dung để lưu trữ trang web của mình.

Chọn không xuất hiện trong một số sản phẩm của Google

Dành cho trang web

Bạn có thể yêu cầu Google không đưa nội dung trên trang web của bạn vào một số sản phẩm cụ thể của Google (thay vì toàn bộ sản phẩm của Google).

Thẻ meta nosnippet

Dành cho đoạn trích trong kết quả tìm kiếm

Hãy thêm thẻ <meta name="robots" content="nosnippet" /> vào phần head trong HTML của trang để ngăn đoạn trích cho trang đó xuất hiện trên Tìm kiếm. Tuy nhiên, xin lưu ý rằng thẻ này có thể tạo ra một thông báo gây khó hiểu trong kết quả tìm kiếm ("Không có thông tin nào cho trang này").

Công cụ Tham số URL

Dành cho trang web, mục trang web, mẫu URL

Người dùng trình độ nâng cao có thể dùng công cụ Tham số URL để chặn hoạt động thu thập dữ liệu trên những URL chứa các tham số cụ thể. Bạn chỉ nên dùng phương pháp này khi bạn là một người dùng rất thành thạo, do phương pháp này có thể chặn một phần lớn không gian URL của trang web và nếu có sai sót sẽ rất khó gỡ lỗi.

Xoá nội dung hiện có khỏi Google

Tìm hiểu cách Xoá một trang lưu trữ trên trang web của bạn khỏi Google.