Giải thích về tính năng xoá URL, Phần I: URL và thư mục

Thứ Ba, ngày 30 tháng 3 năm 2010

Ngày nay, có rất nhiều nội dung trên Internet. Đến lúc nào đó, có thể có thông tin bạn không muốn xuất hiện trên mạng – mọi nội dung từ một bài đăng kích động mà bạn hối hận khi xuất bản trên blog cho đến dữ liệu bí mật vô tình bị lộ. Trong hầu hết trường hợp, việc xoá hoặc hạn chế quyền truy cập vào nội dung đó sẽ khiến nội dung đó tự nhiên biến mất khỏi kết quả tìm kiếm sau một thời gian. Tuy nhiên, nếu cần xoá ngay nội dung không mong muốn mà Google đã lập chỉ mục và không thể đợi nội dung đó tự biến mất, bạn có thể dùng công cụ xoá URL của chúng tôi để đẩy nhanh việc xoá nội dung khỏi kết quả tìm kiếm miễn là đáp ứng một số tiêu chí nhất định (mà chúng tôi sẽ thảo luận dưới đây).

Chúng tôi sắp có một loạt bài đăng trên blog giải thích cách xoá thành công các loại nội dung cũng như những lỗi phổ biến cần tránh. Trong bài đăng đầu tiên này, tôi sẽ đề cập đến một số tình huống cơ bản: xoá một URL, xoá toàn bộ một thư mục hoặc trang web và thêm lại nội dung đã xoá. Bạn cũng nên tham khảo bài đăng trước đây của chúng tôi về việc quản lý những thông tin hiện có về bạn trên mạng.

Xoá một URL

Nhìn chung, để yêu cầu xoá của bạn thành công, chủ sở hữu của (các) URL được đề cập (cho dù là bạn hay người khác) phải cho biết việc có thể xoá được nội dung đó. Đối với một URL riêng lẻ, bạn có thể cho biết theo một trong ba cách sau:

Trước khi gửi yêu cầu xoá, bạn có thể kiểm tra xem URL đã được chặn đúng cách hay chưa:

  • robots.txt: Bạn có thể kiểm tra xem URL được chặn đúng cách hay chưa bằng cách dùng các tính năng Tìm nạp như Googlebot hoặc Kiểm tra tệp robots.txt trong Công cụ quản trị trang web.
  • Thẻ meta noindex: Bạn có thể sử dụng tính năng Tìm nạp như Googlebot để đảm bảo thẻ meta xuất hiện ở vị trí nào đó giữa thẻ <head></head>. Nếu muốn kiểm tra một trang mà bạn không thể xác minh trong Công cụ quản trị trang web, bạn có thể mở URL trong trình duyệt, chuyển đến Xem > Nguồn trang rồi đảm bảo rằng bạn thấy thẻ meta đó giữa các thẻ <head></head>.
  • Mã trạng thái 404410: Bạn có thể dùng tính năng Tìm nạp như Googlebot hoặc sử dụng các công cụ như Tiêu đề HTTP trực tiếp hoặc web-sniffer.net để xác minh xem URL có thực sự đang trả về đúng mã hay không. Đôi khi, các trang "đã xoá" có thể nói rằng "404" hoặc "Không tìm thấy" trên trang, nhưng thực ra lại trả về mã trạng thái 200 trong tiêu đề trang; vì vậy, bạn nên dùng một công cụ kiểm tra tiêu đề thích hợp để kiểm tra kỹ.

Nếu nội dung không mong muốn đã được xoá khỏi một trang nhưng trang đó không bị chặn theo bất kỳ cách nào nêu trên, bạn sẽ không thể xoá hoàn toàn URL đó khỏi kết quả tìm kiếm của chúng tôi. Đây là điều thường gặp nhất khi bạn không sở hữu trang web lưu trữ nội dung đó. Chúng tôi trình bày những việc cần làm trong trường hợp này ở một bài đăng tiếp theo trong phần II của loạt bài viết về việc xoá nội dung.

Nếu một URL đáp ứng một trong các tiêu chí trên, bạn có thể xoá URL đó bằng cách truy cập Công cụ xoá, nhập URL mà bạn muốn xoá rồi chọn "Quản trị viên trang web đã chặn trang". Xin lưu ý rằng bạn phải nhập URL lưu trữ nội dung chứ không phải URL của kết quả tìm kiếm trên Google nơi nội dung đó xuất hiện. Ví dụ: nhập https://www.example.com/embarrassing-stuff.html chứ không phải https://www.google.com/search?q=embarrassing+stuff.

Bài viết trong trung tâm trợ giúp của chúng tôi có thêm thông tin chi tiết về cách đảm bảo bạn đã nhập đúng URL. Hãy nhớ rằng nếu bạn không cho chúng tôi biết chính xác URL đang gây khó khăn cho bạn, chúng tôi sẽ không thể xoá nội dung mà bạn muốn.

Xoá toàn bộ thư mục hoặc trang web

Để xoá thành công toàn bộ thư mục hoặc trang web, bạn phải từ chối thư mục hoặc trang web đó trong tệp robots.txt của trang web. Ví dụ: để xoá thư mục https://www.example.com/secret/, tệp robots.txt của bạn cần có nội dung như sau:

User-agent: *
Disallow: /secret/

Vẫn chưa đủ để thư mục gốc trả về mã trạng thái 404, vì thư mục này có thể trả về 404 nhưng vẫn phân phát các tệp bên dưới thư mục này. Việc dùng tệp robots.txt để chặn một thư mục (hoặc toàn bộ trang web) cũng đảm bảo rằng mọi URL trong thư mục đó (hoặc trang web) cũng đều được chặn. Bạn có thể kiểm tra xem một thư mục có được chặn đúng cách hay không bằng cách dùng tính năng Tìm nạp như Googlebot hoặc Kiểm tra tệp robots.txt trong Công cụ quản trị trang web.

Chỉ những chủ sở hữu đã xác minh của một trang web mới có thể yêu cầu xoá toàn bộ trang web hoặc thư mục trong Công cụ quản trị trang web. Để yêu cầu xoá một thư mục hoặc trang web, hãy nhấp vào trang web đó, sau đó chuyển đến Cấu hình trang web > Truy cập của trình thu thập thông tin > Xoá URL. Nếu bạn nhập phần gốc của trang web làm URL mà bạn muốn xoá, bạn sẽ được yêu cầu xác nhận rằng bạn muốn xoá toàn bộ trang web. Nếu bạn nhập một thư mục con, hãy chọn tuỳ chọn "Xoá thư mục" trên trình đơn thả xuống.

Thêm lại nội dung đã xoá

Lúc nào bạn cũng có thể huỷ các yêu cầu xoá cho bất kỳ trang web nào của mình, bao gồm cả những yêu cầu do người khác gửi. Để làm điều đó, bạn phải là chủ sở hữu đã xác minh của trang web đó trong Công cụ quản trị trang web. Sau khi xác minh quyền sở hữu, bạn có thể chuyển đến Cấu hình trang web > Truy cập của trình thu thập thông tin > Xoá URL > URL đã xoá (hoặc > Do người khác tạo) rồi nhấp vào "Huỷ" bên cạnh yêu cầu bất kỳ mà bạn muốn huỷ.

Bạn vẫn còn thắc mắc? Hãy theo dõi phần còn lại của loạt bài về việc xoá nội dung khỏi kết quả tìm kiếm trên Google. Nếu bạn không thể chờ đợi thì chúng tôi cũng từng viết nhiều nội dung về việc xoá URL và khắc phục từng trường hợp riêng lẻ trong Diễn đàn trợ giúp của chúng tôi. Nếu vẫn còn thắc mắc sau khi đọc trải nghiệm của người khác, bạn có thể đặt câu hỏi. Xin lưu ý rằng trong hầu hết trường hợp, thật khó để đưa ra lời khuyên phù hợp về một yêu cầu xoá cụ thể mà không biết trang web hoặc URL có liên quan. Bạn nên chia sẻ URL bằng cách sử dụng dịch vụ rút ngắn URL để Google không lập chỉ mục URL mà bạn quan tâm trong bài đăng của bạn; một số dịch vụ rút ngắn thậm chí sẽ cho phép bạn tắt lối tắt sau này, khi câu hỏi của bạn đã được giải quyết.

Cuối cùng, bạn cũng có thể tìm hiểu về cách quản lý những thông tin hiện có về bạn trên mạng.