Penjelasan Penghapusan URL, bagian II: Menghapus teks sensitif dari halaman

Jumat, 6 Agustus 2010

Perubahan dapat terjadi—terkadang, seperti yang kita lihat di postingan sebelumnya tentang penghapusan URL, Anda dapat sepenuhnya memblokir atau menghapus halaman dari situs. Terkadang, Anda hanya dapat mengubah bagian halaman, atau menghapus bagian teks tertentu. Bergantung pada seberapa sering halaman di-crawl, perlu waktu beberapa saat sebelum perubahan ini tercermin di hasil penelusuran kami. Dalam postingan blog ini, mari kita lihat langkah-langkah yang dapat dilakukan jika konten lama yang telah dihapus masih ditampilkan di hasil penelusuran, baik dalam bentuk "cuplikan" maupun di halaman yang di-cache yang ditautkan dari hasil penelusuran. Tindakan ini berguna jika konten lama tersebut berisi informasi sensitif yang harus segera dihapus—Anda tidak perlu melakukan hal ini saat baru saja memperbarui situs seperti biasanya.

Sebagai contoh, mari kita lihat hasil penelusuran fiktif berikut:

Walter E. Coyote < Judul

Chief Development Officer at Acme Corp 1948-2003: worked on the top
secret velocitus incalculii capturing device which has shown potential...

< Cuplikan
www.example.com/about/waltercoyote - Di-cache < URL + link ke halaman yang di-cache

Untuk mengubah konten yang ditampilkan di cuplikan (atau di halaman tertaut yang di-cache), Anda harus mengubah konten terlebih dahulu di halaman (aktif) sebenarnya. Kecuali jika konten halaman yang tersedia secara publik diubah, proses otomatis Google akan terus menampilkan bagian konten asli di hasil penelusuran kami.

Setelah konten halaman diubah, ada beberapa opsi yang tersedia agar perubahan tersebut terlihat di hasil penelusuran kami:

  1. Tunggu hingga Googlebot meng-crawl ulang dan mengindeks ulang halaman: Ini adalah metode pembaruan alami untuk sebagian besar konten di Google. Proses ini terkadang dapat memakan waktu yang cukup lama, bergantung pada seberapa sering saat ini Googlebot meng-crawl halaman yang dimaksud. Setelah kami meng-crawl ulang dan mengindeks ulang halaman, konten lama biasanya tidak akan terlihat karena akan diganti dengan konten yang saat ini ditampilkan. Jika Googlebot tidak diblokir untuk meng-crawl halaman yang dimaksud (baik dengan robots.txt atau karena server tidak dapat diakses dengan benar), Anda tidak perlu melakukan tindakan khusus untuk menyelesaikan proses ini. Umumnya, Anda tidak dapat mempercepat crawling dan pengindeksan karena proses ini sepenuhnya otomatis dan bergantung pada banyak faktor eksternal.

  2. Gunakan alat penghapusan URL publik Google untuk meminta penghapusan konten yang telah dihapus dari halaman web orang lain. Dengan alat ini, Anda harus memasukkan URL halaman spesifik yang telah diubah, memilih opsi "Konten telah dihapus dari halaman", lalu menetapkan satu atau beberapa kata yang telah dihapus sepenuhnya dari halaman tersebut.

    alat penghapusan cache google

    Perhatikan bahwa tidak satu pun kata yang Anda masukkan boleh muncul di halaman; meskipun jika kata tersebut telah dihapus dari satu bagian halaman, permintaan Anda akan ditolak jika kata tersebut masih muncul di bagian halaman yang lain. Pastikan untuk memilih kata (atau beberapa kata) yang tidak lagi muncul di bagian halaman mana pun. Jika, pada contoh di atas, Anda menghapus "top secret velocitus incalculii capturing device", kirimkan kata-kata tersebut dan bukan sesuatu seperti "project saya". Namun, jika kata "top" atau "device" masih ada di halaman, permintaan akan ditolak. Untuk memaksimalkan peluang keberhasilan, sering kali, cara termudahnya adalah dengan hanya memasukkan satu kata yang Anda yakin tidak muncul lagi di bagian halaman mana pun.

    Setelah permintaan Anda diproses dan diketahui bahwa kata yang dikirimkan tidak lagi muncul di halaman tersebut, hasil penelusuran tidak akan lagi menampilkan cuplikan, dan halaman yang di-cache juga tidak akan tersedia. Judul dan URL halaman akan tetap terlihat, dan entrinya mungkin masih muncul di hasil penelusuran untuk penelusuran yang terkait dengan konten yang telah dihapus (seperti penelusuran untuk velocitus incalculii), meskipun jika kata tersebut tidak muncul lagi di cuplikan. Namun, jika halaman sudah di-crawl ulang dan diindeks ulang, halaman yang di-cache dan cuplikan baru akan terlihat di hasil penelusuran kami.

    Ingat bahwa kami harus melihat halaman untuk memverifikasi bahwa kata tersebut sudah dihapus. Jika halaman sudah tidak ada dan server menampilkan kode hasil HTTP 404 atau 410 sebagaimana mestinya, sehingga kami tidak dapat melihat halaman, sebaiknya Anda meminta penghapusan halaman sepenuhnya.

  3. Gunakan alat penghapusan URL Alat WebMaster Google untuk meminta penghapusan informasi di halaman dari situs Anda. Jika Anda memiliki akses ke situs yang dimaksud dan telah memverifikasi kepemilikannya di Alat WebMaster Google, Anda dapat menggunakan alat penghapusan URL di sana (di bagian Konfigurasi Situs > Akses crawler) untuk meminta agar cuplikan dan halaman yang di-cache dihapus hingga halaman di-crawl ulang. Untuk menggunakan alat ini, Anda hanya perlu mengirimkan URL halaman spesifik (Anda tidak perlu menetapkan kata yang dihapus). Setelah permintaan Anda diproses, kami akan menghapus cuplikan dan halaman yang di-cache dari hasil penelusuran. Judul dan URL halaman akan tetap terlihat, dan halaman mungkin juga tetap mendapatkan peringkat di hasil penelusuran untuk kueri terkait konten yang telah dihapus. Setelah halaman di-crawl ulang dan diindeks ulang, hasil penelusuran dengan pembaruan cuplikan dan halaman yang di-cache (berdasarkan konten baru) akan terlihat.

Google mengindeks dan memberi peringkat item tidak hanya berdasarkan konten halaman, tetapi juga berdasarkan faktor eksternal lainnya, seperti link masuk ke URL. Oleh karena itu, URL mungkin akan terus muncul di hasil penelusuran untuk konten yang tidak ada lagi di halaman tersebut, meskipun setelah halaman di-crawl ulang dan diindeks ulang. Meskipun alat penghapusan URL dapat menghapus cuplikan dan halaman yang di-cache dari hasil penelusuran, alat ini tidak akan mengubah atau menghapus judul hasil penelusuran, mengubah URL yang ditampilkan, atau mencegah halaman ditampilkan untuk penelusuran berdasarkan konten saat ini atau sebelumnya. Jika menurut Anda ini penting, harap pastikan bahwa URL memenuhi persyaratan untuk dihapus sepenuhnya dari hasil penelusuran kami.

Menghapus konten non-HTML

Jika konten yang diubah tidak dalam format (X)HTML (misalnya saat gambar, file Flash, atau file PDF telah diubah), Anda tidak akan dapat menggunakan alat penghapusan cache. Jadi, jika konten lama tidak perlu terlihat lagi di hasil penelusuran, solusi paling cepat adalah mengubah URL file tersebut agar URL lama menampilkan kode hasil HTTP 404 dan menggunakan alat penghapusan URL untuk menghapus URL lama. Atau, jika memilih untuk mengizinkan Google memperbarui informasi Anda secara alami, perlu diketahui bahwa pratinjau konten non-HTML (seperti link Lihat Detail untuk file PDF) mungkin memakan waktu lebih lama untuk diperbarui setelah di-crawl ulang daripada halaman HTML biasa.

Secara proaktif mencegah cuplikan atau versi yang di-cache ditampilkan

Sebagai webmaster, Anda memiliki opsi untuk menggunakan tag meta robots guna secara proaktif mencegah cuplikan atau versi yang di-cache ditampilkan tanpa menggunakan alat penghapusan kami. Meskipun kami tidak merekomendasikan cara ini sebagai pendekatan umum (cuplikan dapat membantu pengguna mengenali hasil penelusuran yang relevan dengan lebih cepat, dan halaman yang di-cache memberi mereka kemampuan untuk melihat konten bahkan jika ada kejadian tidak terduga saat server Anda tidak tersedia), Anda dapat menggunakan tag meta robots "nosnippet" untuk mencegah cuplikan ditampilkan, atau tag meta robots "noarchive" untuk menonaktifkan cache halaman. Perhatikan bahwa jika setelan ini diubah di halaman yang sudah ada dan yang diketahui, Googlebot perlu meng-crawl ulang dan mengindeks ulang halaman tersebut sebelum perubahan ini terlihat di hasil penelusuran.

Semoga postingan blog ini membantu menjelaskan sedikit beberapa proses di balik alat penghapusan URL untuk halaman yang diperbarui. Pada postingan blog berikutnya, kami akan membahas cara meminta penghapusan konten yang bukan milik Anda; nantikan kabar selanjutnya!

Seperti biasa, kami menerima masukan dan pertanyaan Anda di Forum Bantuan Webmaster.

Terakhir, Anda mungkin juga tertarik untuk membaca informasi terkait mengelola informasi tentang Anda yang tersedia secara online.