Anotasi: Menentukan Situs yang akan Ditelusuri

Halaman ini menjelaskan cara menentukan cakupan mesin telusur Anda menggunakan file anotasi XML.

  1. Overview
  2. Menggunakan Format XML Programmable Search
  3. Meningkatkan Cakupan Penelusuran
  4. Batas Anotasi

Ringkasan

Mengelola kumpulan situs yang besar bisa merepotkan jika Anda membuat mesin telusur yang besar. Alih-alih, Anda dapat menambahkan dan mengelola banyak situs dengan mencantumkannya dalam file anotasi dan mengunggahnya. Selain itu, file anotasi memberikan kontrol yang jauh lebih besar atas peringkat hasil penelusuran.

File anotasi hanyalah daftar anotasi. Setiap anotasi memiliki dua komponen: situs dan label yang terkait. Label memberi tahu Programmable Search Engine cara menangani situs; yaitu, apakah situs harus disertakan, dikecualikan, dipromosikan, atau didemosikan. Di file konteks, Anda menentukan label; di file anotasi, Anda memberi tag situs dengan label yang sesuai.

Saat Anda mulai mengedit file anotasi, mulailah dengan anotasi dalam jumlah kecil. Menguji dan memecahkan masalah mesin telusur menjadi lebih mudah dengan beberapa anotasi. Setelah mendapatkan hasil yang diharapkan, tambahkan lebih banyak anotasi secara bertahap.

Anda dapat mengupload file anotasi ke Panel Kontrol. Untuk mengetahui detail tentang batas file, lihat bagian Batas Anotasi.

Kembali ke atas

Menggunakan Format XML Programmable Search

Jika Anda ingin memanfaatkan semua fitur yang tersedia di file konfigurasi Programmable Search Engine, XML adalah cara yang tepat.

Anotasi XML

Berikut adalah contoh anotasi XML. File anotasi ini memberi tahu Programmable Search Engine untuk menyertakan semuanya di bawah www.webmd.com/hw/* tetapi mengecualikan semuanya di bawah www.webmd.com/hw/cancer/*.

<Annotations>
  <Annotation about="www.cancer.gov/cancertopics/types/liver/*">
    <Label name="_include_"/>
    <Comment>government site</Comment>
  </Annotation>
  <Annotation about="www.medicinenet.com/liver_cancer/">
    <Label name="_exclude_"/>
    <Comment>site on symptoms</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/*">
    <Label name="_include_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.webmd.com/hw/cancer/*">
    <Label name="_exclude_"/>
    <Comment>great sites for patients!</Comment>
  </Annotation>
  <Annotation about="www.oncologychannel.com/*/treatment">
    <Label name="_exclude_"/>
  </Annotation>
</Annotations>

File anotasi memiliki empat elemen dalam hierarki berikut:

  • Annotations (elemen root)
    • Annotation
      • Label
      • Comment (opsional)

Kembali ke atas

Membuat Anotasi Eksternal

Untuk mencantumkan situs yang ingin dicakup oleh mesin telusur Anda, lakukan hal berikut:

  1. Mulai file dengan elemen root <Annotations></Annotations>.
  2. Buat anotasi dengan menambahkan tag <Annotation></Annotation>, lalu tentukan atribut about dengan pola URL situs.
    <Annotations>
       <Annotation about="www.webmd.com/hw/cancer/*">
       </Annotation>
       </Annotations>
    
  3. Kaitkan situs dengan mesin telusur menggunakan tag <Label name=" "/>, dan tentukan cara mesin telusur harus memperlakukan situs tersebut. Anda dapat memperoleh label untuk mesin telusur dari file Konteks mesin telusur. Anda akan menemukan dua label: satu untuk menambahkan situs ke Programmable Search Engine dan satu lagi untuk mengecualikan situs darinya. Jika Anda belum mengubah nama label mesin telusur di file konteks, label untuk menyertakan situs akan berbentuk _include_, dan label untuk mengecualikan situs akan berbentuk _exclude_. Untuk menghindari error, salin dan tempel label ini, bukan mengetiknya secara manual.
       <Annotations>
       <Annotation about="http://www.solarenergy.org/*">
         <Label name="_include_"/>
       </Annotation>
    </Annotations>
    

    Satu situs dapat memiliki beberapa label yang terkait dengannya,

    Jika Anda telah mengubah nama label dalam file konteks, jangan lupa memperbarui nilai Label name dalam file anotasi Anda.

  4. Untuk menambahkan lebih banyak situs, buat dan tentukan elemen Annotation lainnya.
  5. Simpan file XML.

Kembali ke atas

Meningkatkan Cakupan Penelusuran

Programmable Search Engine dibuat di atas indeks Google. Ini berarti halaman web yang ada di indeks Google tersedia untuk mesin telusur Anda; sebaliknya, halaman web yang belum di-crawl oleh Google tidak akan muncul di hasil penelusuran Anda. Jika Anda ingin Programmable Search Engine menyertakan situs yang saat ini tidak ada di indeks Google, kirimkan Peta Situs ke Google Search Console.

Peta situs menyertakan daftar halaman di situs Anda, serta informasi tentang frekuensi update halaman web dan tingkat kepentingannya terhadap satu sama lain. Mengirimkan Peta Situs membantu Google menemukan halaman web Anda dan meningkatkan jadwal crawling. Untuk mempelajari lebih lanjut tentang Peta Situs, lihat Pusat Bantuan Webmaster dan Menggunakan Protokol Peta Situs. Jika Anda tertarik untuk membuat Peta Situs yang lebih bagus, lihat http://www.sitemaps.org/protocol.php.

Mengirimkan Peta Situs sangat membantu jika situs Anda memiliki hal-hal berikut:

  • Konten dinamis
  • Halaman yang tidak mudah ditemukan Googlebot (web crawler Google), seperti halaman dengan fitur AJAX atau Flash yang kaya
  • Hanya sedikit situs yang tertaut ke hasil tersebut.

    Googlebot meng-crawl web dengan mengikuti link dari satu halaman ke halaman lainnya, jadi jika situs Anda tidak ditautkan dengan baik, crawler akan sulit menemukannya. Jika situs Anda masih baru, mungkin tidak banyak situs yang mengarah ke situs Anda.

  • Arsip besar halaman konten yang tidak memiliki jaringan link silang yang kuat

Google hanya dapat mengindeks halaman yang dapat diaksesnya. Jadi, jika Anda menggunakan file robots.txt atau tag meta robot di halaman web, pastikan halaman tersebut tidak memblokir crawler.

Cakupan yang ditingkatkan tidak seketika, karena halaman memerlukan waktu untuk di-crawl dan diindeks. Namun, setelah diindeks, halaman web Anda dapat muncul di Google Penelusuran dan Programmable Search Engine.

Kembali ke atas

Batas Anotasi

Tabel berikut mencantumkan batas untuk file anotasi yang diupload ke Programmable Search Engine:

Catatan: Ikuti batas dengan cermat; jika melebihi batas, mesin telusur mungkin tidak menampilkan hasil.

Aspek Batas
Ukuran file (file konteks atau anotasi) 30KB
Jumlah maksimum anotasi per mesin telusur 5.000

Tips: Jika Anda mendapati bahwa mesin telusur Anda melebihi batas 5.000 situs yang besar, pertimbangkan untuk menggabungkan setiap URL menjadi pola URL.

Kembali ke atas