Faydalı robots.txt kuralları
Yaygın olarak uygulanan bazı faydalı robots.txt kuralları aşağıda listelenmiştir:
| Faydalı kurallar | |
|---|---|
| Sitenin tamamının taranmasına izin vermeme |
Bazı durumlarda sitedeki URL'lerin, taranmamış olsalar bile yine de dizine eklenebileceklerini unutmayın. User-agent: * Disallow: / |
Sitenin tamamının taranmasına izin verme (boş bir Disallow kuralıyla)
|
Bu işlem, tüm tarayıcıların sitenin tamamına erişmesine açıkça izin verir. Bu, işlevsel olarak robots.txt dosyasının olmaması veya User-agent: * Disallow: |
| Bir dizin ve içeriğinin taranmasına izin vermeme |
Tüm bir dizinin taranmasına izin vermemek için dizin adının sonuna bir öne eğik çizgi ekleyin. User-agent: * Disallow: /calendar/ Disallow: /junk/ Disallow: /books/fiction/contemporary/ |
|
Tek bir web sayfasının taranmasına izin vermeme |
Örneğin, User-agent: * Disallow: /useless_file.html Disallow: /junk/other_useless_file.html |
|
Alt dizin dışında, sitenin taranmasını tümüyle reddetme |
Tarayıcılar yalnızca User-agent: * Disallow: / Allow: /public/ |
| Tek bir tarayıcının erişimine izin verme |
Yalnızca User-agent: Googlebot-News Allow: / User-agent: * Disallow: / |
| Bir tarayıcı dışında tüm tarayıcıların erişimine izin verme |
User-agent: Unnecessarybot Disallow: / User-agent: * Allow: / |
|
Sitenin tamamının |
Bu uygulama, sayfalarınızı Google Arama sonuçlarından gizler. Ancak User-agent: * Disallow: / User-agent: Storebot-Google Allow: / |
|
Sitenizdeki tüm resimlerin Google'da (Google Görseller ve Keşfet dahil olmak üzere resimlerin Google'da gösterildiği her yer) görünmesini engelleme |
Google, görselleri ve videoları taramadan dizine ekleyemez. User-agent: Googlebot-Image Disallow: / |
|
Google Görseller'den belirli bir görseli engelleme |
Örneğin, User-agent: Googlebot-Image Disallow: /images/dogs.jpg |
|
Belirli bir türdeki dosyaların taranmasına izin vermeme |
Örneğin, tüm User-agent: Googlebot Disallow: /*.gif$ |
Belirli bir dizeyle biten URL'leri eşleştirmek için * ve $ joker karakterleri kullanın
|
Örneğin, tüm User-agent: Googlebot Disallow: /*.xls$ |
| Birden fazla kullanıcı aracısını tek bir grupta birleştirme |
Birden fazla tarayıcıya ait kuralları tek bir grupta birleştirmek, gruptaki tüm kurallar listelenen her kullanıcı aracısı için geçerli olduğundan dosyayı daha kısa ve yönetimi daha kolay hale getirir. Bu, kullanıcı aracılarının ilgili kurallarla birlikte iki kez listelenmesiyle aynıdır. User-agent: Googlebot User-agent: Storebot-Google Allow: /cats Disallow: / |