Faydalı robots.txt kuralları
Yaygın olarak uygulanan bazı faydalı robots.txt kuralları aşağıda listelenmiştir:
| Faydalı kurallar | |
|---|---|
| Sitenin tamamının taranmasına izin vermeme |
Bazı durumlarda sitedeki URL'lerin, taranmamış olsalar bile yine de dizine eklenebileceklerini unutmayın. User-agent: * Disallow: / |
| Bir dizin ve içeriğinin taranmasına izin vermeme |
Tüm bir dizinin taranmasına izin vermemek için dizin adının sonuna bir öne eğik çizgi ekleyin. User-agent: * Disallow: /calendar/ Disallow: /junk/ Disallow: /books/fiction/contemporary/ |
| Tek bir tarayıcının erişimine izin verme |
Yalnızca User-agent: Googlebot-news Allow: / User-agent: * Disallow: / |
| Bir tarayıcı dışında tüm tarayıcıların erişimine izin verme |
User-agent: Unnecessarybot Disallow: / User-agent: * Allow: / |
|
Tek bir web sayfasının taranmasına izin vermeme |
Örneğin, User-agent: * Disallow: /useless_file.html Disallow: /junk/other_useless_file.html |
|
Alt dizin dışında, sitenin taranmasını tümüyle reddetme |
Tarayıcılar yalnızca User-agent: * Disallow: / Allow: /public/ |
|
Google Görseller'den belirli bir görseli engelleme |
Örneğin, User-agent: Googlebot-Image Disallow: /images/dogs.jpg |
|
Google Görseller'den sitenizdeki tüm görselleri engelleme |
Google, görselleri ve videoları taramadan dizine ekleyemez. User-agent: Googlebot-Image Disallow: / |
|
Belirli bir türdeki dosyaların taranmasına izin vermeme |
Örneğin, tüm User-agent: Googlebot Disallow: /*.gif$ |
|
Sitenin tamamının |
Bu uygulama, sayfalarınızı arama sonuçlarından gizler. Ancak User-agent: * Disallow: / User-agent: Mediapartners-Google Allow: / |
Belirli bir dizeyle biten URL'leri eşleştirmek için * ve $ joker karakterleri kullanın
|
Örneğin, tüm User-agent: Googlebot Disallow: /*.xls$ |