Google arama sonuçlarındaki PDF'ler

01 Eylül 2011, Perşembe

Misyonumuz, dünyadaki bilgileri düzenleyerek herkesin erişebileceği ve faydalanabileceği hale getirmektir. Bu iddialı görev sırasında bazen PDF'ler, e-tablolar ve sunular gibi HTML olmayan dosyalara rastlıyoruz. Farklı dosya türlerinin algoritmalarımızı yavaşlatmasına izin vermiyor, alakalı içerikleri çıkarıp gerekli şekilde dizine ekleyerek arama sonuçlarımıza katmak için büyük çaba gösteriyoruz. Peki çoğu zaman standart HTML'den bu kadar farklı olan bu dosya türlerini dizine nasıl ekliyoruz? Bu dosyalar için geçerli olan kurallar nelerdir? Bu dosyaları dizine eklememizi istemeyen web yöneticilerinin ne yapması gerekir?

Google PDF dosyalarını dizine eklemeye 2001 yılında başladı ve şu anda dizinimize eklenmiş yüz milyonlarca PDF dosyası var. PDF'lerin dizine eklenmesi hakkında en sık sorulan soruları ve cevaplarını sizin için bir araya getirdik:

S: Google her tür PDF dosyasını dizine ekleyebilir mi?
C: Genellikle, çeşitli karakter kodlama türlerinin kullanıldığı PDF dosyalarındaki metin içeriklerini (tüm dillerdeki) dizine ekleyebiliyoruz. Bunun için dosyaya şifreyle erişilmemesi ve dosyanın şifrelenmiş olmaması gerekir. Metinlerin resim olarak yerleştirildiği durumlarda metni çıkarmak için resimleri OCR algoritmalarıyla işleyebiliriz. Genel bir kural olarak, bir metin PDF dokümanından kopyalanıp standart metin dokümanına yapıştırılabiliyorsa bu metni dizine ekleyebileceğimizi söyleyebiliriz.

S: PDF dosyalarındaki resimler nasıl işlenir?
C: Şu anda resimler dizine eklenmemektedir. Dizine eklenmesini istediğiniz resimler için HTML sayfaları oluşturmanız gerekir. Resimlerinizin arama sonuçlarımızda döndürülme olasılığını artırmak için lütfen Google Görseller ile ilgili en iyi uygulamaları okuyun.

S: PDF dosyalarındaki bağlantılar nasıl işlenir?
C: PDF dosyalarındaki bağlantılar genellikle HTML'deki bağlantılara benzer şekilde işlenir. Bu bağlantılar PageRank ve diğer dizine ekleme sinyallerini iletebilir ve PDF dosyasını taradıktan sonra bu bağlantıları takip edebiliriz. Şu anda PDF dokümanlarında nofollow bağlantıları kullanılamamaktadır.

S: PDF dosyalarımın arama sonuçlarında görünmesini nasıl engellerim veya arama sonuçlarında görünen PDF dosyalarımı nasıl kaldırabilirim?
C: PDF dokümanlarının arama sonuçlarında görünmesini engellemenin en basit yolu, dosyayı sunmak için kullanılan HTTP başlığına X-Robots-Tag: noindex etiketi eklemektir. noindex kuralıyla X-Robot-Tag etiketini kullanırsanız halihazırda dizine eklenmiş olan PDF dosyaları zaman içinde dizinden çıkarılır. Kaldırma sürecini hızlandırmak için Google Web Yöneticisi Araçları'ndaki URL kaldırma aracını kullanabilirsiniz.

S: PDF dosyaları arama sonuçlarının üst sıralarında yer alabilir mi?
Y: Elbette. PDF dosyalarının sıralaması genellikle diğer web sayfalarıyla benzer olur. Örneğin, bu yayının yazıldığı tarihlerde mortgage market review, irs form 2011 veya paracetamol expert report sorgularının tamamı arama sonuçlarımızda üst sıralarda bulunmayı başaran PDF dokümanlarını döndürüyor. Dosyaların içeriğinin yanı sıra, yerleştirilmiş oldukları web sayfaları ve diğer web sayfalarından aldıkları bağlantılar da bu başarıya etki eden faktörler arasında.

S: Sayfalarımın hem HTML hem PDF kopyalarının olması yinelenen içerik olarak değerlendirilir mi?
C: Mümkünse içeriğinizin tek bir kopyasını yayınlamanızı öneririz. Bunun mümkün olmadığı durumlarda ise tercih ettiğiniz sürümü belirttiğinizden emin olun. Örneğin, tercih edilen URL'yi site haritanıza ekleyerek veya HTML'de ya da PDF kaynağının HTTP başlıklarında standart sürümü belirterek bunu yapabilirsiniz. Daha fazla ipucu için standartlaştırma konulu Yardım Merkezi makalemizi inceleyin.

S: PDF dokümanım için arama sonuçlarında hangi başlığın gösterileceğine etki edebilir miyim?
C: Gösterilen başlığı belirlemek için kullandığımız iki ana öğe vardır: Dosyanın içindeki başlık meta verisi ve PDF dosyasına işaret eden bağlantıların bağlantı metinleri. Algoritmalarımıza kullanılacak doğru başlıkla ilgili güçlü bir ipucu vermek için her öğeyi de güncellemenizi öneririz.

Matt Cutts'ın Arama için PDF dosyalarının optimizasyonu konulu videosunu izleyebilir, dizine ekleyebildiğimiz içerik türleri hakkında bilgi almak için Yardım Merkezimizi ziyaret edebilirsiniz. Geri bildirimlerinizi veya önerilerinizi Web Yöneticisi Yardım Forumu'ndan bize iletebilirsiniz.