این صفحه نحوه تعریف پوشش موتور جستجوی خود را با استفاده از یک فایل حاشیه نویسی XML توضیح می دهد.
نمای کلی
اگر در حال ساخت یک موتور جستجوی بزرگ هستید، مدیریت مجموعه بزرگی از سایت ها می تواند خسته کننده باشد. در عوض، میتوانید سایتهای زیادی را با فهرست کردن آنها در یک فایل حاشیهنویسی و آپلود آن اضافه و مدیریت کنید. علاوه بر این، فایل های حاشیه نویسی به شما کنترل بسیار بیشتری بر رتبه بندی نتایج جستجو می دهد.
یک فایل حاشیه نویسی به سادگی فهرستی از حاشیه نویسی است. هر حاشیه نویسی دارای دو جزء است: سایت و برچسب های مرتبط با آن. این برچسب به موتور جستجوی قابل برنامه ریزی می گوید که چگونه یک سایت را مدیریت کند. یعنی اینکه آیا یک سایت باید گنجانده شود، حذف شود، ارتقا یابد یا تنزل رتبه یابد. در فایل زمینه ، برچسب ها را تعریف می کنید. در فایل حاشیه نویسی، سایت ها را با برچسب های مناسب تگ می کنید.
هنگامی که ویرایش فایل حاشیه نویسی خود را شروع می کنید، با تعداد کمی از حاشیه نویسی شروع کنید. آزمایش و عیب یابی موتور جستجوی خود با تعداد انگشت شماری از حاشیه نویسی آسان تر است. وقتی به نتایجی رسیدید که انتظار دارید، به تدریج حاشیه نویسی های بیشتری اضافه کنید.
می توانید فایل حاشیه نویسی را در کنترل پنل آپلود کنید . برای جزئیات بیشتر در مورد محدودیت های فایل، به بخش حاشیه نویسی ها مراجعه کنید.
با استفاده از فرمت XML جستجوی قابل برنامه ریزی
اگر میخواهید از تمام ویژگیهای موجود در فایل پیکربندی موتور جستجوی قابل برنامهریزی استفاده کنید، XML راهی برای رفتن است.
حاشیه نویسی XML
در زیر نمونه ای از حاشیه نویسی های XML آورده شده است. این فایل حاشیهنویسی به موتور جستجوی برنامهپذیر میگوید همه چیز را در www.webmd.com/hw/* درج کند، اما همه چیز را در زیر www.webmd.com/hw/cancer/* حذف کند.
<Annotations> <Annotation about="www.cancer.gov/cancertopics/types/liver/*"> <Label name="_include_"/> <Comment>government site</Comment> </Annotation> <Annotation about="www.medicinenet.com/liver_cancer/"> <Label name="_exclude_"/> <Comment>site on symptoms</Comment> </Annotation> <Annotation about="www.webmd.com/hw/*"> <Label name="_include_"/> <Comment>great sites for patients!</Comment> </Annotation> <Annotation about="www.webmd.com/hw/cancer/*"> <Label name="_exclude_"/> <Comment>great sites for patients!</Comment> </Annotation> <Annotation about="www.oncologychannel.com/*/treatment"> <Label name="_exclude_"/> </Annotation> </Annotations>
فایل حاشیه نویسی دارای چهار عنصر در سلسله مراتب زیر است:
-
Annotations
(عنصر ریشه)-
Annotation
-
Label
-
Comment
(اختیاری)
-
-
ایجاد حاشیه نویسی خارجی
برای فهرست کردن سایت هایی که می خواهید موتور جستجوی شما پوشش دهد، موارد زیر را انجام دهید:
- فایل را با عنصر ریشه
<Annotations></Annotations>
شروع کنید. - با افزودن تگ های
<Annotation></Annotation>
یک حاشیه نویسی ایجاد کنید و سپس ویژگیabout
را با الگوی URL سایت تعریف کنید.<Annotations> <Annotation about="www.webmd.com/hw/cancer/*"> </Annotation> </Annotations>
- با استفاده از تگ
<Label name=" "/>
سایت را با موتور جستجو مرتبط کنید و نحوه برخورد موتور جستجو با آن سایت را مشخص کنید. می توانید برچسب های موتور جستجوی خود را از فایل Context موتور جستجو دریافت کنید. دو برچسب پیدا خواهید کرد: یکی برای افزودن سایت ها به موتور جستجوی قابل برنامه ریزی و دیگری برای حذف سایت ها از آن. اگر نام برچسب موتور جستجو را در فایل زمینه تغییر ندادهاید، برچسب درج سایتها به شکل_include_
و برچسب حذف سایتها به شکل_exclude_
است. برای جلوگیری از خطا، این برچسب ها را به جای تایپ دستی کپی و جایگذاری کنید.<Annotations> <Annotation about="http://www.solarenergy.org/*"> <Label name="_include_"/> </Annotation> </Annotations>
یک سایت می تواند چندین برچسب مرتبط با آن داشته باشد،
اگر نام برچسب را در فایل زمینه تغییر داده اید، به یاد داشته باشید که مقادیر
Label name
را در فایل حاشیه نویسی خود به روز کنید. - برای افزودن سایت های بیشتر، عنصر
Annotation
دیگری ایجاد و تعریف کنید. - فایل XML را ذخیره کنید.
بهبود پوشش جستجو
موتور جستجوی قابل برنامه ریزی در بالای فهرست گوگل ساخته شده است. این بدان معناست که صفحات وب که در فهرست گوگل هستند در دسترس موتور جستجوی شما هستند. برعکس، صفحات وبی که توسط گوگل خزیده نشده اند در نتایج جستجوی شما نمایش داده نمی شوند. اگر میخواهید موتور جستجوی قابل برنامهریزی شما شامل سایتهایی باشد که در حال حاضر در فهرست Google نیستند، نقشه سایت را به کنسول جستجوی Google ارسال کنید.
نقشه سایت شامل لیستی از صفحات در سایت شما و همچنین اطلاعاتی در مورد تعداد دفعات به روز رسانی صفحات وب و اهمیت آنها نسبت به یکدیگر است. ارسال نقشه سایت به Google کمک می کند تا صفحات وب شما را کشف کند و برنامه خزیدن را بهبود بخشد. برای کسب اطلاعات بیشتر در مورد نقشه سایت، به مرکز راهنمای وب مستر و استفاده از پروتکل نقشه سایت مراجعه کنید. اگر به ساختن نقشههای سایت شیکتر علاقه دارید، به http://www.sitemaps.org/protocol.php مراجعه کنید.
ارسال نقشه سایت به ویژه در صورتی مفید است که سایت شما دارای موارد زیر باشد:
- محتوای پویا
- صفحات وب که به راحتی توسط Googlebot (خزنده وب گوگل) کشف نمی شوند، مانند صفحاتی با ویژگی های غنی AJAX یا Flash
- تعداد کمی از وب سایت ها به آن لینک می دهند.
Googlebot با دنبال کردن پیوندها از یک صفحه به صفحه دیگر، وب را می خزد، بنابراین اگر سایت شما به خوبی پیوند داده نشده باشد، کشف آن برای خزنده دشوار است. اگر وب سایت شما جدید است، احتمالاً وب سایت های زیادی به سایت شما اشاره نمی کنند.
- آرشیو بزرگی از صفحات محتوا که شبکه قوی پیوند متقابل ندارد
گوگل فقط می تواند صفحاتی را که می تواند به آن دسترسی داشته باشد فهرست بندی کند. بنابراین، اگر از فایل robots.txt یا متا تگ های روبات در صفحات وب خود استفاده می کنید، مطمئن شوید که این صفحات خزنده ها را مسدود نمی کنند.
پوشش بهبود یافته آنی نیست، زیرا مدتی طول می کشد تا صفحات خزیده شوند و فهرست شوند. اما هنگامی که صفحات وب شما در فهرست قرار می گیرند، می توانند هم در جستجوی گوگل و هم در موتور جستجوی قابل برنامه ریزی شما ظاهر شوند.
محدودیت های حاشیه نویسی
جدول زیر محدودیتهایی را برای فایلهای حاشیهنویسی که در موتور جستجوی قابل برنامهریزی آپلود میشوند فهرست میکند:
توجه: محدودیت ها را به دقت دنبال کنید. اگر از آنها فراتر بروید، ممکن است موتور جستجوی شما نتایجی را نشان ندهد.
جنبه | محدود کنید |
---|---|
اندازه فایل (فایل های متن یا حاشیه نویسی) | 30 کیلوبایت |
حداکثر تعداد حاشیه نویسی در هر موتور جستجو | 5000 نکته: اگر متوجه شدید که موتور جستجوی شما از محدودیت بزرگ 5000 سایت بیشتر است، URL های فردی را در الگوهای URL ادغام کنید. |