robots.txt文件,是每一個搜索引擎蜘蛛到你的網(wǎng)站之后要尋找和訪問的第一個文件,robots.txt是你對搜索引擎制定的一個如 何索引你的網(wǎng)站的規(guī)則。通過該文件,搜索引擎就可以知道在你的網(wǎng)站中哪些文件是可以被索引的,哪些文件是被拒絕索引的。我們就可以很方便地控制搜索引擎索引網(wǎng)站內(nèi)容了。 在很多網(wǎng)站中,站長們都忽略了使用robots.txt文件。
因為很多站長都認為,自己的網(wǎng)站沒有什么秘密可言,而且自己也不太會使用robots.txt的語法,因此一旦寫錯了會帶來更多的麻煩,還不如不用。 其實這樣的做法是不對的。如果蜘蛛在某個網(wǎng)站*問了一個不存在的URL,那么就會記錄下一條404信息(網(wǎng)頁不存在),而robots.txt作為蜘蛛訪問網(wǎng)站的第一個文件,一旦搜索引擎找不到這個文件,也會在它的索引服務(wù)器上記錄下一條404信息。如果這樣的404信息過多,那么搜索引擎蜘蛛就會認為該網(wǎng)站價值較低,從而降低對該網(wǎng)站的“印象分”,這就是我們經(jīng)常會聽到的“降低權(quán)重”。
“權(quán)重”是一個影響網(wǎng)站在搜索引擎排名中非常重要的因素,如果網(wǎng)站的權(quán)重高,那么搜索引擎蜘蛛也會頻繁地訪問該網(wǎng)站,而且網(wǎng)站排名也好。如果權(quán)重低,那么搜索引擎蜘蛛對于網(wǎng)站的訪問次數(shù)也相應(yīng)的要少,同時網(wǎng)站排名較差。而網(wǎng)站的權(quán)重是由很多條件所積累的,404信息就是很重要的一條,因此不得不重視。 雖然在百度的幫助文件中,有這樣的一句話“請注意,僅當您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容時,才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上的所有內(nèi)容,請 勿建立robots.txt文件”。
實際上百度只是擔心由于網(wǎng)站管理員不懂得robots.txt語法,導致搜索引擎蜘蛛無法正常抓取網(wǎng)站,才這樣寫的。建立robots.txt文件還是必需的,哪怕這個robots.txt文件是一個空白的文本文檔都可以。因為我們的網(wǎng)站畢竟不是僅僅會被百度收錄,同時也會被其他搜索引擎收錄,上傳一個空白的robots.txt文件,至少不會導致一條404信息的產(chǎn)生。
本文來源:裕順網(wǎng)絡(luò)www.ahyushun.com如有轉(zhuǎn)載請注明出處
友情提示:A5官方SEO服務(wù),為您提供權(quán)威網(wǎng)站優(yōu)化解決方案,快速解決網(wǎng)站流量異常,排名異常,網(wǎng)站排名無法突破瓶頸等服務(wù):http://www.admin5.cn/seo/zhenduan/
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!