當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

百度蜘蛛Baiduspider的真假如何分辨

 2021-01-21 16:24  來(lái)源: 黎青松SEO博客   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

實(shí)際上,我們的日志中,有很多的baiduspider是他人偽裝的,要想解決這個(gè)問(wèn)題。我們必須在驗(yàn)證baiduspider真?zhèn)紊舷鹿Ψ?,這篇文章詳細(xì)的介紹了爬蟲的鑒別方法。

我們?cè)诟鶕?jù)網(wǎng)站日志分析搜索引擎蜘蛛抓取網(wǎng)頁(yè)的記錄時(shí),實(shí)際上很多站點(diǎn)都是有一些偽裝稱baiduspider的到訪者的。這些數(shù)據(jù)會(huì)嚴(yán)重影響我們對(duì)日志分析后的判斷。

這些到訪者,為什么會(huì)偽裝為baiduspider來(lái)訪問(wèn)我們的網(wǎng)站呢?最典型的就是采集你內(nèi)容的那些人。他們知道很多工具是能夠看到哪些ip訪問(wèn)網(wǎng)站的量過(guò)大的。例如某一個(gè)ip今天訪問(wèn)你網(wǎng)站1萬(wàn)次,那正常嗎?肯定是不正常的。但他要是baiduspdier呢?呵呵,那就正常了。

Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(Linux;u;Android4.2.2;zh-cn;)AppleWebKit/534.46(KHTML,likeGecko)Version/5.1MobileSafari/10600.6.3(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,likeGecko)Version/9.0Mobile/13B143Safari/601.1(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

如上是包含了百度的常規(guī)爬蟲,和渲染爬蟲render的。這兩個(gè)爬蟲的區(qū)別符已經(jīng)用紅色字體標(biāo)出來(lái)了。

可以通過(guò)DNS反查方式來(lái)解決這個(gè)問(wèn)題。根據(jù)平臺(tái)不同驗(yàn)證方法不同,如linux/windows/os三種平臺(tái)下的驗(yàn)證方法分別如下:

1、在linux平臺(tái)下,您可以使用hostip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

2、在windows平臺(tái)或者IBMOS/2平臺(tái)下,您可以使用nslookupip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。打開(kāi)命令處理器輸入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

3、在macos平臺(tái)下,您可以使用dig命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。打開(kāi)命令處理器輸入digxxx.xxx.xxx.xxx(IP地址)就能解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

文章來(lái)源:黎青松SEO博客

來(lái)源地址:http://www.alitaohuo.com/SEObaike/SEOrumenjiaocheng/2005.html

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
百度蜘蛛

相關(guān)文章

  • 提升網(wǎng)站圖片的優(yōu)化效果的幾種策略淺析

    雖然現(xiàn)在很多搞網(wǎng)站優(yōu)化的核心工作就是對(duì)網(wǎng)站首頁(yè)進(jìn)行優(yōu)化,認(rèn)為通過(guò)將首頁(yè)的權(quán)重提升,那么對(duì)于整個(gè)網(wǎng)站的曝光率和流量都會(huì)產(chǎn)生本質(zhì)的提升,一起來(lái)提升網(wǎng)站圖片的優(yōu)化效果的幾種策略淺析

  • 只需兩步,教你正確識(shí)別百度蜘蛛

    怎么才能識(shí)別正確的百度蜘蛛呢?來(lái)來(lái)來(lái),只需兩步,教你正確識(shí)別百度蜘蛛

    標(biāo)簽:
    百度蜘蛛
  • 逆冬:一招教你識(shí)別百度真假蜘蛛!

    最近一個(gè)使用眾火的徒弟問(wèn)我、說(shuō)220和116的蜘蛛不是真蜘蛛,因?yàn)樗鹡slookup的時(shí)候,并沒(méi)有出現(xiàn)“baidu”類的字樣、反而出現(xiàn)了別的字樣,所以他感覺(jué)不真,而同樣的ip,我本地用windows電腦nslookup的確實(shí)可以出現(xiàn)“baidu”類的字樣,如下圖:

    標(biāo)簽:
    百度蜘蛛
  • 搜索引擎及搜索引擎蜘蛛是什么?

    很多新人SEO同學(xué)很少接觸到搜索引擎蜘蛛,即使百度蜘蛛也未必能接觸到。即使接觸到了,也不知道它是不是。為什么呢?因?yàn)楹芏郤EO新人沒(méi)有分析網(wǎng)站日志,所以沒(méi)看到。

    標(biāo)簽:
    搜索引擎
    百度蜘蛛
  • 百度蜘蛛抓取不存在目錄 對(duì)應(yīng)的解決方法

    相信大家在分析百度蜘蛛日志的時(shí)候經(jīng)常會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題,就是百度蜘蛛經(jīng)常會(huì)抓取一些不存在的目錄,比如:我網(wǎng)站沒(méi)有這些目錄,但是百度蜘蛛一直在抓取,或者你會(huì)發(fā)現(xiàn)百度蜘蛛在抓取自己的隱私目錄

    標(biāo)簽:
    百度蜘蛛
    蜘蛛抓取

熱門排行

信息推薦