亚洲一区二区综合久久小说,少妇扒开毛毛自慰喷水

識別搜索引擎爬蟲真?zhèn)蔚姆椒\析2010/2/25 11:11:32　瀏覽：30

　　相信不少網(wǎng)站對搜索引擎爬蟲都是又愛又恨，因為其中不僅有些爬蟲不守規(guī)矩，還有人冒充爬蟲對網(wǎng)站進行瘋狂的掃描。

　　做的比較好的爬蟲抓取頻率都比較合理，對網(wǎng)站資源消耗比較少，Google Spider會根據(jù)網(wǎng)頁的下載速度等因素進行抓取速度的動態(tài)調(diào)整，你可以通過Webmaster Tools來調(diào)整Spider的抓取速度。

　　Google_Webmaster_Tools_Settings

　　很多糟糕的網(wǎng)絡(luò)爬蟲，經(jīng)常并發(fā)幾十上百個請求循環(huán)重復(fù)抓取。一個“爬蟲”先是將PageNo遞增到無窮大——被封，過了4個小時，“爬蟲”又回來了，這次程序倒是改進了不少，通過分析網(wǎng)頁內(nèi)部的鏈接進行抓取，可是沒過多久發(fā)現(xiàn)總是抓取那幾個特定的頁面，原來被網(wǎng)頁內(nèi)部鏈接套住，程序進入了死循環(huán)，只能封殺。

　　網(wǎng)上也出現(xiàn)了很多如何封殺惡意爬蟲的方法。常見的就是根據(jù)UserAgent中的標識進行識別封殺，但是道高一尺魔高一丈，接下來就有人偽造User-Agent，偽裝成各大搜索引擎的爬蟲進行抓取。

　　目前的做法是根據(jù)UserAgent進行判斷，如果是真正的搜索引擎爬蟲，那么就放過；如果發(fā)現(xiàn)是偽造的就堅決封殺。剩余的正常UserAgent的訪問則通過限制IP并發(fā)請求次數(shù)來限制。

　　那么問題就出現(xiàn)了，如何才能正確識別搜索引擎爬蟲的真?zhèn)危鋵嵰恍┐笮偷乃阉饕嫔潭家呀?jīng)提供了相關(guān)的方法，那就是反向DNS驗證。

　　拿Google Spider舉個例子：

　　Google：www.google.com/support/webmasters/bin/answer.py?answer=80553

　　Yahoo：http://www.ysearchblog.com/2007/06/05/yahoo-search-crawler-slurp-has-a-new-address-and-signature-card/

　　Bing：cn.bing.com/community/blogs/search/archive/2006/11/29/search-robots-in-disguise.aspx

　　可喜可賀的是baidu的2個月前爬蟲也開始遵守這一“潛規(guī)則”，雖然沒有在任何網(wǎng)頁公開此消息，但經(jīng)過測試，實際上是可行的。

上一條：有道搜索引擎廣告系統(tǒng)的優(yōu)缺點分析　
下一條：博客搜索引擎分析

相關(guān)資訊: 企業(yè)網(wǎng)建設(shè)過程中需要考慮的幾點

現(xiàn)在這個互聯(lián)網(wǎng)時代，企業(yè)網(wǎng)站已經(jīng)成為了企業(yè)營銷推廣的基礎(chǔ)，更是品牌建設(shè)中不可或缺的部分，但是網(wǎng)站也不..; 企業(yè)官網(wǎng)建設(shè)多少錢？

許多公司為了滿足自身發(fā)展的需要，會建立屬于自己公司網(wǎng)站。每個公司在制作網(wǎng)站的時候都需要有產(chǎn)品和服務(wù)營..; 移動互聯(lián)網(wǎng)+時代，還是企業(yè)官網(wǎng)嗎？

在這樣一個移動互聯(lián)網(wǎng)的時代，搭建好企業(yè)的官網(wǎng)，做好互聯(lián)網(wǎng)上面的一個營銷宣傳工作，對于企業(yè)，尤其是傳統(tǒng)行業(yè)來說，起著至關(guān)重要的作用。; 如何選擇一家好的網(wǎng)站建設(shè)公司

品牌網(wǎng)站建設(shè)公司; 2021年的新網(wǎng)站建設(shè)報價

2021年的網(wǎng)站建設(shè)報價

建站資深品牌
專業(yè)網(wǎng)站建設(shè)公司

識別搜索引擎爬蟲真?zhèn)蔚姆椒\析2010/2/25 11:11:32　瀏覽：30

企業(yè)網(wǎng)建設(shè)過程中需要考慮的幾點

企業(yè)官網(wǎng)建設(shè)多少錢？

移動互聯(lián)網(wǎng)+時代，還是企業(yè)官網(wǎng)嗎？

如何選擇一家好的網(wǎng)站建設(shè)公司

2021年的新網(wǎng)站建設(shè)報價

關(guān)于我們

案例分享

AllyNavAllyNav was established in 201..

正至建筑工程（上海）有限公司正至建筑工程（上海）有限公司成..

服務(wù)范圍

聯(lián)系我們

建站資深品牌專業(yè)網(wǎng)站建設(shè)公司

識別搜索引擎爬蟲真?zhèn)蔚姆椒\析2010/2/25 11:11:32 瀏覽：30

企業(yè)網(wǎng)建設(shè)過程中需要考慮的幾點

企業(yè)官網(wǎng)建設(shè)多少錢？

移動互聯(lián)網(wǎng)+時代，還是企業(yè)官網(wǎng)嗎？

如何選擇一家好的網(wǎng)站建設(shè)公司

2021年的新網(wǎng)站建設(shè)報價

關(guān)于我們

案例分享

AllyNavAllyNav was established in 201..

正至建筑工程（上海）有限公司正至建筑工程（上海）有限公司成..

服務(wù)范圍

聯(lián)系我們

建站資深品牌
專業(yè)網(wǎng)站建設(shè)公司

識別搜索引擎爬蟲真?zhèn)蔚姆椒\析2010/2/25 11:11:32　瀏覽：30

企業(yè)官網(wǎng)建設(shè)多少錢？

移動互聯(lián)網(wǎng)+時代，還是企業(yè)官網(wǎng)嗎？