全國服務(wù)熱線:400-080-4418

您現(xiàn)在的位置是:首頁 > 新聞資訊 > 網(wǎng)站建設(shè)常識

網(wǎng)站中的robots.txt文件的具體作用2011/8/2 13:46:20 瀏覽:63

上海網(wǎng)站建設(shè)給大家說一下網(wǎng)站中的robots.txt文件的作用,robots.txt文件放在網(wǎng)站根目錄下,是搜索引擎中訪問網(wǎng)站的時候要查看的第一個文件。當(dāng)一個搜索蜘蛛訪問一個站點(diǎn)時,它會首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果存在,搜索機(jī)器人就會按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。每個網(wǎng)站都應(yīng)該有一個robots,它告訴搜索引擎我的網(wǎng)站里有哪些東西是不允許抓取的,有哪些頁面是歡迎爬行與抓取。

  robots的幾種作用:

  1.屏蔽所有的搜索引擎抓取信息,如果你的網(wǎng)站只是你的私密性的網(wǎng)站,不想太多的人知道的話,可以利用robots屏蔽掉所有的搜索引擎,例如你寫的私人博客。你就可以把搜索引擎全都屏蔽掉

  User-agent: *

  Disallow: /

  2.如果你只想某一個搜索引擎抓取你的信息,這個時候就可以用robots進(jìn)行設(shè)置,例如:我只想我的網(wǎng)站被百度這個收錄,而不想被別的搜索引擎收錄。就可以利用robots進(jìn)行設(shè)置

  User-agent: Baiduspider

  Allow:

  User-agent: *

  Disallow: /

  3.可以利用各種通配符對網(wǎng)站進(jìn)行相對應(yīng)的調(diào)配,例如我不想網(wǎng)站抓取我的所有圖片,這個時候就可以運(yùn)用$來進(jìn)行設(shè)置。一般我們常見的圖片的格式是BMPJPG、GIF、JPEG等格式。這個時候設(shè)置就是:

  User-agent: *

  Disallow: /.bmp$

  Disallow: /.jpg$

  Disallow: /.gif$

  Disallow: /.jpeg$

  4.還可以利用*來屏蔽掉相關(guān)的URL,有些網(wǎng)站不允許搜索引擎抓取動態(tài)地址的時候可以利用這個*通配符來進(jìn)行匹配設(shè)置。一般情況下動態(tài)URL的有一個特點(diǎn)就是有“?”這個時候我們就可以利用這個特性來進(jìn)行匹配的屏蔽:

  User-agent: *

  Disallow: /*?*

  5.如果網(wǎng)站改版了,整個文件夾都沒有了的時候,這個情況下就要考慮屏蔽掉整個文件夾。我們可以運(yùn)用robots來對這整個的文件夾進(jìn)行屏蔽,例如網(wǎng)站里的ab文件夾因改版全都給刪掉了,這個時候就可以這樣子設(shè)置:

  User-agent: *

  Disallow: /ab/

  6.如果網(wǎng)站里有一個文件夾不想被收錄,但是在這個文件夾里面有一個信息是允許被收錄。那可以運(yùn)用robotsallow進(jìn)行設(shè)置。例如我網(wǎng)站里ab文件夾不允許搜索引擎抓取,但是在ab文件夾里面又有一個信息cd是允許被抓取的,這個時候就可以運(yùn)用robots進(jìn)行設(shè)置:

  User-agent: *

  Disallow: /ab/

 7.可以在robots里定義出網(wǎng)站地圖的位置,有利于網(wǎng)站的收錄。

  sitemap:<網(wǎng)站地圖的位置>

  8.有的時候你會發(fā)現(xiàn)我的網(wǎng)站里設(shè)置了robots但是還發(fā)現(xiàn)其收錄了這個URL地址,這個的原因是因?yàn)檫@個搜索引擎的蜘蛛是通過URL爬行到網(wǎng)頁的一般 google抓取這樣子的URL的時候是不帶title與描述的,但是百度抓取這個URL會帶上title與描述,所以有很多有人會說我設(shè)置了 robots但是沒有效果。實(shí)際情況是抓取了這個鏈接而沒有收錄這個頁面內(nèi)容。

  網(wǎng)站的首頁權(quán)重是高的,權(quán)重是靠鏈接傳遞的,我們設(shè)置robots是為了更好的把權(quán)重傳遞給那些需要有很高權(quán)重的頁面,而有一些頁面則是不需要搜索引擎抓取和爬行的。

 

服務(wù)網(wǎng)絡(luò)

關(guān)于我們

網(wǎng)至普專注于網(wǎng)站建設(shè)/網(wǎng)站優(yōu)化,始終追求 “您的滿意,我的追求!”。懂您所需、做您所想!我們一直在思考如何為客戶創(chuàng)造更大的價值,讓客戶更省心!立足上海,服務(wù)全國。服務(wù):上海,北京,廣州,深圳,成都,杭州,南京,蘇州,無錫等地

查看更多 >>

聯(lián)系我們

Copyright 2008 © 上海網(wǎng)至普信息科技有限公司 All rights reserved. 滬ICP備11006570號-13 滬公網(wǎng)安備 31011402007386號


關(guān)于我們 | 聯(lián)系我們 | 網(wǎng)站建設(shè)

返回頂部