時間:2022-07-18 02:21:01 | 來源:建站知識
時間:2022-07-18 02:21:01 來源:建站知識
什么是robots.txt?
robots.txt是搜索引擎中訪問網(wǎng)站的時候要查看的第一個文件。robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。
robtots.txt必須放置在我這根目錄之下,而且,文件名必須全部小寫,這兩點是做robots.txt優(yōu)化設(shè)置必須注意的。
robots.txt在SEO中起作用
搜索引擎是遵循robots.txt這個搜索蜘蛛遵循協(xié)議的。因此,如果我們網(wǎng)站上的某些內(nèi)容不希望搜索引擎爬取收錄,那么,我們就可以利用這個robots.txt來設(shè)置一番,設(shè)置搜索引擎蜘蛛不要爬取。語法如下:
User-agent: *
Disallow: /禁止抓取的路徑/
以上這個語法是禁止所有搜索引擎蜘蛛,如果你指針對百度或者谷歌,那么將User-agent: baiduspider即可。注釋:google蜘蛛:googlebot 百度蜘蛛:baiduspider。
robots.txt的一些使用小技巧
網(wǎng)站為什么要使用偽靜態(tài)?因為url地址是類似靜態(tài)的,所以,像織夢那樣的動態(tài)評論,對排名起不了作用,而搜索引擎蜘蛛一旦爬取收錄發(fā)現(xiàn)是毫無價值的信息之后,是不是的來段收錄暴漲,收錄大跌的情景,相信站長對這類情況就顯得比較抓狂了。那么,Disallow: /*?* 禁止訪問網(wǎng)站中所有的動態(tài)頁面,可以幫你很好的解決這類難題了。
當(dāng)然,網(wǎng)站的后臺文件是不希望暴露在公眾視野的,故因此可利用robots.txt中的Disallow: /后臺登陸路徑/很好的解決這一問題。當(dāng)然,如果是圖片類的站點,希望防止盜鏈減輕服務(wù)器壓力的話,那么Disallow: .jpg$就可以很好的解決這一個難題了。
至于網(wǎng)站地圖的重要性,相信大伙兒都清楚的指導(dǎo),那么,搜索引擎蜘蛛爬到一個網(wǎng)站的時候,最先爬取的robots.txt這個協(xié)議,想讓網(wǎng)站收錄更多嗎?那么,在Sitemap: 網(wǎng)站地圖url,就是個不錯的應(yīng)用技巧了。
本文首發(fā)A5,轉(zhuǎn)載時請標(biāo)明出處。更多關(guān)于robots.txt設(shè)置的問題,可在了解更多!
關(guān)鍵詞:設(shè)置,利用,巧妙,玄機(jī)
微信公眾號
版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。