什么是網(wǎng)站地圖(SiteMap.html)?
時間:2023-09-01 04:18:01 | 來源:網(wǎng)站運(yùn)營
時間:2023-09-01 04:18:01 來源:網(wǎng)站運(yùn)營
什么是網(wǎng)站地圖(SiteMap.html)?:SiteMap就是我們站長稱之為網(wǎng)站地圖,包含并列出了網(wǎng)站中幾乎所有的URL,以便搜索引擎可以更加方便快捷的抓取和發(fā)現(xiàn)網(wǎng)站的網(wǎng)頁,從而提高搜索引擎的抓取效率。因為很多網(wǎng)站的連接層次比較深,蜘蛛很難抓取到,網(wǎng)站地圖可以方便搜索引擎蜘蛛抓取網(wǎng)站頁面,通過抓取網(wǎng)站頁面,清晰了解網(wǎng)站的架構(gòu),網(wǎng)站地圖一般存放在根目錄下并命名為sitemap,為搜索引擎蜘蛛指路,增加網(wǎng)站重要內(nèi)容頁面的收錄。網(wǎng)站地圖就是根據(jù)網(wǎng)站的結(jié)構(gòu)、框架、內(nèi)容,生成的導(dǎo)航網(wǎng)頁文件。大多數(shù)人都知道網(wǎng)站地圖對于提高用戶體驗有好處:它們?yōu)榫W(wǎng)站訪問者指明方向,并幫助迷失的訪問者找到他們想看的頁面。在實(shí)際中我們最常見的有以下幾種網(wǎng)站地圖文件格式:sitemap.xml,sitemap.html,sitemap.txt。
sitemap.xml、sitemap.txt
XML版本的網(wǎng)站地圖是由Google首先提出的,是用于提交給搜索引擎的重要文件,XML文件也是sitemap信息量最大最常用的,其文件中列出了網(wǎng)站中的所有網(wǎng)頁地址及其它相關(guān)數(shù)據(jù)(更新的時間、頻率以及相對于網(wǎng)站上其他網(wǎng)址的重要程度等)。XML版本的網(wǎng)站地圖是由XML標(biāo)簽組成的,文件本身必須是utf8編碼,網(wǎng)站地圖文件實(shí)際上就是列出網(wǎng)站需要被收錄的頁面的URL,最簡單的網(wǎng)站地圖可以是一個純文本件,文件只要列出頁面的URL,一行列一個URL,搜索引擎就能抓取并理解文件內(nèi)容。簡單的我們可以理解這兩個文件是給搜索引擎看的文件,XML版本中包含了URL,時間,重要性等參數(shù)。
sitemap.html
sitemap.html格式的網(wǎng)站地圖主要用來方便用戶的瀏覽使用,簡單的來說就是給來訪用戶看的。稱為HTML版本的網(wǎng)站地圖,這個版本的網(wǎng)站地圖就是用戶可以在網(wǎng)站上看到的,列出網(wǎng)站上所有主要頁面的鏈接的頁面。對小網(wǎng)站來說,甚至可以列出整個網(wǎng)站的所有頁面,對于具有規(guī)模的網(wǎng)站來說,一個網(wǎng)站地圖不可能羅列所有的頁面鏈接,可以采取兩種辦法,一種辦法是網(wǎng)站地圖只列出網(wǎng)站最主要的鏈接,如一級分類,二級分類,第二種辦法是將網(wǎng)站地圖分成幾個文件,主網(wǎng)站地圖列出通往次級網(wǎng)站的鏈接,次級網(wǎng)站地圖在列出一部分頁面鏈接。如下圖:新浪的網(wǎng)站地圖HTML頁
sitemap的優(yōu)點(diǎn)
1.為搜索引擎蜘蛛提供可以瀏覽整個網(wǎng)站的鏈接簡單的體現(xiàn)出網(wǎng)站的整體框架出來給搜索引擎看;
2.為搜索引擎蜘蛛提供一些鏈接,指向動態(tài)頁面或者采用其他方法比較難以到達(dá)的頁面;
3.作為一種潛在的著陸頁面,可以為搜索流量進(jìn)行優(yōu)化;
4.如果訪問者試圖訪問網(wǎng)站所在域內(nèi)并不存在的URL,那么這個訪問者就會被轉(zhuǎn)到“無法找到文件”的錯誤頁面,而網(wǎng)站地圖可以作為該頁面的“準(zhǔn)”內(nèi)容
sitemap的使用建議
百度:建議使用HTML格式和TXT格式的網(wǎng)站地圖。
Google:建議使用XML格式的網(wǎng)站地圖。
Yahoo:建議使用TXT格式的網(wǎng)站地圖。