網(wǎng)站日志基本內(nèi)容
時(shí)間:2023-04-05 15:02:01 | 來源:營銷百科
時(shí)間:2023-04-05 15:02:01 來源:營銷百科
網(wǎng)站日志基本內(nèi)容: 網(wǎng)站日志是記錄web服務(wù)器接收處理請求以及運(yùn)行時(shí)錯(cuò)誤等各種原始信息的以.log結(jié)尾文件。
n 網(wǎng)站日志的作用?
n 通過網(wǎng)站日志可以清楚的得知用戶在什么IP、什么時(shí)間、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下訪問了你網(wǎng)站的哪個(gè)頁面,是否訪問成功。
n 對于專業(yè)從事搜索引擎優(yōu)化工作者而言,網(wǎng)站日志可以記錄各搜索引擎蜘蛛機(jī)器人爬行網(wǎng)站的詳細(xì)情況,例如:哪個(gè)IP的百度蜘蛛機(jī)器人在哪天訪問了網(wǎng)站多少次,訪問了哪些頁面,以及訪問頁面時(shí)返回的HTTP狀態(tài)碼。
n 如何查看網(wǎng)站日志?
n 網(wǎng)站日志一般存放在虛擬主機(jī)的logfiles文件夾下,可以通過FTP工具將網(wǎng)站日志下載下來,通過txt文檔方式查看。
n 日志分析
n 從網(wǎng)站上下載下的網(wǎng)站日志,在txt文本中就可以看到以下數(shù)據(jù):
n 117.26.203.167 - - [02/May/2011:01:57:44 -0700] 'GET/index.php HTTP/1.1' 500 19967 '-' 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)'
n 分析:
n 117.26.203.167 訪問ip
n 02/May/2011:01:57:44 -0700 訪問日期 -時(shí)區(qū)
n GET/index.php HTTP/1.1 根據(jù)HTTP/1.1 協(xié)議 抓取(域名下)/index.php 這個(gè)頁面(GET表示服務(wù)器動作)
n 500 服務(wù)器響應(yīng)狀態(tài)碼
n 服務(wù)器響應(yīng)狀態(tài)碼通常狀態(tài)碼有以下幾種:200,301,302,304,404,500等。200代表用戶成功的獲取到了所請求的文件,如果是搜索引擎,則證明蜘蛛在這次爬行中順利的發(fā)現(xiàn)了一些新的內(nèi)容。而301則代表用戶所訪問的某個(gè)頁面url已經(jīng)做了301重定向(永久性)處理,302則是暫時(shí)性重定向。404則代表所訪問的頁面已經(jīng)不存在了,或者說訪問的url根本就是個(gè)錯(cuò)誤的。500則是服務(wù)器的錯(cuò)誤。
n 19967 表示抓取了19967個(gè)字節(jié)
n Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar 表示訪問者使用火狐瀏覽器及Alexa Toolbar 等訪問端信息
n 如果你的日志里格式不是如此,則代表日志格式設(shè)置不同。
n 很多日志里可以看到 200 0 0和200 0 64 則都代表正常抓取。
n 抓取頻率是通過查看每日的日志里百度蜘蛛抓取次數(shù)來獲知。抓取頻率并沒有一個(gè)規(guī)范的時(shí)間表或頻率數(shù)字,我們一般通過多日的日志對比來判斷。
n