網(wǎng)站日志怎么看,1分鐘教會(huì)你!
時(shí)間:2023-05-07 00:03:02 | 來(lái)源:網(wǎng)站運(yùn)營(yíng)
時(shí)間:2023-05-07 00:03:02 來(lái)源:網(wǎng)站運(yùn)營(yíng)
網(wǎng)站日志怎么看,1分鐘教會(huì)你?。篧eb日志是網(wǎng)站的Web服務(wù)處理程序,根據(jù)一定的規(guī)范生成的ASCII文本。它主要記錄了網(wǎng)站訪問(wèn)記錄數(shù)據(jù)內(nèi)容,是網(wǎng)站分析和網(wǎng)站數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)基礎(chǔ)來(lái)源,而網(wǎng)站分析和數(shù)據(jù)分析也將對(duì)SEO產(chǎn)生一定的影響,所以了解Web日志的格式和組成將有利于我們更好地進(jìn)行網(wǎng)站數(shù)據(jù)的收集、處理和分析,從而更好的進(jìn)行網(wǎng)站優(yōu)化。
一、Web日志格式分類目前常見(jiàn)的Web日志格式主要有兩類:
1、Apache的NCSA日志格式
NCSA格式又分為NCSA普通日志格式(CLF)和NCSA擴(kuò)展日志格式(ECLF)兩類,目前最常用的是NCSA擴(kuò)展日志格式(ECLF)及基于自定義類型的Apache日志格式;
2、IIS的W3C日志格式。
W3C擴(kuò)展日志格式(ExLF)具備了更為豐富的輸出信息,主要是微軟IIS(Internet Information Services)中應(yīng)用。
二、NCSA擴(kuò)展Web日志格式(ECLF)下面是一個(gè)最常見(jiàn)的基于NCSA擴(kuò)展Web日志格式(ECLF)的Apache日志樣例:
218.161.64.101 – - [22/Nov/2021:09:51:46 +0800] “GET /reference-and-source/Weblog-format/ HTTP/1.1″ 202 6326 ”http :/ /www .
http://google.cn/search?q=friend” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)”
這個(gè)日志可以解讀為:來(lái)自"
http://www.google.cn/search?q=friend "的訪客,使用IE6.0瀏覽器,應(yīng)用HTTP/1.1協(xié)議,在22/Nov/2021:09:51:46,訪問(wèn)(GET)了218.161.64.101主機(jī)的 /reference-and-source/Weblog-format/,訪問(wèn)成功,得到6326字節(jié)數(shù)據(jù)。
可以看到這個(gè)日志主要由以下幾個(gè)部分組成:訪問(wèn)主機(jī)(remotehost):顯示主機(jī)的IP地址或者已解析的域名。
標(biāo)識(shí)符(Ident):由identd或直接由瀏覽器返回瀏覽者的EMAIL或其他唯一標(biāo)示,因?yàn)樯婕坝脩羿]箱等隱私信息,目前幾乎所有的瀏覽器就取消了這項(xiàng)功能。
授權(quán)用戶(authuser):用于記錄瀏覽者進(jìn)行身份驗(yàn)證時(shí)提供的名字,如果需要身份驗(yàn)證或者訪問(wèn)密碼保護(hù)的信息則這項(xiàng)不為空,但目前大多數(shù)網(wǎng)站的日志這項(xiàng)也都是為空的。
日期時(shí)間(date):一般的格式形如[22/Feb/2010:09:51:46 +0800],即[日期/月份/年份:小時(shí):分鐘:秒鐘 時(shí)區(qū)],占用的的字符位數(shù)也基本固定。
請(qǐng)求(request):即在網(wǎng)站上通過(guò)何種方式獲取了哪些信息,也是日志中較為重要的一項(xiàng),主要包括三種請(qǐng)求類型(METHOD),主要包括GET/POST/HEAD這三種。
請(qǐng)求資源(RESOURCE):顯示的是相應(yīng)資源的URL,可以是某個(gè)網(wǎng)頁(yè)的地址,也可以是網(wǎng)頁(yè)上調(diào)用的圖片、動(dòng)畫、CSS等資源;
協(xié)議版本號(hào)(PROTOCOL):顯示協(xié)議及版本信息,通常是HTTP/1.1或HTTP/1.0。
狀態(tài)碼(status):用于表示服務(wù)器的響應(yīng)狀態(tài),通常1xx的狀態(tài)碼表示繼續(xù)消息;2xx表示請(qǐng)求成功;3xx表示請(qǐng)求的重定向;4xx表示客戶端錯(cuò)誤;5xx表示服務(wù)器錯(cuò)誤。
傳輸字節(jié)數(shù)(bytes):即該次請(qǐng)求中一共傳輸?shù)淖止?jié)數(shù)。
來(lái)源頁(yè)面(referrer):用于表示瀏覽者在訪問(wèn)該頁(yè)面之前所瀏覽的頁(yè)面,只有從上一頁(yè)面鏈接過(guò)來(lái)的請(qǐng)求才會(huì)有該項(xiàng)輸出,如果是新開(kāi)的頁(yè)面則該項(xiàng)為空。上例中來(lái)源頁(yè)面是google,即用戶從google搜索的結(jié)果中點(diǎn)擊進(jìn)入。
用戶代理(agent):用于顯示用戶的詳細(xì)信息,包括IP、OS、Bowser等。
三、W3C擴(kuò)展Web日志下面是一段常見(jiàn)的IIS生產(chǎn)的W3C擴(kuò)展Web日志
2021-11-22 13:11:38 GET /Enterprise/detail.asp 70.25.29.53
https://m1.fit/pricing 202 17735 369 4656
這個(gè)日志可以解讀為:IP是70.25.29.53,來(lái)自"
https://m1.fit/pricing "的訪客,在2021-11-22 13:11:38,訪問(wèn)(GET)了/config/getuser?index=0,訪問(wèn)成功,得到17735字節(jié)數(shù)據(jù)。
日期:date 動(dòng)作發(fā)生時(shí)的日期。
時(shí)間:time 動(dòng)作發(fā)生時(shí)的時(shí)間(默認(rèn)為UTC標(biāo)準(zhǔn))。
客戶端IP地址:c-ip 訪問(wèn)服務(wù)器的客戶端IP地址。
用戶名:cs-username 通過(guò)身份驗(yàn)證的訪問(wèn)服務(wù)器的用戶名。不包括匿名用戶(用‘-’表示)。
服務(wù)名:s-sitename 客戶所訪問(wèn)的Internet服務(wù)名以及實(shí)例號(hào)。
服務(wù)器名:s-computername 產(chǎn)生日志條目的服務(wù)器的名字。
服務(wù)器IP 地址:s-ip 產(chǎn)生日志條目的服務(wù)器的IP地址。
服務(wù)器端口:s-port 服務(wù)端提供服務(wù)的傳輸層端口。
方法:cs-method 客戶端執(zhí)行的行為(主要是GET與POST行為)。
URI Stem:cs-uri-stem 被訪問(wèn)的資源,如Default.asp等。
URI Query:cs-uri-query 客戶端提交的參數(shù)(包括GET與POST行為)。
協(xié)議狀態(tài):sc-status 用HTTP或者FTP術(shù)語(yǔ)所描述的、行為執(zhí)行后的返回狀態(tài)。
Win32狀態(tài):sc-win32-status 用Microsoft Windows的術(shù)語(yǔ)所描述的動(dòng)作狀態(tài)。
發(fā)送字節(jié)數(shù):sc-bytes 服務(wù)端發(fā)送給客戶端的字節(jié)數(shù)。
接受字節(jié)數(shù):cs-bytes 服務(wù)端從客戶端接收到的字節(jié)數(shù)。
花費(fèi)時(shí)間:time-taken 執(zhí)行此次行為所消耗的時(shí)間,以毫秒為單位。
協(xié)議版本:cs-version 客戶端所用的協(xié)議(HTTP、FTP)版本。對(duì)HTTP協(xié)議來(lái)說(shuō)是HTTP 1.0或者HTTP 1.1。
主機(jī):cs-host 客戶端的HTTP報(bào)頭(host header)信息。
用戶代理:cs(User-Agent) 客戶端所用的瀏覽器版本信息。
Cookie:cs(Cookie) 發(fā)送或者接受到的cookie內(nèi)容。
Referrer:cs(Referer) 用戶瀏覽的前一個(gè)網(wǎng)址,當(dāng)前網(wǎng)址是從該網(wǎng)址鏈接過(guò)來(lái)的。
協(xié)議底層狀態(tài):sc-substatus 協(xié)議底層狀態(tài)的一些錯(cuò)誤信息。
Web日志記錄了網(wǎng)站訪客的詳細(xì)情況,我們可以通過(guò)日志分析工具來(lái)分析網(wǎng)民對(duì)網(wǎng)站的瀏覽情況,但在實(shí)際應(yīng)用中,我們更多的是采用一些第三方的網(wǎng)站統(tǒng)計(jì)工具來(lái)監(jiān)控訪客對(duì)網(wǎng)站的訪問(wèn)情況。對(duì)于Web日志,我們需要重點(diǎn)關(guān)注的是各大搜索引擎蜘蛛對(duì)網(wǎng)站的抓取情況,這才是對(duì)我們SEO工作最直接的影響因素。
【聲明】原創(chuàng)內(nèi)容,請(qǐng)勿刪改,轉(zhuǎn)載須注明出處https://m1.fit!