如何查看及分析網(wǎng)站IIS日志文件
時(shí)間:2022-05-28 17:42:01 | 來(lái)源:網(wǎng)絡(luò)營(yíng)銷
時(shí)間:2022-05-28 17:42:01 來(lái)源:網(wǎng)絡(luò)營(yíng)銷
網(wǎng)站IIS日志分析是一個(gè)專業(yè)的SEO必備的工作技能之一,服務(wù)器的一些狀況和訪問(wèn)IP的來(lái)源都會(huì)記錄在IIS日志中,所以IIS日志對(duì)每個(gè)服務(wù)器管理者非常的重要,這點(diǎn)同時(shí)也可方便網(wǎng)站管理人員查看網(wǎng)站的運(yùn)營(yíng)情況。
通過(guò)分析查看網(wǎng)站IIS日志可以讓我們知道分析出網(wǎng)站的死鏈接,301,202,等等,可讓我們知道網(wǎng)站那些鏈接是搜索引擎經(jīng)常爬取的,每天那些頁(yè)面是被搜索引擎爬取過(guò),可以分析出網(wǎng)站是否被降權(quán)、哪些頁(yè)面被收錄等,今天,億企邦就跟大家分享一下如何查看IIS日志,以及如何分析IIS日志?希望對(duì)大家有所幫助。
一、IIS日志是什么? IIS日志主要用于記錄用戶和搜索引擎蜘蛛對(duì)網(wǎng)站的訪問(wèn)行為。
簡(jiǎn)單來(lái)說(shuō),網(wǎng)站IIS日志就是指記錄各種搜索引擎蜘蛛來(lái)訪并抓取網(wǎng)站的行為狀態(tài)碼,并已文件的方式生成IIS日志。
我們可以通過(guò)IIS日志來(lái)讓我們知道蜘蛛來(lái)訪的記錄,而且可以讓我們知道網(wǎng)站的死鏈接,301等,讓我們及時(shí)的分析好網(wǎng)站的收錄和快照更新情況。
IIS日志中,包括客戶端訪問(wèn)時(shí)間、訪問(wèn)來(lái)源、來(lái)源IP、客戶端請(qǐng)求方式、請(qǐng)求端口、訪問(wèn)路徑及參數(shù)、Http狀態(tài)碼狀態(tài)、返回字節(jié)大小等信息(具體可查看億企邦《如何通過(guò)iis日志分析網(wǎng)站的隱形信息》的相關(guān)介紹)。
二、如何查看IIS日志文件? Windows2003環(huán)境中,IIS日志默認(rèn)存儲(chǔ)路徑:C:/WINDOWS/system32/LogFiles/,在LogFiles文件夾下,存在多個(gè)IIS日志文件夾,每個(gè)IIS日志文件夾對(duì)應(yīng)一個(gè)站點(diǎn)日志,當(dāng)然IIS日志文件存儲(chǔ)位置也可以根據(jù)自己的實(shí)際情況,在IIS管理器中重新設(shè)定,具體的步驟如下:
1、進(jìn)入服務(wù)器的管理之后,打開“Internet 信息服務(wù)(IIS)管理器”,圖標(biāo)如下圖所示:
2、雙擊信息服務(wù)(IIS)管理器,進(jìn)入管理以后打開信息服務(wù)(IIS)管理器,選中要查看的網(wǎng)站,在網(wǎng)站欄目那里右鍵單擊,選擇“屬性”,如下圖所示:
3、在彈出的窗口里面,點(diǎn)擊“網(wǎng)站”欄目,查看日志記錄中的“屬性”,如下圖所示:
4、通過(guò)日志記錄屬性欄目,即可看到日志文件目錄了,如下圖所示:
上面的日志文件目錄即是iis的文件存放位置了,IIS日志文件便在C:/WINDOWS/system32/LogFiles/文件夾內(nèi)。
IIS日志文件存儲(chǔ)格式是后綴名為log的文本文件,如下面這些文件就是網(wǎng)站的iis日志了。
要查看對(duì)應(yīng)站點(diǎn)的IIS日志,只需要打開對(duì)應(yīng)IIS日志文件夾找到相對(duì)應(yīng)日志文件即可,也可借助IIS日志分析工具提供查看IIS日志的效率!
三、如何分析IIS日志? 知道了IIS日志的位置了,也看到了IIS日志的文件了,接下來(lái)我們就應(yīng)該對(duì)日志文件進(jìn)行分析了,那么,我們?cè)撊绻治鯥IS日志呢?
1、如何查看IIS日志信息 IIS日志可以用IIS日志分析工具去大概的去查一查,一般工具都能查出有各種蜘蛛來(lái)到網(wǎng)站的總數(shù),以及有沒(méi)有失敗,不會(huì)把各種的信息都給你,工具分析只是簡(jiǎn)單的告訴你一個(gè)概況,億企邦在此就拿出一條信息來(lái)為大家具體的分析一下,如下面的截圖所示:
我們可以分段對(duì)這個(gè)IIS日志進(jìn)行分析:
2010-10-22 05:04:53 表示的是時(shí)間;
W3SVC151800 P-0YMR9WW8YX4U9是機(jī)器編號(hào);
222.76.213.49為網(wǎng)站的IP;
GET是觸發(fā)事件;
80是端口號(hào);
61.135.186.49是搜索引擎蜘蛛的IP;
Baiduspider是百度的蜘蛛(另外,谷歌蜘蛛:Googlebot;360搜索蜘蛛:360Spider,更多的可查看億企邦《解讀iis日志中搜索引擎蜘蛛名稱代碼及爬尋返回代碼》的相關(guān)介紹);
200 0 0是訪問(wèn)成功的返回代碼;
41786 193 6968是蜘蛛與網(wǎng)站對(duì)話的時(shí)間與下載的數(shù)據(jù)以及花了多少時(shí)間。
連在一起就是2010.10.22的早上5點(diǎn)4分53秒的時(shí)候一個(gè)編號(hào)為W3SVC151800 P-0YMR9WW8YX4U9的蜘蛛通過(guò)80端口進(jìn)入網(wǎng)站成功訪問(wèn)并下載了47186B的數(shù)據(jù),花費(fèi)了193MS。
2、用excel表格分析網(wǎng)站的iis日志 先新建一個(gè)excel表格,把剛才的ex121129.log文件里的文件粘貼到新建的excel表格里面,,如下圖所示:
復(fù)制之后,選定A,在工具欄里選擇數(shù)據(jù)→分列,如下圖所示:
選擇分隔符號(hào),點(diǎn)擊下一步:
選擇空格,去掉Tab鍵前面的鉤,點(diǎn)擊完成,如下圖所示:
網(wǎng)站的iis日志就這樣被拆分出來(lái)了,之后自己再調(diào)整一下表格的列寬、升降序等即可。
四、詳解IIS日志參數(shù) 一般情況下,IIS日志文件代碼格式如下所示:
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2009-11-26 06:14:21
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2009-11-26 06:14:21 W3SVC692644773 125.67.67.* GET /index.html - 80 - 123.125.66.130 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64
2009-11-26 06:14:21 W3SVC692644773 125.67.67.* GET /index.html - 80 - 220.181.7.116 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64
在此,億企邦也為大家詳細(xì)的解說(shuō)一下IIS日志參數(shù):
date:發(fā)出請(qǐng)求時(shí)候的日期。
time:發(fā)出請(qǐng)求時(shí)候的時(shí)間,注意:默認(rèn)情況下這個(gè)時(shí)間是格林威治時(shí)間,比我們的北京時(shí)間晚8個(gè)小時(shí),下面有說(shuō)明。
c-ip:客戶端IP地址。
cs-username:用戶名,訪問(wèn)服務(wù)器的已經(jīng)過(guò)驗(yàn)證用戶的名稱,匿名用戶用連接符-表示。
s-sitename:服務(wù)名,記錄當(dāng)記錄事件運(yùn)行于客戶端上的Internet服務(wù)的名稱和實(shí)例的編號(hào)。
s-computername:服務(wù)器的名稱。
s-ip:服務(wù)器的IP地址。
s-port:為服務(wù)配置的服務(wù)器端口號(hào)。
cs-method:請(qǐng)求中使用的HTTP方法,GET/POST。
cs-uri-stem:URI資源,記錄做為操作目標(biāo)的統(tǒng)一資源標(biāo)識(shí)符(URI),即訪問(wèn)的頁(yè)面文件。
cs-uri-query:URI查詢,記錄客戶嘗試執(zhí)行的查詢,只有動(dòng)態(tài)頁(yè)面需要URI查詢,如果有則記錄,沒(méi)有則以連接符-表示,即訪問(wèn)網(wǎng)址的附帶參數(shù)。
sc-status:協(xié)議狀態(tài),記錄HTTP狀態(tài)代碼,200表示成功,403表示沒(méi)有權(quán)限,404表示找不到該頁(yè)面,具體說(shuō)明在下面。
sc-substatus:協(xié)議子狀態(tài),記錄HTTP子狀態(tài)代碼。
sc-win32-status:Win32狀態(tài),記錄Windows狀態(tài)代碼。
sc-bytes:服務(wù)器發(fā)送的字節(jié)數(shù)。
cs-bytes:服務(wù)器接受的字節(jié)數(shù)。
time-taken:記錄操作所花費(fèi)的時(shí)間,單位是毫秒。
cs-version:記錄客戶端使用的協(xié)議版本,HTTP或者FTP。
cs-host:記錄主機(jī)頭名稱,沒(méi)有的話以連接符-表示。億企邦提醒大家注意:為網(wǎng)站配置的主機(jī)名可能會(huì)以不同的方式出現(xiàn)在日志文件中,原因是HTTP.sys使用Punycode編碼格式來(lái)記錄主機(jī)名。
cs(User-Agent):用戶代理,客戶端瀏覽器、操作系統(tǒng)等情況。
cs(Cookie):記錄發(fā)送或者接受的Cookies內(nèi)容,沒(méi)有的話則以連接符-表示。
cs(Referer):引用站點(diǎn),即訪問(wèn)來(lái)源。
五、搜索引擎蜘蛛爬尋返回代碼 HTTP協(xié)議狀態(tài)碼的含義,協(xié)議狀態(tài)sc-status,是服務(wù)器日記擴(kuò)展屬性的一項(xiàng),下面是各狀態(tài)碼含義:
"100" :Continue,客戶必須繼續(xù)發(fā)出請(qǐng)求。
"101" :witching Protocols,客戶要求服務(wù)器根據(jù)請(qǐng)求轉(zhuǎn)換HTTP協(xié)議版本。
"200" :OK,交易成功。
"201" :Created,提示知道新文件的URL。
"202" :Accepted,接受和處理、但處理未完成。
"203" :Non-Authoritative Information,返回信息不確定或不完整。
"204" :No Content,請(qǐng)求收到,但返回信息為空。
"205" :Reset Content,服務(wù)器完成了請(qǐng)求,用戶代理必須復(fù)位當(dāng)前已經(jīng)瀏覽過(guò)的文件。
"206" :Partial Content,服務(wù)器已經(jīng)完成了部分用戶的GET請(qǐng)求。
"300" :Multiple Choices,請(qǐng)求的資源可在多處得到。
"301" :Moved Permanently,刪除請(qǐng)求數(shù)據(jù)。
"302" :Found,在其他地址發(fā)現(xiàn)了請(qǐng)求數(shù)據(jù)。
"303" :See Other,建議客戶訪問(wèn)其他URL或訪問(wèn)方式。
"304" :Not Modified,客戶端已經(jīng)執(zhí)行了GET,但文件未變化。
"305" :Use Proxy,求的資源必須從服務(wù)器指定的地址得到。
"306" :前一版本HTTP中使用的代碼,現(xiàn)行版本中不再使用。
"307" :Temporary Redirect,申明請(qǐng)求的資源臨時(shí)性刪除。
"400" :Bad Request,錯(cuò)誤請(qǐng)求,如語(yǔ)法錯(cuò)誤。
"401" :Unauthorized,請(qǐng)求授權(quán)失敗。
"402" :Payment Required,保留有效ChargeTo頭響應(yīng)。
"403" :Forbidden,請(qǐng)求不答應(yīng)(具體可查看億企邦《403 Forbidden錯(cuò)誤的原因和解決方法》的相關(guān)介紹)。
"404" :Not Found,沒(méi)有發(fā)現(xiàn)文件、查詢或URl(具體可查看億企邦《404 Not Found錯(cuò)誤頁(yè)面的解決方法和注意事項(xiàng)》的相關(guān)介紹)。
"405" :Method Not Allowed,用戶在Request-Line字段定義的方法不答應(yīng)。
"406" :Not Acceptable,根據(jù)用戶發(fā)送的Accept拖,請(qǐng)求資源不可訪問(wèn)。
"407" :Proxy Authentication Required,類似401,用戶必須首先在代理服務(wù)器上得到授權(quán)。
"408" :Request Time-out,客戶端沒(méi)有在用戶指定的餓時(shí)間內(nèi)完成請(qǐng)求。
"409" :Conflict,對(duì)當(dāng)前資源狀態(tài),請(qǐng)求不能完成。
"410" :Gone,服務(wù)器上不再有此資源且無(wú)進(jìn)一步的參考地址。
"411" :Length Required,服務(wù)器拒絕用戶定義的Content-Length屬性請(qǐng)求。
"412" :Precondition Failed,一個(gè)或多個(gè)請(qǐng)求頭字段在當(dāng)前請(qǐng)求中錯(cuò)誤。
"413" :Request Entity Too Large,請(qǐng)求的資源大于服務(wù)器答應(yīng)的大小。
"414" :Request-URI Too Large,請(qǐng)求的資源URL長(zhǎng)于服務(wù)器答應(yīng)的長(zhǎng)度。
"415" :Unsupported Media Type,請(qǐng)求資源不支持請(qǐng)求項(xiàng)目格式。
"416" :Requested range not satisfiable,請(qǐng)求中包含Range請(qǐng)求頭字段,在當(dāng)前請(qǐng)求資源范圍內(nèi)沒(méi)有range指示值,請(qǐng)求也不包含If-Range請(qǐng)求頭字段。
"417" :Expectation Failed,服務(wù)器不滿足請(qǐng)求Expect頭字段指定的期望值,假如是代理服務(wù)器。
"500" :Internal Server Error,服務(wù)器產(chǎn)生內(nèi)部錯(cuò)誤。
"501" :Not Implemented,服務(wù)器不支持請(qǐng)求的函數(shù)。
"502" :Bad Gateway,服務(wù)器暫時(shí)不可用,有時(shí)是為了防止發(fā)生系統(tǒng)過(guò)載。
"503" :Service Unavailable,服務(wù)器過(guò)載或暫停維修。
"504" :Gateway Time-out,關(guān)口過(guò)載,服務(wù)器使用另一個(gè)關(guān)口或服務(wù)來(lái)響應(yīng)用戶,等待時(shí)間設(shè)定值較長(zhǎng)。
"505" :HTTP Version not supported,服務(wù)器不支持或拒絕支請(qǐng)求頭中指定的HTTP版本。
億企邦點(diǎn)評(píng): 通過(guò)IIS日志可以了解蜘蛛對(duì)網(wǎng)站的基本爬取情況,可以知道蜘蛛的爬取軌跡和爬取量,我們可以根據(jù)IIS日志的反應(yīng)情況,對(duì)我們的空間的某些事情和問(wèn)題提前進(jìn)行預(yù)警,因?yàn)榉?wù)器如果出問(wèn)題的話,在IIS日志中會(huì)第一時(shí)間反映出來(lái),要知道服務(wù)器的穩(wěn)定速度和打開速度兩者都會(huì)直接影響我們的網(wǎng)站。