重溫Http
時間:2023-02-10 10:12:01 | 來源:建站知識
時間:2023-02-10 10:12:01 來源:建站知識
司空見慣的Http,訪問網(wǎng)頁,請求接口,可謂無處不在,那么什么是Http呢?這篇文章,會給大家做一個簡單的總結(jié),雖然說,在開發(fā)中我們即便不去了解,也不會影響到我們,但對于常見的面試環(huán)節(jié),這個不得不顯得尤為重要,知之總比不知強(qiáng)。
什么是Http?
說白了,它是一個標(biāo)準(zhǔn),比如你去做火車,需要憑借火車票或有效證件才能去乘坐,那么這就是標(biāo)準(zhǔn),標(biāo)準(zhǔn),是人制定的,需要按照它去執(zhí)行的,要不然沒有這個標(biāo)準(zhǔn),一個人有一個人的想法,這樣將會非常的混亂,同樣,我們的Http,它也是一個標(biāo)準(zhǔn),一個協(xié)議,是因特網(wǎng)上應(yīng)用最為廣泛的一種網(wǎng)絡(luò)傳輸協(xié)議,所有的WWW文件都必須遵守這個標(biāo)準(zhǔn)。英文全稱,HyperText Transfer Protocol,翻譯為:超文本傳輸協(xié)議,這個需要簡單的了解一下。
HTTP是一個基于TCP/IP通信協(xié)議來傳遞數(shù)據(jù)(HTML 文件, 圖片文件, 查詢結(jié)果等)。
HTTP是一個屬于應(yīng)用層的面向?qū)ο蟮膮f(xié)議,由于其簡捷、快速的方式,適用于分布式超媒體信息系統(tǒng)。它于1990年提出,經(jīng)過幾年的使用與發(fā)展,得到不斷地完善和擴(kuò)展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規(guī)范化工作正在進(jìn)行之中,而且HTTP-NG(Next Generation of HTTP)的建議已經(jīng)提出。
HTTP協(xié)議工作于客戶端-服務(wù)端架構(gòu)為上。瀏覽器作為HTTP客戶端通過URL向HTTP服務(wù)端即WEB服務(wù)器發(fā)送所有請求。Web服務(wù)器根據(jù)接收到的請求后,向客戶端發(fā)送響應(yīng)信息。
Http1.0和Http1.1:
HTTP1.0最早在網(wǎng)頁中使用是在1996年,那個時候只是使用一些較為簡單的網(wǎng)頁上和網(wǎng)絡(luò)請求上,而HTTP1.1則在1999年才開始廣泛應(yīng)用于現(xiàn)在的各大瀏覽器網(wǎng)絡(luò)請求中,同時HTTP1.1也是當(dāng)前使用最為廣泛的HTTP協(xié)議。 主要區(qū)別主要體現(xiàn)在:
緩存處理,在HTTP1.0中主要使用header里的If-Modified-Since,Expires來做為緩存判斷的標(biāo)準(zhǔn),HTTP1.1則引入了更多的緩存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供選擇的緩存頭來控制緩存策略。
帶寬優(yōu)化及網(wǎng)絡(luò)連接的使用,HTTP1.0中,存在一些浪費(fèi)帶寬的現(xiàn)象,例如客戶端只是需要某個對象的一部分,而服務(wù)器卻將整個對象送過來了,并且不支持?jǐn)帱c(diǎn)續(xù)傳功能,HTTP1.1則在請求頭引入了range頭域,它允許只請求資源的某個部分,即返回碼是206(Partial Content),這樣就方便了開發(fā)者自由的選擇以便于充分利用帶寬和連接。
錯誤通知的管理,在HTTP1.1中新增了24個錯誤狀態(tài)響應(yīng)碼,如409(Conflict)表示請求的資源與資源的當(dāng)前狀態(tài)發(fā)生沖突;410(Gone)表示服務(wù)器上的某個資源被永久性的刪除。
Host頭處理,在HTTP1.0中認(rèn)為每臺服務(wù)器都綁定一個唯一的IP地址,因此,請求消息中的URL并沒有傳遞主機(jī)名(hostname)。但隨著虛擬主機(jī)技術(shù)的發(fā)展,在一臺物理服務(wù)器上可以存在多個虛擬主機(jī)(Multi-homed Web Servers),并且它們共享一個IP地址。HTTP1.1的請求消息和響應(yīng)消息都應(yīng)支持Host頭域,且請求消息中如果沒有Host頭域會報告一個錯誤(400 Bad Request)。
長連接,HTTP 1.1支持長連接(PersistentConnection)和請求的流水線(Pipelining)處理,在一個TCP連接上可以傳送多個HTTP請求和響應(yīng),減少了建立和關(guān)閉連接的消耗和延遲,在HTTP1.1中默認(rèn)開啟Connection: keep-alive,一定程度上彌補(bǔ)了HTTP1.0每次請求都要創(chuàng)建連接的缺點(diǎn)。
Http的主要特點(diǎn):
1、簡單快速:客戶向服務(wù)器請求服務(wù)時,只需傳送請求方法和路徑。請求方法常用的有GET、HEAD、POST。每種方法規(guī)定了客戶與服務(wù)器聯(lián)系的類型不同。由于HTTP協(xié)議簡單,使得HTTP服務(wù)器的程序規(guī)模小,因而通信速度很快。
2、靈活:HTTP允許傳輸任意類型的數(shù)據(jù)對象。正在傳輸?shù)念愋陀蒀ontent-Type加以標(biāo)記。
3.無連接:無連接的含義是限制每次連接只處理一個請求。服務(wù)器處理完客戶的請求,并收到客戶的應(yīng)答后,即斷開連接。采用這種方式可以節(jié)省傳輸時間。
4.無狀態(tài):HTTP協(xié)議是無狀態(tài)協(xié)議。無狀態(tài)是指協(xié)議對于事務(wù)處理沒有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息,則它必須重傳,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。另一方面,在服務(wù)器不需要先前信息時它的應(yīng)答就較快。
5、支持B/S及C/S模式。
B/S及C/S模式【擴(kuò)展】
C/S模式:
C/S(Client/Server,客戶/服務(wù)器)方式的網(wǎng)絡(luò)計(jì)算模式,A、服務(wù)器負(fù)責(zé)管理數(shù)據(jù)庫的訪問,并對客戶機(jī)/服務(wù)器網(wǎng)絡(luò)結(jié)構(gòu)中的數(shù)據(jù)庫安全層加鎖,進(jìn)行保護(hù);B、客戶機(jī)負(fù)責(zé)與用戶的交互,收集用戶信息,通過網(wǎng)絡(luò)向服務(wù)器發(fā)送請求。C、C/S模式中,資源明顯不對等,是一種“胖客戶機(jī)(fat client)”或“瘦服務(wù)器(thin server)”結(jié)構(gòu)。D、客戶程序(前臺程序)在客戶機(jī)上運(yùn)行,數(shù)據(jù)庫服務(wù)程序(后臺程序)在應(yīng)用服務(wù)器上運(yùn)行。
B/S模式:
B/S(Browser/Server,瀏覽器/服務(wù)器)方式的網(wǎng)絡(luò)結(jié)構(gòu),A、客戶端統(tǒng)一采用瀏覽器如:Netscape和IE,通過Web瀏覽器向Web服務(wù)器提出請求,由Web服務(wù)器對數(shù)據(jù)庫進(jìn)行操作,并將結(jié)果傳回客戶端。B、B/S結(jié)構(gòu)簡化了客戶機(jī)的工作,但服務(wù)器將擔(dān)負(fù)更多的工作,對數(shù)據(jù)庫的訪問和應(yīng)用程序的執(zhí)行都將在這里完成。即當(dāng)瀏覽器發(fā)出請求后,其數(shù)據(jù)請求、加工、返回結(jié)果、動態(tài)網(wǎng)頁生成等工作全部由Web服務(wù)器完成。
Http之URLHTTP使用統(tǒng)一資源標(biāo)識符(Uniform Resource Identifiers, URI)來傳輸數(shù)據(jù)和建立連接。URL是一種特殊類型的URI,包含了用于查找某個資源的足夠的信息URL,全稱是UniformResourceLocator, 中文叫統(tǒng)一資源定位符,是互聯(lián)網(wǎng)上用來標(biāo)識某一處資源的地址。
http://www.vipandroid.cn/cert/get_news_speak.php?open_id=100#name
從上面的URL可以看出,一個完整的URL包括以下幾部分:
1.協(xié)議部分:該URL的協(xié)議部分為“http:”,這代表網(wǎng)頁使用的是HTTP協(xié)議。在Internet中可以使用多種協(xié)議,如HTTP,F(xiàn)TP等等本例中使用的是HTTP協(xié)議。在"HTTP"后面的“//”為分隔符
2.域名部分:該URL的域名部分為“www.vipandroid.cn”。一個URL中,也可以使用IP地址作為域名使用
3.端口部分:跟在域名后面的是端口,域名和端口之間使用“:”作為分隔符。端口不是一個URL必須的部分,如果省略端口部分,將采用默認(rèn)端口
4.虛擬目錄部分:從域名后的第一個“/”開始到最后一個“/”為止,是虛擬目錄部分。虛擬目錄也不是一個URL必須的部分。本例中的虛擬目錄是“/cert/”
5.文件名部分:從域名后的最后一個“/”開始到“?”為止,是文件名部分,如果沒有“?”,則是從域名后的最后一個“/”開始到“#”為止,是文件部分,如果沒有“?”和“#”,那么從域名后的最后一個“/”開始到結(jié)束,都是文件名部分。本例中的文件名是“get_news_speak.php”。文件名部分也不是一個URL必須的部分,如果省略該部分,則使用默認(rèn)的文件名
6.錨部分:從“#”開始到最后,都是錨部分。本例中的錨部分是“name”。錨部分也不是一個URL必須的部分
7.參數(shù)部分:從“?”開始到“#”為止之間的部分為參數(shù)部分,又稱搜索部分、查詢部分。本例中的參數(shù)部分為“open_id=100”。參數(shù)可以允許有多個參數(shù),參數(shù)與參數(shù)之間用“&”作為分隔符。
URI與URL區(qū)別
很多人會混淆這兩個名詞。
URL:(Uniform/Universal Resource Locator 的縮寫,統(tǒng)一資源定位符)。
URI:(Uniform Resource Identifier 的縮寫,統(tǒng)一資源標(biāo)識符)(代表一種標(biāo)準(zhǔn))。
關(guān)系:
URI 屬于 URL 更高層次的抽象,一種字符串文本標(biāo)準(zhǔn)。
就是說,URI 屬于父類,而 URL 屬于 URI 的子類。URL 是 URI 的一個子集。
二者的區(qū)別在于,URI 表示請求服務(wù)器的路徑,定義這么一個資源。而 URL 同時說明要如何訪問這個資源(http://)。
URI 示例:
大家把瀏覽器地址欄里訪問網(wǎng)站的地址認(rèn)為是URL就好了,也就是以HTTP/HTTPS開頭的URI子集。
端口與URL標(biāo)準(zhǔn)格式
何為端口?端口(Port),相當(dāng)于一種數(shù)據(jù)的傳輸通道。用于接受某些數(shù)據(jù),然后傳輸給相應(yīng)的服務(wù),而電腦將這些數(shù)據(jù)處理后,再將相應(yīng)的回復(fù)通過開啟的端口傳給對方。
端口的作用:因?yàn)?IP 地址與網(wǎng)絡(luò)服務(wù)的關(guān)系是一對多的關(guān)系。所以實(shí)際上因特網(wǎng)上是通過 IP 地址加上端口號來區(qū)分不同的服務(wù)的。
端口是通過端口號來標(biāo)記的,端口號只有整數(shù),范圍是從0 到65535。
URL標(biāo)準(zhǔn)格式
通常而言,我們所熟悉的 URL 的常見定義格式為:
scheme://host[:port#]/path/.../[;url-params][?query-string][#anchor]
scheme //有我們很熟悉的http、https、ftp以及著名的ed2k,迅雷的thunder等。
host //HTTP服務(wù)器的IP地址或者域名
port# //HTTP服務(wù)器的默認(rèn)端口是80,這種情況下端口號可以省略。如果使用了別的端口,必須指明,例如tomcat的默認(rèn)端口是8080 http://localhost:8080/
path //訪問資源的路徑
url-params //所帶參數(shù)
query-string //發(fā)送給http服務(wù)器的數(shù)據(jù)
anchor //錨點(diǎn)定位
URN,uniform resource name,統(tǒng)一資源命名,是通過名字來標(biāo)識資源,比如mailto:java-net@java.sun.com。
URI與URL的區(qū)別【總結(jié)】
URI(uniform resource identifier),意思是統(tǒng)一資源標(biāo)識符,用于唯一的標(biāo)識一個資源。
Web上可用的每種資源如HTML文檔、圖像、視頻等都是用URI來定位的。
一個URI由三部分組成:
訪問資源的命名機(jī)制
存放資源的主機(jī)名
資源自身名稱,由路徑表示
URL(uniform resource locator),意思是統(tǒng)一資源定位器,它是一種具體的URI。可以用來標(biāo)識一個資源,而且還指明了如何鎖定這個資源。
URL是Internet上用來描述信息資源的字符串,主要用在各種WWW客戶程序和服務(wù)器程序上。采用URL可以用一種統(tǒng)一的格式來描述各種信息資源,包括文件、服務(wù)器的地址和目錄 。
一個URL由三部分組成:
協(xié)議
存有資源的主機(jī)IP地址(包含端口號)
主機(jī)資源具體地址
請求方法
根據(jù)HTTP標(biāo)準(zhǔn),HTTP請求可以使用多種請求方法。
HTTP1.0定義了三種請求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五種請求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
常見狀態(tài)碼
當(dāng)瀏覽者訪問一個網(wǎng)頁時,瀏覽者的瀏覽器會向網(wǎng)頁所在服務(wù)器發(fā)出請求。當(dāng)瀏覽器接收并顯示網(wǎng)頁前,此網(wǎng)頁所在的服務(wù)器會返回一個包含HTTP狀態(tài)碼的信息頭(server header)用以響應(yīng)瀏覽器的請求。
HTTP狀態(tài)碼的英文為HTTP Status Code。
下面是常見的HTTP狀態(tài)碼:
200 - 請求成功
301 - 資源(網(wǎng)頁等)被永久轉(zhuǎn)移到其它URL
404 - 請求的資源(網(wǎng)頁等)不存在
500 - 內(nèi)部服務(wù)器錯誤
HTTP之請求消息Request
客戶端發(fā)送一個HTTP請求到服務(wù)器的請求消息包括以下格式:
請求行(request line)、請求頭部(header)、空行和請求數(shù)據(jù)四個部分組成。
請求
請求行以一個方法符號開頭,以空格分開,后面跟著請求的URI和協(xié)議的版本。
Get請求例子,使用Charles抓取的request:
第一部分:請求行,用來說明請求類型,要訪問的資源以及所使用的HTTP版本.
GET說明請求類型為
GET /cert/get_news_speak.php?open_id=100 HTTP/1.1
為要訪問的資源,該行的最后一部分說明使用的是HTTP1.1版本。
第二部分:請求頭部,緊接著請求行(即第一行)之后的部分,用來說明服務(wù)器要使用的附加信息
從第二行起為請求頭部,HOST將指出請求的目的地.User-Agent,服務(wù)器端和客戶端腳本都能訪問它,它是瀏覽器類型檢測邏輯的重要基礎(chǔ).該信息由你的瀏覽器來定義,并且在每個請求中自動發(fā)送等等
第三部分:空行,請求頭部后面的空行是必須的
即使第四部分的請求數(shù)據(jù)為空,也必須有空行。
第四部分:請求數(shù)據(jù)也叫主體,可以添加任意的其他數(shù)據(jù)。
這個例子的請求數(shù)據(jù)為空。
POST請求例子,使用Charles抓取的request:
第一部分:請求行,第一行明了是post請求,以及http1.1版本。
第二部分:請求頭部,第二行至第六行。
第三部分:空行,第七行的空行。
第四部分:請求數(shù)據(jù),第八行。
HTTP之響應(yīng)消息Response
一般情況下,服務(wù)器接收并處理客戶端發(fā)過來的請求后會返回一個HTTP的響應(yīng)消息。
HTTP響應(yīng)也由四個部分組成,分別是:狀態(tài)行、消息報頭、空行和響應(yīng)正文。
第一部分:狀態(tài)行,由HTTP協(xié)議版本號, 狀態(tài)碼, 狀態(tài)消息 三部分組成。
第一行為狀態(tài)行,(HTTP/1.1)表明HTTP版本為1.1版本,狀態(tài)碼為200,狀態(tài)消息為(ok)
第二部分:消息報頭,用來說明客戶端要使用的一些附加信息
第二行和第三行為消息報頭,
Date:生成響應(yīng)的日期和時間;Content-Type:指定了MIME類型的application/json,編碼類型是UTF-8
第三部分:空行,消息報頭后面的空行是必須的
第四部分:響應(yīng)正文,服務(wù)器返回給客戶端的文本信息。
空行后面的html部分為響應(yīng)正文。
GET和POST的區(qū)別
GET提交的數(shù)據(jù)會放在URL之后,以?分割URL和傳輸數(shù)據(jù),參數(shù)之間以&相連,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的數(shù)據(jù)放在HTTP包的Body中.
GET提交的數(shù)據(jù)大小有限制(因?yàn)闉g覽器對URL的長度有限制),而POST方法提交的數(shù)據(jù)沒有限制.
GET方式需要使用Request.QueryString來取得變量的值,而POST方式通過Request.Form來獲取變量的值。
GET方式提交數(shù)據(jù),會帶來安全問題,比如一個登錄頁面,通過GET方式提交數(shù)據(jù)時,用戶名和密碼將出現(xiàn)在URL上,如果頁面可以被緩存或者其他人可以訪問這臺機(jī)器,就可以從歷史記錄獲得該用戶的賬號和密碼.
HTTP工作原理
HTTP協(xié)議定義Web客戶端如何從Web服務(wù)器請求Web頁面,以及服務(wù)器如何把Web頁面?zhèn)魉徒o客戶端。HTTP協(xié)議采用了請求/響應(yīng)模型??蛻舳讼蚍?wù)器發(fā)送一個請求報文,請求報文包含請求的方法、URL、協(xié)議版本、請求頭部和請求數(shù)據(jù)。服務(wù)器以一個狀態(tài)行作為響應(yīng),響應(yīng)的內(nèi)容包括協(xié)議的版本、成功或者錯誤代碼、服務(wù)器信息、響應(yīng)頭部和響應(yīng)數(shù)據(jù)。
以下是 HTTP 請求/響應(yīng)的步驟:
1、客戶端連接到Web服務(wù)器
一個HTTP客戶端,通常是瀏覽器,與Web服務(wù)器的HTTP端口(默認(rèn)為80)建立一個TCP套接字連接。例如,http://www.oakcms.cn。
2、發(fā)送HTTP請求
通過TCP套接字,客戶端向Web服務(wù)器發(fā)送一個文本的請求報文,一個請求報文由請求行、請求頭部、空行和請求數(shù)據(jù)4部分組成。
3、服務(wù)器接受請求并返回HTTP響應(yīng)
Web服務(wù)器解析請求,定位請求資源。服務(wù)器將資源復(fù)本寫到TCP套接字,由客戶端讀取。一個響應(yīng)由狀態(tài)行、響應(yīng)頭部、空行和響應(yīng)數(shù)據(jù)4部分組成。
4、釋放連接TCP連接
若connection 模式為close,則服務(wù)器主動關(guān)閉TCP連接,客戶端被動關(guān)閉連接,釋放TCP連接;若connection 模式為keepalive,則該連接會保持一段時間,在該時間內(nèi)可以繼續(xù)接收請求;
5、客戶端瀏覽器解析HTML內(nèi)容
客戶端瀏覽器首先解析狀態(tài)行,查看表明請求是否成功的狀態(tài)代碼。然后解析每一個響應(yīng)頭,響應(yīng)頭告知以下為若干字節(jié)的HTML文檔和文檔的字符集??蛻舳藶g覽器讀取響應(yīng)數(shù)據(jù)HTML,根據(jù)HTML的語法對其進(jìn)行格式化,并在瀏覽器窗口中顯示。
例如:在瀏覽器地址欄鍵入URL,按下回車之后會經(jīng)歷以下流程:
1、瀏覽器向 DNS 服務(wù)器請求解析該 URL 中的域名所對應(yīng)的 IP 地址;
2、解析出 IP 地址后,根據(jù)該 IP 地址和默認(rèn)端口 80,和服務(wù)器建立TCP連接;
3、瀏覽器發(fā)出讀取文件(URL 中域名后面部分對應(yīng)的文件)的HTTP 請求,該請求報文作為 TCP 三次握手的第三個報文的數(shù)據(jù)發(fā)送給服務(wù)器;
4、服務(wù)器對瀏覽器請求作出響應(yīng),并把對應(yīng)的 html 文本發(fā)送給瀏覽器;
5、釋放 TCP連接;
6、瀏覽器將該 html 文本并顯示內(nèi)容;
【補(bǔ)充】
常用的HTTP請求頭
常用的HTTP響應(yīng)頭