Http協議詳解

一、HTTP協議的URL

HTTP URL (URL是一種特殊類型的URI,包含了用於查找某個資源的足夠的信息)的格式如下:
http://host[":"port][abs_path]
http表示要通過HTTP協議來定位網絡資源;
host表示合法的Internet主機域名或者IP地址;
port指定一個端口號,爲空則使用缺省端口80;
abs_path指定請求資源的URI;
如果URL中沒有給出abs_path,那麼當它作爲請求URI時,
必須以“/”的形式給出,通常這個工作瀏覽器自動幫我們完成。
eg:
1、輸入:www.guet.edu.cn
瀏覽器自動轉換成:http://www.guet.edu.cn/
2、http:192.168.0.116:8080/index.jsp 

二、 Http協議的內容

Request and Response messages use the generic message format of RFC 822 [9] for transferring
entities (the payload of the message). Both types of message consist of a start-line, 
zero or more header fields (also known as "headers"), 
an empty line (i.e., a line with nothing preceding the CRLF) 
indicating the end of the header fields, and possibly a message-body.
    generic-message = start-line
             *(message-header CRLF)
             CRLF
             [ message-body ]

http協議請求和響應內容都由三部分組成,分別是:行(請求行和狀態行)、報頭(消息頭)、正文(消息體)
消息頭和消息體之間,用CRLF(回車和換行)隔開,表示報頭域的結束.




請求行以一個方法符號開頭,以空格分開,後面跟着請求的URI和協議的版本,
格式如下:Method Request-URI HTTP-Version CRLF 
其中 Method表示請求方法;
Request-URI是一個統一資源標識符;
HTTP-Version表示請求的HTTP協議版本,當前使用1.1;
CRLF表示回車和換行(除了作爲結尾的CRLF外,不允許出現單獨的CR或LF字符)。

請求方法(所有方法全爲大寫)有多種,各個方法的解釋如下:
GET 請求獲取Request-URI所標識的資源
POST 在Request-URI所標識的資源後附加新的數據
HEAD 請求獲取由Request-URI所標識的資源的響應消息報頭
PUT 請求服務器存儲一個資源,並用Request-URI作爲其標識
DELETE 請求服務器刪除Request-URI所標識的資源
TRACE 請求服務器回送收到的請求信息,主要用於測試或診斷
CONNECT 保留將來使用
OPTIONS 請求查詢服務器的性能,或者查詢與資源相關的選項和需求

應用舉例:
GET方法:在瀏覽器的地址欄中輸入網址的方式訪問網頁時,瀏覽器採用GET方法向服務器獲取資源,
eg:GET /form.html HTTP/1.1 (CRLF)

POST方法要求被請求服務器接受附在請求後面的數據,常用於提交表單。
eg:POST /reg.jsp HTTP/ (CRLF) 


響應的行稱爲狀態行,格式如下:HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服務器HTTP協議的版本;
Status-Code表示服務器發回的響應狀態代碼;
Reason-Phrase表示狀態代碼的文本描述。
狀態代碼有三位數字組成,第一個數字定義了響應的類別,且有五種可能取值:
1xx:指示信息--表示請求已接收,繼續處理
2xx:成功--表示請求已被成功接收、理解、接受
3xx:重定向--要完成請求必須進行更進一步的操作
4xx:客戶端錯誤--請求有語法錯誤或請求無法實現
5xx:服務器端錯誤--服務器未能實現合法的請求
eg:HTTP/1.1 200 OK (CRLF)


HTTP頭字段包括4類: general-header ; request-header ; response-header ; entity-header .


general-header是request、response都可用的, 但是不能用於entity.
通用頭域包含請求和響應消息都支持的頭域,
包含Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via。

Cache-Control
Cache -Control指定請求和響應遵循的緩存機制。
在請求消息或響應消息中設置 Cache-Control並不會修改另一個消息處理過程中的緩存處理過程。
請求時的緩存指令包括no-cache、no-store、max-age、 max-stale、min-fresh、only-if-cached,
響應消息中的指令包括public、private、no-cache、no- store、no-transform、must-revalidate、
proxy-revalidate、max-age。
經常使用的就是no-cache,表示不緩存。

Date
Date頭域表示消息發送的時間,時間的描述格式由rfc822定義。
例如,Date:Mon,31Dec200104:25:57GMT。
Date描述的時間表示世界標準時,換算成本地時間,需要知道用戶所在的時區。

Pragma
Pragma頭域用來包含實現特定的指令,最常用的是Pragma:no-cache。
在HTTP/1.1協議中,它的含義和Cache- Control:no-cache相同。 


請求頭域可能包含下列字段Accept、Accept-Charset、Accept-Encoding、
Accept-Language、Authorization、From、Host、If-Modified-Since、
If- Match、If-None-Match、If-Range、If-Range、If-Unmodified-Since、
Max-Forwards、 Proxy-Authorization、Range、Referer、User-Agent。

Header 解釋 示例
Accept 指定客戶端能夠接收的內容類型 Accept: text/plain, text/html
Accept-Charset 瀏覽器可以接受的字符編碼集。 Accept-Charset: iso-8859-5
Accept-Encoding 指定瀏覽器可以支持的web服務器返回內容壓縮編碼類型。 Accept-Encoding: compress, gzip
Accept-Language 瀏覽器可接受的語言 Accept-Language: en,zh
Host 指定請求的服務器的域名和端口號 Host: www.zcmhi.com
From 發出請求的用戶的Email From: [email protected]
Referer 先前網頁的地址,當前請求網頁緊隨其後,即來路 Referer: http://www.zcmhi.com/archives/71.html
User-Agent User-Agent的內容包含發出請求的用戶信息 User-Agent: Mozilla/5.0 (Linux; X11)


響應頭域允許服務器傳遞不能放在狀態行的附加信息,
這些域主要描述服務器的信息和 Request-URI進一步的信息。
響應頭域包含Age、Location、Proxy-Authenticate、Public、
Retry-After、Server、Vary、Warning、WWW-Authenticate。

Header 解釋 示例
Age 從原始服務器到代理緩存形成的估算時間(以秒計,非負) Age: 12
Location 用來重定向接收方到非請求URL的位置來完成請求或標識新的資源 Location: http://www.zcmhi.com/archives/94.html
Proxy-Authenticate 它指出認證方案和可應用到代理的該URL上的參數 Proxy-Authenticate: Basic
Server web服務器軟件名稱 Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
Retry-After 如果實體暫時不可取,通知客戶端在指定時間之後再次嘗試 Retry-After: 120
Vary 告訴下游代理是使用緩存響應還是從原始服務器請求 Vary: *
Warning 警告實體可能存在的問題 Warning: 199 Miscellaneous warning
WWW-Authenticate 表明客戶端請求實體應該使用的授權方案 WWW-Authenticate: Basic


實體頭域包含關於實體的原信息,實體頭包括Allow、Content- Base、Content-Encoding、
Content-Language、 Content-Length、Content-Location、Content-MD5、
Content-Range、Content-Type、 Etag、Expires、Last-Modified、extension-header。

Header 解釋 示例
Allow 對某網絡資源的有效的請求行爲,不允許則返回405 Allow: GET, HEAD
Content-Encoding web服務器支持的返回內容壓縮編碼類型。 Content-Encoding: gzip
Content-Language 響應體的語言 Content-Language: en,zh
Content-Length 響應體的長度 Content-Length: 348
Content-Location 請求資源可替代的備用的另一地址 Content-Location: /index.htm
Content-MD5 返回資源的MD5校驗值 Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
Content-Range 在整個返回體中本部分的字節位置 Content-Range: bytes 21010-47021/47022
Content-Type 返回內容的MIME類型 Content-Type: text/html; charset=utf-8
ETag 請求變量的實體標籤的當前值 ETag: “737060cd8c284d8af7ad3082f209582d”
Expires 響應過期的日期和時間 Expires: Thu, 01 Dec 2010 16:00:00 GMT
Last-Modified 請求資源的最後修改時間 Last-Modified: Tue, 15 Nov 2010 12:45:26 GMT

看到這裏你可能會很奇怪,爲什麼會沒有Cookie,Content-Disposition這種常見的信息頭?!
這裏我說一下,Content-Disposition不是HTTP標準的一部分,但它在其他RFC文檔中定義了(RFC1806)。
而Cookie呢?首先看看Cookie是用來幹嘛的:Cookie和Session是爲了解決Http協議中無狀態的問題
,由於Http的設計者們時就沒打算讓Http有狀態這種特性,故Cookie這種東西是肯定不可能
是Http標準中的一部分。其實,它們都屬於上面所說的:extension-header。


The message-body (if any) of an HTTP message is used to carry the entity-body associated 
with the request or response. The message-body differs from the entity-body only when a 
transfer-coding has been applied, as indicated by the Transfer-Encoding header field.
(message-body = entity-body
           | entity-body encoded as per Transfer-Encoding )

消息頭和消息體之間是一個空行,這個行非常重要,它表示消息頭已經結束,接下來的是消息體。
通常情況下Post方式請求的消息體,內容格式:param1=value1¶m2=value2
響應的消息體常見有html和json的消息體,
json格式:{"key1":"value1","key2":"value2"}
html格式:
<!DOCTYPE html>
<html lang="zh-cn">
...
...
</html>

三、 參考資料

(1)狀態碼詳細信息
(2)更多消息頭的信息
(3)Http/1.1 Document
(4)RFC Archives
原創轉自:http://beadlechen.github.io/
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章