嘗試寫個爬蟲(3)

http請求與數據下載

http(超文本傳輸協議)

通常http用於傳輸文本信息,當然也可以傳輸二進制或者各種流式文件。

通信原理如下:

1.建立tcp會話連接,通常指一次socket連接;

2.client端向server端發送請求命令,即http請求頭;

3.server端響應client端請求,生成http返回頭,以及返回的數據,發送client端;

4.通信結束,釋放本次連接。


http請求頭

http請求分爲兩部分:

1.請求內容信息:  Method   Request-URI   HTTP-VersionCRLF

Method表示對於Request-URI完成的方法,這個字段是大小寫敏感的


Request-URI:請求的資源文件路徑,遵循URI格式,爲(*)時,說明請求並不用於某個特定的資源地址,而是用於server本身。

HTTP-Version:表示支持的HTTP版本。

2.請求實體參數:  實體名:實體值

可用”:”或者空格或者製表符隔開



數據下載

對於一次http下載,數據分爲兩個部分,前一部分是http響應頭信息;後一部分是http數據體。這裏並不涉及數據的解析,因此將服務器發送的數據統一對待。


注意後面補上代碼和測試結果



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章