如何解決http封包中gzip編碼的html

原創

2020-02-21 16:34

gzip編碼，最早由Jean-loup Gailly和Mark Adler創建，用於UNIX系統的文件壓縮。我們在Linux中經常會用到後綴爲.gz的文件，它們就是GZIP格式的。現今已經成爲Internet 上使用非常普遍的一種數據壓縮格式，或者說一種文件格式。HTTP協議上的GZIP編碼是一種用來改進WEB應用程序性能的技術。大流量的WEB站點常常使用GZIP壓縮技術來讓用戶感受更快的速度。（摘在百度百科）。

      廢話少說，來進入正題吧。

      大家都知道，在默認模式下，http協議中發送的網頁的Html代碼是經過gzip編碼後傳送的。那麼我們怎麼才能回覆這段編碼後的html呢？

      大家可能都知道linux下有一個gzip命令。可以把文件壓縮成gzip編碼的格式，即*.gz

      而對於文件的壓縮和解壓縮，可以採用zlib庫中提供的各種接口來進行操作。但是這裏問題來了。關於gzip編碼的那些函數都帶有gz開頭的標示。而這些接口維護了一個名叫gz_stream的結構體。並且是針對文件FILE*操作的。

      而我們要解決的問題是，我們把截取的封包中的gzip編碼的內容拿出來，放到一個buffer中。那麼怎麼才能針對這個buffer中的數據應用這些接口呢？

      我本來的想法是能不能在這些接口中找到專門對內存中的數據進行解碼？

      考慮這個問題，我看了這個庫的源代碼。後來放棄了。至於放棄的原因，可能是我意志力不夠，或者不想看那些源代碼了。總之，我看了一天，看的我頭疼。

      後來我就想個辦法繞開這一思路，走個彎路。問題豁然開朗。

      思路如下：

      1. 把獲取到的經過編碼的數據保存到一個文件中。注意寫文件的時候一定要以二進制方式。否則是不能解碼的。

      2. 應用zlib中的接口，gzopen(),gzread(),gzclose()即可完成解碼的任務了。

      我把這一過程簡單封裝起來，在VC2005下經過測試，僅提供參考：

// ~GzipParse.h #ifndef __GZIPPARSE_H_ #define __GZIPPARSE_H_ /* * 此類用於解碼http協議中gzip編碼的html數據數據 * 也可用於其他類似用途 */ class GzipParse { public: //sCompressedData壓縮數據的buffer， //nLen sCompressedData的長度 GzipParse(char *sCompressedData,int nLen); ~GzipParse(); public: //調用時，請確保unCompressedData的長度足夠長，能夠容納解碼後的數據 //sUnCompressedData解碼數據的buffer //nLen sUnCompressedData的長度 char *Decode(char *sUnCompressedData,int nLen); private: char *m_sCompressedData; int m_nLen; }; #endif // __GZIPPARSE_H_ // ~GzipParse.cpp #include "GzipParse.h" #include "zlib.h" #include <fstream> #ifdef WIN32 #pragma comment(lib,"zlib.lib") #endif using std::ofstream; using std::ios_base; GzipParse::GzipParse(char *sCompressedData,int nLen) { this->m_sCompressedData = sCompressedData; this->m_nLen = nLen; } GzipParse::~GzipParse() { } char * GzipParse::Decode(char *out，int nOutLen) { ofstream fout; fout.open("html.tmp",ios_base::out | ios_base::trunc | ios_base::binary ); fout.write(m_sCompressedData,m_nLen); fout.close(); gzFile file = gzopen("html.tmp","rb"); int nLength = gzread(file,out,nOutLen); gzclose(file); out[nLength] = '/0'; return out; } //~ testGzipParse.cpp #include "GzipParse.h" #include <iostream> using std::cout; using std::cin; using std::endl; int main() { char * sUnCompress = new char[100]; char sCompress[] = {0x1f,0x8b,0x08,0x08,0x8c,0x9f,0x5E,0x4A,0x00,0x03,0x67, 0x7a,0x69,0x70,0x2e,0x74,0x78,0x74,0x00,0x33,0x34,0x32, 0x36,0x32,0x31,0x1c,0x25,0x46,0x09,0x9a,0x12,0x5c,0x00, 0xb4,0xe9,0x50,0x7F,0x68,0x02,0x00,0x00}; GzipParse gzip(sCompress,sizeof sCompress); gzip.Decode(sUnCompress); cout << sUnCompress << endl; cin.get(); delete []sUnCompress; return 0; }

wfqxx

發佈了24 篇原創文章 · 獲贊 1 · 訪問量 11萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

如何解決http封包中gzip編碼的html

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

H.264視頻編碼傳輸的QoS特性分析（三）

總結：名字空間

實現視頻長時間播放而顯示器不會關閉或者屏保出現的簡單方法

vim常用指令使用指南

H.264視頻編碼傳輸的QoS特性分析（二）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結