壓縮的過程

壓縮的過程

原創

iteye_7471

2020-06-19 23:04

壓縮：

1.壓縮思路：

1.把文件的字符讀出來，記錄出現過的字符及其出現的次數。構造相應的結點。

2.把結點組建成一棵哈夫曼樹，並獲得哈夫曼編碼。

3.利用哈夫曼編碼，寫入頭文件和文件內容。

2.讀字符,存隊列

1.讀取文件信息，存放於數組之中，下標作爲ask碼值


public int[] countChar(String path){
			File file = new File(path);//根據文件地址創建文件對象
			int[] c = new int[256];

			for(int i=0;i<c.length;i++){
				c[i]=0;
			}
			try {
				//創建輸出流對象
				InputStream is = new FileInputStream(file);
				//一個一個的讀出
				while(is.available()>0){
					int i = is.read();   //將文件讀入到 數組 中
					c[i]++;
				}
			} catch (FileNotFoundException e) {
				e.printStackTrace();
			} catch (IOException e) {
				e.printStackTrace();
			} 
			return c;
		}

2.構建結點，建造樹。

Queue q =  new Queue();//實例化隊列對象
		HFMTree tree = new HFMTree();//實力化一個樹對象
		//用於記錄文件中出現過的字符的次數，下標指 ask碼值對應的字符 
		int[] ch = this.countChar(path);
		//利用次數數組創建結點對象，加入隊列
		for(int i=0;i<ch.length;i++){
			if(ch[i]!=0){
				//如果出現過該字符，則創建結點，加入隊列
				Node node = new Node(((char)i)+"", ch[i]);
				q.add(node);
			}
		}
		tree.creatTree(q);  //利用結點構建樹
		q = tree.ergodic(tree.getRoot(),""); //遍歷樹，給結點繪製對應的編碼，存儲於隊列之中

3.第三步驟：

1.頭文件

1.頭文件包括出現字符的編碼。

@ 隊列長度（int）

@ 文件末尾補零情況

@ 每一個隊列元素

@字符

@編碼長度

@最後一次補零的個數

@編碼的具體信息

這是頭文件的內容格式，也就是必要的一些內容，因爲文件本身是一個獨立的個體，要考慮到之後能夠讀取出來，所以必須要存入如上戲信息，不然在打開時，因爲不知道文件信息，而無法打開。

2.寫入頭文件

public void compressFile(String path,String newpath){
		File file = new File(path);  //將地址解析成具體的文件
		File newfile = new File(newpath);  //將地址解析成具體的文件
		
		try {
			//創建輸出流對象
			InputStream bis = new FileInputStream(file);
			BufferedInputStream is = new BufferedInputStream(bis);
			//創建輸入流對象 
			OutputStream bos = new FileOutputStream(newfile);
			BufferedOutputStream os = new BufferedOutputStream(bos);
			/***將隊列讀入文件***/
			os.write(q.size());                                              
			//文件最後補零的情況
			int addzero = 0,cache = 0;
			for(int i=0;i<q.size();i++){
				//文件長度 = 字符次數   * 編碼長度
				cache += q.get(i).getCount()*q.get(i).getSymbol().length(); 
			}
			addzero = 8-cache%8; //文件補零的情況
			/***寫入文件末尾補零情況****/
			os.write(addzero);
			/****寫入編碼信息*****/
			for(int i=0;i<q.size();i++){
				//獲取信息
				int xchar = q.get(i).getData().charAt(0); 
				int xsize = q.get(i).getSymbol().length()/8+1;
				int xzero = 8-q.get(i).getSymbol().length()%8;
				//寫入信息
				os.write(xchar);//字符
				os.write(xsize);//長度
				os.write(xzero);//補零個數
				//寫入編碼
				String string = q.get(i).getSymbol();
				String waitString = ""; //用來緩存的字符串
				//寫入編碼的前幾位
				for(int j=0;j<xsize-1;j++){
					waitString = "";
					waitString = string.substring(0, 8);
					string = string.substring(8);
					int xString = changeString(waitString);
					os.write(xString);
				}
				//寫入編碼最後一位
				for(int j=0;j<xzero;j++){
					string += "0";
				}
				int xString = changeString(string);
				os.write(xString);//寫入編碼內容
			}

3.寫入文件內容

String writeString = ""; 
			while(is.available()>0){
				int i = is.read();   //將文件讀出來
				for(int j=0;j<q.size();j++){//用循環找到對應的字符編碼
					boolean bool = false; //需要尋找的字符還未找到
					//如果找到了
					if(q.get(j).getData().equals((((char)i)+""))){
						int x=0;
						while(true){
							writeString += q.get(j).getSymbol().charAt(x)+"";
							x++;
							//如果是因爲溢出
							if(writeString.length()==8){
								int xString = changeString(writeString);
								os.write(xString);             //寫入一個字節
								writeString = "";
							}
							//如果是因爲數字位數不足
							if(x==q.get(j).getSymbol().length()){
								bool = true;
								break;
							}
						}
					}//如果找到文件
					if(bool==true){
						break;
					}
				}
			}
			//對最後一個經行處理
			if(writeString.length()>0){
				int x = 8-writeString.length();
				for(int i=0;i<x;i++){
					writeString += "0";
				}
				int xString = changeString(writeString);
				os.write(xString);
			}
			os.close();//關閉輸出流
			is.close();//關閉輸入流
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} 
	}

這樣就對一個文本文件實現了壓縮功能。剩下的解壓，無非是根據文件信息，一步一步經行反步驟，解壓開來。這種壓縮方式在我的測試中發現有一個缺點，當文件末尾是字符時，就正常運行，當文件最後一個是漢字時，最後一個漢字會被改變，所以這一點暫時還沒考慮到，留着廣大讀者去思考吧。呵呵！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

壓縮的過程

如何使用線程

java 網絡通信零基礎入門-------理論篇

集合框架的應用解析

java異常機制以及處理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結