Java 壓縮字符串

1.引言

最近在做項目中,平臺提供一個http服務給其他系統調用,然後我接收到其他系統的json格式的報文後去解析,然後用拿到的數據去調用corba服務,我再把corba的返回值封裝完成json字符串返回給外部系統。遇到一個接口去調用corba服務,然後corba返回的數據經過封裝後字符串的長度達到7M左右,導致http客戶端無法正常的接收完所有的數據。你可能會說這個接口設計的不合理,爲什麼不增加查詢條件把查詢條件範圍縮小一點?但是,這個不是本節要討論的內容,主要是因爲corba服務已經發布用了很久且不在此次項目改造範圍之內,再者這個corba服務已經上線用了N久,輕易的改變可能會導致未知的錯誤。籤於此,我想到可以把json格式的字符串給壓縮,然後客戶端再解壓。(一是字符串的壓縮比例比較的高,二是字符串的壓縮和解壓實現起來也比較簡單)。雖然,最後沒有用到字符串的壓縮和解壓的方式,而是修改客戶端(1.http客戶端進一步精確查詢條件 2.讀取返回數據流採用循環讀取的方式)來解決此問題,我還是把字符串的壓縮和解壓做一下簡單的記錄。

2.關於壓縮與解壓

壓縮算法有多種,我說知道和接觸有java I/O自帶的zip和gzip兩種方式。

本節主要來簡單介紹一下在系統交互之間遇到大容量的字符串數據交互時,採用一端壓縮,另一端再解壓的方式來發送和接收數據。

關於此次的壓縮和解壓用到的主要就是GZIPOutputStream和GZIPInputStream類,此類的相關介紹在JDK中有詳細的介紹,這裏就不再累述了。

 

3.代碼如下:

 

[html] view plaincopy
  1. ZipStrUtil.java   
  2.  package gzip;  
  3.    
  4.  import java.io.ByteArrayInputStream;  
  5.  import java.io.ByteArrayOutputStream;  
  6.  import java.io.IOException;  
  7.  import java.util.zip.GZIPInputStream;  
  8.  import java.util.zip.GZIPOutputStream;  
  9.    
  10.  /**  
  11.   *   
  12.   *Module:          ZipUtil.java  
  13.   *Description:    對字符串的壓縮及解壓  
  14.   *Company:         
  15.   *Author:           pantp  
  16.   *Date:             May 6, 2012  
  17.   */  
  18.  public class ZipStrUtil {  
  19.    
  20.      public static void main(String[] args) throws IOException {  
  21.          // 字符串超過一定的長度  
  22.          String str = "ABCdef123中文~!@#$%^&*()_+{};/1111111111111111111111111AAAAAAAAAAAJDLFJDLFJDLFJLDFFFFJEIIIIIIIIIIFJJJJJJJJJJJJALLLLLLLLLLLLLLLLLLLLLL" +  
  23.                  "LLppppppppppppppppppppppppppppppppppppppppp===========================------------------------------iiiiiiiiiiiiiiiiiiiiiii";  
  24.          System.out.println("\n原始的字符串爲------->" + str);  
  25.          float len0=str.length();  
  26.          System.out.println("原始的字符串長度爲------->"+len0);  
  27.    
  28.          String ys = compress(str);  
  29.          System.out.println("\n壓縮後的字符串爲----->" + ys);  
  30.          float len1=ys.length();  
  31.          System.out.println("壓縮後的字符串長度爲----->" + len1);  
  32.    
  33.          String jy = unCompress(ys);  
  34.          System.out.println("\n解壓縮後的字符串爲--->" + jy);  
  35.          System.out.println("解壓縮後的字符串長度爲--->"+jy.length());  
  36.            
  37.          System.out.println("\n壓縮比例爲"+len1/len0);  
  38.            
  39.          //判斷  
  40.          if(str.equals(jy)){  
  41.              System.out.println("先壓縮再解壓以後字符串和原來的是一模一樣的");  
  42.          }  
  43.      }  
  44.    
  45.      /**  
  46.       * 字符串的壓縮  
  47.       *   
  48.       * @param str  
  49.       *            待壓縮的字符串  
  50.       * @return    返回壓縮後的字符串  
  51.       * @throws IOException  
  52.       */  
  53.      public static String compress(String str) throws IOException {  
  54.          if (null == str || str.length() <= 0) {  
  55.              return str;  
  56.          }  
  57.          // 創建一個新的 byte 數組輸出流  
  58.          ByteArrayOutputStream out = new ByteArrayOutputStream();  
  59.          // 使用默認緩衝區大小創建新的輸出流  
  60.          GZIPOutputStream gzip = new GZIPOutputStream(out);  
  61.          // 將 b.length 個字節寫入此輸出流  
  62.          gzip.write(str.getBytes());  
  63.          gzip.close();  
  64.          // 使用指定的 charsetName,通過解碼字節將緩衝區內容轉換爲字符串  
  65.          return out.toString("ISO-8859-1");  
  66.      }  
  67.        
  68.      /**  
  69.       * 字符串的解壓  
  70.       *   
  71.       * @param str  
  72.       *            對字符串解壓  
  73.       * @return    返回解壓縮後的字符串  
  74.       * @throws IOException  
  75.       */  
  76.      public static String unCompress(String str) throws IOException {  
  77.          if (null == str || str.length() <= 0) {  
  78.              return str;  
  79.          }  
  80.          // 創建一個新的 byte 數組輸出流  
  81.          ByteArrayOutputStream out = new ByteArrayOutputStream();  
  82.          // 創建一個 ByteArrayInputStream,使用 buf 作爲其緩衝區數組  
  83.          ByteArrayInputStream in = new ByteArrayInputStream(str  
  84.                  .getBytes("ISO-8859-1"));  
  85.          // 使用默認緩衝區大小創建新的輸入流  
  86.          GZIPInputStream gzip = new GZIPInputStream(in);  
  87.          byte[] buffer = new byte[256];  
  88.          int n = 0;  
  89.          while ((n = gzip.read(buffer)) >= 0) {// 將未壓縮數據讀入字節數組  
  90.              // 將指定 byte 數組中從偏移量 off 開始的 len 個字節寫入此 byte數組輸出流  
  91.              out.write(buffer, 0, n);  
  92.          }  
  93.          // 使用指定的 charsetName,通過解碼字節將緩衝區內容轉換爲字符串  
  94.          return out.toString("GBK");  
  95.      }  
  96.    
  97.  }  


說明

字符串長度很小的時候,測試時你會發現壓縮後的長度竟然變長了,字符串必須達到一定長度,壓縮比例就可以明顯看到很大。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章