base64編碼處理大文件

在做項目的時候遇到需要將文件轉爲base64編碼,並存儲在文件中。

在將文件轉爲base64編碼是會將文件讀入內存,進行base64編碼,輸出到文件中。代碼入下:

1
2
3
4
5
6
7
8
9
10
FileInputStream stream = new FileInputStream("D:\\桌面\\程序員-第4版.pdf");
     ByteArrayOutputStream out new ByteArrayOutputStream(1024);
     byte[] b = new byte[1024];
     int n;
     while ((n = stream.read(b)) != -1) {
         out.write(b, 0, n);
     }
     stream.close();
     out.close();
     System.out.println(new String(Base64.encodeBase64(out.toByteArray())));   

  但是大文件在進行base64編碼的時候就會遇到OOM(OOM爲out of memory的簡稱,稱之爲內存溢出)。

  產生OOM的原因:

  • 文件太大,超出了內存

  • 文件可以正常讀入內存,由於base64編碼後的文件比原來的文件大1/3,在編碼的過程中超出內存

由於3個常規字符可以轉換爲4個base64編碼字符,所以使用3的公倍數作爲緩衝區大小。

所以在對大文件進行base64編碼時可以採用分段編碼,進行輸出。代碼入下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
//使用分段上傳的讀取文件的方式將大文件轉換爲base64編碼數據 官網 www.1b23.com
        ByteArrayOutputStream os1 = new ByteArrayOutputStream();
        InputStream file1 = new FileInputStream("D:\\桌面\\程序員-第4版.pdf");
        byte[] byteBuf = new byte[3 * 1024 * 1024];
        byte[] base64ByteBuf;
        int count1; //每次從文件中讀取到的有效字節數
        while ((count1 = file1.read(byteBuf)) != -1) {
            if (count1 != byteBuf.length) {//如果有效字節數不爲3*1000,則說明文件已經讀到尾了,不夠填充滿byteBuf了
                byte[] copy = Arrays.copyOf(byteBuf, count1); //從byteBuf中截取包含有效字節數的字節段
                base64ByteBuf = Base64.encodeBase64(copy); //對有效字節段進行編碼
            else {
                base64ByteBuf = Base64.encodeBase64(byteBuf);
            }
            os1.write(base64ByteBuf, 0, base64ByteBuf.length);
            os1.flush();
        }
        file1.close();
        System.out.println(os1.toString());

  以上代碼是將編碼後的數據輸出至控制檯。其實最好是將文件分段進行編碼,分段輸出,這樣不管文件多大,都可以進行編碼,並且不會OOM。以下是將文件輸出至txt文檔中:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
ByteArrayOutputStream os1 = new ByteArrayOutputStream();
       InputStream file1 = new FileInputStream("D:\\桌面\\程序員-第4版.pdf");
       byte[] byteBuf = new byte[3 * 1024 * 1024];
       byte[] base64ByteBuf;
       int count1; //每次從文件中讀取到的有效字節數
       File file = new File("D:\\1.txt");
       while ((count1 = file1.read(byteBuf)) != -1) {
           if (count1 != byteBuf.length) {//如果有效字節數不爲3*1000,則說明文件已經讀到尾了,不夠填充滿byteBuf了
               byte[] copy = Arrays.copyOf(byteBuf, count1); //從byteBuf中截取包含有效字節數的字節段
               base64ByteBuf = Base64.encodeBase64(copy); //對有效字節段進行編碼
           else {
               base64ByteBuf = Base64.encodeBase64(byteBuf);
           }
           FileUtils.writeByteArrayToFile(file, base64ByteBuf, true); // 將轉換後的數據寫入文件中,該方法會自動創建文件
           os1.flush();
       }
       file1.close();


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章