base64編碼處理大文件

原創

2019-10-16 14:10

在做項目的時候遇到需要將文件轉爲base64編碼，並存儲在文件中。

在將文件轉爲base64編碼是會將文件讀入內存，進行base64編碼，輸出到文件中。代碼入下：

1

2

3

4

5

6

7

8

9

10

FileInputStream stream = new FileInputStream("D:\\桌面\\程序員-第4版.pdf");

ByteArrayOutputStream out = new ByteArrayOutputStream(1024);

byte[] b = new byte[1024];

int n;

while ((n = stream.read(b)) != -1) {

out.write(b, 0, n);

}

stream.close();

out.close();

System.out.println(new String(Base64.encodeBase64(out.toByteArray())));

　　但是大文件在進行base64編碼的時候就會遇到OOM（OOM爲out of memory的簡稱，稱之爲內存溢出）。

　　產生OOM的原因：

文件太大，超出了內存
文件可以正常讀入內存，由於base64編碼後的文件比原來的文件大1/3，在編碼的過程中超出內存

由於3個常規字符可以轉換爲4個base64編碼字符，所以使用3的公倍數作爲緩衝區大小。

所以在對大文件進行base64編碼時可以採用分段編碼，進行輸出。代碼入下：

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

//使用分段上傳的讀取文件的方式將大文件轉換爲base64編碼數據官網 www.1b23.com

ByteArrayOutputStream os1 = new ByteArrayOutputStream();

InputStream file1 = new FileInputStream("D:\\桌面\\程序員-第4版.pdf");

byte[] byteBuf = new byte[3 * 1024 * 1024];

byte[] base64ByteBuf;

int count1; //每次從文件中讀取到的有效字節數

while ((count1 = file1.read(byteBuf)) != -1) {

if (count1 != byteBuf.length) {//如果有效字節數不爲3*1000，則說明文件已經讀到尾了，不夠填充滿byteBuf了

byte[] copy = Arrays.copyOf(byteBuf, count1); //從byteBuf中截取包含有效字節數的字節段

base64ByteBuf = Base64.encodeBase64(copy); //對有效字節段進行編碼

} else {

base64ByteBuf = Base64.encodeBase64(byteBuf);

}

os1.write(base64ByteBuf, 0, base64ByteBuf.length);

os1.flush();

}

file1.close();

System.out.println(os1.toString());

　　以上代碼是將編碼後的數據輸出至控制檯。其實最好是將文件分段進行編碼，分段輸出，這樣不管文件多大，都可以進行編碼，並且不會OOM。以下是將文件輸出至txt文檔中：

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

ByteArrayOutputStream os1 = new ByteArrayOutputStream();

InputStream file1 = new FileInputStream("D:\\桌面\\程序員-第4版.pdf");

byte[] byteBuf = new byte[3 * 1024 * 1024];

byte[] base64ByteBuf;

int count1; //每次從文件中讀取到的有效字節數

File file = new File("D:\\1.txt");

while ((count1 = file1.read(byteBuf)) != -1) {

if (count1 != byteBuf.length) {//如果有效字節數不爲3*1000，則說明文件已經讀到尾了，不夠填充滿byteBuf了

byte[] copy = Arrays.copyOf(byteBuf, count1); //從byteBuf中截取包含有效字節數的字節段

base64ByteBuf = Base64.encodeBase64(copy); //對有效字節段進行編碼

} else {

base64ByteBuf = Base64.encodeBase64(byteBuf);

}

FileUtils.writeByteArrayToFile(file, base64ByteBuf, true); // 將轉換後的數據寫入文件中，該方法會自動創建文件

os1.flush();

}

file1.close();

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Python:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x9c in position 3: invalid start byte

SOAP 之 base64Binary bs64binary->str print(type(config.scriptCheckSum)) print(config.scriptCheckSum) import base64

2020-07-07 08:06:47

實現JS監聽文件下載完成的功能（解決不同瀏覽器的下載觸發 + a標籤base64url過長無法下載的問題）

一般來說，我們的js文件下載會使用window.location.href定位到後端的接口，後端生成文件返回，然後瀏覽器自動下載。這種方法最簡單，但是無法獲取下載成功的通知，在大文件生成和下載的時候，時間過長，用戶可能會重複進行下

2020-07-05 19:20:45

c#中如何用xml來保存並提取圖片

private void button1_Click(object sender, EventArgs e) { try{ int readByte =

2020-07-04 20:52:58

BASE64編碼（網絡機器人JAVA編程指南學習）

Base64編對應表（十進制）以字符串Spider爲例 public class Test1 { private static char[] toBase64 = { 'A','B','C','D','E','F','

是夜色太荒芜

2020-07-04 02:05:34

iOS： base64 加密解密通用類

在使用過程中，直接將被類引入到項目中即可，不需要其它輔助類。使用示例：將此通用類的頭文件引入到目標類後，直接使用類名進行調用即可。 NSString *str = [NSString stringWithF

2020-07-04 00:17:14

讀取本地圖片上次圖片服務器

import java.io.ByteArrayOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStr

2020-07-03 21:10:25

Java 生成在線二維碼以Base64返回前端

依賴的jar包主要是Google 的zxing 進行二維碼的生成 <dependency> <groupId>com.google.zxing</groupId> <artifactId>

2020-07-03 21:10:25

.Net Core API關於二維碼/圖片/Base64轉換的Help類

首先引入QRCoder Nuget包，方可使用。 using QRCoder; using System; using System.Collections.Generic; using System.Drawing; using

2020-07-03 02:21:34

Golang Base64編碼解碼

Golang Base64編碼解碼 Golang內置支持Base64編碼解碼,Go的encoding/base64包遵照RFC 4648規範實現了base64編碼解碼功能,包括標準方式以及URL/文件名稱安全方式編碼。本文通過示例

2020-07-02 03:27:13

java/c++跨語言base64加密解密

一定要用java原生的java.util.Base64，才能保證在c++可以正確decode！比如：在java用這個encode：java.util.Base64.getEncoder().encodeToString(testBy

2020-07-02 00:26:17

C語言base64編碼轉碼

一、最近，在做一個智能鎖項目，鎖上具有一個貓眼攝像頭，當有客人來訪時，需要通過貓眼抓拍圖片上傳到手機app端，讓主人知道來訪者是誰，項目中使用到了Base64編解碼技術，所謂Base64編解碼就是把每三個8bit的字節轉換爲四個6

2020-07-01 18:54:39

C++ 實現包含中文字符用Base64編碼傳輸和解碼讀取數據

QT實現包含中文字符用base64編碼和解碼 #include <QCoreApplication> #include <QDebug> #include <QTextCodec> // QString GetCorrectUni

2020-07-01 16:59:40

C++簡單實現Base64的編解碼

Base64是個很簡單的將數據編碼爲可見字符的算法。就是將原始數據每6個位取出來，找一個可見字符代替，這樣4個可見字符剛好可以代替原來的3個字節，原理不多說，直接上代碼。 PS:代碼只實現對可見字符的加解密，不可打印的還要修改。 #inc

2020-06-30 01:48:12

圖片轉成base64編碼

//UIImage圖片轉成Base64字符串： UIImage *originImage = [UIImage imageNamed:@"originImage.png"]; NSData *data = UIImageJPEGRepr

2020-06-29 19:51:11

web中文數據解析流程

1 獲取web原始數據 2 確定數據編碼如:是不是url編碼或base64編碼 3 如有編碼需解碼 4 確定原始數據字符集以及本地顯示字符集 5 字符集轉換 6 顯示

小狗狗的专栏

2020-06-26 22:29:07

24小時熱門文章

最新文章

最新評論文章