iText系列之PdfCopy和PdfSmartCopy

原創

Harold_

2018-09-05 00:54

一個PDF文件是由一系列的對象組成的，比如說一個PDF文件中的圖片是由鍵值對形式的字典組成的一個流對象，而這個流對象是由stream和endstream這兩個詞來界定的。

那麼，如果我們現在在不同的兩個頁面上，都有一個相同的圖片，我們需要避免重複的信息存儲，這樣一來，就可以達到優化和壓縮PDF文件的大小的目的。

我們來看看這兩個對象是怎麼做的：

PdfCopy：它會存儲兩個不同的圖片流對象，在索引表中會引用兩次，因此雖然是一個相同的圖片，但是在不同的頁面上會分別顯示對應的圖片。
PdfSmartCopy：經過它處理，會重建索引表，會把這個圖片流對象引用到不同的頁面上，而這個圖片對象只存儲了一份。

由此看來，PdfCopy處理的比較快，但是生成的PDF文件的大小會很大，很臃腫。而PdfSmartCopy處理文檔比較慢，也會消耗更多的內存，但是生成的PDF文件大小會很小。

因此，在實際使用中，爲了控制大小，一般會使用PdfSmartCopy來對PDF文件進行處理。

例如：

public static void compressPdf(byte[] pdf, OutputStream out) throws Exception {
	PdfReader reader = null;
	PdfSmartCopy copy = null;
	Document document = null;
	try {
		document = new Document();
		copy = new PdfSmartCopy(document, out);
		reader = new PdfReader(pdf);
		int n = reader.getNumberOfPages();
		document.open();
		for (int i=1; i<=n; i++) {
			document.newPage();
			PdfImportedPage imported = copy.getImportedPage(reader, i);
			copy.addPage(imported);
		}
	} catch (IOException e) {
		e.printStackTrace();
	} finally {
		if (document != null)
			document.close();
		if (reader != null)
			reader.close();
		if (copy != null)
			copy.close();
	}
}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

iText系列之PdfCopy和PdfSmartCopy

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

RedHat5.4系統下載及中文設置

同義詞和屬主問題

項目在Weblogic中啓動報錯BEA-101165

Oracle中插入大量測試數據

在Activity之間傳值

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結