windows系統下基於jacob將word/excel/ppt轉換成pdf

PS:1.本文中說的是windows server下用 jacob這一部分,之後說openoffice的解決方案。

   2.本文中說的解決方案支持將doc,docx,xls,xlsx,ppt,pptx這些格式轉成pdf。

   3. jacob可以調用windows com組件,但不是不止這一種方案:可以搜“java調用com”,查看其它的解決方案

 

1.尋找解決方案的過程:

  項目中遇到了office(word,excel,ppt,之後統稱mssoft document)轉pdf的需求。

  最初藉助java調用openoffice (OpenOffice.org 是一套跨平臺的辦公室軟件套件)服務將mssoft document 轉換成pdf,均能轉換成功,當時的心情也是蠻激動的,感覺openoffice簡直是萬能啊,既能轉mssoft document,又能轉odt,ods,odp。但是,後來有部分mssoft document 轉成pdf後,出現排版錯位問題,字體莫名加粗問題,甚至有的的內容直接就消失了,苦苦冥思不得其解。

  後來在github上找了一個轉pdf的項目,大致試着轉了幾個word,發現轉pdf後的效果還說的過去,好景不長,後續的mssoft document轉換到pdf後,還是出現了出現排版錯位問題,這讓我很抓狂。

  想想也是,mssoft document是微軟的,讓其他第三方的工具解析轉換肯定不能達到100%效果,所以考慮能否讓msoffice自己做轉換操作,這樣就能保證轉換後的效果了。並且服務器是windows server,然後就找到了jacob(java com bridge)。

 

2.前提條件:

  本機運行只需要是windows系統即可。若是web項目中用到的服務器必須是windows server。原因:jacob需要藉助 msoffice軟件做pdf轉換操作,因此需要在服務器上安裝msoffice 07/10/13。

 

  我本機的環境:

  jdk 1.6

  tomcat 1.6

  maven 3.1 (也可以不用maven,直接創建普通的java項目也可以)

  msoffice 2010

 

3.準備工作:

  下載jacob.zip ,地址:https://sourceforge.net/projects/jacob-project/

 

  點擊圖中的download即可,下載後的壓縮包中有如下內容:


  64位系統就用 x64的dll,32位系統就用x86的dll。將dll文件放入放入jdk/bin目錄下,如下圖所示:

  PS:我本地的是1.18-M2版本,本文中截圖壓縮包中的版本是1.18,所以截圖中版本有不一樣的地方,這不影響程序的運行。

 

4.將壓縮包中的jacob.jar引入項目

普通的java項目(guava工具包可以自行下載)怎麼引入就不細說了。

maven項目,我本地的pom.xml是這樣配置的:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>indi.johnny</groupId>
    <artifactId>jacob-convert</artifactId>
    <version>0.0.1-SNAPSHOT</version>
    
    <properties>
        <maven.compiler.source>1.6</maven.compiler.source>
        <maven.compiler.target>1.6</maven.compiler.target>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>
    </properties>

    <dependencies>
    
        <dependency>
            <groupId>com.google.guava</groupId>
            <artifactId>guava</artifactId>
            <version>19.0</version>
        </dependency>
    
        <dependency>
            <groupId>com.jacob</groupId>
            <artifactId>jacob</artifactId>
            <version>1.18-M2</version>
            <scope>system</scope>
            <systemPath>E:/.m2/repository/jacob-1.18-M2/jacob.jar</systemPath>
        </dependency>

    </dependencies>
</project>

  上面的配置文件中第二個<dependency>的<systemPath>標籤的值就是jacob.jar的具體路徑,這個改成自己的就行了。

 

5.上代碼

  下方的代碼也是參考了博主的代碼

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
import lombok.extern.slf4j.Slf4j;

/**
 *
 * @author zhang xin
 * @date 2018/9/7
 */
@Slf4j
public class Word2PdfUtils {
	private static final Integer WORD_TO_PDF_OPERAND = 17;
	private static final Integer PPT_TO_PDF_OPERAND = 32;
	private static final Integer EXCEL_TO_PDF_OPERAND = 0;

	public static void doc2Pdf(String srcFilePath, String pdfFilePath) {
		ActiveXComponent app = null;
		Dispatch doc = null;
		try {
			ComThread.InitSTA();
			app = new ActiveXComponent("Word.Application");
			app.setProperty("Visible", false);
			Dispatch docs = app.getProperty("Documents").toDispatch();
			Object[] obj = new Object[]{
				srcFilePath,
				new Variant(false),
				new Variant(false),//是否只讀
				new Variant(false),
				new Variant("pwd")
			};
			doc = Dispatch.invoke(docs, "Open", Dispatch.Method, obj, new int[1]).toDispatch();
//          Dispatch.put(doc, "Compatibility", false);  //兼容性檢查,爲特定值false不正確
			Dispatch.put(doc, "RemovePersonalInformation", false);
			Dispatch.call(doc, "ExportAsFixedFormat", pdfFilePath, WORD_TO_PDF_OPERAND); // word保存爲pdf格式宏,值爲17

		}catch (Exception e) {
			e.printStackTrace();
			throw e;
		} finally {
			if (doc != null) {
				Dispatch.call(doc, "Close", false);
			}
			if (app != null) {
				app.invoke("Quit", 0);
			}
			ComThread.Release();
		}
	}
	public static void ppt2Pdf(String srcFilePath, String pdfFilePath) {
		ActiveXComponent app = null;
		Dispatch ppt = null;
		try {
			ComThread.InitSTA();
			app = new ActiveXComponent("PowerPoint.Application");
			Dispatch ppts = app.getProperty("Presentations").toDispatch();

			/*
			 * param 4: ReadOnly
			 * param 5: Untitled指定文件是否有標題
			 * param 6: WithWindow指定文件是否可見
			 * */
			ppt = Dispatch.call(ppts, "Open", srcFilePath, true,true, false).toDispatch();
			Dispatch.call(ppt, "SaveAs", pdfFilePath, PPT_TO_PDF_OPERAND); // ppSaveAsPDF爲特定值32

		} catch (Exception e) {
			e.printStackTrace();
			throw e;
		} finally {
			if (ppt != null) {
				Dispatch.call(ppt, "Close");
			}
			if (app != null) {
				app.invoke("Quit");
			}
			ComThread.Release();
		}
	}

	public static void excel2Pdf(String inFilePath, String outFilePath) {
		ActiveXComponent ax = null;
		Dispatch excel = null;
		try {
			ComThread.InitSTA();
			ax = new ActiveXComponent("Excel.Application");
			ax.setProperty("Visible", new Variant(false));
			ax.setProperty("AutomationSecurity", new Variant(3)); // 禁用宏
			Dispatch excels = ax.getProperty("Workbooks").toDispatch();

			Object[] obj = new Object[]{
				inFilePath,
				new Variant(false),
				new Variant(false)
			};
			excel = Dispatch.invoke(excels, "Open", Dispatch.Method, obj, new int[9]).toDispatch();

			// 轉換格式
			Object[] obj2 = new Object[]{
				new Variant(EXCEL_TO_PDF_OPERAND), // PDF格式=0
				outFilePath,
				new Variant(0)  //0=標準 (生成的PDF圖片不會變模糊) ; 1=最小文件
			};
			Dispatch.invoke(excel, "ExportAsFixedFormat", Dispatch.Method,obj2, new int[1]);

		} catch (Exception es) {
			es.printStackTrace();
			throw es;
		} finally {
			if (excel != null) {
				Dispatch.call(excel, "Close", new Variant(false));
			}
			if (ax != null) {
				ax.invoke("Quit", new Variant[] {});
				ax = null;
			}
			ComThread.Release();
		}

	}
}

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章