PS:1.本文中說的是windows server下用 jacob這一部分,之後說openoffice的解決方案。
2.本文中說的解決方案支持將doc,docx,xls,xlsx,ppt,pptx這些格式轉成pdf。
3. jacob可以調用windows com組件,但不是不止這一種方案:可以搜“java調用com”,查看其它的解決方案
1.尋找解決方案的過程:
項目中遇到了office(word,excel,ppt,之後統稱mssoft document)轉pdf的需求。
最初藉助java調用openoffice (OpenOffice.org 是一套跨平臺的辦公室軟件套件)服務將mssoft document 轉換成pdf,均能轉換成功,當時的心情也是蠻激動的,感覺openoffice簡直是萬能啊,既能轉mssoft document,又能轉odt,ods,odp。但是,後來有部分mssoft document 轉成pdf後,出現排版錯位問題,字體莫名加粗問題,甚至有的的內容直接就消失了,苦苦冥思不得其解。
後來在github上找了一個轉pdf的項目,大致試着轉了幾個word,發現轉pdf後的效果還說的過去,好景不長,後續的mssoft document轉換到pdf後,還是出現了出現排版錯位問題,這讓我很抓狂。
想想也是,mssoft document是微軟的,讓其他第三方的工具解析轉換肯定不能達到100%效果,所以考慮能否讓msoffice自己做轉換操作,這樣就能保證轉換後的效果了。並且服務器是windows server,然後就找到了jacob(java com bridge)。
2.前提條件:
本機運行只需要是windows系統即可。若是web項目中用到的服務器必須是windows server。原因:jacob需要藉助 msoffice軟件做pdf轉換操作,因此需要在服務器上安裝msoffice 07/10/13。
我本機的環境:
jdk 1.6
tomcat 1.6
maven 3.1 (也可以不用maven,直接創建普通的java項目也可以)
msoffice 2010
3.準備工作:
下載jacob.zip ,地址:https://sourceforge.net/projects/jacob-project/
點擊圖中的download即可,下載後的壓縮包中有如下內容:
64位系統就用 x64的dll,32位系統就用x86的dll。將dll文件放入放入jdk/bin目錄下,如下圖所示:
PS:我本地的是1.18-M2版本,本文中截圖壓縮包中的版本是1.18,所以截圖中版本有不一樣的地方,這不影響程序的運行。
4.將壓縮包中的jacob.jar引入項目
普通的java項目(guava工具包可以自行下載)怎麼引入就不細說了。
maven項目,我本地的pom.xml是這樣配置的:
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>indi.johnny</groupId>
<artifactId>jacob-convert</artifactId>
<version>0.0.1-SNAPSHOT</version>
<properties>
<maven.compiler.source>1.6</maven.compiler.source>
<maven.compiler.target>1.6</maven.compiler.target>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
<project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>
</properties>
<dependencies>
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>19.0</version>
</dependency>
<dependency>
<groupId>com.jacob</groupId>
<artifactId>jacob</artifactId>
<version>1.18-M2</version>
<scope>system</scope>
<systemPath>E:/.m2/repository/jacob-1.18-M2/jacob.jar</systemPath>
</dependency>
</dependencies>
</project>
上面的配置文件中第二個<dependency>的<systemPath>標籤的值就是jacob.jar的具體路徑,這個改成自己的就行了。
5.上代碼
下方的代碼也是參考了博主的代碼
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.ComThread;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;
import lombok.extern.slf4j.Slf4j;
/**
*
* @author zhang xin
* @date 2018/9/7
*/
@Slf4j
public class Word2PdfUtils {
private static final Integer WORD_TO_PDF_OPERAND = 17;
private static final Integer PPT_TO_PDF_OPERAND = 32;
private static final Integer EXCEL_TO_PDF_OPERAND = 0;
public static void doc2Pdf(String srcFilePath, String pdfFilePath) {
ActiveXComponent app = null;
Dispatch doc = null;
try {
ComThread.InitSTA();
app = new ActiveXComponent("Word.Application");
app.setProperty("Visible", false);
Dispatch docs = app.getProperty("Documents").toDispatch();
Object[] obj = new Object[]{
srcFilePath,
new Variant(false),
new Variant(false),//是否只讀
new Variant(false),
new Variant("pwd")
};
doc = Dispatch.invoke(docs, "Open", Dispatch.Method, obj, new int[1]).toDispatch();
// Dispatch.put(doc, "Compatibility", false); //兼容性檢查,爲特定值false不正確
Dispatch.put(doc, "RemovePersonalInformation", false);
Dispatch.call(doc, "ExportAsFixedFormat", pdfFilePath, WORD_TO_PDF_OPERAND); // word保存爲pdf格式宏,值爲17
}catch (Exception e) {
e.printStackTrace();
throw e;
} finally {
if (doc != null) {
Dispatch.call(doc, "Close", false);
}
if (app != null) {
app.invoke("Quit", 0);
}
ComThread.Release();
}
}
public static void ppt2Pdf(String srcFilePath, String pdfFilePath) {
ActiveXComponent app = null;
Dispatch ppt = null;
try {
ComThread.InitSTA();
app = new ActiveXComponent("PowerPoint.Application");
Dispatch ppts = app.getProperty("Presentations").toDispatch();
/*
* param 4: ReadOnly
* param 5: Untitled指定文件是否有標題
* param 6: WithWindow指定文件是否可見
* */
ppt = Dispatch.call(ppts, "Open", srcFilePath, true,true, false).toDispatch();
Dispatch.call(ppt, "SaveAs", pdfFilePath, PPT_TO_PDF_OPERAND); // ppSaveAsPDF爲特定值32
} catch (Exception e) {
e.printStackTrace();
throw e;
} finally {
if (ppt != null) {
Dispatch.call(ppt, "Close");
}
if (app != null) {
app.invoke("Quit");
}
ComThread.Release();
}
}
public static void excel2Pdf(String inFilePath, String outFilePath) {
ActiveXComponent ax = null;
Dispatch excel = null;
try {
ComThread.InitSTA();
ax = new ActiveXComponent("Excel.Application");
ax.setProperty("Visible", new Variant(false));
ax.setProperty("AutomationSecurity", new Variant(3)); // 禁用宏
Dispatch excels = ax.getProperty("Workbooks").toDispatch();
Object[] obj = new Object[]{
inFilePath,
new Variant(false),
new Variant(false)
};
excel = Dispatch.invoke(excels, "Open", Dispatch.Method, obj, new int[9]).toDispatch();
// 轉換格式
Object[] obj2 = new Object[]{
new Variant(EXCEL_TO_PDF_OPERAND), // PDF格式=0
outFilePath,
new Variant(0) //0=標準 (生成的PDF圖片不會變模糊) ; 1=最小文件
};
Dispatch.invoke(excel, "ExportAsFixedFormat", Dispatch.Method,obj2, new int[1]);
} catch (Exception es) {
es.printStackTrace();
throw es;
} finally {
if (excel != null) {
Dispatch.call(excel, "Close", new Variant(false));
}
if (ax != null) {
ax.invoke("Quit", new Variant[] {});
ax = null;
}
ComThread.Release();
}
}
}