網站開發過程中,有時候需要將word內容展示在網頁,可以通過aspose將doc文件直接轉爲pdf進行預覽,但是有時候可能需要就在網頁的某部分信息中顯示內容,而不需要在線預覽,這時候可以考慮將word內容簡單轉換爲html內容來顯示。
- 引入aspose相關jar包
- 將word內容轉爲HTML字符串
/**
* word轉html文本
* @param doc 需要轉換的doc文件對象
* @return
*/
public String parseWord2Html(Document doc){
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setExportHeadersFootersMode(ExportHeadersFootersMode.NONE); // HtmlSaveOptions的其他設置信息請參考相關API
ByteArrayOutputStream htmlStream = new ByteArrayOutputStream();
String htmlText = "";
try {
doc.save(htmlStream, saveOptions);
htmlText = new String(htmlStream.toByteArray(),"UTF-8");
htmlStream.close();
} catch (Exception e) {
LOG.error("word文件轉換失敗,詳細錯誤信息:{}",e.getMessage());
}
return htmlText;
}
轉換的效果如下,左邊是word內容,右邊是轉換後的內容:
當然,效果並不會特別好,但是一些簡單的格式會轉換成功,差不多夠用了,比如標題居中、加粗、回車換行縮進等;複雜一點的格式就可能不會轉換成功了,測試發現序號之類的沒有轉換成功,可能和我option配置的有關係,沒有仔細研究。