aspose將word文檔轉爲html內容

網站開發過程中,有時候需要將word內容展示在網頁,可以通過aspose將doc文件直接轉爲pdf進行預覽,但是有時候可能需要就在網頁的某部分信息中顯示內容,而不需要在線預覽,這時候可以考慮將word內容簡單轉換爲html內容來顯示。

  1. 引入aspose相關jar包
  2. 將word內容轉爲HTML字符串
/**
	 * word轉html文本
	 * @param doc 需要轉換的doc文件對象
	 * @return
	 */
	public String parseWord2Html(Document doc){
		HtmlSaveOptions saveOptions = new HtmlSaveOptions();
		saveOptions.setExportHeadersFootersMode(ExportHeadersFootersMode.NONE); // HtmlSaveOptions的其他設置信息請參考相關API
		ByteArrayOutputStream htmlStream = new ByteArrayOutputStream();
		String htmlText = "";
		try {
			doc.save(htmlStream, saveOptions);
			htmlText = new String(htmlStream.toByteArray(),"UTF-8");
			htmlStream.close();
		} catch (Exception e) {
			LOG.error("word文件轉換失敗,詳細錯誤信息:{}",e.getMessage());
		}
		return htmlText;
	}

轉換的效果如下,左邊是word內容,右邊是轉換後的內容:
在這裏插入圖片描述
當然,效果並不會特別好,但是一些簡單的格式會轉換成功,差不多夠用了,比如標題居中、加粗、回車換行縮進等;複雜一點的格式就可能不會轉換成功了,測試發現序號之類的沒有轉換成功,可能和我option配置的有關係,沒有仔細研究。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章