在使用DOM4j解析文檔的時候,遇見上了 Invalid byte 2 of 2-byte UTF-8 sequence 錯誤。這個錯誤一看就是編碼的問題,用SAXReader解析的是我自己用Dom4j生成的文檔,在生成的文檔時候沒有指定編碼格式,所以需要在寫入XML文件的時候指定編碼格式。
具體的代碼是:
OutputFormat format = new OutputFormat("", true, "UTF-8");
String fileName = "xx.xml";
XMLWriter writer = new XMLWriter(new FileOutputStream(fileName), format);
//.....
//....將doc寫入writer