解決java.io.UTFDataFormatException: Invalid byte 1 of 1-byte UTF-8 sequence.

原創

tianshanaoxue

2020-02-20 14:20

import java.io.*;

import org.w3c.dom.*;

import javax.xml.parsers.*;

public class MyXMLReader{

public static void main(String arge[]){

long lasting =System.currentTimeMillis();

try{
File f=new File("d://test//test.xml");
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);
NodeList nl = doc.getElementsByTagName("VALUE");
for (int i=0;i<nl.getLength();i++){
System.out.print("車牌號碼:" +
doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue());
System.out.println("車主地址:" +
doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue());
}

}catch(Exception e){

e.printStackTrace();

}
}
}

解析運行時拋出瞭如下異常：

java.io.UTFDataFormatException: Invalid byte 1 of 1-byte UTF-8 sequence.
at org.apache.xerces.impl.io.UTF8Reader.invalidByte(Unknown Source)
at org.apache.xerces.impl.io.UTF8Reader.read(Unknown Source)
at org.apache.xerces.impl.XMLEntityScanner.load(Unknown Source)
at org.apache.xerces.impl.XMLEntityScanner.skipString(Unknown Source)
at org.apache.xerces.impl.XMLVersionDetector.determineDocVersion(Unknown Source)
at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source)
at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source)
at org.apache.xerces.parsers.XMLParser.parse(Unknown Source)
at org.apache.xerces.parsers.DOMParser.parse(Unknown Source)
at org.apache.xerces.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
at MyXMLReader.main(MyXMLReader.java:19)

谷歌，百度了半天都沒有解決。最後重新手動輸入了一下原xml文件的內容。好了……

總結如下：

xml文件的內容是從網上覆制粘貼到本地的。所以其中的符號可能是中文狀態下的。比如那個單書名號<>是中文狀態下的，後來我手工重新寫的時候在字母輸入狀態下，改完後，解析就正確了。

所以有時候肉眼並不是那麼容易分辨出來拷貝的東西到底是不是自己需要的。尤其是現在的編輯器那麼多……結果費了很長時間也解決不了。因爲這不是技術性錯誤，而是隱藏性錯誤。

tianshanaoxue

發佈了40 篇原創文章 · 獲贊 18 · 訪問量 15萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

解決java.io.UTFDataFormatException: Invalid byte 1 of 1-byte UTF-8 sequence.

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

Linux中查看某個網址頭信息的命令

JavaScript獲取瀏覽器信息

Android中判斷網絡連接狀態

Nginx負載均衡配置文件詳解之一(初級詳解)

高分求助，windows系統中如何通過JNA獲取另外一個程序窗口上的內容？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結