Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某個 URL 地址、HTML 文本內容。它提供了一套非常省力的 API,可通過 DOM,CSS 以及類似於 jQuery 的操作方法來取出和操作數據
(1)導入jar包
(2)獲取Document對象
(3)獲取對應的標籤Element對象
(4)獲取數據
- 導入 jar 包,並將 建立的 libs 設置爲 Module Library
- 具體使用
package jsoup;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.File;
public class JsoupDemo {
public static void main(String[] args) throws Exception{
//2.1獲取student.xml的path
String path = JsoupDemo.class.getClassLoader().getResource("student.xml").getPath();
//2.2解析xml文檔,加載文檔進內存,獲取dom樹--->Document
Document document = Jsoup.parse(new File(path),"utf-8");
//3.獲取元素對象 Element
Elements elements = document.getElementsByTag("name");
System.out.println(elements.size());
//3.1獲取第一個name的Element對象
Element element = elements.get(0);
//3.2獲取數據
String name = element.text();
System.out.println(name);
}
}