1. XML解析
1.1 XML解析思路
DOM解析
Document Object Model 文件對象模型
把XML整個文件看做一個Document對象,每一個節點看做一個Element,節點中有Attribute,或者當前節點中存在Text文本內容。
DOM是將整個XML文件讀取到計算機內存中,可以進行CRUD操作。
缺點:
佔用了大量內存空間
適用的環境:
服務器對於XML文件的解析過程。
SAX解析
逐行讀取,給予一定的事件操作。
讀取一行內容,釋放上一行內容,可以有效的節約內存空間
缺點:
不能對XML文件,進行增刪改
適用的環境:
手機讀取解析XML文件時採用的方式。
1.2 DOM圖例
1.3 XML文件解析工具
1. JAXP: SUN提供的一個基本的解析器,支持DOM和SAX兩種解析方式,但是操作很繁瑣,不便於程序員開發。
2. Dom4j: DOM For Java 一款非常優秀的解析器
Spring,SpringMVC... 框架中集成的XML解析器
3. Jsoup: 基於Java完成的對於HTML解析的工具,因爲HTML和XML文件都是標記語言。
給Jsoup一個URL,頁面地址. Java的小爬蟲,API很多很方便
4. PULL:
Android手機上集成的XML解析工具,SAX方式解析
1.4 Dom4j使用入門
1. 導包
目前使用的是第三方工具,不是原生的JDK
導入第三方Jar包
2. 設置IDEA
3. Dom4j涉及到的方法
SAXReader();
解析XML文件使用的核心類
read() --> XML文件Document對象
Document document = new SAXReader().read(new File("./xml/User.xml"));
Document對象中可以使用方法
Element getRootElement();
獲取當前XML文件的根節點對象
Element對象中可以使用方法
List elements();
當前節點下的所有子節點
List elements(String name);
當前節點下所有指定名字的子節點
Element element();
獲取當前節點下的第一個子節點
Element element(String name);
獲取當前節點下指定名字的第一個子節點
Attribute getAttribute(String name);
根據屬性名獲取對應的屬性對象Attribute
Attribute節點中可以使用String getValue()來獲取對應的節點數據
String getName();
獲取當前節點的名字
String getText();
獲取當前節點對應的文本數據
package com.qfedu.d_xmlparse;
import jdk.nashorn.internal.ir.CallNode;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.List;
/**
* @description Dom4j方法演示
* @author Anonymous
* @data 2020/3/6 15:07
*/
public class Demo1 {
public static void main(String[] args) throws DocumentException {
// 當前XML文件的Document對象
Document document = new SAXReader().read(new File("./xml/User.xml"));
// 獲取根節點 Root Element
Element rootElement = document.getRootElement();
// 獲取Root Element下子節點
List<Element> elements = rootElement.elements();
// 可以獲取當前節點下的所有子節點
// System.out.println(elements);
Element teacher = rootElement.element("teacher");
// 獲取屬性節點指定屬性值
System.out.println(teacher.attribute("id").getValue());
List<Element> elements1 = teacher.elements();
for (Element element : elements1) {
// 獲取節點的名字
System.out.println(element.getName() + ":" + element.getText());
}
}
}
3.5 Dom4j Xpath解析讀取XML文件
package com.qfedu.d_xmlparse;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.List;
/**
* @description Xpath語法解析 XML文件
* @author Anonymous
* @date 2020/3/6 15:55
*/
public class Demo2 {
public static void main(String[] args) throws DocumentException {
// 當前XML文件的Document對象
Document document = new SAXReader().read(new File("./xml/User.xml"));
// 獲取根節點 Root Element
Element rootElement = document.getRootElement();
// 無視目錄結構,無視當前解析狀態,直接獲取所有的user節點
List list = rootElement.selectNodes("//user");
for (Object o : list) {
Element element = (Element) o;
int id = Integer.parseInt(element.attributeValue("id"));
String name = element.element("name").getText();
int age = Integer.parseInt(element.element("age").getText());
String gender = element.element("gender").getText();
System.out.println("User[id=" + id + ", name=" + name
+ ", age=" + age + ", gender=" + gender + "]");
}
System.out.println("--------------------------------------");
System.out.println();
// //user[index] 不考慮路徑關係,獲取當前XML文件中指定下標的user節點
Node node = rootElement.selectSingleNode("//user[1]");
System.out.println(node);
System.out.println("--------------------------------------");
System.out.println();
// //user[@id=9] 不考慮路徑關係,獲取當前XML文件中指定屬性爲id,值爲9的user節點
// @之後是屬性 @id 這裏需要匹配的是屬性
Node node1 = rootElement.selectSingleNode("//user[@id=9]");
System.out.println(node1);
System.out.println("--------------------------------------");
System.out.println();
// //user[gender='male'] 不考慮路徑關係,獲取當前XML文件中指定子節點爲gender,對應子節點文本數據爲male
// 的user所有節點
List list1 = rootElement.selectNodes("//user[gender='male']");
for (Object o : list1) {
System.out.println(o);
}
System.out.println("--------------------------------------");
System.out.println();
List list2 = rootElement.selectNodes("//user[age<20]");
for (Object o : list2) {
System.out.println(o);
}
}
}
package com.qfedu.d_xmlparse;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.util.List;
/**
* @description Xpath語法解析 XML文件
* @author Anonymous
* @date 2020/3/6 15:55
*/
public class Demo3 {
public static void main(String[] args) throws DocumentException {
// 當前XML文件的Document對象
Document document = new SAXReader().read(new File("./xml/User.xml"));
// 獲取根節點 Root Element
Element rootElement = document.getRootElement();
System.out.println("--------------------------------------");
System.out.println();
// //user[last()] 這裏是不考慮路徑關係,獲取最後一個user節點
Node node = rootElement.selectSingleNode("//user[last()]");
System.out.println(node);
System.out.println("--------------------------------------");
System.out.println();
// //user[last()] 這裏是不考慮路徑關係,獲取前兩個User節點
List list = rootElement.selectNodes("//user[position() < 3]");
for (Object o : list) {
System.out.println(o);
}
System.out.println("--------------------------------------");
System.out.println();
// //name | // age 無視路徑關係,獲取所有的name節點和age節點
List list1 = rootElement.selectNodes("//name | // age");
for (Object o : list1) {
Element element = (Element) o;
System.out.println(element.getText());
}
}
}
2. XML文件保存
流程:
1. 創建Document對象
2. 通過Document對象來添加元素
addElment();
addAttribute();
package com.qfedu.e_xmlwrite;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
import java.io.FileWriter;
import java.io.IOException;
/**
* @description: 創建XML文件
* @author: Anonymous
* @time: 2020/3/6 16:29
*
* <students>
* <student id="qf1">
* <name>騷磊</name>
* <age>fdasfdsaf</age>
* <sex>male</sex>
* </student>
* <student id="qf2">
* <name>騷磊</name>
* <age>16</age>
* <sex>male</sex>
* </student>
* </students>
*/
public class Demo1 {
public static void main(String[] args) throws IOException {
// 1. 創建了一個XML文件對應的Document對象
Document document = DocumentHelper.createDocument();
// 2. 放入到XML文件對應的Document對象中
Element root = document.addElement("students");
// 3. 在根節點之下添加了一個student節點,同時設置了屬性
Element element = root.addElement("student").addAttribute("id", "qf1");
// 根節點下添加了對應的子節點,以及對應的文本
element.addElement("name").addText("騷磊");
element.addElement("age").addText("16");
element.addElement("sex").addText("male");
// 字符輸出流
FileWriter fileWriter = new FileWriter("./xml/student.xml");
document.write(fileWriter);
// 4. 關閉資源
fileWriter.close();
}
}
5. 反射+XML文件保存讀取操作
package f_xmlsave;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.lang.reflect.Field;
import java.lang.reflect.InvocationTargetException;
import java.lang.reflect.Method;
import java.util.ArrayList;
import java.util.List;
/**
* @description:
* @author: Anonymous
* @time: 2020/3/6 16:46
*/
public class MainProject {
public static void main(String[] args)
throws IllegalAccessException, DocumentException, NoSuchMethodException, InvocationTargetException, IOException {
ArrayList<Student> list = new ArrayList<>();
readDataFromXML(list);
for (Student student : list) {
System.out.println(student);
}
}
public static void saveDateToXML(ArrayList<Student> list) throws IllegalAccessException, IOException {
// 創建XML文件對應Document對象
Document document = DocumentHelper.createDocument();
// 明確根節點
Element root = document.addElement("students");
// 獲取所有的成員變量Field對象
Field[] declaredFields = Student.class.getDeclaredFields();
// 循環遍歷Student ArrayList集合
for (Student student : list) {
// 每一個Student對象都要對應一個Student節點
Element element = root.addElement("student");
// 遍歷所有的Field成員變量
for (Field declaredField : declaredFields) {
declaredField.setAccessible(true);
// id存儲到Student節點中的屬性中
if ("id".equals(declaredField.getName())) {
// 所有的數據都是在String類型處理
element.addAttribute("id", declaredField.get(student) + "");
} else {
// declaredField.getName() 成員變量名字 declaredField.get(student) 對應數據
element.addElement(declaredField.getName()).addText(declaredField.get(student) + "");
}
}
}
// 字符流對象+Document對象的write方法寫入XML信息到文件中
FileWriter fileWriter = new FileWriter("./xml/student.xml");
document.write(fileWriter);
fileWriter.close();
}
public static void readDataFromXML(ArrayList<Student> list)
throws DocumentException, NoSuchMethodException, InvocationTargetException, IllegalAccessException {
Document document = new SAXReader().read(new File("./xml/student.xml"));
// 找出當前XML文件中的所有student節點
List list1 = document.selectNodes("//student");
// 得到當前Student類內的所有成員變量對象,注意使用暴力反射
Field[] declaredFields = Student.class.getDeclaredFields();
/*
String字符串問題
name String getText
gender String getText
id Integer Attribute ==> Integer
age Integer getText ==> Integer
*/
// 遍歷所有的Student節點
for (Object o : list1) {
// Student節點對象
Element element = (Element) o;
Student student = new Student();
// 成員變量Field數組遍歷
for (Field declaredField : declaredFields) {
// 給予暴力反射操作成員變量權限
declaredField.setAccessible(true);
// 獲取當前成員變量的數據類型
Class<?> type = declaredField.getType();
// 如果數據類型是String類型
if (type.equals(String.class)) {
// String
declaredField.set(student, element.element(declaredField.getName()).getText());
} else if (type.equals(Integer.class)) {
// Integer類型
// 獲取Integer類型中的valueOf方法
Method valueOf = type.getMethod("valueOf", String.class);
if ("id".equals(declaredField.getName())) {
/*
id是在student節點屬性中,從屬性中獲取對應是數據,使用valueOf方法轉換成對應的Integer類型
*/
declaredField.set(student, valueOf.invoke(student, element.attributeValue("id")));
} else {
/*
非ID數據,從Student指定名字的子節點下獲取,指定名字和成員變量名字一直,同樣需要轉換一下
*/
declaredField.set(student,valueOf.invoke(student, element.element(declaredField.getName()).getText()));
}
}
}
list.add(student);
}
}
}