XML(extensible Markup Language)全稱可擴展標記語言,首先它與HTML一樣是標記語言,那就具有標記語言全部特徵。同時XML是被設計用來傳輸與存儲數據,這和HTML用來顯示數據大不一樣,所以XML又有網絡數據交換最流行格式的美譽
編寫XML文檔需自行定義標籤,XML被設計爲具有自我描述性。作爲一種純文本格式,任何有處理純文本能力的軟件都可以用來處理XML
語法規則
1.XML文檔永遠以聲明該文檔的一行代碼起始
<?xml version="1.0" encoding="ISO-8859-1"?>
version="1.0"聲明該XML文檔版本號,目前就兩個版本:1.0與1.1
encoding="ISO-8859-1"聲明編碼格式
2.XML須要有一個根元素,根元素包裹整個文檔,在上面例子中根元素是:
<nbaplayer> ... <\nbaplayer>
XML是用來傳輸數據的,數據通常放在具體XML元素中
3.XML元素由起始標籤和具體內容來定義,一個元素可用一個閉合標籤來結束,也可在起始標籤裏用一個斜槓(/)來閉合.元素中可包含其他元素/屬性/具體數據等其他內容.上述例子中<city>元素:
<city name="houston"> rockets </city>
組成部分有:
元素標題 city
起始標籤 <city>
終止標籤 </city>
數據值 rockets
R語言中解析XML
library(XML)
nbadata<-xmlParse(file="D:/Rdata/nbadata.xml")