XML基礎學習

一、什麼是 XML?
XML 指可擴展標記語言(EXtensible Markup Language)
XML 是一種標記語言,很類似 HTML
XML 的設計宗旨是傳輸數據,而非顯示數據
XML 標籤沒有被預定義。您需要自行定義標籤。
XML 被設計爲具有自我描述性。
XML 是 W3C的推薦標準。(萬維網聯盟World Wide Web Consortium,又稱W3C理事會。 )

1.XML 與 HTML 的主要差異
XML 不是 HTML 的替代。
XML 和 HTML 爲不同的目的而設計:
XML 被設計爲傳輸和存儲數據,其焦點是數據的內容。
HTML 被設計用來顯示數據,其焦點是數據的外觀。
HTML 旨在顯示信息,而 XML 旨在傳輸信息。
沒有任何行爲的 XML,XML 是“不作爲”的。
也許這有點難以理解,但是 XML 不會做任何事情。XML 被設計用來結構化、存儲以及傳輸信息。
XML 僅僅是純文本
XML沒什麼特別的。它僅僅是純文本而已。有能力處理純文本的軟件都可以處理 XML。
不過,能夠讀懂 XML 的應用程序可以有針對性地處理 XML 的標籤。標籤的功能性意義依賴於應用程序的特性。
通過 XML 您可以發明自己的標籤
XML的標籤沒有在任何 XML 標準中定義過。這些標籤是由文檔的創作者發明的。
這是因爲 XML 沒有預定義的標籤。

在HTML中使用的標籤(以及 HTML 的結構)是預定義的。HTML 文檔只使用在 HTML 標準中定義過的標籤。

XML 允許創作者定義自己的標籤和自己的文檔結構。
XML 不是對 HTML 的替代
XML 是對 HTML 的補充。

XML 不是對 HTML 的替代,理解這一點很重要。在大多數 web 應用程序中,XML 用於傳輸數據,而 HTML 用於格式化並顯示數據。

2.對 XML 的最好的描述是
XML 是獨立於軟件和硬件的信息傳輸工具。
XML 是 W3C 的推薦標準,可擴展標記語言 (XML) 於 1998 年 2 月 10 日成爲 W3C 的推薦標準。

3.XML 無所不在
當我們看到 XML 標準突飛猛進的開發進度,以及大批的軟件開發商採用這個標準的日新月異的速度時,真的是不禁感嘆這真是令人歎爲觀止。
目前,XML 在 Web 中起到的作用不會亞於一直作爲 Web 基石的 HTML。
XML 無所不在。XML是各種應用程序之間進行數據傳輸的最常用的工具,並且在信息存儲和描述領域變得越來越流行。

二、XML的用途
1.XML 把數據從 HTML 分離
如果你需要在 HTML 文檔中顯示動態數據,那麼每當數據改變時將花費大量的時間來編輯 HTML。
通過 XML,數據能夠存儲在獨立的 XML 文件中。這樣你就可以專注於使用 HTML 進行佈局和顯示,並確保修改底層數據不再需要對 HTML 進行任何的改變。
通過使用幾行 JavaScript,你就可以讀取一個外部XML文件,然後更新 HTML 中的數據內容。

2.XML 簡化數據共享
在真實的世界中,計算機系統和數據使用不兼容的格式來存儲數據。
XML 數據以純文本格式進行存儲,因此提供了一種獨立於軟件和硬件的數據存儲方法。
這讓創建不同應用程序可以共享的數據變得更加容易。

3.XML 簡化數據傳輸
通過 XML,可以在不兼容的系統之間輕鬆地交換數據。
對開發人員來說,其中一項最費時的挑戰一直是在因特網上的不兼容系統之間交換數據。
由於可以通過各種不兼容的應用程序來讀取數據,以XML交換數據降低了這種複雜性。

4.XML 簡化平臺的變更
升級到新的系統(硬件或軟件平臺),總是非常費時的。必須轉換大量的數據,不兼容的數據經常會丟失。
XML 數據以文本格式存儲。這使得 XML 在不損失數據的情況下,更容易擴展或升級到新的操作系統、新應用程序或新的瀏覽器。

5.XML 使您的數據更有用
由於 XML 獨立於硬件、軟件以及應用程序,XML 使您的數據更可用,也更有用。
不同的應用程序都能夠訪問您的數據,不僅僅在 HTML 頁中,也可以從 XML 數據源中進行訪問。
通過XML,您的數據可供各種閱讀設備使用(手持的計算機、語音設備、新聞閱讀器等),還可以供盲人或其他殘障人士使用。

6.XML 用於創建新的 Internet 語言
很多新的 Internet 語言是通過 XML 創建的:
其中的例子包括:
XHTML - 最新的 HTML 版本
WSDL - 用於描述可用的 web service
WAP 和 WML - 用於手持設備的標記語言
RSS - 用於 RSS feed 的語言
RDF 和 OWL - 用於描述資源和本體
SMIL - 用於描述針對 web 的多媒體

三、XML語法規則
1.所有 XML 元素都須有關閉標籤
在 HTML,經常會看到沒有關閉標籤的元素:

<p>This is a paragraph
<p>This is another paragraph

在 XML 中,省略關閉標籤是非法的。所有元素都必須有關閉標籤:

<p>This is a paragraph</p>

This is another paragraph

註釋:您也許已經注意到XML聲明沒有關閉標籤。這不是錯誤。聲明不屬於XML本身的組成部分。它不是 XML 元素,也不需要關閉標籤。
XML 標籤對大小寫敏感
XML 元素使用 XML 標籤進行定義。
在 XML 中,標籤 《Letter》 與標籤 《letter》 是不同的。
必須使用相同的大小寫來編寫打開標籤和關閉標籤:
《Message》這是錯誤的。《/message》
《message》這是正確的。《/message》
註釋:打開標籤和關閉標籤通常被稱爲開始標籤和結束標籤。不論您喜歡哪種術語,它們的概念都是相同的。

2.XML 必須正確地嵌套
在 HTML 中,常會看到沒有正確嵌套的元素:
《b》《i》This text is bold and italic《/b》《/i》。
在 XML 中,所有元素都必須彼此正確地嵌套:
《b》《i》This text is bold and italic《/i》《/b》。在上例中,正確嵌套的意思是:由於 《i》 元素是在 《b》 元素內打開的,那麼它必須在 《b》 元素內關閉。

3.XML 文檔必須有根元素
XML 文檔必須有一個元素是所有其他元素的父元素。該元素稱爲根元素。

<root>
 <child>
   <subchild>.....</subchild>
 </child>
</root>

4.XML 的屬性值須加引號
與 HTML 類似,XML 也可擁有屬性(名稱/值的對)
在XML中,XML的屬性值須加引號。請研究下面的兩個 XML 文檔。第一個是錯誤的,第二個是正確的:

 1.錯
 <note date=08/08/2008>
 <to>George</to>
 <from>John</from>
 </note> 
 2.對
 <note date="08/08/2008">
 <to>George</to>
 <from>John</from>
 </note> 

在第一個文檔的錯誤是,note 元素中的 date 屬性沒有加引號。

實體引用在 XML 中,一些字符擁有特殊的意義
如果你把字符 “<” 放在 XML 元素中,會發生錯誤,這是因爲解析器會把它當作新元素的開始。
這樣會產生 XML 錯誤:
<message>if salary < 1000 then</message>爲了避免這個錯誤,請用一個實體引用來代替 “<” 字符:
<message>if salary << 1000 then</message> 在 XML 中,有 5 個預定義的實體引用:

< < 小於 
> > 大於 
& & 和號 
' ' 單引號 
" " 引號 

註釋:在 XML 中,只有字符 “<” 和 “&” 確實是非法的。大於號是合法的,但是用實體引用來代替它是一個好習慣。

5.XML 中的註釋
在 XML 中編寫註釋的語法與 HTML 的語法很相似:
在 XML 中,空格會被保留
HTML 會把多個連續的空格字符裁減爲一個
HTML: Hello my name is David.
輸出: Hello my name is David.
在 XML 中,文檔中的空格不會被刪節。

6.XML 以 LF 存儲換行
在 Windows 應用程序中,換行通常以一對字符來存儲:回車符 (CR) 和換行符 (LF)。這對字符與打字機設置新行的動作有相似之處。在 Unix 應用程序中,新行以 LF 字符存儲。而 Macintosh 應用程序使用 CR 來存儲新行。

四、什麼是 XML 元素 ?
1.XML 元素指的是從(且包括)開始標籤直到(且包括)結束標籤的部分。
元素可包含其他元素、文本或者兩者的混合物。元素也可以擁有屬性

<bookstore>
<book category="CHILDREN">
 <title>Harry Potter</title> 
 <author>J K. Rowling</author> 
 <year>2005</year> 
 <price>29.99</price> 
</book>
<book category="WEB">
 <title>Learning XML</title> 
 <author>Erik T. Ray</author> 
 <year>2003</year> 
 <price>39.95</price> 
</book>
</bookstore> 

在上例中,<bookstore><book> 都擁有元素內容,因爲它們包含了其他元素。<author> 只有文本內容,因爲它僅包含文本。
在上例中,只有 <book> 元素擁有屬性 (category=”CHILDREN”)。

2.XML 命名規則
XML 元素必須遵循以下命名規則:
a.名稱可以含字母、數字以及其他的字符
b.名稱不能以數字或者標點符號開始
c.名稱不能以字符 “xml”(或者 XML、Xml)開始
d.名稱不能包含空格
e.可使用任何名稱,沒有保留的字詞。
最佳命名習慣
a.使名稱具有描述性。使用下劃線的名稱也很不錯。
b.名稱應當比較簡短,比如:<book_title>而不是:<the_title_of_the_book>
c.避免 “-” 字符。如果您按照這樣的方式進行命名:”first-name”,一些軟件會認爲你需要提取第一個單詞。
d.避免 “.” 字符。如果您按照這樣的方式進行命名:”first.name”,一些軟件會認爲 “name” 是對象 “first” 的屬性。
e.避免 “:” 字符。冒號會被轉換爲命名空間來使用(稍後介紹)。
f.XML 文檔經常有一個對應的數據庫,其中的字段會對應 XML 文檔中的元素。有一個實用的經驗,即使用數據庫的名稱規則來命名 XML 文檔中的元素。
g.非英語的字母比如 éòá 也是合法的 XML 元素名,不過需要留意當軟件開發商不支持這些字符時可能出現的問題。

3.XML 元素是可擴展的
XML 元素是可擴展,以攜帶更多的信息。
請看下面這個 XML 例子:

<note>
<to>George</to>
<from>John</from>
<body>Don't forget the meeting!</body>
</note> 

讓我們設想一下,我們創建了一個應用程序,可將 <to><from> 以及 <body> 元素提取出來,併產生以下的輸出:
MESSAGE
To: George
From: John
Don’t forget the meeting!
想象一下,之後這個 XML 文檔作者又向這個文檔添加了一些額外的信息:

<note>
<date>2008-08-08</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

那麼這個應用程序會中斷或崩潰嗎?
不會。這個應用程序仍然可以找到 XML 文檔中的 <to><from> 以及 <body> 元素,併產生同樣的輸出。
XML 的優勢之一,就是可以經常在不中斷應用程序的情況進行擴展

五、XML屬性
1.XML 屬性
在 HTML 中(以及在 XML 中),屬性提供有關元素的額外信息:

<img src="computer.gif">
<a href="demo.asp"> 

屬性通常提供不屬於數據組成部分的信息。在下面的例子中,文件類型與數據無關,但是對需要處理這個元素的軟件來說卻很重要:

<file type="gif">computer.gif</file>XML 

2.屬性必須加引號
屬性值必須被引號包圍,不過單引號和雙引號均可使用。比如一個人的性別,person 標籤可以這樣寫:
<person sex="female">或者這樣也可以:
<person sex='female'>註釋:如果屬性值本身包含雙引號,那麼有必要使用單引號包圍它,就像這個例子:
<gangster name='George "Shotgun" Ziegler'>或者可以使用實體引用:
<gangster name="George "Shotgun" Ziegler">
XML 元素 vs. 屬性
請看這些例子:

<person sex="female">
 <firstname>Anna</firstname>
 <lastname>Smith</lastname>
</person> 
<person>
 <sex>female</sex>
 <firstname>Anna</firstname>
 <lastname>Smith</lastname>
</person> 

在第一個例子中,sex 是一個屬性。在第二個例子中,sex 則是一個子元素。兩個例子均可提供相同的信息。

沒有什麼規矩可以告訴我們什麼時候該使用屬性,而什麼時候該使用子元素。我的經驗是在 HTML 中,屬性用起來很便利,但是在 XML 中,您應該儘量避免使用屬性。如果信息感覺起來很像數據,那麼請使用子元素吧。

下面的三個 XML 文檔包含完全相同的信息:
第一個例子中使用了 date 屬性:

<note date="08/08/2008">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note> 

第二個例子中
使用了 date 元素:

<note>
<date>08/08/2008</date>
<to>George</to>
<from>John</from>
<heding>Reminder</heading>
<body>Don't forget the meeting!</body>
</note> 

第三個例子中使用
了擴展的 date 元素(這是我的最愛):

<note>
<date>
 <day>08</day>
 <month>08</month>
 <year>2008</year>
</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

3.避免 XML 屬性
因使用屬性而引起的一些問題:
a.屬性無法包含多個值(子元素可以)
b.屬性無法描述樹結構(子元素可以)
c.屬性不易擴展(爲未來的變化)
d.屬性難以閱讀和維護
請儘量使用元素來描述數據。而僅僅使用屬性來提供與數據無關的信息
不要做這樣的蠢事(這不是 XML 應該被使用的方式):

<note day="08" month="08" year="2008"
 to="George" from="John" heading="Reminder" 
 body="Don't forget the meeting!">
 </note>

4.針對元數據的 XML 屬性
有時候會向元素分配 ID 引用。這些 ID 索引可用於標識 XML 元素,它起作用的方式與 HTML 中 ID 屬性是一樣的。這個例子向我們演示了這種情況:

<messages>
 <note id="501">
   <to>George</to>
   <from>John</from>
   <heading>Reminder</heading>
   <body>Don't forget the meeting!</body>
 </note>
 <note id="502">
   <to>John</to>
   <from>George</from>
   <heading>Re: Reminder</heading>
   <body>I will not</body>
 </note> 
</messages>

上面的 ID 僅僅是一個標識符,用於標識不同的便籤。它並不是便籤數據的組成部分。
在此我們極力向您傳遞的理念是:元數據(有關數據的數據)應當存儲爲屬性,而數據本身應當存儲爲元素

參考自站長之家,點擊獲取更多XML內容

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章