全新的Open XML文件格式——Office 2007面面觀之(11)

 
       最近我們一直在聊有關2007 Microsoft Office system的新功能和新特性,有一個重大變革相信用過Office 2007的朋友都會留意到,這就是全新的、基於XML的文檔格式,微軟稱之爲Office Open XML格式(簡稱OOXML)。
XML是一種通用數據格式,擁有開放的格式和標準,XML格式的內容能夠通過應用程序、平臺和 Internet 瀏覽器來讀取,因此得到了廣泛的應用。而用以前的Office創建的文檔採用的都是二進制格式,包括我們非常熟悉的.doc.xls .ppt等文件,這些文件需要用戶安裝Office程序才能打開和編輯,我們也很難將文件中的數據在不同的應用程序之間移動和傳輸。二進制文件格式的不透明性阻礙了其他應用程序對Office文檔內容的訪問和交互,還有像文件受損和應用程序版本的衝突等問題也時有發生,讓人頭痛。看來採用開放的XML是勢在必行!微軟最早在Office 2000這個版本中採用了對 XML文件格式的支持,用戶可以將Office文件的二進制格式轉換爲XML格式,但由於Office文件格式的本質沒有改變,所以要想實現向通用的XML格式的轉換是一件麻煩事。在全新的Office 2007中,微軟終於正式引入了Office Open XML,並將其作爲文檔的默認格式。
請大家注意兩點:第一,Office Open XML格式並不是單純的XML格式,而是微軟推出的一種基於XML和ZIP技術的新的文檔格式,其標準是由微軟來制定的;但微軟已經承諾Open XML並無版權,向用戶免費開放,任何人都可以將Open XML整合到自己的產品中,而不需向微軟支付版權費用。第二,只有Word 2007Excel 2007PowerPoint 2007的文檔可以以Open XML新格式來保存,其他Office 2007的組件所創建的文檔將仍然採用原有的格式。
下表列出了Office 2007所支持的全新的文件格式,並說明了其中有哪些新文件格式可在WordExcelPowerPoint2000XP20032007版本之間實現互換。

 
與以往的二進制文件格式相比,全新的Open XML文件格式有很多優勢和特性,我們具體來看:
1.       交互性:

Open XML文件格式將Office文檔由封閉轉爲開放,使得Office文檔與其他應用程序和系統的交互性得到了顯著的增強,你可以採用多種方式來訪問Office文檔中的內容,即使沒有安裝Office,也能夠實現數據的交換和傳輸。另外,你還可以通過使用能夠處理XML的標準工具和技術來創建Office文檔,或者改寫Office文檔中的信息。因此對於開發人員來說,想要構建與Office文檔實現交互的應用程序將會變得易如反掌!
2.       壓縮性:

XML 是一種基於文本的格式,本身的壓縮性就非常好,而且 Open XML文件格式藉助了ZIP技術進行文檔的存儲,因此通過壓縮能夠有效地減小Office文檔的大小。據微軟官方的統計數據顯示,WordExcel文檔格式與原來相比減小了50~75%PowerPoint文檔比原來減小了25%,而且顯示效果反而有了提升。文檔大小的減少不僅可以幫助用戶提高工作效率,更能爲用戶節省成本,因爲它減小了存儲文件所需的磁盤空間,並降低了通過電子郵件和網絡傳輸文件所需的帶寬。
實際上,基於Open XML格式的文件是由一些部件組合而成的,而ZIP技術會在文檔存儲時將這些組件都封裝在一個ZIP容器中,進行壓縮打包,最終仍以一個單個文件的形式保存起來。如果你有興趣的話,可以試着將.docx.xlsx.pptxOpen XML格式的文件進行解包,查看Open XML格式的內部結構。具體方法很簡單,直接將文件的後綴名改爲.zip,然後用ZIP程序進行解壓縮即可。你會看到原來的單個文件會轉變爲一個文件夾,裏面包含了一定的目錄結構,以及一些文件,這些實際上就是原文檔中帶有的各種元數據、文檔部件、文檔屬性、縮略圖和圖形對象等等,通過這種方式,我們能夠輕鬆瞭解到Office XML格式文件的內部組成。當然你可能無法理解各個文件的具體功能,建議你去查看微軟MSDN站點上的官方說明。下面這張圖就展現了Open XML格式的內部文件結構。
3.       可靠性:

以前會常常看到有些朋友由於Office文檔的損壞而丟失掉非常重要的資料和數據,包括我自己,那種心情真的是比刀割還難受,用了無數的修復工具,最終依舊全是眼淚…… 如果你的文檔是採用Open XML格式來保存的,可就不必擔心這個問題了。正如我在前面所提到的,即使Office文檔已經損壞,無法使用Office程序打開,你也可以將文件通過ZIP解壓縮,在包中找到用於記錄所有文字信息的XML文件,以及文檔中內嵌的所有的圖片、圖表和音頻視頻等對象(如下圖所示),幫助你將由於文件的損壞或破壞而丟失信息的風險降低到最低限度。
4.       安全性:

Office文檔中可以創建宏,可以加入VBA代碼,這既擴展了Office文檔的功能,同時也可能會導致一些惡意病毒的***,使你的計算機面臨嚴重的威脅。以往,爲了能夠有效地防範宏病毒的發生,Office程序在默認狀態下會禁用宏,但這並不是解決問題的最好辦法。如今,基於Open XML格式的文檔會變得更加安全,更加透明,因爲凡是包含宏或代碼的文檔,都會以特殊的名稱保存,如Word文檔的後綴名是.docmExcel工作簿的後綴名是.xlsmPPT演示文稿的後綴名是.pptm,其中的字母“m”就代表了macro(宏),這樣你可以很清楚的識別到當前的文檔中是否有宏的存在。另外在默認情況下,新的Open XML文件格式不執行文檔中的宏和嵌入代碼,你還可以快速識別和刪除文檔中帶有的身份信息和敏感信息,如用戶名、備註和文件路徑等。因此,以Open XML格式保存的文檔將更加安全,你可以放心地與他人進行文檔的相互共享。
5.       兼容性:

我們用Office 2007創建的文檔,別人能打開嗎?能修改嗎?對於新格式兼容性,一直都是大家非常關注的問題。實際上,Office 2007具有向後兼容性,也就是說在兼容模式下,Office 2007能夠打開Office 2000XP2003所創建的二進制格式的文檔,也可以通過現成的功能,將其轉換爲Open XML格式。但早期的Office版本在默認狀態下是不支持Open XML格式的,這爲新格式的推廣帶來了一定的困難。但你完全不必擔心版本的兼容性問題,因爲微軟爲早期Office版本的用戶提供了一個免費的插件(Office 2007文件格式兼容包,下載地址:[url]http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=941b3470-3ae9-4aee-8f43-c6bb74cd1466[/url]),只要在Office中安裝了這一更新插件,即可實現對Open XML格式的兼容,也可在早期的Office程序中將文檔直接保存爲或轉換爲Open XML新格式,使各種版本的Office用戶都能體驗到Open XML格式的卓越功能和特性。這裏需要大家注意的是,有些Office 2007中的功能在兼容模式下是不支持的,比如SmartArt圖示在兼容模式下是隻讀的,無法編輯修改;比如Excel表格的隔行彩色效果在兼容模式下是看不到的。你可以使用Office 2007自帶的“兼容性檢查器”(Office 按鈕à準備à運行兼容性檢查器),對當前Open XML格式的文檔中是否帶有早期Office所不支持的功能進行檢查,兼容性的情況一目瞭然。

 

好了,以上就是我對Open XML的理解,誇了很多微軟新標準的好,肯定有人說我是微軟的託了。我沒那麼大能耐,只能說算是一個微軟技術和產品的愛好者,但我還是要提醒大家:由於大部分的用戶使用的還是早期的Office版本,並且沒有安裝兼容包,所以建議朋友們在使用Office 2007時,還是有必要把文檔另存成早期的格式一份,以防別人無法打開這些文檔。Open XML好是好,但要真正推廣開來,還是需要一個漫長的過渡期的。
微軟從自己的利益出發,打算把Open XML打造成國際標準,我覺得是可以理解的,但這一過程顯然並不那麼容易。目前的情況是,ANSI沒有給微軟好臉色,給拒了,微軟出師不利。今年9月份,ISO大會上將表決是否將微軟的Open XML文檔格式納入國際標準,情況可能也並不樂觀,因爲微軟遭遇了很多來自辦公軟件企業的阻力。我相信大家都是反對壟斷的,但我看不慣近期國內某些人士的說法和做法,表面上是鼓動國人愛國,是反對微軟的壟斷,實質上恐怕很難排除利益的驅使。我不想做過多的評論,作爲最終用戶,我只想說,不論是OOXML,還是什麼ODFUOF,我選擇我喜歡,哪個兼容性好我用哪個,哪個認可度高我用哪個。你們吵去吧,我們看看熱鬧就滿足了。呵呵~~
 

 

 

 

歡迎關注  Office 2007面面觀系列專題   by 阿拉丁

 

Section IOffice 2007組件概覽

Section IIOffice 2007新特性介紹

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章