用JAVA和XML構建分佈式系統

可擴展標記語言(XML)作爲一種簡單的、中性的、易讀的數據表示形式已經變得越來越流行,許多軟件廠商宣佈的“支持XML",意味着他們的產品將能生成 或處理XML數據。XML也被看作再企業間交換數據最佳格式。它允許企業在所交換的數據的XML的文檔類型定義(Document Type Definitions,DTDs)或模式(Schema)上取得一致。這些DTDs或Schema是獨立於企業使用的數據庫模式的。
本文將用研究在不同計算機之間通訊與處理XML數據的分佈式系統的構建方法,主要是運行在不同的虛擬機上的JAVA應用之間的XML通訊。

XML通訊
萬維網協會(World Wide Web Consortium, W3C)在XML規範中定義了XML的語法和語義。爲了處理XML數據,XML文檔必須經過解析。W3C定義了文檔對象模型(DOM),它是應用程序員處 理XML數據的接口。DOM已經有包括JAVA在內的許多語言的實現。JAVA應用程序可以通過DOM API來訪問XML數據。XML解析器將產生XML文檔的DOM表示。
圖1說明了處理XML文檔的JAVA分佈式應用的簡單模型。這個模型假設數據可以從諸如關係數據庫之類的數據源得到。JAVA代碼處理數據並最終產生DOM表示,這些代碼表示爲圖中的處理器。

處理器代碼將DOM代表的XML數據傳給發送者。發送者是與接收者進行XML數據通訊的JAVA代碼。接收者JAVA代碼來接受XML數據,產生DOM表示的數據並把它傳送給另一個處理器。簡而言之,發送者和接收者抽象了DOM表示的XML數據的通訊。
發送者和接收者不是在同一個JAVA虛擬機上執行的。他們是通過分佈式系統的構件來相連的。無論是接收者還是發送者都既是客戶端又是服務器端,兩者的數據傳輸都是雙向的。

Xbeans
就像將要看到的一樣,在本文中描述的發送者和接收者的三種實現方法都都是通過Xbeans來實現。Xbeans是一種接受XML數據作爲輸入,處理這個輸 入然後向下一個Xbeans輸出XML結果的軟件構件。Xbeans的輸入輸出都是XML的DOM文檔,亦即傳送給Xbeans的不是需要XML解析器解 析的字符串,而是通過W3C的標準DOM API解析成了文檔對象。圖2說明了一個Xbeans。

Xbeans是JavaBeans,支持封裝、重用、連接和客戶化Java代碼。通過適當的一些Xbeans和JavaBeans的設計工具,我們就能編 很少的代碼構建非常有用的分佈式應用。 Xbeans從IBM的XML的JAVA開發工具包而來,在其上作了少量修改以便更適合分佈式的應用。Xbeans能夠從www.Xbeans.org的 開放源碼項目中免費獲得。

實現發送方和接收方
下面將介紹用JAVA實現發送者和接收者的三種不同的方法。然後對每種方法作一個簡單的分析。
方法一:用標準的web 服務器
這種方法將只是簡單的將XML作爲文本發送給遠程計算機上的web服務器。發送方必須將DOM表示的XML轉化爲文本來與接收方進行通訊。然後,接受方必須將文本還原爲DOM表示,如圖3:

以下代碼段用HTTP來實現發送者。這裏用到了IBM Java開發包中的DOMWriter類來實現DOM表示到文本XML表示的轉換。





public void documentReady(DOMEvent evt)

throws XbeansException {

try {

URL receiver = new URL (getRemoteURL ());

URLConnection receiverConnection = receiver.openConnection();

receiverConnection.setDoOutput(true);

//向發送者打開一個輸出流然後發送文本形式的XML數據

OutputStream out = receiverConnection.getOutputStream();

DOMWriter writer = new DOMWriter();

writer.setPrintWriter(new PrintWriter(out));

writer.documentReady(

new com.ibm.xml.xpk4j.dom.DOMEvent( this,evt.getDocument()));

out.close(); // 爲結果打開一個輸入流

BufferedReader in = New BufferedReader(

new InputStreamReader(receiverConnection.getInputStream()));

// 處理結果:"OK" 表示成功;"Exception" 表示輸入流串行化異常

...

in.close();

} catch (Throwable e) {

e.printStackTrace(System.err);

}

}




注意到以上的documentReady()方法用remoteURL屬性得到服務器上的CGI腳本的URL。爲了與HTTP兼容,CGI腳本類用字符 串”Content-type: text/html"封裝接收者的輸出。這個腳本然後調用服務器上的the receiverMain()方法。 Main()函數只是簡單的實例化接收者然後調用其receiveDocument()方法。





import org.xbeans.communication.stdio.receiver.*;

public class receiverMain {

static Bean theReceiver = new Bean();

public static void main(String[] args) {

theReceiver.receiveDocument();

}

}


最後receiveDocument()方法的代碼段將重新生成DOM表示以便進一步處理。這裏用到了IBM的XML解析器。





DOMParser parser = new DOMParser(); // 構造解析器

try { // 調用解析器

parser.parse(new InputSource(System.in));

} catch (Throwable e) {

throw new XbeansException("","receiver","io error parsing incoming document",

"io error parsing incoming document "+e);

}

//將文檔傳向下一個bean

DOMListener.documentReady(new DOMEvent(this,parser.getDocument()));


方法二:通過JAVA遠程方法調用串行化文檔
這個方法通過JAVA遠程方法調用(JAVA RMI)和DOM串行化(serialization)來從發送者向接收者傳輸XML DOM 文檔。如圖4:

以下代碼用JAVA遠程方法調用實現發送方與接受方的通訊.





public void documentReady(DOMEvent evt) throws XbeansException {

if (DOMListener==null) {

try {

DOMListener = (DOMListener)Naming.lookup(getReceiverName());

} catch (Exception e) {

throw new XbeansException( evt.getDocument().getNodeName(),

"sender", "error obtaining remote receiver",

"The name may be wrong or the network may be down.");

}

}

DOMListener.documentReady(evt); }


以下是接受方的JAVA 遠程方法調用的實現。setName()方法將接受這傳送給RMI註冊(registry),documentReady()方法僅僅將接收到的文檔傳送給下一個組件。





public void setReceiverName(String newName) {

try {

if (receiverName!=null) Naming.unbind(receiverName);

receiverName = newName;

Naming.rebind(receiverName, this );

} catch( Exception e ) {

System.out.println( e );

}

}



public void documentReady(Document incomingDocument)

throws RemoteException, XbeansException {

if (DOMListener==null) {

throw new XbeansException(incomingDocument.getNodeName(),"rmiReceiver",

"next component not established", "The component needs to be configured.");

}

DOMListener.documentReady(new DOMEvent(this,incomingDocument));

}


方法三:CORBA-IIOP
第三方法用CORBA-IIOP(CORBA over Internet Inter-ORB Protocol)來傳輸數據。對象管理組織(OMG)正在建議擴展接口定義語言(IDL)將XML數據類型包括進去。這樣,將來CORBA產品將能傳輸 XML數據。如圖5所示:

以下的OMG IDL給出了發送者和接收者CORBA實現的接口。





exception RemoteReceiverException {

string remoteIdentifier;

string documentName;

string componentName;

string message;

string moreMessage;

};



typedef sequence byteArray;

interface XMLReceiver {

void documentReady(in byteArray serializedDocument)

raises(RemoteReceiverException);

};


以下代碼用JAVA串行化DOM和CORBA實現發送者。





public void documentReady(DOMEvent evt) throws XbeansException {

Document documentToSend = evt.getDocument();

try {

ByteArrayOutputStream bastream = new ByteArrayOutputStream();

ObjectOutputStream p = new ObjectOutputStream(bastream);

p.writeObject(documentToSend);

p.flush();

org.omg.CORBA.ORB orb = org.omg.CORBA.ORB.init( new String[0],

System.getProperties());

XMLReceiver receiver = urlToObject(orb,getReceiverURL());

receiver.documentReady(bastream.toByteArray());

} catch (RemoteReceiverException rre) {

throw new XbeansException(rre.remoteIdentifier, rre.documentName,

rre.componentName, rre.message,rre.moreMessage);

} catch (Throwable e) {

throw new XbeansException("","sender", "error sending document "+e,

"error sending document "+e);

}

}


以下代碼用JAVA串行化DOM和CORBA實現接收者。





public void documentReady(byte[] serializedDocument)throws RemoteReceiverException {

// 反串行化字節流

ByteArrayInputStream bais = new ByteArrayInputStream(serializedDocument);

Document theDocument;

try {

ObjectInputStream ois = new ObjectInputStream(bais);

theDocument = (Document)ois.readObject();

} catch(Throwable e) {

throw new RemoteReceiverException(corbaName,"incoming document","receiver",

"error deserializing document","error deserializing document"+e);

}

try { //將文檔傳向監聽者

local.DOMListener.documentReady(new DOMEvent(this,theDocument));

} catch (XbeansException xbe) {

throw new RemoteReceiverException( xbe.remoteIdentifier(),

xbe.documentName(),xbe.componentName(),

xbe.message(),xbe.moreMessage());

}

}


分析:
測試表明,純文本表示的XML要比DOM串行化表示性能更好。同時,解析DOM和文本所用的時間也要比用JAVA直接串行化和法串行化所用的時間少。
標準的web服務器方式的優勢是其應用基礎要廣泛許多。CGI腳本能夠在絕大多數web服務器上運行,而且,接受方能夠很容易的通過URL標識。而對於 RMI,則需要RMI註冊。CORBA的解決辦法則需要在服務器上安裝對象請求代理(Object Request Broker,ORB ),而且,CORBA發送者的實現使用的是一個URL的命名模式而不是接收者的CORBA對象引用,用一個字符串與一個URL相聯繫,然後在客戶端轉化。
CORBA 和RMI支持JAVA 客戶端到JAVA服務器的解決方案。沒有CGI腳本也不需要從標準輸入中讀取編碼異常。而且,不需要在發送者每次用XML通訊時都啓動一個JAVA虛擬機。他們兩則均支持接收者的自動激活。
JAVA RMI方式只能在JAVA代碼之間工作,對於web服務器包括CORBA理論上能在任何編程語言之間通訊。對於JAVA串行化的DOM來說,即便是客戶端 和服務器端均需要是JAVA代碼的要求不是問題,它還存在另外一個困難,即JAVA串行化要求客戶端和服務器運行的是相同的DOM實現。

結論
正如上面所述,有許多方法可以實現在JAVA分佈式應用中發送XML數據,每一種方法的性能和互操作性都是不同的。重要的是應該把XML通訊從分佈式應用 邏輯中抽取出來。也就是,實現發送和接受XML的代碼應和應用邏輯的代碼中分離出來。通過把代碼打包成軟件組件,就能夠改變發送方和接受方的代碼而不會影 響到應用其餘實現。 
發佈了45 篇原創文章 · 獲贊 15 · 訪問量 18萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章