android XML解析學習——android.Sax

一.基礎知識
  在《OPhone XML解析學習--Sax方式》中我們學習了OPhone /Android上使用Java的SAX進行XML解析的方式。而在OPhone/Android平臺上使用SAX解析XML,除了使用Java的API外,還可以使用OPhone/Android SDK帶的API來實現。OPhone/Android SDK中和SAX解析相關的包爲android.sax,在這個包中OPhone/Android提供了都有的SAX API,使用它們可以更加方便的進行SAX方式的XML解析。
  當xml文件中在不同的位置處有相同的元素標籤名時,在相應的事件回調處理函數中往往就需要進行判斷處理。比如USGS的xml形式的地震數據爲:

  1. <?xml version="1.0"?>  
  2.   <feed xmlns="http://www.w3.org/2005/Atom" xmlns:georss="http://www.georss.org/georss">  
  3.   <updated>2010-09-15T04:41:18Z</updated>  
  4.   <title>USGS M2.5+ Earthquakes</title>  
  5.   <subtitle>Real-time, worldwide earthquake list for the past day</subtitle>  
  6.   <link rel="self" href="http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml"/>  
  7.   <link href="http://earthquake.usgs.gov/earthquakes/"/>  
  8.   <author><name>U.S. Geological Survey</name></author>  
  9.   <id>http://earthquake.usgs.gov/</id>  
  10.   <icon>/favicon.ico</icon>  
  11.   <entry>  
  12.      <id>urn:earthquake-usgs-gov:ak:10078833</id>  
  13.      <title>M 2.9, Southern Alaska</title>  
  14.      <updated>2010-09-15T04:14:03Z</updated>  
  15.      <link rel="alternate" type="text/html" href="http://earthquake.usgs.gov/earthquakes/recenteqsww/Quakes/ak10078833.php"/>  
  16.      <summary type="html">  
  17.     <![CDATA[<img src="http://earthquake.usgs.gov/images/globes/60_-155.jpg" alt="59.909&#176;N 153.124&#176;W" align="left" hspace="20" /><p>Wednesday, September 152010 04:14:03 UTC<br>Tuesday, September 142010 08:14:03 PM at epicenter</p><p><strong>Depth</strong>: 98.90 km (61.45 mi)</p>]]>  
  18.      </summary>  
  19.      <georss:point>59.9094 -153.1241</georss:point>  
  20.      <georss:elev>-98900</georss:elev>  
  21.      <category label="Age" term="Past hour"/>  
  22.   </entry>  
  23.   <entry>  
  24.    <!-- 還有entry條目,省略-->  
  25.   </entry>  
  26.   </feed>  


  我們看到在<entry>開始前就有<updated>、<title>和<link>等元素標籤,而<entry></entry>元素中也包含這些標籤名,在SAX解析時都會產生相應的事件,但我們實際需要處理的爲<entry></entry>元素中的這些標籤產生的事件,因此我們設置了一個變量
  private Boolean startEntryElementFlag = false;
  來進行判斷。對以上的xml數據來說,這樣的處理還不會出現問題,但是如果需要解析一個更加複雜的XML文檔,則類似的需要對不同位置處的相同標籤名進行判斷這樣的處理可能會帶來各種各樣的Bug。
  而使用android.sax包中的API來進行SAX方式的解析則不會有以上的問題。實際上使用android.sax包還有點結合了我們以後會詳細介紹的DOM方式,首先獲取需要解析部分的根元素,然後使用getChild方法獲取具體的某個子元素,之後就可以爲具體的元素設置事件處理的回調函數,比如爲一個元素分別設置元素開始的事件處理setStartElementListener,元素包含的文本內容結束的事件處理setEndTextElementListener和元素結束的事件處理setEndElementListener。
  概括的來說,android.sax包進行XML解析的過程爲用DOM的方式獲取具體位置處的元素,然後爲其設置需要的事件處理函數。具體的實現我們可以看實例開發部分的代碼。
  OPhone/Android SDK中提供的和XML相關的還有一個類:android.util.Xml,在該類中提供了比較實用的XML相關的類方法,比如開始解析的parse方法,和直接創建XmlPullParser及XmlSerializer(這兩塊內容以後介紹)的方法等。

  下面我們就用上面介紹的OPhone/Android SDK中的SAX方式來實現解析XML形式的USGS地震數據的Demo例子。


  二.實例開發
  我們要完成的效果圖如下圖1所示:

  圖1 ListView列表顯示的地震數據


  和上一部分Demo例子的一樣,也是解析完地震數據後用ListView列表的方式顯示每條地震的震級和地名信息。
  新建一個OPhone工程OPhoneXMLDemoSaxII。
  添加進上一個Demo工程OPhoneXMLDemoSax中的EarthquakeEntry.java文件,如果需要從本地讀取xml數據的話,同時在assets文件夾下添加保存爲xml格式了的USGS地震數據USGS_Earthquake_1M2_5.xml,如果需要聯網讀取的話,在manifest.xml文件中添加權限:

  1. <uses-permission android:name="android.permission.INTERNET" />  
  2.   並修改res/layout下的main.xml爲:  
  3.   <?xml version="1.0" encoding="utf-8"?>  
  4.   <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"  
  5.   android:orientation="vertical"  
  6.   android:layout_width="fill_parent"  
  7.   android:layout_height="fill_parent"  
  8.   >  
  9.   <ListView  
  10.   android:id="@+id/list"  
  11.   android:layout_width="fill_parent"   
  12.   android:layout_height="fill_parent"  
  13.   />  
  14.   </LinearLayout>  


 接下來就來新建添加一個類AndroidSaxEarthquakeHandler,以OPhone/Android SDK提供的包android.sdk的API來完成解析地震數據的具體邏輯實現,內容如下:

  1. public class AndroidSaxEarthquakeHandler {  
  2.    //xml解析用到的Tag  
  3.    private String kRootElementName = "feed";  
  4.    private String kEntryElementName = "entry";  
  5.    private String kLinkElementName = "link";  
  6.    private String kTitleElementName = "title";  
  7.    private String kUpdatedElementName = "updated";  
  8.    private String kGeoRSSPointElementName = "point";  
  9.    private String kGeoRSSElevElementName = "elev";  
  10.    static final String ATOM_NAMESPACE = "http://www.w3.org/2005/Atom";   
  11.    static final String GEORSS_NAMESPACE = "http://www.georss.org/georss";  
  12.    //用於保存xml解析獲取的結果  
  13.    private ArrayList<EarthquakeEntry> earthquakeEntryList;  
  14.    private EarthquakeEntry earthquakeEntry;  
  15.      
  16.    //解析xml數據  
  17.    public ArrayList<EarthquakeEntry> parse(InputStream inStream)  
  18.    {  
  19.     earthquakeEntryList = new ArrayList<EarthquakeEntry>();  
  20.     RootElement root = new RootElement(ATOM_NAMESPACE, kRootElementName);  
  21.     Element entry = root.getChild(ATOM_NAMESPACE, kEntryElementName);  
  22.     //具體解析xml  
  23.     //處理entry標籤  
  24.     entry.setStartElementListener(new StartElementListener() {    
  25.      @Override  
  26.      public void start(Attributes attributes) {  
  27.       // TODO Auto-generated method stub  
  28.       earthquakeEntry = new EarthquakeEntry();  
  29.      }  
  30.     });  
  31.     entry.setEndElementListener(new EndElementListener() {   
  32.      @Override  
  33.      public void end() {  
  34.       // TODO Auto-generated method stub  
  35.       earthquakeEntryList.add(earthquakeEntry);  
  36.      }  
  37.     });  
  38.     //處理title標籤  
  39.     entry.getChild(ATOM_NAMESPACE, kTitleElementName).setEndTextElementListener(new EndTextElementListener() {  
  40.      @Override  
  41.      public void end(String currentData) {  
  42.       // TODO Auto-generated method stub  
  43.          //提取強度信息  
  44.          String magnitudeString = currentData.split(" ")[1];  
  45.          int end =  magnitudeString.length()-1;  
  46.          magnitudeString = magnitudeString.substring(0, end);  
  47.          double magnitude = Double.parseDouble(magnitudeString);  
  48.          earthquakeEntry.setMagnitude(magnitude);  
  49.          //提取位置信息  
  50.          String place = currentData.split(",")[1].trim();  
  51.          earthquakeEntry.setPlace(place);      
  52.      }  
  53.     });  
  54.     //處理updated標籤  
  55.     entry.getChild(ATOM_NAMESPACE, kUpdatedElementName).setEndTextElementListener(new EndTextElementListener() {  
  56.      @Override  
  57.      public void end(String currentData) {  
  58.       // TODO Auto-generated method stub  
  59.       //構造更新時間  
  60.       SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ss'Z'");  
  61.       Date qdate = new GregorianCalendar(0,0,0).getTime();  
  62.             try {  
  63.            qdate = sdf.parse(currentData);  
  64.          } catch (ParseException e) {  
  65.            e.printStackTrace();  
  66.          }  
  67.          earthquakeEntry.setDate(qdate);      
  68.      }  
  69.     });  
  70.     //處理point標籤  
  71.     entry.getChild(GEORSS_NAMESPACE, kGeoRSSPointElementName).setEndTextElementListener(new EndTextElementListener() {   
  72.      @Override  
  73.      public void end(String currentData) {  
  74.       // TODO Auto-generated method stub  
  75.       //提取經緯度信息  
  76.          String[] latLongitude = currentData.split(" ");  
  77.          Location location = new Location("dummyGPS");  
  78.          location.setLatitude(Double.parseDouble(latLongitude[0]));  
  79.          location.setLongitude(Double.parseDouble(latLongitude[1]));  
  80.          earthquakeEntry.setLocation(location);  
  81.      }  
  82.     });  
  83.     //處理elev標籤  
  84.     entry.getChild(GEORSS_NAMESPACE, kGeoRSSElevElementName).setEndTextElementListener(new EndTextElementListener() {  
  85.      @Override  
  86.      public void end(String currentData) {  
  87.       // TODO Auto-generated method stub  
  88.          //提取海拔高度信息  
  89.       double evel;  
  90.       //因爲USGS數據有可能會輸錯,比如爲"--10000",多了一個"-"號  
  91.          try {  
  92.           evel = Double.parseDouble(currentData);  
  93.       } catch (Exception e) {  
  94.        // TODO: handle exception  
  95.        e.printStackTrace();  
  96.        evel = 0;  
  97.       }  
  98.          Log.v("Sax_Elev", String.valueOf(evel));  
  99.          earthquakeEntry.setElev(evel);     
  100.      }  
  101.     });  
  102.     //處理link標籤  
  103.     entry.getChild(ATOM_NAMESPACE, kLinkElementName).setStartElementListener(new StartElementListener() {    
  104.      @Override  
  105.      public void start(Attributes attributes) {  
  106.       // TODO Auto-generated method stub  
  107.       //獲取link鏈接  
  108.       String webLink = attributes.getValue("href");  
  109.       earthquakeEntry.setLink(webLink);  
  110.      }  
  111.     });  
  112.     //調用android.util.Xml開始解析  
  113.     try {  
  114.      Xml.parse(inStream, Xml.Encoding.UTF_8, root.getContentHandler());  
  115.     } catch (Exception e) {  
  116.      // TODO Auto-generated catch block  
  117.      e.printStackTrace();  
  118.     }  
  119.       
  120.     return earthquakeEntryList;  
  121.    }  
  122.   }  


  開頭處定義瞭解析需要的元素標籤名稱,因爲getChild方法獲取子元素時需要命名空間,因此還新定義了USGS的xml數據中包含的兩個命名空間:
   static final String ATOM_NAMESPACE = "http://www.w3.org/2005/Atom"; 
   static final String GEORSS_NAMESPACE = "http://www.georss.org/georss";
  在定義的用於解析xml數據的方法中
  public ArrayList<EarthquakeEntry> parse(InputStream inStream)
  首先獲取xml文檔的根元素:
  RootElement root = new RootElement(ATOM_NAMESPACE, kRootElementName);
  有了根元素之後,就可以使用類似DOM的getChild方法獲取具體的某個位置處的子元素,並且可以爲具體的子元素註冊事件處理器和在對應的回調函數中實現具體的處理邏輯。
  從程序中我們可以看到,我們只爲<entry>元素和<entry></entry>包含的子元素註冊了事件處理器,因此即使xml文檔開始處有<updated>、<title>和<link>等同名的元素標籤,但也不會進行處理。因此和上一部分的Demo相比,就不再需要設置標誌變量用來判斷,而且看起來也更加簡單了。
  雖然寫法不同了,但是對具體標籤的處理邏輯和上一部分Demo中是一樣的,因爲處理的xml文檔內容沒有變。
  程序的最後調用android.util.Xml類的類方法parse直接進行解析,也更加方便了。

  1. //調用android.util.Xml開始解析  
  2.    try {  
  3.     Xml.parse(inStream, Xml.Encoding.UTF_8, root.getContentHandler());  
  4.    } catch (Exception e) {  
  5.     // TODO Auto-generated catch block  
  6.     e.printStackTrace();  
  7.    }  


   其中Xml類parse方法的ContentHandler參數由根元素通過getContentHandler()方式獲得。
  最後添加OPhoneXMLDemoSaxII.java文件中的內容,內容和上一個Demo工程OPhoneXMLDemoSax中的OPhoneXMLDemoSax.java基本一樣,

  1. public class OPhoneXMLDemoSaxII extends Activity {  
  2.   /** Called when the activity is first created. */  
  3.    //定義顯示的List相關變量  
  4.    ListView list;  
  5.    ArrayAdapter<EarthquakeEntry> adapter;  
  6.    ArrayList<EarthquakeEntry> earthquakeEntryList;  
  7.   @Override  
  8.   public void onCreate(Bundle savedInstanceState) {  
  9.   super.onCreate(savedInstanceState);  
  10.   setContentView(R.layout.main);  
  11.   
  12.   //獲取地震數據流  
  13.   InputStream earthquakeStream = readEarthquakeDataFromFile();  
  14.   //Android Sax方式進行解析  
  15.   AndroidSaxEarthquakeHandler androidSaxHandler = new AndroidSaxEarthquakeHandler();  
  16.   earthquakeEntryList = androidSaxHandler.parse(earthquakeStream);  
  17.     //用ListView進行顯示  
  18.     list = (ListView)this.findViewById(R.id.list);  
  19.     adapter = new ArrayAdapter<EarthquakeEntry>(this, android.R.layout.simple_list_item_1, earthquakeEntryList);  
  20.     list.setAdapter(adapter);  
  21.   }  
  22.   
  23.   private InputStream readEarthquakeDataFromFile()  
  24.   {  
  25.     //從本地獲取地震數據  
  26.     InputStream inStream = null;  
  27.     try {  
  28.      inStream = this.getAssets().open("USGS_Earthquake_1M2_5.xml");  
  29.     } catch (IOException e) {  
  30.      // TODO Auto-generated catch block  
  31.      e.printStackTrace();  
  32.     }  
  33.     return inStream;  
  34.   }  
  35.   private InputStream readEarthquakeDataFromInternet()  
  36.   {  
  37.    //從網絡上獲取實時地震數據  
  38.    URL infoUrl = null;  
  39.    InputStream inStream = null;  
  40.    try {  
  41.      infoUrl = new URL("http://earthquake.usgs.gov/earthquakes/catalogs/1day-M2.5.xml");  
  42.      URLConnection connection = infoUrl.openConnection();  
  43.      HttpURLConnection httpConnection = (HttpURLConnection)connection;  
  44.      int responseCode = httpConnection.getResponseCode();  
  45.      if(responseCode == HttpURLConnection.HTTP_OK)  
  46.      {  
  47.       inStream = httpConnection.getInputStream();  
  48.      }  
  49.     } catch (MalformedURLException e) {  
  50.      // TODO Auto-generated catch block  
  51.      e.printStackTrace();  
  52.     } catch (IOException e) {  
  53.      // TODO Auto-generated catch block  
  54.      e.printStackTrace();  
  55.     }  
  56.     return inStream;  
  57.   }  
  58.   }  

  只是把進行SAX解析的部分換成了如下方式:

  1. //Android Sax方式進行解析  
  2.   AndroidSaxEarthquakeHandler androidSaxHandler = new AndroidSaxEarthquakeHandler();  
  3.   earthquakeEntryList = androidSaxHandler.parse(earthquakeStream);  


  完成了,可以保存運行看下效果。

  三.總結
  OPhone/Android平臺提供了相當強大的XML解析支持,不僅包含了Java SDK中用來XML處理的API,而且OPhone/Android SDK還提供了特有的用於SAX解析XML的包android.sax。使用這個包中的API可以更加方便解析,特別是當要解析的xml文檔中在不同的層級位置處有多個相同名稱的標籤但需要分別進行不同處理時,同時也有更好的魯棒性,減少解析時產生Bug的可能性。
  以上我們介紹的都是SAX方式解析XML,而解析XML常用的還有DOM方式,這部分內容我們以後接着學習。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章