用 Asp.Net 建立一個在線 RSS 新聞聚合器

用 Asp.Net 建立一個在線 RSS 新聞聚合器

原著:Scott Mitchell
翻譯:汪泳

原代碼下載:RSSAggregator.msi
原文出處:Creating an Online RSS News Aggregator with ASP.NET

概要

  本文講解了如何使用 XML Web 控件獲取遠程XML數據並在 ASP.NET 頁面顯示這些XML數據,以及使用Repeater控件發佈數據庫中的XML數據。在過去的幾年間,隨着異構平臺間共享數據的需求不斷增長,XML的使用也呈爆炸性增長。意識到這種趨勢,微軟在整個.NET框架中對 XML 提供了健壯的支持。這意味着,對於 ASP.NET 開發者來說,在Web頁面 中顯示和處理 XML 數據從來沒有這麼容易過。本文將通過生成一個 RSS2.0 聚合引擎和在線新聞聚合器來學習 XML 和 ASP.NET 技術。 本文假設讀者熟悉 ASP.NET 和 XML。

目錄

簡介
使用 RSS 2.0 規範的聚合內容
通過 ASP.NET 頁面輸出聚合內容
在 ASP.NET 頁面中使用聚合摘要
顯示聚合摘要列表
顯示特定聚合摘要的新聞項
顯示特定新聞項的詳細內容
未來的擴展和當前程序的缺點
總結

簡介

  隨着辦公室和家庭上網在線時間的延長,以及 Web 站點和可訪問的互聯網應用程序呈持續爆炸性增長,應用程序之間能數據共享變得越來越重要。在異構平臺之間共享數據需要一種平臺中立的數據格式,這種數據格式要求能易於通過標準的互聯網協議來傳輸,而這正是XML的用武之地。因爲XML文件本質上只是一個文本文件,其編碼格式衆所周知,而且現有的XML解析器能爲所有主流編程語言所用,所以XML數據能被任何平臺輕鬆使用。
  Web 網站聚合就是一種使用 XML 來共享數據的範例,在新聞站點和網誌中經常可以看到。採用 Web 網站聚合技術,網站能以 XML 格式的 Web 可訪問的聚合文件來發布最新內容。網站使用的聚合格式有很多種,其中最流行的一種格式就是 RSS2.0。( RSS2.0 規範被髮布在 Harvard Law 網站 的技術欄目上)。此外,MSDN 雜誌有一個聚合文件:MSDN雜誌:本期刊物, 其中列出了最新一期 MSDN 雜誌上的文章,包括到在線版本文章的鏈接。
  一旦 Web 站點有了公開發布聚合文件,那麼不同的客戶端就可以消費它。消費聚合文件的方式有很多種,比如,某個提供 .NET 技術資源的站點可能希望在網站中 添加最新的 MSDN 雜誌文章標題。聚合文件還常常被新聞聚合器程序所用,這種程序被專門設計用來獲取和顯示不同來源的聚合文件。
  隨着人們越來越注重使用 XML 數據,在 ASP.NET 頁面中處理 XML 數據的能力變得比以往更關鍵。既然 Web 站點聚合如此重要, 本文我們就來創建一個 Web 站點聚合文件生成程序和一個在線新聞聚合器。在建立這兩個微型程序的過程中,我們將講述如何訪問和顯示XML數據,不論這些數據是來自遠端的Web服務器還是本地的文件系統。我們將演示如 何多種不同的方法顯示XML數據,比如:用 Repeater 控件以及用 ASP.NET XML Web控件。
  因爲這只是一篇小文章,不可能長篇大論,我會假設讀者您熟悉 XSLT 和 XPath。如果您不熟悉,建議在看這篇文章之前先訪問以下資源:
使用 RSS 2.0 規範的聚合內容
  本文我們將要創建的第一個微型程序是一個聚合文件生成器。針對這個迷你程序,假設你是一個大型新聞網站(如 MSNBC.com)的 Web 開發者,所有的新聞內容都保存在 Microsoft SQL Server 2000 數據庫中。具體地說,這些文章是 都保存在一個名爲 Articles 的表中,表中以下字段與我們的程序密切相關:
  • ArticleID—主鍵,自增長的整型字段,用來唯一標識每一篇文章;
  • Title— 指定標題,字段數據類型: varchar(50);
  • Author—指定作者,字段數據類型: varchar(50);
  • Description—新聞內容描述,字段數據類型: varchar(2000);
  • DatePublished—新聞發佈日期,字段數據類型:datetime
  請注意,Articles 表中可能還有其它字段,上面所列的只是我們在創建聚合文件的時候所要用到的字段。而且,這只是一個非常簡單的數據模型,在 是應用的數據庫環境中,你可能會使用更加標準化的數據庫模型,比如具備一個單獨的 authors (作者)表,有一個建立作者和文章之間多對多關係的表等等。
  下一步,我們將創建一個ASP.NET頁面,用格式化好的 RSS2.0 XML 文件顯示一個最新的新聞列表。在講述如何在 ASP.NET 頁面 中完成這種轉換之前,我們要先介紹一下 RSS2.0 規範的內容。我們應該記住,在整個規範中,RSS 是被設計用來爲聚合內容提供一個數據模型。那麼 毫無疑問,它會有一系列的 XML 元素,用來描述 Web 站點要聚合的內容信息,以及一系列用來描述某一特定新聞項的 XML 元素。最後,不要忘記 RSS 聚合文件是一個 XML 格式文件,必須符合 XML 格式化的準則, 也就是:
  • 所有 XML元素必須正確嵌套;
  • 所有的屬性值要用引號包含起來;
  • <, >, &, "和''符號要相應地替換爲 &lt;,&gt;, &amp;, &quot; 和 &apos;;
  而且,XML格式是大小寫敏感的,這就意味着,XML元素的起始和終止標籤必須匹配,拼寫和大小寫都必須一致。
  RSS2.0 的根元素是<rss>元素,這個元素可以有一個版本號的屬性,例如:
<rss version="2.0">
  ...
</rss>
<rss>元素只有一個子元素<channel>,用來描述聚合的內容。在<channel>元素裏面有三個必需的子元素,用來描述 Web 站點的信息。這三個元素是:
  • title—定義聚合文件的名稱,一般來說,還會包括Web站點的名稱;
  • link—Web站點的URL;
  • description—Web站點的一段簡短的描述。

除此之外,還有一些可選元素來描述站點信息。這些元素的更多信息請參見 RSS2.0規範

每一個新聞項目放在一個單獨的<item>元素中。<channel>元素可以有任意數量的<item>元素。每個<item>元素可以有多種的子元素,唯一的要求是最少必須包含<title>元素和<description>元素其中一個作爲子元素。以下列出了一些相關的<item> 子元素:

  • title—新聞項目的標題;
  • link—新聞項目的URL;
  • description—新聞項目的大綱;
  • author—新聞項目的作者;
  • pubDate—新聞項目的發佈日期
  下面是一個非常簡單的 RSS2.0 聚合文件。你可以從 RSS generated by Radio UserLand 看到其他的RSS2.0文件的例子。
<rss version="2.0">
  <channel>
    <title>Latest DataWebControls.com FAQs</title>
    <link>http://datawebcontrols.com</link>
    <description>
        This is the syndication feed for the FAQs 
        at DataWebControls.com
    </description>
    <item>
      <title>Working with the DataGrid</title>
      <link>http://datawebcontrols.com/faqs/DataGrid.aspx</link>
      <pubDate>Mon, 07 Jul 2003 21:00:00 GMT</pubDate>
    </item>
    <item>
      <title>Working with the Repeater</title>
      <description>
         This article examines how to work with the Repeater 
         control.
      </description>
      <link>http://datawebcontrols.com/faqs/Repeater.aspx</link>
      <pubDate>Tue 08 Jul 2003 12:00:00 GMT</pubDate>
    </item>
  </channel>
</rss>      
  關於<pubDate>元素的格式有一點特別重要,再此要講一下。RSS 要求日期必須按照 RFC822 日期和時間規範 進行格式化,此格式要求:開頭是一個可選的3字母星期縮寫加一個逗號,接着必須是日加上3字母縮寫的月份和年份,最後是一個帶時區名的時間。另外,要注意 <description> 子元素是可選的:上 述文件第一個新聞沒有 <description> 元素,而第二個新聞就有一個。
通過 ASP.NET 頁面輸出聚合內容
  現在,我們已經知道了如何按照 RSS2.0 規範存儲我們的新聞項,我們已經就緒創建一個 ASP.NET 頁面,當用戶發出請求時,就會返回網站聚合 的內容。更確切地說,我們將建立一個名字叫 rss.aspx 的 ASP.NET 頁面,這個頁面會按照 RSS2.0 規範的格式返回 Articles 數據庫表中的最新的 5 個新聞項 。
  可以有幾種方法來完成這件事,稍後將會講到。但是現在,我們首先要完成一件事,那就是先要從數據庫中獲得最新的5個新聞項。這可以用下面的 SQL 查詢語句獲得:
SELECT TOP 5 ArticleID,Title,Author,Description,DatePublished FROM Articles ORDER BY DatePublished DESC
  獲得了這些信息以後,我們需要把這些信息轉換成相應的 RSS2.0 格式聚合文件。要把數據庫的數據顯示爲XML數據最簡單、快速的方法就是使用 Repeater 控件。準確地說,Repeater 控件 將在 HeaderTemplate 和 FooterTemplate 模版裏顯示<rss>元素、<channel>元素以及站點相關的 元素標籤,在 ItemTemplate 模版裏面顯示 <item> 元素。下面是我們這個 ASP.NET 頁面(.aspx文件)的 HTML 部分 :
<%@ Page language="c#" ContentType="text/xml" Codebehind="rss.aspx.cs"
  AutoEventWireup="false" Inherits="SyndicationDemo.rss" %>
<asp:Repeater id="rptRSS" runat="server">
  <HeaderTemplate>
    <rss version="2.0">
      <channel>
        <title>ASP.NET News!</title>
        <link>http://www.ASPNETNews.com/Headlines/</link>
        <description>
          This is the syndication feed for ASPNETNews.com.
        </description>
  </HeaderTemplate>

  <ItemTemplate>
        <item>
          <title><%# FormatForXML(DataBinder.Eval(Container.DataItem,
                                              "Title")) %></title>
          <description>
             <%# FormatForXML(DataBinder.Eval(Container.DataItem, 
                                     "Description")) %>
          </description>
          <link>
             http://www.ASPNETNews.com/Story.aspx?ID=<%# 
                   DataBinder.Eval(Container.DataItem, "ArticleID") %>
          </link>
          <author><%# FormatForXML(DataBinder.Eval(Container.DataItem, 
                                             "Author")) %></author>
          <pubDate>
             <%# String.Format("{0:R}", 
                  DataBinder.Eval(Container.DataItem, 
                                         "DatePublished")) %>
           </pubDate>
        </item>
  </ItemTemplate>

  <FooterTemplate>
      </channel>
    </rss>  
  </FooterTemplate>
</asp:Repeater>      
  首先要注意的是:上面這段代碼例子只包括 Repeater 控件,沒有其它的 HTML 標記或 Web 控件。這是因爲我們希望頁面只輸出 XML 格式的數據。實際上,觀察一下 @Page 指令,你就會發現 ContentType 被設置爲XML MIME 類型(text/xml)。其次要注意的是:在 ItemTemplate 模版裏,當 在 XML 輸出中添加數據庫字段Title、Description 和 Author 時,我們調用了輔助函數 FormatForXML()。我們 很快就會看到,該函數被定義在後臺編碼的類中,其作用只是將非法的 xml 字符替換爲它們對應的合法的轉義字符。最後我們應該注意,在 <pubDate> 元素裏面的數據庫字段 DatePublished 是用 String.Format 來格式化的。標準的格式描述符“R”對 DatePublished 的值進行相應的格式化 。
  此 Web 頁面的後臺編碼類代碼並不複雜。Page_Load 事件處理函數只是將數據庫查詢結果綁定到 Repeater控件,FormatForXML()函數根據需要做一些簡單的字符串替換。爲 簡單起見,下面的例子只列出了這兩個函數的代碼:
在瀏覽器中訪問 rss.aspx 頁面的截圖參見圖一。

圖一 通過瀏覽器訪問 Rss.aspx 頁面

  在我們生成在線新聞聚合器之前,讓我談談這個聚合引擎一些可能的增強功能。首先,每一次訪問 rss.aspx 頁面的時候,都要訪問一次數據庫。如果預期可能有大量的人頻繁地訪問 rss.aspx 頁面,使用輸出緩存是很有價值的。其次,通常新聞網站會將聚合的內容分爲不同的類別。例如:News.com 有一些專門的聚合內容區, 比如針對企業計算、電子商務、通信的內容等等。在數據庫表 Articles 中加入表示類別的 Category 字段就可以很容易地提供這種支持。這樣 一來,在 rss.aspx 頁面中,可以接收一個表示顯示分類的查詢參數,然後只搜索指定的新聞項分類即可。

在 ASP.NET 頁面中使用聚合摘要

  爲了測試我們剛建立的聚合引擎,我們將創建一個在線新聞聚合器,允許採集任意數量的聚合內容摘要。聚合器的界面很簡單,參見圖二。它包括三個框架頁面。左邊框架以列表形式列出了不同的聚合內容摘要。右上部框架顯示所選的聚合內容摘要包含的新聞項以及查看該新聞項的鏈接。最後,在右下部框架則顯示選中的新聞項標題和內容。順便提及一下,這樣的界面基本上是各種類型的聚合器的一個事實上的標準界面,包括新聞聚合器、email客戶端軟件和新聞組閱讀器都是這樣的界面。

圖二 新聞聚合器用戶界面的截圖

  第一步是創建一個html頁面來建立框架用戶界面。幸運的是,在Visual Studio.NET 2003 中,這一過程非常容易。只需要在Web應用程序解決方案中添加一個新 的項目,選擇新項目類型爲 Frameset。(我在我的工程中將這個新文件命名爲 NewsAggregator.htm。我之所以將它設置爲 html 文件而不是 asp.net 頁面, 是因爲這個頁面只包括建立框架的 html 代碼。每一個單獨的框架會顯示一個 asp.net 頁面)。下一步,參見圖三,Frameset 模版嚮導會啓動,簡單地選擇選項“Nested Hierarchy”,然後按ok按鈕就可以了。


圖三 VS2003 中 Frameset 模版嚮導畫面

  然後 Frameset 模版嚮導會創建一個HTML頁面,裏面已經加入了框架的源代碼。 只要將左邊框架的src屬性設置爲 DisplayFeeds.aspx,它是列表顯示聚合摘要 asp.net 頁面的 url。至此 NewsAggreator.htm 頁面就完成了。
  以下三個部分,我們將講述如何創建在線新聞聚合器的三個組件,它們分別是顯示聚合摘要列表的 DisplayFeeds.aspx;顯示特定聚合摘要新聞項 的 DisplayNewsItems.aspx;以及顯示指定聚合摘要特定新聞項具體內容的 DisplayItem.aspx。

顯示聚合摘要列表

  現在我們需要創建 DisplayFeeds.aspx 頁面。該頁面要顯示訂閱的聚合摘要列表。作爲示範,我將這些聚合摘要放在一個叫 Feeds 的數據庫表中。當然你也可以將它們放在一個XML文件中。表 Feeds 有如下四個字段:

  • FeedID—主鍵,自增長整數類型,唯一標示一個摘要
  • Title—摘要名稱,數據庫字段類型:varchar(50)
  • URL—RSS 摘要的 URL,數據庫字段類型:varchar(150)
  • UpdateInterval—摘要更新頻率(分鐘),數據庫字段類型:int
DisplayFeeds.aspx 頁面使用一個 DataGrid 控件顯示聚合摘要的列表。這個 DataGrid 只有一個 HyperLinkColumn 列,顯示 Title 字段的內容並且鏈接到 DisplayNewsItems.aspx 頁面, 在查詢字符串中 要傳遞 FeedID 字段的值。以下是 DataGrid 控件的聲明,爲簡單起見,省略了一些無關的部分):
<asp:DataGrid id="dgFeeds" runat="server" 
             AutoGenerateColumns="False" ...>
   ...
   <Columns>
     <asp:HyperLinkColumn Target="rtop" 
         DataNavigateUrlField="FeedID" 
         DataNavigateUrlFormatString="DisplayNewsItems.aspx?FeedID={0}"
         DataTextField="Title" HeaderText="RSS Feeds">
     </asp:HyperLinkColumn>
   </Columns>
</asp:DataGrid>      
  這裏要注意的關鍵是 HyperLinkColumn 列的定義。它的 Target 屬性設置爲右上部分框架的名稱,這樣當用戶點擊的時候,DisplayNewsItems.aspx 頁面就會顯示在右上部分的框架中。另外, 屬性 DataNavigateUrlField、DataNavigateUrlFormatString 和 DataTextField 也做了相應的設置, 以便超鏈接顯示摘要的標題,並且當點擊它時,就會將用戶帶到 DisplayNewsItems.aspx 頁面,並在查詢串中將 FeedID 字段的內容傳 過來。(該頁面的後臺代碼類只訪問來自 Feeds 表的摘要清單,按照 Title 字段的字母順序返回,接着將查詢結果綁定到 DataGrid 控件。 由於篇幅所限,本文在此不列出代碼。)
顯示特定聚合摘要的新聞項

  我們面臨的下一個任務是創建 DisplayNewsItems.aspx 頁面。這個頁面會以鏈接的形式顯示所選聚合摘要的新聞項標題,當點擊標題時,新聞的內容就會顯示在右下部分的框架中。要完成這一任務,我們會面臨以下兩個主要的挑戰:

  • 通過指定的 URL 訪問 RSS 聚合摘要;
  • 將接收到的 XML 數據轉換爲相應的 HTML;
  幸運的是,在.NET 框架中,要實現這兩個任務都不是很難。對於第一個任務,只需要兩行代碼,我們就可以將遠程的xml數據裝載到一個XmlDocument對象中。而第二個任務呢, 藉助 ASP.NET XML Web 控件在ASP.NET 頁面中顯示XML數據也比較容易。
  XML Web 控件被設計用於在 Web 頁面中顯示原始或者轉換過的 XML 數據。使用 XML Web 控件的第一步是定義XML數據源,通過 定義一系列的屬性,用許多方法都可以完成這一工作。使用 Document屬性,你可以指定一個 XmlDocument 實例作爲 XML Web 控件的 XML 數據源。如果XML數據存在於 Web 服務器文件系統的一個文件中,可以用 DocumentSource 屬性,只要提供該 XML 文件的相對或者絕對路徑就可以了。最後,如果你 的 XML數據是一個字符串,那麼你可以將這個字符串的內容賦給控件的 DocumentContent 屬性。這三種辦法都可以將 XML 數據與 XML 控件聯繫起來。
  通常,在將 XML 數據顯示到 Web 頁面之前,我們會以某種方式轉換 XML 數據。XML Web 控件允許我們指定一個 XSLT 樣式表來做這個轉換工作。與 XML 數據相似,XSLT 樣式表可以通過 兩個屬性之一,以兩種不同的方式中的一種來設置,一是 Transform 屬性可被賦值給 XslTransform 實例,二是將本地 Web 服務器上 XSLT文件的 相對或絕對路徑賦予 TransformSource 屬性。
  現在我們來創建 DisplayNewsItems.aspx 頁面。在添加 XML Web 控件以及編寫後臺代碼類之前,我們需要在 HTML 部分加入一小段客戶端 JavaScript 代碼。準確地說,是在 html 部分的 <head> 標籤裏面 添加如下的<script>代碼塊:
<script language="javascript">
  // display a blank page in the bottom frame when the news items loads
  parent.rbottom.location.href = "about:blank";
</script>      

  每當 DisplayNewsItems.aspx 頁面裝載的時候,這段客戶端 JavaScript 代碼會在右下角的框架中顯示一個空白頁。爲了理解爲什麼要加入這段代碼,我們來看看省略這段代碼,我們會碰到什麼情況:

  1. 用戶在左邊的框架中點擊聚合摘要,瀏覽器會在右上部的框架中裝載摘要新聞項;
  2. 用戶在右上部框架中點擊某個新聞項,瀏覽器會在右下部框架中裝載這個新聞項 的詳細內容;
  3. 現在用戶在左邊的框架中點擊其它的聚合摘要,瀏覽器會在右上部分的框架中裝載新的摘要新聞項;
  現在,前一個新聞項的詳細內容還顯示在右下部的框架中!通過上面的客戶端 Javascript 代碼,每次點擊左面框架的摘要便可以清除右下部框架 的內容,以消除這一瑕疵。
  現在我們處理了客戶端代碼的問題之後,讓我們把注意力轉到添加 XML Web 控件。一旦加入 XML Web 控件,將其 ID 屬性設置爲 xsltNewsItems,TransformSourc 屬性設置爲 NewsItems.xslt(我們將要創建的 XSLT 樣式表文件的名稱)。現在,在 Page_Load 事件處理函數中,我們需要 在某個 XmlDocument 實例中獲取遠程 RSS 聚合文件,然後將該 XML Web 控件的 Document 屬性賦給該 XmlDocument 實例。
  在 Page_Load 事件處理函數中,與我們要實現的任務有密切關係的代碼是最後三行代碼。這三行代碼創建一個新的 XmlDocument 對象, 加載遠程 RSS 摘要內容,然後將這個 XmlDocument 對象賦給 XML Web 控件的 Document 屬性。訪問遠程 XML 數據並 將它們顯示在 ASP.NET 頁面中就是這麼簡單,難道給你留下的印象不深嗎?
  剩下我們要做的一件事就是創建 XSLT 樣式表,NewsItems.aspx。下面是樣式表的第一版的草稿:
<?xml version="1.0" encoding="UTF-8" ?>
<xsl:stylesheet version="1.0" 
            xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
   <xsl:output method="html" omit-xml-declaration="yes" />

   <xsl:template match="/rss/channel">
      <b><xsl:value-of select="title" 
                   disable-output-escaping="yes" /></b>
      <xsl:for-each select="item">
         <li>
            <a>
               <xsl:attribute name="href">
                  DisplayItem.aspx?ID=<xsl:number value="position()" />
   </xsl:attribute>
               <xsl:attribute name="target">rbottom</xsl:attribute>
               <xsl:value-of select="title"
                       disable-output-escaping="yes"  />
            </a>
            (<xsl:value-of select="pubDate" />)
         </li>
      </xsl:for-each>
   </xsl:template>
</xsl:stylesheet>      
  這個XSLT樣式表只有一個模版,用於匹配“/rss/channel”XPath表達式。這個模版先是以粗體顯示<title>元素的內容。然後,循環獲取每一個<item>元素,對於每一個元素,顯示一個到 DisplayItem.aspx 頁面的超鏈接,在查詢字符串中傳遞<item>元素的位置屬性。要留意超鏈接的 target 屬性設置爲 rbottom,右下部框架的名稱。最後,顯示每一個新聞項的標題和<pubDate>元素。
  該 XSLT 樣式表中有兩個項目,並不是每個人都熟悉。首先是 <xsl:value-of> 元素中的 disable-output-escaping="yes" 屬性。從本質上講,這個屬性的設置通知 XSLT 引擎不要轉義那些非法的 XML 字符,比如:&, < , >, " 和 ''。爲了理解這個設置的意義,就要知道,如果不設置該屬性(也就是設置爲默認值"no"),那麼如果標題包含一個轉義的&字符&amp;,那麼輸出的 html 文件中也會有一個&amp;,而不單單是一個字符&。如果你再仔細想一想,你會發現這種情況會導致很多問題。例如,假設一個聚合文件的標題是Matt''s &lt;i&gt;Cool&lt;/i&gt; Blog”,如果輸出轉義沒有被禁止,那麼輸出就會保留 “Matt''s &lt;i&gt;Cool&lt;/i&gt; Blog”,在 Web 頁面就會顯示爲 "Matt''s <i>Cool</i> Blog"。當用 disable-output-escaping="yes"設置禁止輸出轉義時,輸出就不會被轉義,上面的內容就會被當作“Matt''s <i>Cool</i> Blog”,顯示在頁面上就是我們想要的“Matt''s Cool Blog”。
另一個要注意的是元素<a>。這個奇怪的語法會生成下面的輸出內容:
<a href="DisplayItem.aspx?ID=position">news item title</a>
  之所以要使用這種語法,是因爲要給 XSLT 樣式表中某個你要創建的元素添加一個屬性,然後在該元素的標籤裏使用 <xsl:attribute> 語法 。有關該語法的一些例子可在 W3Schools 網站上找到:The <xsl:attribute> Element
  最後要注意的是,超鏈接的ID查詢字符串的值是來自於 <xsl:number> 元素,從 position() 函數中返回的值。<xsl:number> 元素僅僅是輸出一個數值。position()函數是一個 XPath 函數,用來返回 XML 文檔中當前節點的順序位置。這意味着對於第一個新聞項,position() 函數返回 1,第二個 新聞項,position函數返回 2,以此類推。我們需要記錄這個值並將它通過查詢字符串傳遞出去。這樣當 DisplayItem.asp 頁面被訪問時,就可以知道顯示 RSS 聚合摘要的什麼項目了。
  聰明的讀者可能已經注意到,我們的 XSLT 樣式表沒有全部完成,因爲 FeedID 參數沒有通過查詢字符串傳遞到 DisplayItem.aspx 頁面。要明白 這是爲什麼,我們回顧一下在 ID 查詢串參數中所傳遞的是用戶擬察看詳細信息的<item>元素順序號。也就是說,如果用戶點擊第四條新聞項,頁面 DisplayItem.aspx?ID=4 就會被 加載到右下部分的框架中。問題在於 DisplayItem.aspx 頁面無法確定用戶希望查看哪一個摘要。有兩個不同的方法可以解決這個問題,比如可以在右下部框架中用客戶端 Javascript 代碼讀取右上部框架的 URL,然後確定FeedID 的值。在我看來,更簡單的辦法是和 ID 參數一起將 FeedID 的值通過查詢字符串傳遞 。
  這樣的話,有一個難題是 XSLT 樣式表操縱的 RSS XML 數據中並沒有 FeedID 值。但是 DisplayNewsItems.aspx 頁面知道 FeedID 值,需要一種方法讓 XSLT 樣式表也知道這個值。通過使用 XSLT參數可以 實現完成。
   XSLT 參數的使用是非常簡單。在 XSLT 樣式表中,你需要在 <xsl:template> 元素中加入一個<xsl:param> 元素, 該元素提供參數的名稱。下面的代碼將這個參數命名爲 FeedID:
<xsl:stylesheet version="1.0" 
       xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

   <xsl:template match="/rss/channel">
      <xsl:param name="FeedID" />

                ...
   </xsl:template>
</xsl:stylesheet>
      
現在,就可以用下面的語法在<xsl:value-of>元素中使用這個參數了:
<xsl:value-of select="$parameterName" />      
最後,在我們的 XSLT 樣式表中加入下面的代碼,我們就可以把 FeedID 查詢字符串參數加到超鏈接中了:
<a>
  <xsl:attribute name="href">DisplayItem.aspx?ID=<xsl:number 
    value="position()" />&amp;FeedID=<xsl:value-of select="$FeedID" 
      /></xsl:attribute>
      
  注意在ID查詢字符串參數後面我們加了一個&字符(轉義&amp;),這樣我們就可以傳遞 FeedID 參數的值到查詢字符串的 FeedID 參數中了。 這就是我們要在 XSLT 樣式表中添加的內容。
  剩下的工作是在 DisplayNewsItems.aspx 頁面的 Page_Load 事件處理函數中設置這個參數的值。通過使用 XsltArgumentList 類可以完成這一工作。這個類有一個 AddParameter() 方法。一旦我們創建了這個類的一個實例,加入了相應的參數,就可以將這個 實例賦給 XML Web 控件的 TransformArgumentList 參數了。下面的代碼顯示了更新後的 DisplayNewsItems.aspx 頁面 Page_Load 事件處理函數:




顯示特定新聞項的詳細內容

  還剩下最後一件需要做的事情是顯示用戶選擇的特定新聞項的詳細內容。這些詳細內容將顯示在右下部的框架中,而且將會顯示新聞項的標題,描述和新聞項的鏈接等信息。和 DisplayNewsItem.aspx 頁面 類似,DisplayItem.aspx 頁面首先將根據傳入的 FeedID 查詢字符串參數獲取遠程的 RSS 聚合摘要,然後它會用 XML Web 控件顯示這些詳細內容。實際上,DisplayItem.aspx 頁面的 Page_Load 事件處理函數和DisplayNewsItem.aspx 頁面的 該函數幾乎一樣,只有以下兩個小小的區別:

  • DisplayItem.aspx 頁面需要讀取ID查詢字符串參數的值;
  • DisplayItem.aspx 頁面使用一個 XSLT 參數,但是這個參數與 DisplayNewsItem.aspx 頁面用的參數是不一樣的;
DisplayNewsItem.aspx 和 DisplayItem.aspx 頁面一樣都需要在參數中傳遞一個 XSLT 樣式表。DisplayNewsItem.aspx 頁面傳遞的是 參數 FeedID,而 DisplayItem.aspx 還需要傳入 ID 參數,它表示 XSLT 樣式表應該顯示那個新聞項。這個細小的差別在以下代碼中以粗體顯示,以下 代碼省略了與 DisplayNewsItems.aspx 頁面相同的部分:

以下是轉換 XML 數據的 XSLT 樣式表:
<?xml version="1.0" encoding="UTF-8" ?>
<xsl:stylesheet version="1.0"
          xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
   <xsl:output method="html" omit-xml-declaration="yes" />
   <xsl:param name="ID" />

   <xsl:template match="/rss/channel">
      <b><xsl:value-of select="item[$ID]/title" 
                           disable-output-escaping="yes" /></b>
      <p>
         <xsl:value-of select="item[$ID]/description" 
                           disable-output-escaping="yes" />
      </p>
      <a>
         <xsl:attribute name="href"><xsl:value-of 
           select="item[$ID]/link" /></xsl:attribute>
         <xsl:attribute name="target">_blank</xsl:attribute>
         Read More...
      </a>
   </xsl:template>
</xsl:stylesheet>      
  注意 <xsl:param> 元素被用於聲明 ID XSLT 參數。然後,在幾個不同的 <xsl:value-of> 元素中,ID 參數 被用來從 <item> 元素列表中抓取特定的 <item> 元素。在 XPath 的語法中,elementName[i]意思是根據相應元素名 存取第i個元素。例如,item[1]將只獲取第一個<item>元素,item[2]則獲取第二個元素。所以 item[$ID]是獲取由 XSLT 參數 ID 定義的 特定 <item> 元素。
  最後,值得注意的還有在樣式表靠近末尾部分的超鏈接 Read More…,它的target屬性設爲空,這樣的話當用戶點擊 Read More… 鏈接的時候,瀏覽器會打開一個新的窗口。
未來的擴展和當前程序的缺點
  本文講述的代碼中有一個明顯的缺點就是每次用戶點擊左邊框架的某個聚合摘要或者在右上部框架點擊某個新聞項時,遠程聚合摘要都會被裝載和解析。每次用戶點擊遠程聚合 摘要時,所有的項都被加載,這樣的效率無疑是很差的。每次用戶點擊一個新聞項標題就重新裝載整個遠程聚合摘要也是很浪費資源的。這樣的方法不僅沒有效率,對提供發佈服務的個人或者公司也是不禮貌的,因爲這些 連續的、不沒必要的請求佔用了他們的 Web 服務器的負載資源。
  這個缺點在本文附帶的源代碼中已經得到解決。具體來說,.NET數據緩存可以用來存放不同摘要的 XmlDocument 對象。緩存間隔設置爲數據表 Feeds 中 UpdateInterval 字段定義的值。(當然,由於某些原因,摘要的 XmlDocument 對象有可能會被提前清除出緩存)
  這個系統的另外一個缺點是在右上部框架和右下部框架之間沒有狀態的保存。爲了說明這樣會引起什麼問題,考慮以下的動作:
  1. 用戶點擊左邊框架的某個聚合摘要鏈接,在右上部框架中裝載這個摘要的新聞項目。假設這個摘要的UpdateInterval 的值是30,則表示這些內容在30分鐘之 後會過期;
  2. 裝載右上部框架的新聞項的同時,這些內容被緩存起來;
  3. 用戶離開去吃午飯;
  4. 發佈聚合內容的網站增加了一條新的新聞項;
  5. 我們的用戶一個小時午飯後回來了,這個 摘要的 XmlDocument 的緩存已經過期;
  6. 用戶點擊右上部框架的第一條新聞項,將會在右下部分框架中裝載 DisplayItem.aspx,傳入 ID 參數值1;
  7. DisplayItem.aspx 頁面在緩存中沒找到 XmlDocument 對象,只好重新獲取遠程摘要。這樣就會獲得新的數據了(別忘了,步驟 4 已經加了一個新的新聞項),然後此頁面會顯示第一條新聞項目(因爲ID參數的值爲1) ;
  8. 用戶看到了新的新聞項,但是內容會令他感到有點困惑,因爲已經不是他所點擊的那一條新聞了,而且右上部也沒有顯示那條新的新聞。
  之所以出現這樣的問題,是因爲 ID 參數沒有唯一地標識一個新聞項,它只是一個特定時間點上新聞項列表中的一個偏移量。解決這個問題的一個好的方法是不要用數據緩存來保存聚合 摘要,而是使用數據庫或者持久介質的其它方式(比如 Web 服務器本地文件系統的 XML 文件)。如果使用數據庫,每一個新聞項都可以擁有一個唯一的標識號,可以用來傳遞到右下角的框架中。這種方法可以保證解決上面提到的問題。當然也會增加系統的複雜性,比如需要決定何時從數據庫中清除掉舊的新聞項 。
  本文現有的應用程序還缺少異常處理,而這肯定是應該加上的。尤其是當從遠程 RSS 聚合摘要文件獲取數據並加載到 XmlDocument 對象時,應該加上異常處理。因爲遠程的文件可能不存在或者格式不正確。
  還有很多增強功能可以輕鬆地加入到這個在線新聞聚合器。一個明顯的功能是需要一個管理頁面來允許用戶添加,刪除和編輯他們現在的聚合摘要。還有,如果能允許用戶自定義分類 ,將他們的聚合摘要按類別放在一起就更好了。另外,現在的用戶界面還是比較粗糙的,但是通過增加一些 XSLT 樣式表生成的 HTML 代碼或者在幾個框架裏面增加一些樣式表就可以很容易地美化一下界面。最後,在html標籤裏面加一些<meta>元素,可以讓右上部框架定時地去刷新,使得用戶不用自己手工去刷新頁面就可以看到最新的新聞項目。
註解 (2003年8月4日): 在這篇文章發佈以後,一些讀者用 Email 告訴通知我在顯示特定 RSS 聚合項的 <description> 元素時,有兩個潛在的問題:
1、Disable-output-encoding 屬性,這個屬性用在 <xsl:value-of> 元素中,但是並不是所有的 XSLT解析器都實現了這個功能。.NET XSLT 解析器支持 disable-output-encoding,但是還是要 注意一下,因爲讀者可能試圖將這個應用程序移植到其它平臺。
2、<description> 元素的 HTML 內容是被原封不動地輸出的。但是,這些 HTML 內容可能包含惡意代碼,比如 <script> 或者 <embed> 代碼塊。理想情況下,這些代碼應該被剔除掉。爲了清除掉這些有潛在危險的代碼,可能需要用到一些擴展函數(參見 Extending XSLT with JScript, C#, and Visual Basic .NET)。想查看從 RSS 聚合 摘要剔除 HTML 內容的更多信息,可以參見''Dive Into Mark'' 日誌.
總結
  在本文中,我們不僅講到如何創建一個聚合引擎,還創建了一個在線新聞聚合器。在建立這兩個應用程序時,我們都採用了在 ASP.NET 頁面顯示 XML 數據的技術。在聚合引擎裏面,我們使用了 Repeater 控件以 XML格式來顯示數據庫中的數據。而在新聞聚合器裏面,我們使用了 XML Web 控件和 XSLT 樣式表。
  我邀請你下載本文的在線新聞聚合器,然後根據你的需要來增強它。如果有任何關於這個應用程序或者這篇文章討論的概念方面的問題,隨時恭候你的 EMail。我的 EMail [email protected].
編程快樂!
推薦鏈接  
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章