一個用於網站自動化測試的生態系統實現

這是我在從事網站自動化測試的工作當中構建出的一個“生態系統”。“生態系統”這個概念是我從公司的前輩身上學到的，他一直以來都認爲自動化測試人員不應僅僅侷限於編寫測試代碼，還應該讓整個自動化測試的過程（測試代碼的持續集成、分發、執行等）都自動化，形成一個“系統”，這個系統的自動化程度越高，自動化測試人員就越省力。

一、概念

這裏我畫了一張示意圖：

之所以稱之爲“生態系統”，是因爲建成之後需要的人爲干涉很少，其餘的時間都是系統內部循環運作。作爲自動化測試人員的你只需要提交代碼，之後便可以在AutomationDashboard上看到運行的結果了，其餘的事情都由系統內部消化。當然，結果的分析還是需要人來完成，機器還沒有聰明到可以靈活分析出各種各樣讓case fail掉的原因。

我們可以把整個系統看作一個黑盒子，那麼上面的圖可以變成：

實際上這裏畫的人不僅限於自動化測試人員，也可以是：

（1）產品的管理者，比如產品經理需要從自動化迴歸測試知道這次release有無推遲風險；

（2）團隊的管理者，比如開發經理、QA經理需要從自動化的daily/weekly regression知道最近的代碼質量如何；

（3）開發人員，他們也許會想通過quick regression（提交的產品代碼被部署到測試環境之後運行的測試）知道自己剛提交的代碼有沒有破壞系統的基本功能；

（4）其他幫忙做自動化測試的開發人員、剛剛開始學習編寫自動化測試代碼的手動測試人員，他們不必關心生態系統的內部實現。

二、實現

說完概念，接下來該說說具體實現了。我這裏講的是我認爲最適合我所測試的產品的實現，工具不止一種，方式不止一種。Jenkins可以用TeamCity或其它CI替換，git也可以是svn或tfs，AutomationDahsboard可以用.NET、SpringMVC、ROR等等實現，運行測試的slave可以是Windows/Linux/Mac（土豪！），總之選擇一種最適合你所測試的產品的實現。還有一點就是自動化測試代碼是用關鍵字驅動思想實現的，這是另外一個話題了，有時間另外寫篇文。

好，進入正題。依次說說系統的每個重要組成部分吧：

1、SCM（Source Code Management）。我選的是git，可以是git服務器（公司自己搭建了一個git server），也可以是一個bare repo（http://www.saintsjd.com/2011/01/what-is-a-bare-git-repository/）。

2、CI（continuous integration）。我選的是部署方便、插件豐富的Jenkins。

它的職責是：

（1）從git上取出代碼，build（.NET對應msbuild，如果是ruby則不用build了，直接部署即可）；

（2）把build好的*.dll部署（這裏即是拷貝）到所有的slave上；

（3）啓動或停止所有slave上的AutomationService（後面還會講到AutomationService），從而控制測試的執行。

我在Jenkins的這些個job配置起來還是比較繁瑣的，要細講又可以另外寫一篇文了。這裏就特別提到兩個很實用的插件吧：

（1）Parameterized Trigger Plugin（https://wiki.jenkins-ci.org/display/JENKINS/Parameterized+Trigger+Plugin）：可以在一個build step中觸發其它project的build。

它最有用的就是這個“Block until the triggered projects finish their builds”選項，勾上的話Jenkins就能在所有trigger的project完成build之後（而非僅僅trigger其它project的build，不等它們完成就繼續下一個build step）再繼續下一個build step，做到真正的依次執行每個build step。

（2）NodeLabel Parameter Plugin（https://wiki.jenkins-ci.org/display/JENKINS/NodeLabel+Parameter+Plugin）：在所有“Possible nodes”標有指定標籤（“Label”）的Jenkins節點（就是Jenkins master或Jenkins slave）上觸發指定project（被觸發的project是參數化的）。

比如我有一個project叫“StartClassicROLATServiceOnAllNodes”，它有一個build step是這樣設定的：

再來看看“StartClassicROLATServiceOnASingleNode”這個project的設定：

這個project有一個Node類型的參數，參數名“NodeX”與之前Label Factory中的“NodeX”對應，“Possible nodes”選的是“ALL”，那麼列出的所有node（master、10.107.122.152、10.107.122.153、10.107.122.154）都在判斷範圍之內（判斷其是否有“Node”標籤，有則執行project）。

另外，列出的所有node我都爲其加了一個“Node”標籤。

這樣，當我trigger “StartClassicROLATServiceOnAllNodes”之後，就會在master、10.107.122.152、10.107.122.153、10.107.122.154這4個node上同時執行“StartClassicROLATServiceOnASingleNode”。

3、AutomationDashboard，這裏姑且譯作“自動化測試控制面板”吧。實際上它應該和Jenkins一起並稱控制面板，不過因爲Jenkins有API可以調用，所以想做的畫兩者也是可以統一成一個web界面的。這個dashboard完全是用.NET+IIS+SQLServer一點點從數據庫設計構建、數據訪問層、業務層、表現層做起來的，要細講……額……又會是另外一篇文了（Oh man, not again!）。反正我覺得，雖然我是做自動化測試工作的，但不應該把自己侷限於測試。爲了更好地進行自動化測試，開發網站、安裝配置虛擬機以及其它要用到的工具，都應該抽時間去學習、掌握。

好，來說說這個dashboard。這裏只講兩個主要組成部分，一個網站（以下簡稱dashboard）、一個Windows Service（以下簡稱ATService）和一個console application（以下稱ConsoleRunner）：

（1）dashboard，它的主要功能：

a、展示測試的運行狀況：有多少正在運行/執行完畢，分別在哪臺slave上執行等等。

b、通過call Jenkins的API來trigger Jenkins的job，間接控制測試的執行。

c、展示測試的結果：發生錯誤的是哪個case、出錯時間、錯誤信息、代碼回溯（stack trace）、甚至可以包含一張出錯時的截圖。

主要界面如下：

a、Summary，顧名思義是彙總信息，case有多少pass多少fail、case按分類每一類有多少等等。（其實這裏我少做了一張很重要的圖，就是coverage餅狀圖）

b、Queue，測試隊列，包含當前正在運行的、運行完的、等待運行的test fixture或test case（依據測試工具的不同，NUnit、JUnit、RSpec等，fixture的叫法可能不同，總之就是包含多個test case的集合）。可以啓動、停止、終止（終止之後可以清空）測試執行或清空當前隊列。

c、TestCase，生態系統中的所有測試用例會展示在這裏，可以看到它們最後一次執行的時間和狀態（pass/fail），點擊某條case可以跳轉到該條case的所有test result。可以按狀態（pass/fail/other）篩選用例，可以勾選部分用例重新執行、或重新執行所有fail的case。“Reload Test Cases”主要是考慮到*.dll文件中的test case可能會在某次部署之後發生變化，需要重新加載。不過後來我修改了Jenkins裏的job在每次部署之後都自動重新加載，所以這個按鈕其實沒什麼用了。

d、TestSuite，包含多個fixture的集合是一個suite。勾選多個suite點擊“Run Suite”即可把這些suite中包含的fixture添加到Queue。

這裏的suite是對NUnit中的Category的一個補充，點擊“New Suite”你可以任意選擇fixture來組成自己想要的suite：

e、TestResult，展示所有test case的運行結果，可以按test case id進行篩選，點擊TC#這一列的id就只顯示這條case的結果。

點右邊的藍色“i”圖標可以跳到這條結果的詳細頁面，截圖功能暫未啓用，根據RunnerMessage和RunnerStackTrace可以知道報錯的代碼位置，進而嘗試重現問題。

（2）ATService。這個Windows Service（slave都是Windows，稍後會講）被安裝到了每個slave上，用以向dashboard詢問“現在有沒有分配給我的test fixture/case？”，如果有且當前slave空閒的話就抓過來運行，運行完畢彙報結果。

還記得Queue（隊列）吧？無論你在TestCase還是TestSuite頁面挑選了test case/suite想要運行，都只是把它們添加到隊列當中（準確地說就是往Queue這張數據庫表中INSERT記錄），而不會給它們分配slave。只有當Jenkins啓動了slave上的ATService之後，ATService纔會去Queue表中自己抓取（就是打上標記說這條fixture/case已經有主了，其它slave就不會再去抓）還沒有運行過且沒有分配有slave的test fixture/case。

（3）ConsoleRunner，最開始的那個圖中沒有畫出來。這個console程序主要供Jenkins調用。Jenkins不是可以讓job定時運行麼？正好，定時調用這個console application，傳幾個參數，就可以在指定時間往Queue裏填充fixture/case，然後再啓動ATService開始執行測試。這樣就能實現quick/daily/weekly/full regression的無人值守運行了。

4、Slave

我選擇在Windows上運行測試：

（1）公司IT一般只提供Windows操作系統的虛擬機

（2）產品在Windows上的用戶佔絕大多數（其實這個有點廢話，桌面操作系統Windows依然是世界王者。誠然，我自己業餘時用Linux做開發，Mac在國內外也是相當流行的，但GoogleAnalytics顯示的統計結果就是大部分訪問都來自Windows。什麼，你說iOS/Android？額……移動端現在仍然是產品的短板……）

如果選擇Linux的話要注意下selenium webdriver的native event設定（http://code.google.com/p/selenium/wiki/AdvancedUserInteractions#Native_events_versus_synthetic_events）。

關於瀏覽器，Firefox、Chrome、IE皆可，webdriver的瀏覽器兼容性已經很不錯了。瀏覽器兼容性是個有點頭疼的問題，想支持很多瀏覽器的話有時會增加很多開發、測試成本，我一般在Firefox上跑就足夠了。什麼？數字？馬桶？企鵝？您想多了，selenium官方不支持。

你能找到多少臺slave來執行測試？多多益善哦！找不到那麼多實體機就自己配虛擬機吧，分佈式運行可以給你的自動化測試生態系統裝上火箭！在更短的時間內運行完更多測試，從而更快地從測試中獲得反饋！

嗯，差不多就這麼多了。還有很多細節就留在之後的文中再說了。自我感覺這個生態系統還是有很多可以完善、增加的功能，而且這個實現方式、運作機制可能也並非適用於你所測試的產品，不過現在對於我測的產品來說是夠用的了。

不管怎樣實現，我想表達的核心觀點是：

做自動化測試不要侷限於自動化測試代碼的編寫，我們要自動化的不僅僅是manual test case，還應包括整個automation test的process！測試代碼持續集成、部署（分發）、執行、結果展示，自動化的環節越多、越徹底，爲你節約的時間就越多，你可以用這些節約的時間做更有意義的事情。人類發明計算機，用代碼編寫程序，其實就是一種自動化的過程。以前要靠手工勞動完成的現在都交給電腦做了——服務器不正是勤勤懇懇地重複執行着我們寫好的程序麼？構建自動化測試生態系統是同樣的道理，因爲機器能比人更可靠地完成重複勞動。

如果你還在手動拷貝*.dll，還需要打開NUnit手動執行測試，還在1臺機器上運行測試，那麼，現在就是該提高生產力的時候了！

一個用於網站自動化測試的生態系統實現

PHP學習筆記 2009-8-15_2 輸出可變日期函數：generateAlterableTime()

PHP學習筆記用超鏈接實現在本頁面顯示不同信息

PHP學習筆記 2009-8-15_1 格式化日期產生函數generateDateWeekTime

PHP學習筆記頁面延遲跳轉

一個用於網站自動化測試的生態系統實現

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結