1 那一夜，你傷害了我

今夜的雨下得涼快，小南睡得正香，突然收到遠洋運維小周的電話：Hello, Are you OK? WAS有issue，快起來help me!

只見小南登陸WAS機，查看了機器日誌、應用日誌，終於定位了問題，登上WAS管理界面，一頓操作猛如虎，應用終於恢復了。但不記得這是第幾次新人不懂WAS而向小南求救了。

第二天，小南向領導呈上《替換WAS表》，開始了一場浩蕩的服務器之戰。其文曰：

先弟修bug未半，而中道離職。今WAS已老，Springboot又新，此誠用Boot換WAS之秋也。

......

今當替換，臨碼涕零，不知所言。

所謂WAS，即IBM的WebSphere Application Server，是一種Java應用服務器。相對Tomcat等，會更重型，更復雜；更重要的是價格昂貴。得益於IBM及它一整套的企業開發套件，也還是有一定的市場佔有率，特別是在傳統行業裏。

隨着技術向前發展與之前轟轟烈烈的去IOE運動，用WAS的人越來越少了，許多新人更是完全沒有接觸過，又因其價格昂貴且不利於DevOps，我司決定要替換掉它。經討論，代替它上場的就是現在紅紅火火的Springboot，原因衆多，如開源免費、開箱即用、利於發佈、容易運維等。

2 大刀闊斧還是小打小鬧

硬件、軟件同時替換，就必須謹慎小心，主要方案如下：

（1）硬件上從裝有WAS機器的Linux轉移到普通的Linux機器，但需要注意關鍵指標如處理器、內存、硬盤等。

（2）軟件上從之前打成war包，現改爲jar包，包結構完全改變，引入Springboot後，Spring容器和bean要對應調整、數據庫池化也對應調整。原來WAS跑的是SOAP Webservice，現通過Springboot整合cxf-spring-boot-starter-jaxws實現。

（3）網絡上依然是https協議，但以前WEB服務器爲IHS，現在直接使用Springboot，證書需要重新生成和導入。客戶端證書要先從IHS服務器的密鑰文件導出，需要查看IBM官網資料。

關於https的內容可參考：HTTPS專題。

同時引入新的負載均衡器F5，且需要在上線當天更新DNS到新F5上。結構圖如下：

服務器1與服務器2在同一個數據中心，正常運行時處於工作狀態。如果該數據中心發生災難（如地震等），就會啓用服務器3，並把DNS更新到災備服務器的地址。

（4）發佈上由手工發佈改爲Ansible發佈，可減少人力和錯誤風險。

（5）監測上有日誌監控，但Springboot日誌文件更少更集中，同時Springboot可整合Springboot Admin，可參考：用Springboot Admin監控你的微服務應用。

（6）UAT需要實現多環境部署，可通過maven實現。

3 測試

任何變更都有可能出錯，都會引入風險。由墨菲定律可知，凡是可能出錯的事就一定會出錯。所以測試變得極爲重要。在整個項目的測試中，功能測試和端到端測試都發現了問題，所以不要放過可以發現問題的機會，不然上了生產再出現，成本可太高了。

所謂君子不立危牆之下，讓我們看看都怎麼測試。

3.1 單元測試

單元測試在開發階段就要完成，特別要關注測試覆蓋率、圈複雜度等指標。可以使用Sonar、Findbugs等工具進行檢測，可以參考下面的文章：

Maven整合JaCoCo和Sonar，看看你的測試寫夠了沒

Docker搭建代碼檢測平臺SonarQube並檢測maven項目

3.2 功能測試

根據業務定義測試場景，儘量全面。特別是基線用例，必須覆蓋。可以增加異常場景的用例，保證服務不會受影響，依然保持可用；錯誤場景是否有合理的告警，也是很關鍵的。

3.3 性能與壓力測試

測試出關鍵性能指標，看是否能滿足現在的生產需求，要特別注意測試環境與生產環境的差異有多大，測試報告有多大的參考價值。壓力測試可以分爲兩類，大請求和高併發，大請求是一個請求數據量很大，高併發是指多個請求同時產生。

3.4 端到端測試

聯繫其它相關團隊（客戶端，即請求端）進行端到端的測試，在測試環境發送正式的請求。

4 上線

領導說過，生產是最好的測試環境，哈哈，測試差不多了，就該上生產了。

但上生產不是那麼容易的事，首先要確保發佈的這個downtime沒有客戶端發請求過來，需要和其它團隊約定好時間停服。更重要的是，因爲希望只是自己做變更，不能要求別人做變更，所以域名不能變，就需要找網絡團隊更新DNS到新服務上。

爲了縮短停服時間，提前把Springboot部署到新服務器上，並把新服務器配置在新的F5上，發佈那天直接更新DNS到F5上即可。DNS更新完成後，找客戶端發送請求進行測試，沒有問題即大功告成了！

雖然已經成功上線，但舊服務器還是要並行一段時間，萬一新服務出問題，緊急情況難以修復，還可以回滾。

5 還能再做什麼

雖然已經上線了，但還是有更多東西可以做的。

文檔：人的記憶都是不可靠的，同時也要減少人員流動的風險，需要通過文檔把相關內容記錄下來，並分享到整個團隊。主要內容有開發過程、架構原理、生產環境運維指南、測試環境使用、關鍵知識索引等。

災備測試：做了災備，但並沒有測試。還好公司要求定期要做災備測試，到時可以覆蓋，現在沒做會增大風險。

ELK：日誌收集沒有統一到日誌平臺，需要登陸到指定機器查看。幸好所用的機器不多。

Metric指標：可以收集JVM內存、CPU、GC等信息，以便定位問題，可以展示到Grafana上。

OpenTracing：可以記錄每次請求的詳細情況。可參考：實例講解Springboot整合OpenTracing分佈式鏈路追蹤系統（Jaeger和Zipkin）

REST/RPC改造：現在的服務爲XML格式的WebService，可改造爲RESTful+Json或gRPC。

最後，並不是引入新技術就是好的，有時候需要KISS(Keep it simple and stupid)，簡單能用就是好的，不要想着搞些大新聞，這樣有時間還是很naive的。

6 總結

小南獨立完成了這次改造後，去了趟黃山修練內功，修仙成果如下：黃山徽州五日行-最美風景與攻略獻給你。

回來後，又開始新的征程，這次要改造整個舊系統：System Entire Rebuild (SER)。後續如何，請聽下回糞解。

歡迎訪問南瓜慢說 www.pkslow.com獲取更多精彩文章！

歡迎關注微信公衆號<南瓜慢說>，將持續爲你更新...

多讀書，多分享；多寫作，多整理。

用Springboot幹掉IBM的WAS-爲公司省點錢

1 那一夜，你傷害了我

2 大刀闊斧還是小打小鬧

3 測試

3.1 單元測試

3.2 功能測試

3.3 性能與壓力測試

3.4 端到端測試

4 上線

5 還能再做什麼

6 總結

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

Springboot整合MongoDB的Docker開發，其它應用也類似

Docker可視化工具Portainer

Mac上使用Docker Desktop啓動Kubernetes，踩坑後終於搞掂

如何制定切實可行的計劃並好好執行——2020年，我不想再碌碌無爲

【Springboot】實例講解Springboot整合OpenTracing分佈式鏈路追蹤系統（Jaeger和Zipkin）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結