MySQL的未來在哪?

阿里雲 MySQL&MariaDB 數據庫產品結合開源社區,提供了穩定、可靠、便捷、彈性的在線數據庫服務,幫助全球企業客戶進行數字化轉型。MySQL發展經歷了一系列變化,從Sun到Oracle,發展也經過了幾個階段。MySQL從5.7版本開始走上了代碼重構之路,這爲MySQL未來10年的發展奠定了堅實基礎,而未來MySQL將和雲計算碰撞出什麼樣的火花?本文中,阿里雲研究員呂漫漪將爲大家分享MySQL的前世今生。

MySQL的過去

對於MySQL而言,其最大的發展變化就是被Sun收購,但是Sun原本就有數據庫團隊,MySQL被收購之後兩個團隊也合併了起來。MySQL的團隊懂得社區並且有激情,而Sun的團隊懂得怎樣軟件工程化,懂得保證質量和產品迭代,因此團隊合併之後對於MySQL的改變很大。在這之後Sun被Oracle收購,這又是另外一個轉折點,Oracle不僅給了MySQL團隊很大自由,也投入了很多人力和物力。這也保證了2013、2015以及2018年,每間隔2年多的時間就能推出一個較爲成熟的新版本,而在2018年之後其迭代週期就會迅速變短,因爲朝着物聯網方向發展,大概每三個月就會迭代一次。

近十年中,Oracle做了很多很好的事情,其中有一點事情雖然很少談到,但是對於之後的發展卻極爲重要,那就是——代碼重構。大家都希望完善功能,提高性能,但是很少有人做了代碼重構。所謂代碼重構就是在不改變功能的前提下,改善代碼結構,提高可讀性和可擴展性。這件事情雖然說起來簡單,但是做起來難,特別是在進行決策的時候。MySQL5.6版本的時候決定進行代碼重構,這是因爲,Oracle增加了很多人力進入MySQL項目,但是當時的系統卻存在很多Bug,這使得代碼維護變得極爲困難,使很多人力用於維護舊代碼而不是增加新功能。此外,還使新功能的開發週期變得特別長,並且容易發生錯誤。當然,因爲有很多錯誤,並且代碼沒有註釋和文檔,使新人接手項目變得困難。

MySQL的現狀

因此爲了保證長期的市場領先地位,MySQL必須要進行代碼重構。在最開始,主要是將解析、優化、查詢等步驟進行拆分,方便找到存在問題的模塊。此外, 還實現了一些工具,來幫助檢測Bug。MySQL5.7中的優化器部分,30%的代碼是重寫的,而在8.0中解析器的50%都是重寫的,可見投入很大。MySQL將編程語言都統一到C++,編譯器都使用最新版本,代碼規格採用谷歌的,統一了300人的開發團隊的代碼標準。代碼重構這件事情可能是對於未來10年的MySQL發展所做的最重要的一件事情。這是因爲有了高質量的代碼,才能夠快速推出新的功能,降低維護成本,使得新人更快上手項目。

解析器在重構之前的結構就像是一盤意大利麪,非常混亂,重構之後就變得極爲清晰。當重構完解析器之後發現,以前很多解析器的Bug都消失了,此外,增加複雜語法的效率也得到了極大的提升,節約了大量時間。此外,還做了多核性能提高,這也是硬件的趨勢,雖然每個內核不會更快,但是數目卻會增加。在重構之後,讀性能提高了三倍,寫的性能也有很可觀的的提高。

MySQL另外一個大的改變就是測試方面,如今的用戶更多的是企業級用戶,他們更多關注於更高的穩定性。對於數據庫而言,最重要的永遠都是穩定性,功能和性能是其次的。對於測試方法而言,要求對於新的功能,測試代碼覆蓋率達到95%,所有的開發人員在提交代碼的時候都要進行單元測試。在實現新功能的時候,需要開發和測試同時進行,整體測試之後才能將代碼推入主幹,性能測試,每天都會測試,此外有重大更新推入主幹時需要進行完整的性能測試,保證性能不會退化。所有測試都自動化,不需要人爲測試。

功能上的最大亮點就是在MySQL5.7版本中推出了JSON數據類型。雖然MySQL一直都是關係型數據庫,但是發現自己的用戶不僅僅需要關係型數據庫,也需要支持非結構化數據。因此MySQL需要和客戶自己成長,因此在5.7版本中加入了JSON數據類型,也推出了很多適於JSON的函數,因此用戶可以選擇使用類似於MongoDB的Document的API,用戶可以將MySQL當做NoSQL來使用,而不用關心底層的原理,而且還實現了NoSQL所無法比擬的功能。

MySQL5.7功能中的另外一個亮點是“Group Replication”。這還是因爲了除了互聯網客戶已經普遍地應用MySQL了,還有很多新增客戶是企業級客戶,他們要求高可靠性。組複製就是提高可靠性的一個功能,支持自動切換和多寫,而多寫也提升了高可用性,而且支持多寫檢測。這個功能當前只支持InnoDB,但很多新功能也支持InnoDB。

MySQL 8.0版本的新功能亮點就是自檢表,對於客戶而言做好的一點就是就是它支持原子操作的DDL,特別是在雲上原子性的DDL發揮了決定的作用,因爲很多操作都是自動操作,不可能讓人手動修改DDL回滾時發生的錯誤。這一點對於雲數據庫而言非常重要。

此外,MySQL 8.0版本還提升了Information Scheme的性能。而無論是系統表還是普通表,都存放在InnoDB裏面,因此其處理方式是一樣的。對於開發者而言,有了數據自檢,增加新的功能就會非常容易。

遞歸公用表表達式以及窗口函數都是非常複雜的SQL語句,在8.0中加入這兩個語句縮短了MySQL和Oracle的差距,這會大幅度地降低數據庫開發人員的開發時間。CTE主要用於對於存在層次等級的表中做遞歸的查詢,這一功能在報表中非常常用。窗口函數則是用在分析型工作中的,比如分析每年、每季度的營收等。這些就是在MySQL8.0中新增的針對於數據庫開發者的功能,幫助他們提升開發效率。

MySQL的未來

MySQL的未來其實只有一個字,那就是“雲”。有預測稱“在2020年,83% 的企業負載會轉移到雲上”,也就是說大部分線下場景會轉移到雲上,這對於MySQL而言既是一個機會也是一個挑戰。MySQL需要在進行內核改動和優化,使其更適合在雲上發展。

雲上數據庫架構存在着明顯的轉變,最爲明顯的就是計算層和存儲層的分離。計算層不共享,但是存儲層會變成共享存儲。共享存儲會達到雲規模,也就是極大規模,能夠支持所有用戶,這樣能夠極大地節約資源。而這樣的想法已經被PolarDB用到了。而企業級客戶需要高可靠性,所以雲上數據庫需要演變成爲可以跨機房的高可靠性,而且需要保證切換的過程中不丟失任何數據。在雲上,很切換過程多操作需要自動化,需要保證AC之間的切換不丟失任何數據。雲上數據庫與傳統數據庫不同的是需要考慮到雲上其他的服務,如何將數據庫和備份、恢復、審計、安全以及監控等其他服務進行集成。

資源管理也是值得MySQL提升的部分,有些事務對於響應時間要求很高,這樣可以優先處理響應時間較高的任務,而降低其他事務的優先級。此外,當內存不夠的時候應該如何處理,不能使得服務宕機。可以進行回滾或者降低新的請求,來保證數據庫的穩定狀態。此外,還有想做的一件事情就是智能生成執行計劃。因爲一個SQL進來之後,先解析做優化,產生執行計劃,這裏需要改進的是在執行計劃生成的時候需要考慮更多的事情,比如查詢的響應要求以及內存限制。對於查詢時間和空間的平衡需要客戶自己決定。而現在的執行計劃是由優化器自己決定的,在未來希望能夠智能地生成執行計劃。

回到企業級工作負載,其實MySQL用在互聯網業務中是非常多的,但是衆所周知互聯網業務的查詢往往比較簡單,而企業級用戶的查詢相當複雜。MySQL目前對於簡單數據庫查詢的性能非常好,在這一方面做了很多優化,而在複雜查詢方面還可以做極多的優化,比如開啓多個線程並行執行。同時可以在InnoDB層做更多的並行執行,比如Scan、條件過濾等,因此在複雜查詢方面有無限的提升空間。

MySQL目前只用於OLTP,此外目前還以一個發展很快的趨勢就是在線分析。未來,MySQL可能會同時支持事務性處理也會同時支持在線分析。在線分析和數據倉庫不同,因爲數據已經在手裏了,可以用同一份數據做更多的分析。對於用戶而言,所看到的就是一個數據庫,但是所能夠包含的功能確是難以想象的。

雙11狂歡,雲數據庫首購低至2折!還能100%中獎,最高1000元無門檻通用代金券,快來參加吧!>>

雲服務器99元拼團購!拉新還可贏現金紅包!300萬等你瓜分!
馬上一鍵開團贏紅包: http://click.aliyun.com/m/100...



本文作者: 桐碧2018

閱讀原文

本文爲雲棲社區原創內容,未經允許不得轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章