mysql架構由小變大的演變過程

原創

凌晶2010

2019-02-23 00:11

假設一個網站（discuz）從最開始訪問量很小做到日pv千萬，我們來推測一下它的mysql服務器架構演變過程。

第一階段
網站訪問量日pv量級在1w以下。單臺機器跑web和db，不需要做架構層調優（比如，不需要增加memcached緩存）。此時，數據往往都是每日冷備份的，但有時候如果考慮數據安全性，會搭建一個mysql主從。

第二階段
網站訪問量日pv達到幾萬。此時單臺機器已經有點負載，需要我們把web和db分開，需要搭建memcached服務作爲緩存。也就是說，在這個階段，我們還可以使用單臺機器跑mysql去承擔整個網站的數據存儲和查詢。如果做mysql主從，目的也是爲了數據安全性。

第三階段
網站訪問量日pv達到幾十萬。單臺機器雖然也可以支撐，但是需要的機器配置要比之前的機器好很多。如果經費允許，可以購買配置很高的機器來跑mysql服務，但是並不是說，配置翻倍，性能也翻倍，到了一定階段配置增加已經不能帶來性能的增加。所以，此階段，我們會想到做mysql服務的集羣，也就是說我們可以拿多臺機器跑mysql。但，mysql的集羣和web集羣是不一樣的，我們需要考慮數據的一致性，所以不能簡單套用做web集羣的方式（lvs，nginx代理）。可以做的架構是，mysql主從，一主多從。爲了保證架構的健壯和數據完整，主只能是一個，從可以是多個。
還有一個問題，我們需要想到，就是在前端web層，我們的程序裏面指定了mysql機器的ip，那麼當mysql機器有多臺時，程序裏面如何去配置？discuz，其實有一個功能，支持mysql讀寫分離。即，我們可以拿多臺機器跑mysql，其中一臺寫，其他多臺是讀，我們只需要把讀和寫的ip分別配置到程序中，程序自動會去區分機器。當然，如果不使用discuz自帶的配置，我們還可以引用一個軟件叫做 mysql-proxy, 使用他來實現讀寫分離。它支持一主多從的模式。

第四階段
網站訪問量日pv到幾百萬。之前的一主多從模式已經遇到瓶頸，因爲當網站訪問量變大，讀數據庫的量也會越來越大，我們需要多加一些從進來，但是從的數量增加到數十臺時，由於主需要把bin-log全部分發到所有從上，那麼這個過程本身就是一件很繁瑣的事情，再加上頻繁讀取，勢必會造成從上同步過來的數據有很大延遲。所以，我們可以做一個優化，把mysql原來的一主多從變爲一主一從，然後從作爲其他從的主，而前面的主只負責網站業務的寫入，而後面的從不負責網站任何業務，只負責給其他從同步bin-log。這樣還可以繼續多疊加幾個從庫。

第五階段
網站訪問量日pv到1千萬的時候，我們發現，網站的寫入量非常大，我們之前架構中只有一個主，這裏的主已經成爲瓶頸了。所以，需要再近一步做出調整。比如，我們可以把業務分模塊，把用戶相關的單獨分離出來，把權限、積分等也可以分離出來單獨跑一個庫，然後再做主從，也就是所謂的分庫。當然也可以換一個緯度，把訪問量或者寫入量大的表單獨分離出來，跑在一臺服務器上，也可以把一個表分成多個小表。這一步操作，涉及到一些程序上的改動，所以需要事先和開發同事做好溝通和設計。總之，這一步要做的就是分庫分表。

再往後發展，繼續把大表分小表即可。而國內阿里淘寶網站的數據量是巨量的，他們的數據庫全部都是mysql，他們的mysql架構就是遵循分庫分表這個原則的，只不過他們劃分規則會有很多緯度，比如可以根據地域劃分，可以根據買家、賣家劃分，可以根據時間劃分等等。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

mysql架構由小變大的演變過程

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

帶你逆襲kafka之路

什麼? 搞不定分佈式鎖?

#IT明星不是夢#一站式解決redis的所有煩惱

ulimit -a詳解

mysql架構由小變大的演變過程

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結