一、前言
二、redis啓動流程
rdbSave負責將內存中的數據庫數據以RDB格式保存到磁盤中,如果RDB文件已經存在將會替換已有的RDB文件。保存RDB文件期間會阻塞主進程,這段時間期間將不能處理新的客戶端請求,直到保存完成爲止。爲避免主進程阻塞,Redis提供了rdbSaveBackground函數。在新建的子進程中調用rdbSave,保存完成後會向主進程發送信號,同時主進程可以繼續處理新的客戶端請求。
當Redis啓動時,會根據配置的持久化模式,決定是否讀取RDB文件,並將其中的對象保存到內存中。載入RDB過程中,每載入1000個鍵就處理一次已經等待處理的客戶端請求,但是目前僅處理訂閱功能的命令(PUBLISH 、 SUBSCRIBE 、 PSUBSCRIBE 、 UNSUBSCRIBE 、 PUNSUBSCRIBE),其他一律返回錯誤信息。因爲發佈訂閱功能是不寫入數據庫的,也就是不保存在Redis數據庫的。RDB的缺點:再說RDB缺點時,需要提到的是RDB有保存點的概念。在默認的redis.conf中可以看到這樣的默認配置:
- #save <seconds> <changes>
- save 900 1 #如果15分鐘內,有1個鍵被修改
- save 300 10 #如果6分鐘內,有10個鍵被修改
- save 60 10000 #如果60秒內有10000個鍵被修改
意思是當滿足上面任意一個條件時,將會進行快照保存。爲了保證IO讀寫性能不會成爲Redis的瓶頸,一般都會創建一個比較大的值來作爲保存點。1.此時如果保存點設置過大,就會導致宕機丟失的數據過多。保存點設置過小,又會造成IO瓶頸2.當對數據進行保存時,可能會由於數據集過大導致操作耗時,這會導致Redis可能在短時間內無法處理客戶端請求。
1.將客戶端請求的命令轉換爲網絡協議格式2.將協議內容字符串追加到變量server.aof_buf中3.當AOF系統達到設定的條件時,會調用aof_fsync(文件描述符號)將數據寫入磁盤
其中第三步提到的設定條件,就是AOF性能的關鍵點。目前Redis支持三種保存條件機制:1.AOF_FSYNC_NO:不保存此模式下,每執行一條客戶端的命令,都會將協議字符串追加到server.aof_buf中,但不會執行寫入磁盤。寫入只發生在:1.Redis被正常關閉2.Aof功能關閉3.系統寫緩存已滿,或後臺定時保存操作被執行上面三種情況都會阻塞主進程,導致客戶端請求失敗。2.AOF_FSYNC_EVERYSECS:每一秒保存一次由後臺子進程調用寫入保存,不會阻塞主進程。如果發生宕機,那麼最大丟失數據會在2s以內的數據。這也是默認的設置選項3.AOF_FSYNC_ALWAYS:每執行一個命令都保存一次這種模式下,可以保證每一條客戶端指令都被保存,保證數據不會丟失。但缺點就是性能大大下降,因爲每一次操作都是獨佔性的,需要阻塞主進程。
AOF保存的是數據協議格式的數據,所以只要將AOF中的數據轉換爲命令,模擬客戶端重新執行一遍,就可以還原所有數據庫狀態。讀取的過程是:1.創建模擬的客戶端2.讀取AOF保存的文本,還原數據爲原命令和原參數。然後使用模擬的客戶端發出這個命令請求。3.繼續執行第二步,直到讀取完AOF文件AOF需要將所有的命令都保存到磁盤,那麼這個文件會隨着時間變得越來越大。讀取也會變得很慢。Redis提供了AOF的重寫機制,幫助減少文件的大小。實現的思路是:
- LPUSH list 1 2 3 4 5
- LPOP list
- LPOP list
- LPUSH list 1
最初保存到AOF文件的將會是四條指令。但經過AOF重寫後,會變成一條指令:
- LPUSH list 1 3 4 5
同時,考慮到爲了在AOF重寫時,不影響AOF的寫入增加了AOF重寫緩存的概念。也就是說Redis在開啓AOF時,除了將命令格式數據寫入到AOF文件,同時也會寫入到AOF重寫緩存。這樣AOF的寫入、重寫就做到了隔離,保證了重寫時不會阻塞寫入。
1.AOF重寫完成會向主進程發送一個完成的信號2.會將AOF重寫緩存中的數據全部寫入到文件中3.用新的AOF文件,覆蓋原有的AOF文件。
1.AOF文件通常會大於相同數據集的RDB文件2.AOF模式下性能與RDB模式下性能高低,主要取決於AOF選用的fsync模式
Redis字典使用的是哈希表實現,原本不準備詳細介紹Redis哈希表的實現。但發現Redis在實現哈希表時,
提供了一個很好的rehash方案,這個方案思路很好,甚至可以衍生到其他各個應用中使用,方案的名稱叫“漸進式Rehash”。
實現哈希表的方法大同小異,但爲何各個開源軟件總是去開發自己獨有的哈希數據結構呢?
從研究PHP內核的哈希實現與Redis哈希實現,發現應用場景決定了必須定製才能更好的發揮性能。(關於PHP哈希實現可以參看:PHP內核中的神器之HashTable)
a)PHP主要應用於WEB場景,在WEB場景針對單次請求數據之間是隔離的,並且哈希的數量是有限的,那麼進行一次rehash也是很快的。
所以PHP內核使用阻塞形式rehash,即rehash進行中將不能對當前哈希表進行任何操作。
b)在來看Redis,常駐進程,接收客戶端請求處理各項事務,並且操作的數據是相關且數據量較大的,如果使用PHP內核的那種方式就會出現:
對哈希表進行rehash時,此時將阻塞所有客戶端請求,併發性能會大大下降。