Redis 數據庫(四)—— Redis 持久化

一、持久化概述

1.1 持久化介紹

1.1.1 持久化介紹
利用永久性存儲介質將數據進行保存,在特定的時間將保存的數據進行恢復的工作機制稱爲持款化。

Redis 的持久化可以防止數據的意外丟失,確保數據安全性

1.2 持久化方式

1.2.1 RDB 持久化
RDB 持久化可以在指定的時間間隔內生成數據集的時間點快照(point-in-time snapshot)。

1.2.2 AOF 持久化
AOF 持久化記錄服務器執行的所有寫操作命令,並在服務器啓動時,通過重新執行這些命令來還原數據集。 AOF 文件中的命令全部以 Redis 協議的格式來保存,新命令會被追加到文件的末尾。 Redis 還可以在後臺對 AOF 文件進行重寫,使得 AOF 文件的體積不會超出保存數據集狀態所需的實際大小。

Redis 還可以同時使用 AOF 持久化和 RDB 持久化。 在這種情況下, 當 Redis 重啓時, 它會優先使用 AOF 文件來還原數據集, 因爲 AOF 文件保存的數據集通常比 RDB 文件所保存的數據集更完整。

二、RDB 持久化

2.1 RDB 的優缺點

2.1.1 RDB 的優點
RDB 是一個非常緊湊(compact)的文件,它保存了 Redis 在某個時間點上的數據集。 這種文件非常適合用於進行備份: 比如說,你可以在最近的 24 小時內,每小時備份一次 RDB 文件,並且在每個月的每一天,也備份一個 RDB 文件。 這樣的話,即使遇上問題,也可以隨時將數據集還原到不同的版本。

RDB 非常適用於災難恢復(disaster recovery):它只有一個文件,並且內容都非常緊湊,可以(在加密後)將它傳送到別的數據中心,或者亞馬遜 S3 中。

RDB 可以最大化 Redis 的性能:父進程在保存 RDB 文件時唯一要做的就是 fork 出一個子進程,然後這個子進程就會處理接下來的所有保存工作,父進程無須執行任何磁盤 I/O 操作。

RDB 在恢復大數據集時的速度比 AOF 的恢復速度要快。

2.1.2 RDB 的缺點
如果你需要儘量避免在服務器故障時丟失數據,那麼 RDB 不適合你。 雖然 Redis 允許你設置不同的保存點(save point)來控制保存 RDB 文件的頻率, 但是, 因爲RDB 文件需要保存整個數據集的狀態, 所以它並不是一個輕鬆的操作。 因此你可能會至少 5 分鐘才保存一次 RDB 文件。 在這種情況下, 一旦發生故障停機, 你就可能會丟失好幾分鐘的數據。

每次保存 RDB 的時候,Redis 都要 fork() 出一個子進程,並由子進程來進行實際的持久化工作。 在數據集比較龐大時, fork() 可能會非常耗時,造成服務器在某某毫秒內停止處理客戶端; 如果數據集非常巨大,並且 CPU 時間非常緊張的話,那麼這種停止時間甚至可能會長達整整一秒。 雖然 AOF 重寫也需要進行 fork() ,但無論 AOF 重寫的執行間隔有多長,數據的耐久性都不會有任何損失。

2.2 持久化指令

持久化指令爲

save

2.3 save 指令相關配置文件

2.3.1 dbfilename dump.rdb

  • 設置本地數據庫文件名,默認值爲dump.rdb
  • 通常設置爲dump-端口號.rdb

2.3.2 dir

  • 設置存儲.rdb文件的路徑
  • 通常設置成存儲空間較大的目錄中,目錄名稱data

2.3.3 rdbcompression yes

  • 設置存儲至本地數據庫時是否壓縮數據,默認爲yes,採用LZF壓縮
  • 通常默認爲開啓狀態,如果設置爲no,可以節省CPU運行時間,但會使存儲的文件變大(巨大)

2.3.4 rdbchecksum yes

  • 設置是否進行RDB文件格式校驗,該校驗過程在寫文件和讀文件過程均進行
  • 通常默認爲開啓狀態,如果設置爲no,可以節約讀寫性過程約10%時間消耗,但是存儲一定的數據損壞風險

2.4 RDB 啓動方式

2.4.1 bgsave 指令-手動啓動
(1)示例
save指令可以完成持久化,但是是單線程操作,效率較低,這是可以使用bgsave指令,手動啓動後臺保存操作,但不是立即執行。
在這裏插入圖片描述

(2)bgsave 指令原理
當執行bgsave指令時,會發送指令給Redis,然後Redis會返回一個消息,但這個時候指令沒有真正執行。在返回消息的時候,Redis會調用fork函數並生成一個子進程,這是一個單獨的子進程,由這個子進程創建.rdb文件並完成指令,然後返回消息

bgsave命令是針對save阻塞問題做的優化,Redis內部所有涉及到RDB操作都採用bgsave的方式,save命令可以放棄使用。

(3)bgsave 指令配置

stop-writes-on-bgsave- error yes

後臺存儲過程中如果出現錯誤現象,是否停止保存操作,通常默認爲開啓狀態。

2.4.2 save配置-自動啓動
(1)save配置介紹
RDB 自動啓動方式採用save配置方式完成

save second changes

在conf文件中進行配置,滿足限定時間範圍內key的變化數量達到指定數量即進行持久化。

  • second:監控時間範圍
  • changes:監控key的變化量

(2)save配置啓動原理
配置save啓動方式後,當客戶端執行了對應變化量的操作指令時,指令會發送給Redis,每個指令都會返回一個操作結果,這個結果會真正對數據產生影響,就會自動執行save配置持久化。

(3)配置save啓動注意事項
save配置要根據實際業務情況進行設置,頻度過高或過低都會出現性能問題,結果可能是災難性的。

save配置中對於second與changes設置通常具有互補對應關係,儘量不要設置成包含性關係。

save配置啓動後執行的是bgsave操作。

2.4.3 RDB 特殊啓動方式
(1)全量複製啓動方式

(2)在服務器運行過程中重啓

debug reload

(3)關閉服務器時指定保存數據

shutdown save

2.4.4 RDB 啓動方式比較

方式 save指令 bgsave指令
讀寫 同步 異步
阻塞客戶端指令
額外內存消耗
啓動新進程

三、AOF 持久化

3.1 AOF 持久化概述

3.1.1 AOF 持久化介紹
AOF(append only file)持久化:以獨立日誌的方式記錄每次寫命令,重啓時再重新執行AOF文件中命令達到恢復數據的目的。與RDB相比可以簡單描述爲改記錄數據爲記錄數據產生的過程

AOF的主要作用是解決了數據持久化的實時性,目前已經是Redis持久化的主流方式。

3.1.2 AOF 持久化優缺點
(1)AOF 的優點
使用 AOF 持久化會讓 Redis 變得非常耐久(much more durable):你可以設置不同的 fsync 策略,比如無 fsync ,每秒鐘一次 fsync ,或者每次執行寫入命令時 fsync 。 AOF 的默認策略爲每秒鐘 fsync 一次,在這種配置下,Redis 仍然可以保持良好的性能,並且就算髮生故障停機,也最多隻會丟失一秒鐘的數據( fsync 會在後臺線程執行,所以主線程可以繼續努力地處理命令請求)。

AOF 文件是一個只進行追加操作的日誌文件(append only log), 因此對 AOF 文件的寫入不需要進行 seek , 即使日誌因爲某些原因而包含了未寫入完整的命令(比如寫入時磁盤已滿,寫入中途停機,等等), redis-check-aof 工具也可以輕易地修復這種問題。

Redis 可以在 AOF 文件體積變得過大時,自動地在後臺對 AOF 進行重寫: 重寫後的新 AOF 文件包含了恢復當前數據集所需的最小命令集合。 整個重寫操作是絕對安全的,因爲 Redis 在創建新 AOF 文件的過程中,會繼續將命令追加到現有的 AOF 文件裏面,即使重寫過程中發生停機,現有的 AOF 文件也不會丟失。 而一旦新 AOF 文件創建完畢,Redis 就會從舊 AOF 文件切換到新 AOF 文件,並開始對新 AOF 文件進行追加操作。

AOF 文件有序地保存了對數據庫執行的所有寫入操作, 這些寫入操作以 Redis 協議的格式保存, 因此 AOF 文件的內容非常容易被人讀懂, 對文件進行分析(parse)也很輕鬆。 導出(export) AOF 文件也非常簡單: 舉個例子, 如果你不小心執行了 FLUSHALL 命令, 但只要 AOF 文件未被重寫, 那麼只要停止服務器, 移除 AOF 文件末尾的 FLUSHALL 命令, 並重啓 Redis , 就可以將數據集恢復到 FLUSHALL 執行之前的狀態。

(2)AOF 的缺點
對於相同的數據集來說,AOF 文件的體積通常要大於 RDB 文件的體積。

根據所使用的 fsync 策略,AOF 的速度可能會慢於 RDB 。 在一般情況下, 每秒 fsync 的性能依然非常高, 而關閉 fsync 可以讓 AOF 的速度和 RDB 一樣快, 即使在高負荷之下也是如此。 不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)。

AOF 在過去曾經發生過這樣的 bug : 因爲個別命令的原因,導致 AOF 文件在重新載入時,無法將數據集恢復成保存時的原樣。 (舉個例子,阻塞命令 BRPOPLPUSH source destination timeout 就曾經引起過這樣的 bug 。) 測試套件裏爲這種情況添加了測試: 它們會自動生成隨機的、複雜的數據集, 並通過重新載入這些數據來確保一切正常。 雖然這種 bug 在 AOF 文件中並不常見, 但是對比來說, RDB 幾乎是不可能出現這種 bug 的。

3.2 AOF 持久化策略

3.2.1 AOF 持久化策略介紹
(1)always(每次)
每次寫入操作均同步到AOF文件中,數據零誤差,性能較低。

(2)everysec (每秒)
每秒將緩衝區中的指令同步到AOF文件中,數據準確性較高,性能較高,在系統突然宕機的情況下只會丟失1秒內的數據。

(3)no (系統控制)
由操作系統控制每次同步到AOF文件的週期,整體過程不可控。

**3.2.2AOF 持久化策略配置 **
首先要在配置文件中開啓AOP持久化策略功能,默認爲不開啓狀態

appendonly yes|no

然後再配置文件中配置具體的AOP持久化策略

appendfsyno always|everysec|no 

其他配置

appendfilename filename

AOF持久化文件名,默認文件名未appendonly.aof,建議配置爲appendonly-端口號.aof

dir

AOF持久化文件保存路徑,與RDB持久化文件保持一致即可

3.3 AOP 重寫

3.3.1 AOP 重寫介紹
隨着命令不斷寫入AOF,文件會越來越大,爲了解決這個問題,Redis引入 了AOF重寫機制壓縮文件體積。AOF文件重
寫是將Redis進程內的數據轉化爲寫命令同步到新AOF文件的過程。簡單說就是將對同一個數據的若干個條命令執行結
果轉化成最終結果數據對應的指令進行記錄。

3.3.2 AOP 重寫作用

  • 降低磁盤佔用量,提高磁盤利用率
  • 提高持久化效率,降低持久化寫時間,提高IO性能
  • 降低數據恢復用時,提高數據恢復效率

3.3.3 AOP 重寫規則

  • 進程內已超時的數據不再寫入文件
  • 忽略無效指令,重寫時使用進程內數據直接生成,這樣新的AOF文件只保留最終數據的寫入命令,如del key1hdel key2sremkey3set key4 111. set key4 222等。
  • 對同一數據的多條寫命令合併爲一條命令
    lpush list1 aIpush list1 bIlpush list1 c可以轉化爲:Ipush list1 a b c。爲防止數據量過大造成客戶端緩衝區溢出,對list. set. hash. zset等類型,每條指令最多寫入64個元素。

3.3.4 AOP 重寫相關指令
手動重寫

bgrewriteaof

自動重寫

auto-aof-rewrite-min-size size
auto-aof-rewrite-percentage percentage

自動重寫觸發比對參數 (運行指令info Persistence獲取具體信息)

aof_current_size
aof_base_size

自動重寫觸發條件

aof_current_size > auto-aof-rewrite-min-size
aof_current_size - aof_base_size / aof_base_size >= auto-aof-rewrite-percentage 

3.4 RDB 和 AOP 比較

3.4.1 RDB 和 AOF 比較

持久化方式 RDB AOF
佔用存儲空間 小(數據級:壓縮) 大(指令級:重寫
存儲速度
恢復速度
數據安全性 會丟失數據 依據策略決定
資源消耗 高/重量級 低/輕量級
啓動優先級

3.4.2 RDB 和 AOF 選擇

  • 一般來說, 如果想達到足以媲美 PostgreSQL 的數據安全性, 可以同時使用兩種持久化功能。
  • 如果你非常重視數據, 但仍然可以承受數分鐘以內的數據丟失, 那麼你可以只使用 RDB 持久化。
  • 對數據非常敏感,建議使用默認的AOF持久化方案
    • AOF持久化策略使用everysecond,每秒鐘fsync一次。該策略redis5仍可以保持很好的處理性能,當出
      現問題時,最多丟失0-1秒內的數據。
    • 注意:由於AOF文件存儲體積較大,且恢復速度較慢
  • 數據呈現階段有效性,建議使用RDB持久化方案
    • 數據可以良好的做到階段內無丟失(該階段是開發者或運維人員手工維護的),且恢復速度較快,階段
      點數據恢復通常採用RDB方案
    • 注意:利用RDB實現緊湊的數據持久化會使Redis降的很低
  • 綜合比對
  • RDB與AOF的選擇實際上是在做一種權衡,每種都有利有弊
  • 如不能承受數分鐘以內的數據丟失,對業務數據非常敏感,選用AOF
  • 如能承受數分鐘以內的數據失,且追求大數據集的恢復速度,選用RDB
  • 災難恢復選用RDB
  • 雙保險策略,同時開啓RDB和AOF,重啓後,Redis優先使用AOF來恢復數據,降低丟失數據的量

有很多用戶都只使用 AOF 持久化, 但我們並不推薦這種方式: 因爲定時生成 RDB 快照(snapshot)非常便於進行數據庫備份, 並且 RDB 恢復數據集的速度也要比 AOF 恢復的速度要快, 除此之外, 使用 RDB 還可以避免之前提到的 AOF 程序的 bug 。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章