Redis 數據庫、鍵過期的實現

之前的文章講解了 Redis 的數據結構,這回就可以看看作爲內存數據庫,Redis 是怎麼存儲數據的以及鍵是怎麼過期的。

閱讀這篇文章你將會瞭解到:

  • Redis 的數據庫實現
  • Redis 鍵過期的策略

數據庫的實現

我們先看代碼 server.h/redisServer

struct redisServer{
    ...
    //保存 db 的數組
    redisDb *db;
    
    //db 的數量
    int dbnum;
    ...
}

再看redisDb的代碼:

typedef struct redisDb {
    dict *dict;                 /* The keyspace for this DB */
    dict *expires;              /* Timeout of keys with a timeout set */
    dict *blocking_keys;        /* Keys with clients waiting for data (BLPOP)*/
    dict *ready_keys;           /* Blocked keys that received a PUSH */
    dict *watched_keys;         /* WATCHED keys for MULTI/EXEC CAS */
    int id;                     /* Database ID */
    long long avg_ttl;          /* Average TTL, just for stats */
} redisDb;

總體來說redis的 server 包含若干個(默認16個) redisDb 數據庫。

Redis 是一個 k-v 存儲的鍵值對數據庫。其中字典 dict 保存了數據庫中的所有鍵值對,這個地方叫做 keyspace 直譯過來就是“鍵空間”。

所以我們就可以這麼認爲,在 redisDb 中我們使用 dict(字典)來維護鍵空間。

  • keyspace 的 kay 是數據庫的 key,每一個key 是一個字符串對象。注意不是字符串,而是字符串對象。
  • keyspace 的 value 是數據庫的 value,這個 value 可以是 redis 的,字符串對象,列表對象,哈希表對象,集合對象或者有序對象中的一種。

數據庫讀寫操作

所以對於數據的增刪改查,就是對 keyspace 這個大 map 的增刪改查。

當我們執行:

>redis SET mobile "13800000000"

實際上就是爲 keyspace 增加了一個 key 是包含字符串“mobile”的字符串對象,value 爲包含字符“13800000000”的字符串對象。

看圖:

對於刪改查,沒啥好說的。類似java 的 map 操作,大多數程序員應該都能理解。

需要特別注意的是,再執行對鍵的讀寫操作的時候,Redis 還要做一些額外的維護動作:

  • 維護 hit 和 miss 兩個計數器。用於統計 Redis 的緩存命中率。
  • 更新鍵的 LRU 時間,記錄鍵的最後活躍時間。
  • 如果在讀取的時候發現鍵已經過期,Redis 先刪除這個過期的鍵然後再執行餘下操作。
  • 如果有客戶對這個鍵執行了 WATCH 操作,會把這個鍵標記爲 dirty,讓事務注意到這個鍵已經被改過。
  • 沒修改一次 dirty 會增加1。
  • 如果服務器開啓了數據庫通知功能,鍵被修改之後,會按照配置發送通知。

鍵的過期實現

Redis 作爲緩存使用最主要的一個特性就是可以爲鍵值對設置過期時間。就看看 Redis 是如果實現這一個最重要的特性的?

在 Redis 中與過期時間有關的命令

  • EXPIRE 設置 key 的存活時間單位秒
  • EXPIREAT 設置 key 的過期時間點單位秒
  • PEXPIRE 設置 key 的存活時間單位毫秒
  • PEXPIREAT 設置 key 的過期時間點單位毫秒

其實這些命令,底層的命令都是由 REXPIREAT 實現的。

在 redisDb 中使用了 dict *expires,來存儲過期時間的。其中 key 指向了 keyspace 中的 key(c 語言中的指針), value 是一個 long long 類型的時間戳,標定這個 key 過期的時間點,單位是毫秒。

如果我們爲上文的 mobile 增加一個過期時間。

>redis PEXPIREAT mobile 1521469812000

這個時候就會在過期的 字典中增加一個鍵值對。如下圖:

對於過期的判斷邏輯就很簡單:

  1. 在 字典 expires 中 key 是否存在。
  2. 如果 key 存在,value 的時間戳是否小於當前系統時間戳。

接下來就需要討論一下過期的鍵的刪除策略。

key的刪除有三種策略:

  1. 定時刪除,Redis定時的刪除內存裏面所有過期的鍵值對,這樣能夠保證內存友好,過期的key都會被刪除,但是如果key的數量很多,一次刪除需要CPU運算,CPU不友好。
  2. 惰性刪除,只有 key 在被調用的時候纔去檢查鍵值對是否過期,但是會造成內存中存儲大量的過期鍵值對,內存不友好,但是極大的減輕CPU 的負擔。
  3. 定時部分刪除,Redis定時掃描過期鍵,但是隻刪除部分,至於刪除多少鍵,根據當前 Redis 的狀態決定。

這三種策略就是對時間和空間有不同的傾向。Redis爲了平衡時間和空間,採用了後兩種策略 惰性刪除和定時部分刪除。

惰性刪除比較簡單,不做過多介紹。主要討論一下定時部分刪除。

過期鍵的定時刪除的策略由 expire.c/activeExpireCycle() 函數實現,server.c/serverCron() 定時的調用 activieExpireCycle()

activeExpireCycle 的大的操作原則是,如果過期的key比較少,則刪除key的數量也比較保守,如果,過期的鍵多,刪除key的策略就會很激進。

static unsigned int current_db = 0; /* Last DB tested. */
static int timelimit_exit = 0;      /* Time limit hit in previous call? */
static long long last_fast_cycle = 0; /* When last fast cycle ran. */
  • 首先三個 static 全局參數分別記錄目前遍歷的 db下標,上一次刪除是否是超時退出的,上一次快速操作是什麼時候進行的。
  • 計算 timelimit = 1000000*ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC/server.hz/100; 可以理解爲 25% 的 cpu 時間。
  • 如果 db 中 expire 的大小爲0 不操作
  • expire 佔總 key 小於 1% 不操作
  • num = dictSize(db->expires);num 是 expire 使用的key的數量。
  • slots = dictSlots(db->expires); slots 是 expire 字典的尺寸大小。
  • 已使用的key(num) 大於 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 則設置爲 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP。也就是說每次只檢查 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 個鍵。
  • 隨機獲取帶過期的 key。計算是否過期,如果過期就刪除。
  • 然後各種統計,包括刪除鍵的次數,平均過期時間。
  • 每遍歷十六次,計算操作時間,如果超過 timelimit 結束返回。
  • 如果刪除的過期鍵大於 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 的 1\4 就跳出循環,結束。

步驟比較複雜,總結一下:(這裏都是以默認配置描述)

  1. redis 會用最多 25% 的 cpu 時間處理鍵的過期。
  2. 遍歷所有的 redisDb
  3. 在每個 redisDb 中如果數據中沒有過期鍵或者過期鍵比例過低就直接進入下一個 redisDb。
  4. 否則,遍歷 redisDb 中的過期鍵,如果刪除的鍵達到有過期時間的的key 的25% ,或者操作時間大於 cpu 時間的 25% 就結束當前循環,進入下一個redisDb。

後記

這篇文章主要解釋了 Redis 的數據庫是怎麼實現的,同時介紹了 Redis 處理過期鍵的邏輯。看 Redis 的代碼越多越發現,實際上 Redis 一直在做的一件事情就是平衡,一直在平衡程序的空間和時間。其實平時的業務設計,就是在宏觀上平衡,平衡宏觀系統的時間和空間。所以,看源碼是讓我們從微觀學習系統架構的良好途徑,是架構師的成長的必經之路。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章