之前的文章講解了 Redis 的數據結構,這回就可以看看作爲內存數據庫,Redis 是怎麼存儲數據的以及鍵是怎麼過期的。
閱讀這篇文章你將會瞭解到:
- Redis 的數據庫實現
- Redis 鍵過期的策略
數據庫的實現
我們先看代碼 server.h/redisServer
struct redisServer{ ... //保存 db 的數組 redisDb *db; //db 的數量 int dbnum; ... }
再看redisDb的代碼:
typedef struct redisDb { dict *dict; /* The keyspace for this DB */ dict *expires; /* Timeout of keys with a timeout set */ dict *blocking_keys; /* Keys with clients waiting for data (BLPOP)*/ dict *ready_keys; /* Blocked keys that received a PUSH */ dict *watched_keys; /* WATCHED keys for MULTI/EXEC CAS */ int id; /* Database ID */ long long avg_ttl; /* Average TTL, just for stats */ } redisDb;
總體來說redis的 server 包含若干個(默認16個) redisDb 數據庫。
Redis 是一個 k-v 存儲的鍵值對數據庫。其中字典 dict 保存了數據庫中的所有鍵值對,這個地方叫做 keyspace
直譯過來就是“鍵空間”。
所以我們就可以這麼認爲,在 redisDb 中我們使用 dict(字典)來維護鍵空間。
- keyspace 的 kay 是數據庫的 key,每一個key 是一個字符串對象。注意不是字符串,而是字符串對象。
- keyspace 的 value 是數據庫的 value,這個 value 可以是 redis 的,字符串對象,列表對象,哈希表對象,集合對象或者有序對象中的一種。
數據庫讀寫操作
所以對於數據的增刪改查,就是對 keyspace 這個大 map 的增刪改查。
當我們執行:
>redis SET mobile "13800000000"
實際上就是爲 keyspace 增加了一個 key 是包含字符串“mobile”的字符串對象,value 爲包含字符“13800000000”的字符串對象。
看圖:
對於刪改查,沒啥好說的。類似java 的 map 操作,大多數程序員應該都能理解。
需要特別注意的是,再執行對鍵的讀寫操作的時候,Redis 還要做一些額外的維護動作:
- 維護 hit 和 miss 兩個計數器。用於統計 Redis 的緩存命中率。
- 更新鍵的 LRU 時間,記錄鍵的最後活躍時間。
- 如果在讀取的時候發現鍵已經過期,Redis 先刪除這個過期的鍵然後再執行餘下操作。
- 如果有客戶對這個鍵執行了 WATCH 操作,會把這個鍵標記爲 dirty,讓事務注意到這個鍵已經被改過。
- 沒修改一次 dirty 會增加1。
- 如果服務器開啓了數據庫通知功能,鍵被修改之後,會按照配置發送通知。
鍵的過期實現
Redis 作爲緩存使用最主要的一個特性就是可以爲鍵值對設置過期時間。就看看 Redis 是如果實現這一個最重要的特性的?
在 Redis 中與過期時間有關的命令
- EXPIRE 設置 key 的存活時間單位秒
- EXPIREAT 設置 key 的過期時間點單位秒
- PEXPIRE 設置 key 的存活時間單位毫秒
- PEXPIREAT 設置 key 的過期時間點單位毫秒
其實這些命令,底層的命令都是由 REXPIREAT 實現的。
在 redisDb 中使用了 dict *expires,來存儲過期時間的。其中 key 指向了 keyspace 中的 key(c 語言中的指針), value 是一個 long long 類型的時間戳,標定這個 key 過期的時間點,單位是毫秒。
如果我們爲上文的 mobile 增加一個過期時間。
>redis PEXPIREAT mobile 1521469812000
這個時候就會在過期的 字典中增加一個鍵值對。如下圖:
對於過期的判斷邏輯就很簡單:
- 在 字典 expires 中 key 是否存在。
- 如果 key 存在,value 的時間戳是否小於當前系統時間戳。
接下來就需要討論一下過期的鍵的刪除策略。
key的刪除有三種策略:
- 定時刪除,Redis定時的刪除內存裏面所有過期的鍵值對,這樣能夠保證內存友好,過期的key都會被刪除,但是如果key的數量很多,一次刪除需要CPU運算,CPU不友好。
- 惰性刪除,只有 key 在被調用的時候纔去檢查鍵值對是否過期,但是會造成內存中存儲大量的過期鍵值對,內存不友好,但是極大的減輕CPU 的負擔。
- 定時部分刪除,Redis定時掃描過期鍵,但是隻刪除部分,至於刪除多少鍵,根據當前 Redis 的狀態決定。
這三種策略就是對時間和空間有不同的傾向。Redis爲了平衡時間和空間,採用了後兩種策略 惰性刪除和定時部分刪除。
惰性刪除比較簡單,不做過多介紹。主要討論一下定時部分刪除。
過期鍵的定時刪除的策略由 expire.c/activeExpireCycle() 函數實現,server.c/serverCron() 定時的調用 activieExpireCycle()
。
activeExpireCycle 的大的操作原則是,如果過期的key比較少,則刪除key的數量也比較保守,如果,過期的鍵多,刪除key的策略就會很激進。
static unsigned int current_db = 0; /* Last DB tested. */ static int timelimit_exit = 0; /* Time limit hit in previous call? */ static long long last_fast_cycle = 0; /* When last fast cycle ran. */
- 首先三個
static
全局參數分別記錄目前遍歷的 db下標,上一次刪除是否是超時退出的,上一次快速操作是什麼時候進行的。 - 計算
timelimit = 1000000*ACTIVE_EXPIRE_CYCLE_SLOW_TIME_PERC/server.hz/100;
可以理解爲 25% 的 cpu 時間。 - 如果 db 中 expire 的大小爲0 不操作
- expire 佔總 key 小於 1% 不操作
- num = dictSize(db->expires);num 是 expire 使用的key的數量。
- slots = dictSlots(db->expires); slots 是 expire 字典的尺寸大小。
- 已使用的key(num) 大於 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 則設置爲 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP。也就是說每次只檢查 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 個鍵。
- 隨機獲取帶過期的 key。計算是否過期,如果過期就刪除。
- 然後各種統計,包括刪除鍵的次數,平均過期時間。
- 每遍歷十六次,計算操作時間,如果超過 timelimit 結束返回。
- 如果刪除的過期鍵大於 ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP 的 1\4 就跳出循環,結束。
步驟比較複雜,總結一下:(這裏都是以默認配置描述)
- redis 會用最多 25% 的 cpu 時間處理鍵的過期。
- 遍歷所有的 redisDb
- 在每個 redisDb 中如果數據中沒有過期鍵或者過期鍵比例過低就直接進入下一個 redisDb。
- 否則,遍歷 redisDb 中的過期鍵,如果刪除的鍵達到有過期時間的的key 的25% ,或者操作時間大於 cpu 時間的 25% 就結束當前循環,進入下一個redisDb。
後記
這篇文章主要解釋了 Redis 的數據庫是怎麼實現的,同時介紹了 Redis 處理過期鍵的邏輯。看 Redis 的代碼越多越發現,實際上 Redis 一直在做的一件事情就是平衡,一直在平衡程序的空間和時間。其實平時的業務設計,就是在宏觀上平衡,平衡宏觀系統的時間和空間。所以,看源碼是讓我們從微觀學習系統架構的良好途徑,是架構師的成長的必經之路。