2020 年最新版 68道Redis面試題,20000字乾貨,趕緊收藏起來備用

文章內容過長,建議先收藏 慢慢看!

需要更多其他Java知識點的面試題及答案的老鐵請轉發並關注,然後加我VX【tkzl6666】獲得免費領取方式!

Redis(Remote Dictionary Server) 是一個使用 C 語言編寫的,開源的(BSD許可)高性能非關係型(NoSQL)的鍵值對數據庫。

Redis 可以存儲鍵和五種不同類型的值之間的映射。鍵的類型只能爲字符串,只支持五種數據類型:字符串、列表、集合、散列表、有序集合。

與傳統數據庫不同的是 Redis 的數據是存在內存中的,所以讀寫速度非常快,因此 redis 被廣泛應用於緩存方向,每秒可以處理超過 10萬次讀寫操作,是已知性能最快的Key-Value DB。另外,Redis 也經常用來做分佈式鎖。除此之外,Redis 支持事務 、持久化、LUA腳本、LRU驅動事件、多種集羣方案。

今天就來講講Redis 的面試題,爲復工後的面試做好準備。

3d8f6a78f09d4fb5846d7a19784ba6bc


一、概述

1、Redis有哪些優缺點

優點

  • 讀寫性能優異, Redis能讀的速度是110000次/s,寫的速度是81000次/s。

  • 支持數據持久化,支持AOF和RDB兩種持久化方式。

  • 支持事務,Redis的所有操作都是原子性的,同時Redis還支持對幾個操作合併後的原子性執行。

  • 數據結構豐富,除了支持string類型的value外還支持hash、set、zset、list等數據結構。

  • 支持主從複製,主機會自動將數據同步到從機,可以進行讀寫分離。

缺點

  • 數據庫容量受到物理內存的限制,不能用作海量數據的高性能讀寫,因此Redis適合的場景主要侷限在較小數據量的高性能操作和運算上。

  • Redis 不具備自動容錯和恢復功能,主機從機的宕機都會導致前端部分讀寫請求失敗,需要等待機器重啓或者手動切換前端的IP才能恢復。

  • 主機宕機,宕機前有部分數據未能及時同步到從機,切換IP後還會引入數據不一致的問題,降低了系統的可用性。

  • Redis 較難支持在線擴容,在集羣容量達到上限時在線擴容會變得很複雜。爲避免這一問題,運維人員在系統上線時必須確保有足夠的空間,這對資源造成了很大的浪費。

2、爲什麼要用 Redis /爲什麼要用緩存

主要從“高性能”和“高併發”這兩點來看待這個問題。

  • 高性能:

假如用戶第一次訪問數據庫中的某些數據。這個過程會比較慢,因爲是從硬盤上讀取的。將該用戶訪問的數據存在數緩存中,這樣下一次再訪問這些數據的時候就可以直接從緩存中獲取了。操作緩存就是直接操作內存,所以速度相當快。如果數據庫中的對應數據改變的之後,同步改變緩存中相應的數據即可!

6156ba0adee64089aa288d08e628ead4


  • 高併發:

直接操作緩存能夠承受的請求是遠遠大於直接訪問數據庫的,所以我們可以考慮把數據庫中的部分數據轉移到緩存中去,這樣用戶的一部分請求會直接到緩存這裏而不用經過數據庫。

e036ecf27e4a465494e0eeb7b73a6961


3、爲什麼要用 Redis 而不用 map/guava 做緩存?

緩存分爲本地緩存和分佈式緩存。以 Java 爲例,使用自帶的 map 或者 guava 實現的是本地緩存,最主要的特點是輕量以及快速,生命週期隨着 jvm 的銷燬而結束,並且在多實例的情況下,每個實例都需要各自保存一份緩存,緩存不具有一致性。

使用 redis 或 memcached 之類的稱爲分佈式緩存,在多實例的情況下,各實例共用一份緩存數據,緩存具有一致性。缺點是需要保持 redis 或 memcached服務的高可用,整個程序架構上較爲複雜。

4、Redis爲什麼這麼快

1)完全基於內存,絕大部分請求是純粹的內存操作,非常快速。數據存在內存中,類似於 HashMap,HashMap 的優勢就是查找和操作的時間複雜度都是O(1);

2)數據結構簡單,對數據操作也簡單,Redis 中的數據結構是專門進行設計的;

3)採用單線程,避免了不必要的上下文切換和競爭條件,也不存在多進程或者多線程導致的切換而消耗 CPU,不用去考慮各種鎖的問題,不存在加鎖釋放鎖操作,沒有因爲可能出現死鎖而導致的性能消耗;

4)使用多路 I/O 複用模型,非阻塞 IO;

5使用底層模型不同,它們之間底層實現方式以及與客戶端之間通信的應用協議不一樣,Redis 直接自己構建了 VM 機制 ,因爲一般的系統調用系統函數的話,會浪費一定的時間去移動和請求;

二、數據類型

5、Redis有哪些數據類型

Redis主要有5種數據類型,包括String,List,Set,Zset,Hash,滿足大部分的使用要求

bd5da9ce948d44d488270f6e9fcb5064


6、Redis的應用場景

  • 總結一

計數器:可以對 String 進行自增自減運算,從而實現計數器功能。Redis 這種內存型數據庫的讀寫性能非常高,很適合存儲頻繁讀寫的計數量。

緩存:將熱點數據放到內存中,設置內存的最大使用量以及淘汰策略來保證緩存的命中率。

會話緩存:可以使用 Redis 來統一存儲多臺應用服務器的會話信息。當應用服務器不再存儲用戶的會話信息,也就不再具有狀態,一個用戶可以請求任意一個應用服務器,從而更容易實現高可用性以及可伸縮性。

全頁緩存(FPC):除基本的會話token之外,Redis還提供很簡便的FPC平臺。以Magento爲例,Magento提供一個插件來使用Redis作爲全頁緩存後端。此外,對WordPress的用戶來說,Pantheon有一個非常好的插件 wp-redis,這個插件能幫助你以最快速度加載你曾瀏覽過的頁面。

查找表:例如 DNS 記錄就很適合使用 Redis 進行存儲。查找表和緩存類似,也是利用了 Redis 快速的查找特性。但是查找表的內容不能失效,而緩存的內容可以失效,因爲緩存不作爲可靠的數據來源。

消息隊列(發佈/訂閱功能):List 是一個雙向鏈表,可以通過 lpush 和 rpop 寫入和讀取消息。不過最好使用 Kafka、RabbitMQ 等消息中間件。

分佈式鎖實現:在分佈式場景下,無法使用單機環境下的鎖來對多個節點上的進程進行同步。可以使用 Redis 自帶的 SETNX 命令實現分佈式鎖,除此之外,還可以使用官方提供的 RedLock 分佈式鎖實現。

其它:Set 可以實現交集、並集等操作,從而實現共同好友等功能。ZSet 可以實現有序性操作,從而實現排行榜等功能。

  • 總結二

Redis相比其他緩存,有一個非常大的優勢,就是支持多種數據類型。

數據類型說明string字符串,最簡單的k-v存儲hashhash格式,value爲field和value,適合ID-Detail這樣的場景。list簡單的list,順序列表,支持首位或者末尾插入數據set無序list,查找速度快,適合交集、並集、差集處理sorted set有序的set

其實,通過上面的數據類型的特性,基本就能想到合適的應用場景了。

string——適合最簡單的k-v存儲,類似於memcached的存儲結構,短信驗證碼,配置信息等,就用這種類型來存儲。

hash——一般key爲ID或者唯一標示,value對應的就是詳情了。如商品詳情,個人信息詳情,新聞詳情等。

list——因爲list是有序的,比較適合存儲一些有序且數據相對固定的數據。如省市區表、字典表等。因爲list是有序的,適合根據寫入的時間來排序,如:最新的***,消息隊列等。

set——可以簡單的理解爲ID-List的模式,如微博中一個人有哪些好友,set最牛的地方在於,可以對兩個set提供交集、並集、差集操作。例如:查找兩個人共同的好友等。

Sorted Set——是set的增強版本,增加了一個score參數,自動會根據score的值進行排序。比較適合類似於top 10等不根據插入的時間來排序的數據。

如上所述,雖然Redis不像關係數據庫那麼複雜的數據結構,但是,也能適合很多場景,比一般的緩存數據結構要多。瞭解每種數據結構適合的業務場景,不僅有利於提升開發效率,也能有效利用Redis的性能。

三、持久化

7、什麼是Redis持久化?

持久化就是把內存的數據寫到磁盤中去,防止服務宕機了內存數據丟失。

8、Redis 的持久化機制是什麼?各自的優缺點?

Redis 提供兩種持久化機制 RDB(默認) 和 AOF 機制:

RDB:是Redis DataBase縮寫快照

RDB是Redis默認的持久化方式。按照一定的時間將內存的數據以快照的形式保存到硬盤中,對應產生的數據文件爲dump.rdb。通過配置文件中的save參數來定義快照的週期。

64718064d0d942d1b7ca5a91b48e35bc


優點:

1、只有一個文件 dump.rdb,方便持久化。

2、容災性好,一個文件可以保存到安全的磁盤。

3、性能最大化,fork 子進程來完成寫操作,讓主進程繼續處理命令,所以是 IO 最大化。使用單獨子進程來進行持久化,主進程不會進行任何 IO 操作,保證了 redis 的高性能

4.相對於數據集大時,比 AOF 的啓動效率更高。

缺點:

1、數據安全性低。RDB 是間隔一段時間進行持久化,如果持久化之間 redis 發生故障,會發生數據丟失。所以這種方式更適合數據要求不嚴謹的時候)

2、AOF(Append-only file)持久化方式:是指所有的命令行記錄以 redis 命令請 求協議的格式完全持久化存儲)保存爲 aof 文件。

AOF:持久化

AOF持久化(即Append Only File持久化),則是將Redis執行的每次寫命令記錄到單獨的日誌文件中,當重啓Redis會重新將持久化的日誌中文件恢復數據。

當兩種方式同時開啓時,數據恢復Redis會優先選擇AOF恢復。

1d7f99b1d6174e128ae46f447fb47d06


  • 優點:

1、數據安全,aof 持久化可以配置 appendfsync 屬性,有 always,每進行一次 命令操作就記錄到 aof 文件中一次。

2、通過 append 模式寫文件,即使中途服務器宕機,可以通過 redis-check-aof 工具解決數據一致性問題。

3、AOF 機制的 rewrite 模式。AOF 文件沒被 rewrite 之前(文件過大時會對命令 進行合併重寫),可以刪除其中的某些命令(比如誤操作的 flushall))

  • 缺點:

1、AOF 文件比 RDB 文件大,且恢復速度慢。

2、數據集大的時候,比 rdb 啓動效率低。

優缺點是什麼?

AOF文件比RDB更新頻率高,優先使用AOF還原數據。

AOF比RDB更安全也更大

RDB性能比AOF好

如果兩個都配了優先加載AOF

9、如何選擇合適的持久化方式

  • 一般來說, 如果想達到足以媲美PostgreSQL的數據安全性,你應該同時使用兩種持久化功能。在這種情況下,當 Redis 重啓的時候會優先載入AOF文件來恢復原始的數據,因爲在通常情況下AOF文件保存的數據集要比RDB文件保存的數據集要完整。

  • 如果你非常關心你的數據, 但仍然可以承受數分鐘以內的數據丟失,那麼你可以只使用RDB持久化。

  • 有很多用戶都只使用AOF持久化,但並不推薦這種方式,因爲定時生成RDB快照(snapshot)非常便於進行數據庫備份, 並且 RDB 恢復數據集的速度也要比AOF恢復的速度要快,除此之外,使用RDB還可以避免AOF程序的bug。

  • 如果你只希望你的數據在服務器運行的時候存在,你也可以不使用任何持久化方式。

10、Redis持久化數據和緩存怎麼做擴容?

  • 如果Redis被當做緩存使用,使用一致性哈希實現動態擴容縮容。

  • 如果Redis被當做一個持久化存儲使用,必須使用固定的keys-to-nodes映射關係,節點的數量一旦確定不能變化。否則的話(即Redis節點需要動態變化的情況),必須使用可以在運行時進行數據再平衡的一套系統,而當前只有Redis集羣可以做到這樣。

四、內存相關

14、MySQL裏有2000w數據,redis中只存20w的數據,如何保證redis中的數據都是熱點數據?

redis內存數據集大小上升到一定大小的時候,就會施行數據淘汰策略。

15、Redis的內存淘汰策略有哪些?

Redis的內存淘汰策略是指在Redis的用於緩存的內存不足時,怎麼處理需要新寫入且需要申請額外空間的數據。

全局的鍵空間選擇性移除

  • noeviction:當內存不足以容納新寫入數據時,新寫入操作會報錯。

  • allkeys-lru:當內存不足以容納新寫入數據時,在鍵空間中,移除最近最少使用的key。(這個是最常用的)

  • allkeys-random:當內存不足以容納新寫入數據時,在鍵空間中,隨機移除某個key。

設置過期時間的鍵空間選擇性移除

  • volatile-lru:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,移除最近最少使用的key。

  • volatile-random:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,隨機移除某個key。

  • volatile-ttl:當內存不足以容納新寫入數據時,在設置了過期時間的鍵空間中,有更早過期時間的key優先移除。

總結

Redis的內存淘汰策略的選取並不會影響過期的key的處理。內存淘汰策略用於處理內存不足時的需要申請額外空間的數據;過期策略用於處理過期的緩存數據。

16、Redis主要消耗什麼物理資源?

內存。

17、Redis的內存用完了會發生什麼?

如果達到設置的上限,Redis的寫命令會返回錯誤信息(但是讀命令還可以正常返回。)或者你可以配置內存淘汰機制,當Redis達到內存上限時會沖刷掉舊的內容。

18、Redis如何做內存優化?

可以好好利用Hash,list,sorted set,set等集合類型數據,因爲通常情況下很多小的Key-Value可以用更緊湊的方式存放到一起。儘可能使用散列表(hashes),散列表(是說散列表裏面存儲的數少)使用的內存非常小,所以你應該儘可能的將你的數據模型抽象到一個散列表裏面。比如你的web系統中有一個用戶對象,不要爲這個用戶的名稱,姓氏,郵箱,密碼設置單獨的key,而是應該把這個用戶的所有信息存儲到一張散列表裏面。

五、線程模型

19、Redis線程模型

Redis基於Reactor模式開發了網絡事件處理器,這個處理器被稱爲文件事件處理器(file event handler)。它的組成結構爲4部分:多個套接字、IO多路複用程序、文件事件分派器、事件處理器。因爲文件事件分派器隊列的消費是單線程的,所以Redis才叫單線程模型。

  • 文件事件處理器使用 I/O 多路複用(multiplexing)程序來同時監聽多個套接字, 並根據套接字目前執行的任務來爲套接字關聯不同的事件處理器。

  • 當被監聽的套接字準備好執行連接應答(accept)、讀取(read)、寫入(write)、關閉(close)等操作時, 與操作相對應的文件事件就會產生, 這時文件事件處理器就會調用套接字之前關聯好的事件處理器來處理這些事件。

雖然文件事件處理器以單線程方式運行, 但通過使用 I/O 多路複用程序來監聽多個套接字, 文件事件處理器既實現了高性能的網絡通信模型, 又可以很好地與 redis 服務器中其他同樣以單線程方式運行的模塊進行對接, 這保持了 Redis 內部單線程設計的簡單性。

六、線程模型

19、Redis線程模型

Redis基於Reactor模式開發了網絡事件處理器,這個處理器被稱爲文件事件處理器(file event handler)。它的組成結構爲4部分:多個套接字、IO多路複用程序、文件事件分派器、事件處理器。因爲文件事件分派器隊列的消費是單線程的,所以Redis才叫單線程模型。

  • 文件事件處理器使用 I/O 多路複用(multiplexing)程序來同時監聽多個套接字, 並根據套接字目前執行的任務來爲套接字關聯不同的事件處理器。

  • 當被監聽的套接字準備好執行連接應答(accept)、讀取(read)、寫入(write)、關閉(close)等操作時, 與操作相對應的文件事件就會產生, 這時文件事件處理器就會調用套接字之前關聯好的事件處理器來處理這些事件。

雖然文件事件處理器以單線程方式運行, 但通過使用 I/O 多路複用程序來監聽多個套接字, 文件事件處理器既實現了高性能的網絡通信模型, 又可以很好地與 redis 服務器中其他同樣以單線程方式運行的模塊進行對接, 這保持了 Redis 內部單線程設計的簡單性。

七、事務

20、什麼是事務?

事務是一個單獨的隔離操作:事務中的所有命令都會序列化、按順序地執行。事務在執行的過程中,不會被其他客戶端發送來的命令請求所打斷。

事務是一個原子操作:事務中的命令要麼全部被執行,要麼全部都不執行。

21、Redis事務的概念

Redis 事務的本質是通過MULTI、EXEC、WATCH等一組命令的集合。事務支持一次執行多個命令,一個事務中所有命令都會被序列化。在事務執行過程,會按照順序串行化執行隊列中的命令,其他客戶端提交的命令請求不會插入到事務執行命令序列中。

總結說:redis事務就是一次性、順序性、排他性的執行一個隊列中的一系列命令。

22、Redis事務的三個階段

  • 事務開始 MULTI

  • 命令入隊

  • 事務執行 EXEC

事務執行過程中,如果服務端收到有EXEC、DISCARD、WATCH、MULTI之外的請求,將會把請求放入隊列中排隊。

23、Redis事務相關命令

Redis事務功能是通過MULTI、EXEC、DISCARD和WATCH 四個原語實現的。

Redis會將一個事務中的所有命令序列化,然後按順序執行。

1)redis 不支持回滾,“Redis 在事務失敗時不進行回滾,而是繼續執行餘下的命令”, 所以 Redis 的內部可以保持簡單且快速。

2)如果在一個事務中的命令出現錯誤,那麼所有的命令都不會執行;

.3)如果在一個事務中出現運行錯誤,那麼正確的命令會被執行。

  • WATCH 命令是一個樂觀鎖,可以爲 Redis 事務提供 check-and-set (CAS)行爲。可以監控一個或多個鍵,一旦其中有一個鍵被修改(或刪除),之後的事務就不會執行,監控一直持續到EXEC命令。

  • MULTI命令用於開啓一個事務,它總是返回OK。MULTI執行之後,客戶端可以繼續向服務器發送任意多條命令,這些命令不會立即被執行,而是被放到一個隊列中,當EXEC命令被調用時,所有隊列中的命令纔會被執行。

  • EXEC:執行所有事務塊內的命令。返回事務塊內所有命令的返回值,按命令執行的先後順序排列。當操作被打斷時,返回空值 nil 。

  • 通過調用DISCARD,客戶端可以清空事務隊列,並放棄執行事務, 並且客戶端會從事務狀態中退出。

  • UNWATCH命令可以取消watch對所有key的監控。

24、事務管理(ACID)概述

原子性(Atomicity):原子性是指事務是一個不可分割的工作單位,事務中的操作要麼都發生,要麼都不發生。

一致性(Consistency):事務前後數據的完整性必須保持一致。

隔離性(Isolation):多個事務併發執行時,一個事務的執行不應影響其他事務的執行。

持久性(Durability):持久性是指一個事務一旦被提交,它對數據庫中數據的改變就是永久性的,接下來即使數據庫發生故障也不應該對其有任何影響

Redis的事務總是具有ACID中的一致性和隔離性,其他特性是不支持的。當服務器運行在AOF持久化模式下,並且appendfsync選項的值爲always時,事務也具有耐久性。

25、Redis事務支持隔離性嗎?

Redis 是單進程程序,並且它保證在執行事務時,不會對事務進行中斷,事務可以運行直到執行完所有事務隊列中的命令爲止。因此,Redis 的事務是總是帶有隔離性的。

26、Redis事務保證原子性嗎,支持回滾嗎?

Redis中,單條命令是原子性執行的,但事務不保證原子性,且沒有回滾。事務中任意命令執行失敗,其餘的命令仍會被執行。

27、Redis事務其他實現

  • 基於Lua腳本,Redis可以保證腳本內的命令一次性、按順序地執行,其同時也不提供事務運行錯誤的回滾,執行過程中如果部分命令運行錯誤,剩下的命令還是會繼續運行完

  • 基於中間標記變量,通過另外的標記變量來標識事務是否執行完成,讀取數據時先讀取該標記變量判斷是否事務執行完成。但這樣會需要額外寫代碼實現,比較繁瑣。

八、集羣方案

28、哨兵模式

0ca98083c42f413096f586b51f88fcdc


哨兵的介紹:

sentinel,中文名是哨兵。哨兵是 redis 集羣機構中非常重要的一個組件,主要有以下功能:

  • 集羣監控:負責監控 redis master 和 slave 進程是否正常工作。

  • 消息通知:如果某個 redis 實例有故障,那麼哨兵負責發送消息作爲報警通知給管理員。

  • 故障轉移:如果 master node 掛掉了,會自動轉移到 slave node 上。

  • 配置中心:如果故障轉移發生了,通知 client 客戶端新的 master 地址。

哨兵用於實現 redis 集羣的高可用,本身也是分佈式的,作爲一個哨兵集羣去運行,互相協同工作。

  • 故障轉移時,判斷一個 master node 是否宕機了,需要大部分的哨兵都同意才行,涉及到了分佈式選舉的問題。

  • 即使部分哨兵節點掛掉了,哨兵集羣還是能正常工作的,因爲如果一個作爲高可用機制重要組成部分的故障轉移系統本身是單點的,那就很坑爹了。

哨兵的核心知識

  • 哨兵至少需要 3 個實例,來保證自己的健壯性。

  • 哨兵 + redis 主從的部署架構,是不保證數據零丟失的,只能保證 redis 集羣的高可用性。

  • 對於哨兵 + redis 主從這種複雜的部署架構,儘量在測試環境和生產環境,都進行充足的測試和演練。

29、官方Redis Cluster 方案(服務端路由查詢)

ee67245a49cc462ba39b355d3c3ee464


redis 集羣模式的工作原理能說一下麼?在集羣模式下,redis 的 key 是如何尋址的?分佈式尋址都有哪些算法?瞭解一致性 hash 算法嗎?

簡介

Redis Cluster是一種服務端Sharding技術,3.0版本開始正式提供。Redis Cluster並沒有使用一致性hash,而是採用slot(槽)的概念,一共分成16384個槽。將請求發送到任意節點,接收到請求的節點會將查詢請求發送到正確的節點上執行

方案說明

  • 通過哈希的方式,將數據分片,每個節點均分存儲一定哈希槽(哈希值)區間的數據,默認分配了16384 個槽位

  • 每份數據分片會存儲在多個互爲主從的多節點上

  • 數據寫入先寫主節點,再同步到從節點(支持配置爲阻塞同步)

  • 同一分片多個節點間的數據不保持一致性

  • 讀取數據時,當客戶端操作的key沒有分配在該節點上時,redis會返回轉向指令,指向正確的節點

  • 擴容時時需要需要把舊節點的數據遷移一部分到新節點

在 redis cluster 架構下,每個 redis 要放開兩個端口號,比如一個是 6379,另外一個就是 加1w 的端口號,比如 16379。

16379 端口號是用來進行節點間通信的,也就是 cluster bus 的東西,cluster bus 的通信,用來進行故障檢測、配置更新、故障轉移授權。cluster bus 用了另外一種二進制的協議,gossip 協議,用於節點間進行高效的數據交換,佔用更少的網絡帶寬和處理時間。

節點間的內部通信機制

(基本通信原理)集羣元數據的維護有兩種方式:集中式、Gossip 協議。redis cluster 節點間採用 gossip 協議進行通信。

分佈式尋址算法

  • hash 算法(大量緩存重建)

  • 一致性 hash 算法(自動緩存遷移)+ 虛擬節點(自動負載均衡)

  • redis cluster 的 hash slot 算法

優點

  • 無中心架構,支持動態擴容,對業務透明

  • 具備Sentinel的監控和自動Failover(故障轉移)能力

  • 客戶端不需要連接集羣所有節點,連接集羣中任何一個可用節點即可

  • 高性能,客戶端直連redis服務,免去了proxy代理的損耗

缺點

  • 運維也很複雜,數據遷移需要人工干預

  • 只能使用0號數據庫

  • 不支持批量操作(pipeline管道操作)

  • 分佈式邏輯和存儲模塊耦合等

30、基於客戶端分配

efad7de106e74dc0b9d98ea9b03a73fb


簡介

Redis Sharding是Redis Cluster出來之前,業界普遍使用的多Redis實例集羣方法。其主要思想是採用哈希算法將Redis數據的key進行散列,通過hash函數,特定的key會映射到特定的Redis節點上。Java redis客戶端驅動jedis,支持Redis Sharding功能,即ShardedJedis以及結合緩存池的ShardedJedisPool

優點

優勢在於非常簡單,服務端的Redis實例彼此獨立,相互無關聯,每個Redis實例像單服務器一樣運行,非常容易線性擴展,系統的靈活性很強

缺點

由於sharding處理放到客戶端,規模進一步擴大時給運維帶來挑戰。

客戶端sharding不支持動態增刪節點。服務端Redis實例羣拓撲結構有變化時,每個客戶端都需要更新調整。連接不能共享,當應用規模增大時,資源浪費制約優化

31、基於代理服務器分片

90ed3e1cb0f6452f9adb06ab3d1c373d


簡介

客戶端發送請求到一個代理組件,代理解析客戶端的數據,並將請求轉發至正確的節點,最後將結果回覆給客戶端

特徵

  • 透明接入,業務程序不用關心後端Redis實例,切換成本低

  • Proxy 的邏輯和存儲的邏輯是隔離的

  • 代理層多了一次轉發,性能有所損耗

業界開源方案

Twtter開源的Twemproxy

豌豆莢開源的Codis

32、Redis 主從架構

單機的 redis,能夠承載的 QPS 大概就在上萬到幾萬不等。對於緩存來說,一般都是用來支撐讀高併發的。因此架構做成主從(master-slave)架構,一主多從,主負責寫,並且將數據複製到其它的 slave 節點,從節點負責讀。所有的讀請求全部走從節點。這樣也可以很輕鬆實現水平擴容,支撐讀高併發。

f6dea6c391a4408a9d3ae743748d17fa


redis replication -> 主從架構 -> 讀寫分離 -> 水平擴容支撐讀高併發

redis replication 的核心機制

  • redis 採用異步方式複製數據到 slave 節點,不過 redis2.8 開始,slave node 會週期性地確認自己每次複製的數據量;

  • 一個 master node 是可以配置多個 slave node 的;

  • slave node 也可以連接其他的 slave node;

  • slave node 做複製的時候,不會 block master node 的正常工作;

  • slave node 在做複製的時候,也不會 block 對自己的查詢操作,它會用舊的數據集來提供服務;但是複製完成的時候,需要刪除舊數據集,加載新數據集,這個時候就會暫停對外服務了;

  • slave node 主要用來進行橫向擴容,做讀寫分離,擴容的 slave node 可以提高讀的吞吐量。

注意,如果採用了主從架構,那麼建議必須開啓 master node 的持久化,不建議用 slave node 作爲 master node 的數據熱備,因爲那樣的話,如果你關掉 master 的持久化,可能在 master 宕機重啓的時候數據是空的,然後可能一經過複製, slave node 的數據也丟了。

另外,master 的各種備份方案,也需要做。萬一本地的所有文件丟失了,從備份中挑選一份 rdb 去恢復 master,這樣才能確保啓動的時候,是有數據的,即使採用了後續講解的高可用機制,slave node 可以自動接管 master node,但也可能 sentinel 還沒檢測到 master failure,master node 就自動重啓了,還是可能導致上面所有的 slave node 數據被清空。

redis 主從複製的核心原理

當啓動一個 slave node 的時候,它會發送一個 PSYNC 命令給 master node。

如果這是 slave node 初次連接到 master node,那麼會觸發一次 full resynchronization 全量複製。此時 master 會啓動一個後臺線程,開始生成一份 RDB 快照文件。

同時還會將從客戶端 client 新收到的所有寫命令緩存在內存中。RDB 文件生成完畢後, master 會將這個 RDB 發送給 slave,slave 會先寫入本地磁盤,然後再從本地磁盤加載到內存中。

接着 master 會將內存中緩存的寫命令發送到 slave,slave 也會同步這些數據。

slave node 如果跟 master node 有網絡故障,斷開了連接,會自動重連,連接之後 master node 僅會複製給 slave 部分缺少的數據。

63cd7c6015b34518af82c7eb1def0e1d


過程原理

  • 當從庫和主庫建立MS關係後,會向主數據庫發送SYNC命令

  • 主庫接收到SYNC命令後會開始在後臺保存快照(RDB持久化過程),並將期間接收到的寫命令緩存起來

  • 當快照完成後,主Redis會將快照文件和所有緩存的寫命令發送給從Redis

  • 從Redis接收到後,會載入快照文件並且執行收到的緩存的命令

  • 之後,主Redis每當接收到寫命令時就會將命令發送從Redis,從而保證數據的一致

缺點

所有的slave節點數據的複製和同步都由master節點來處理,會照成master節點壓力太大,使用主從從結構來解決

33、Redis集羣的主從複製模型是怎樣的?

爲了使在部分節點失敗或者大部分節點無法通信的情況下集羣仍然可用,所以集羣使用了主從複製模型,每個節點都會有N-1個複製品

34、生產環境中的 redis 是怎麼部署的?

redis cluster,10 臺機器,5 臺機器部署了 redis 主實例,另外 5 臺機器部署了 redis 的從實例,每個主實例掛了一個從實例,5 個節點對外提供讀寫服務,每個節點的讀寫高峯qps可能可以達到每秒 5 萬,5 臺機器最多是 25 萬讀寫請求/s。

機器是什麼配置?32G 內存+ 8 核 CPU + 1T 磁盤,但是分配給 redis 進程的是10g內存,一般線上生產環境,redis 的內存儘量不要超過 10g,超過 10g 可能會有問題。

5 臺機器對外提供讀寫,一共有 50g 內存。

因爲每個主實例都掛了一個從實例,所以是高可用的,任何一個主實例宕機,都會自動故障遷移,redis 從實例會自動變成主實例繼續提供讀寫服務。

你往內存裏寫的是什麼數據?每條數據的大小是多少?商品數據,每條數據是 10kb。100 條數據是 1mb,10 萬條數據是 1g。常駐內存的是 200 萬條商品數據,佔用內存是 20g,僅僅不到總內存的 50%。目前高峯期每秒就是 3500 左右的請求量。

其實大型的公司,會有基礎架構的 team 負責緩存集羣的運維。

35、說說Redis哈希槽的概念?

Redis集羣沒有使用一致性hash,而是引入了哈希槽的概念,Redis集羣有16384個哈希槽,每個key通過CRC16校驗後對16384取模來決定放置哪個槽,集羣的每個節點負責一部分hash槽。

36、Redis集羣會有寫操作丟失嗎?爲什麼?

Redis並不能保證數據的強一致性,這意味這在實際中集羣在特定的條件下可能會丟失寫操作。

37、Redis集羣之間是如何複製的?

異步複製

38、Redis集羣最大節點個數是多少?

16384個

39、Redis集羣如何選擇數據庫?

Redis集羣目前無法做數據庫選擇,默認在0數據庫。

九、分區

40、Redis是單線程的,如何提高多核CPU的利用率?

可以在同一個服務器部署多個Redis的實例,並把他們當作不同的服務器來使用,在某些時候,無論如何一個服務器是不夠的, 所以,如果你想使用多個CPU,你可以考慮一下分片(shard)。

41、爲什麼要做Redis分區?

分區可以讓Redis管理更大的內存,Redis將可以使用所有機器的內存。如果沒有分區,你最多隻能使用一臺機器的內存。分區使Redis的計算能力通過簡單地增加計算機得到成倍提升,Redis的網絡帶寬也會隨着計算機和網卡的增加而成倍增長。

42、你知道有哪些Redis分區實現方案?

  • 客戶端分區就是在客戶端就已經決定數據會被存儲到哪個redis節點或者從哪個redis節點讀取。大多數客戶端已經實現了客戶端分區。

  • 代理分區 意味着客戶端將請求發送給代理,然後代理決定去哪個節點寫數據或者讀數據。代理根據分區規則決定請求哪些Redis實例,然後根據Redis的響應結果返回給客戶端。redis和memcached的一種代理實現就是Twemproxy

  • 查詢路由(Query routing) 的意思是客戶端隨機地請求任意一個redis實例,然後由Redis將請求轉發給正確的Redis節點。Redis Cluster實現了一種混合形式的查詢路由,但並不是直接將請求從一個redis節點轉發到另一個redis節點,而是在客戶端的幫助下直接redirected到正確的redis節點。

43、Redis分區有什麼缺點?

  • 涉及多個key的操作通常不會被支持。例如你不能對兩個集合求交集,因爲他們可能被存儲到不同的Redis實例(實際上這種情況也有辦法,但是不能直接使用交集指令)。

  • 同時操作多個key,則不能使用Redis事務.

  • 分區使用的粒度是key,不能使用一個非常長的排序key存儲一個數據集(The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set)

  • 當使用分區的時候,數據處理會非常複雜,例如爲了備份你必須從不同的Redis實例和主機同時收集RDB / AOF文件。

  • 分區時動態擴容或縮容可能非常複雜。Redis集羣在運行時增加或者刪除Redis節點,能做到最大程度對用戶透明地數據再平衡,但其他一些客戶端分區或者代理分區方法則不支持這種特性。然而,有一種預分片的技術也可以較好的解決這個問題。

十、分佈式問題

44、Redis實現分佈式鎖

Redis爲單進程單線程模式,採用隊列模式將併發訪問變成串行訪問,且多客戶端對Redis的連接並不存在競爭關係Redis中可以使用SETNX命令實現分佈式鎖。

當且僅當 key 不存在,將 key 的值設爲 value。若給定的 key 已經存在,則 SETNX 不做任何動作。

SETNX 是『SET if Not eXists』(如果不存在,則 SET)的簡寫。

返回值:設置成功,返回 1 。設置失敗,返回 0 。

84822831cf5e44aaa30494a3741ccef8


使用SETNX完成同步鎖的流程及事項如下:

使用SETNX命令獲取鎖,若返回0(key已存在,鎖已存在)則獲取失敗,反之獲取成功。

爲了防止獲取鎖後程序出現異常,導致其他線程/進程調用SETNX命令總是返回0而進入死鎖狀態,需要爲該key設置一個“合理”的過期時間。

釋放鎖,使用DEL命令將鎖數據刪除。

45、如何解決 Redis 的併發競爭 Key 問題

所謂 Redis 的併發競爭 Key 的問題也就是多個系統同時對一個 key 進行操作,但是最後執行的順序和我們期望的順序不同,這樣也就導致了結果的不同!

推薦一種方案:分佈式鎖(zookeeper 和 redis 都可以實現分佈式鎖)。(如果不存在 Redis 的併發競爭 Key 問題,不要使用分佈式鎖,這樣會影響性能)

基於zookeeper臨時有序節點可以實現的分佈式鎖。大致思想爲:每個客戶端對某個方法加鎖時,在zookeeper上的與該方法對應的指定節點的目錄下,生成一個唯一的瞬時有序節點。判斷是否獲取鎖的方式很簡單,只需要判斷有序節點中序號最小的一個。當釋放鎖的時候,只需將這個瞬時節點刪除即可。同時,其可以避免服務宕機導致的鎖無法釋放,而產生的死鎖問題。完成業務流程後,刪除對應的子節點釋放鎖。

在實踐中,當然是從以可靠性爲主。所以首推Zookeeper。

46、分佈式Redis是前期做還是後期規模上來了再做好?爲什麼?

既然Redis是如此的輕量(單實例只使用1M內存),爲防止以後的擴容,最好的辦法就是一開始就啓動較多實例。即便你只有一臺服務器,你也可以一開始就讓Redis以分佈式的方式運行,使用分區,在同一臺服務器上啓動多個實例。

一開始就多設置幾個Redis實例,例如32或者64個實例,對大多數用戶來說這操作起來可能比較麻煩,但是從長久來看做這點犧牲是值得的。

這樣的話,當你的數據不斷增長,需要更多的Redis服務器時,你需要做的就是僅僅將Redis實例從一臺服務遷移到另外一臺服務器而已(而不用考慮重新分區的問題)。一旦你添加了另一臺服務器,你需要將你一半的Redis實例從第一臺機器遷移到第二臺機器。

47、什麼是 RedLock

Redis 官方站提出了一種權威的基於 Redis 實現分佈式鎖的方式名叫 Redlock,此種方式比原先的單節點的方法更安全。它可以保證以下特性:

  • 安全特性:互斥訪問,即永遠只有一個 client 能拿到鎖

  • 避免死鎖:最終 client 都可能拿到鎖,不會出現死鎖的情況,即使原本鎖住某資源的 client crash 了或者出現了網絡分區

  • 容錯性:只要大部分 Redis 節點存活就可以正常提供服務

十一、緩存異常

48、緩存雪崩

緩存雪崩是指緩存同一時間大面積的失效,所以,後面的請求都會落到數據庫上,造成數據庫短時間內承受大量請求而崩掉。

解決方案:

  • 緩存數據的過期時間設置隨機,防止同一時間大量數據過期現象發生。

  • 一般併發量不是特別多的時候,使用最多的解決方案是加鎖排隊。

  • 給每一個緩存數據增加相應的緩存標記,記錄緩存的是否失效,如果緩存標記失效,則更新數據緩存。

49、緩存穿透

緩存穿透是指緩存和數據庫中都沒有的數據,導致所有的請求都落到數據庫上,造成數據庫短時間內承受大量請求而崩掉。

解決方案:

  • 接口層增加校驗,如用戶鑑權校驗,id做基礎校驗,id<=0的直接攔截;

  • 從緩存取不到的數據,在數據庫中也沒有取到,這時也可以將key-value對寫爲key-null,緩存有效時間可以設置短點,如30秒(設置太長會導致正常情況也沒法使用)。這樣可以防止***用戶反覆用同一個id暴力***

  • 採用布隆過濾器,將所有可能存在的數據哈希到一個足夠大的 bitmap 中,一個一定不存在的數據會被這個 bitmap 攔截掉,從而避免了對底層存儲系統的查詢壓力

附加:

對於空間的利用到達了一種極致,那就是Bitmap和布隆過濾器(Bloom Filter)。

Bitmap:典型的就是哈希表

缺點是,Bitmap對於每個元素只能記錄1bit信息,如果還想完成額外的功能,恐怕只能靠犧牲更多的空間、時間來完成了。

布隆過濾器(推薦)

就是引入了k(k>1)k(k>1)個相互獨立的哈希函數,保證在給定的空間、誤判率下,完成元素判重的過程。

它的優點是空間效率和查詢時間都遠遠超過一般的算法,缺點是有一定的誤識別率和刪除困難。

Bloom-Filter算法的核心思想就是利用多個不同的Hash函數來解決“衝突”。

Hash存在一個衝突(碰撞)的問題,用同一個Hash得到的兩個URL的值有可能相同。爲了減少衝突,我們可以多引入幾個Hash,如果通過其中的一個Hash值我們得出某元素不在集合中,那麼該元素肯定不在集合中。只有在所有的Hash函數告訴我們該元素在集合中時,才能確定該元素存在於集合中。這便是Bloom-Filter的基本思想。

Bloom-Filter一般用於在大數據量的集合中判定某元素是否存在。

50、緩存擊穿

緩存擊穿是指緩存中沒有但數據庫中有的數據(一般是緩存時間到期),這時由於併發用戶特別多,同時讀緩存沒讀到數據,又同時去數據庫去取數據,引起數據庫壓力瞬間增大,造成過大壓力。和緩存雪崩不同的是,緩存擊穿指併發查同一條數據,緩存雪崩是不同數據都過期了,很多數據都查不到從而查數據庫。

解決方案

  • 設置熱點數據永遠不過期。

  • 加互斥鎖,互斥鎖

51、緩存預熱

緩存預熱就是系統上線後,將相關的緩存數據直接加載到緩存系統。這樣就可以避免在用戶請求的時候,先查詢數據庫,然後再將數據緩存的問題!用戶直接查詢事先被預熱的緩存數據!

解決方案:

  • 直接寫個緩存刷新頁面,上線時手工操作一下;

  • 數據量不大,可以在項目啓動的時候自動進行加載;

  • 定時刷新緩存;

52、緩存降級

當訪問量劇增、服務出現問題(如響應時間慢或不響應)或非核心服務影響到核心流程的性能時,仍然需要保證服務還是可用的,即使是有損服務。系統可以根據一些關鍵數據進行自動降級,也可以配置開關實現人工降級。、

緩存降級的最終目的是保證核心服務可用,即使是有損的。而且有些服務是無法降級的(如加入購物車、結算)。

在進行降級之前要對系統進行梳理,看看系統是不是可以丟卒保帥;從而梳理出哪些必須誓死保護,哪些可降級;比如可以參考日誌級別設置預案:

  • 一般:比如有些服務偶爾因爲網絡抖動或者服務正在上線而超時,可以自動降級;

  • 警告:有些服務在一段時間內成功率有波動(如在95~100%之間),可以自動降級或人工降級,併發送告警;

  • 錯誤:比如可用率低於90%,或者數據庫連接池被打爆了,或者訪問量突然猛增到系統能承受的最大閥值,此時可以根據情況自動降級或者人工降級;

  • 嚴重錯誤:比如因爲特殊原因數據錯誤了,此時需要緊急人工降級。

服務降級的目的,是爲了防止Redis服務故障,導致數據庫跟着一起發生雪崩問題。因此,對於不重要的緩存數據,可以採取服務降級策略,例如一個比較常見的做法就是,Redis出現問題,不去數據庫查詢,而是直接返回默認值給用戶。


53、熱點數據和冷數據

熱點數據,緩存才有價值。

對於冷數據而言,大部分數據可能還沒有再次訪問到就已經被擠出內存,不僅佔用內存,而且價值不大。頻繁修改的數據,看情況考慮使用緩存

對於熱點數據,比如我們的某IM產品,生日祝福模塊,當天的壽星列表,緩存以後可能讀取數十萬次。再舉個例子,某導航產品,我們將導航信息,緩存以後可能讀取數百萬次。

數據更新前至少讀取兩次,緩存纔有意義。這個是最基本的策略,如果緩存還沒有起作用就失效了,那就沒有太大價值了。

那存不存在,修改頻率很高,但是又不得不考慮緩存的場景呢?有!比如,這個讀取接口對數據庫的壓力很大,但是又是熱點數據,這個時候就需要考慮通過緩存手段,減少數據庫的壓力,比如我們的某助手產品的,點贊數,收藏數,分享數等是非常典型的熱點數據,但是又不斷變化,此時就需要將數據同步保存到Redis緩存,減少數據庫壓力。

54、緩存熱點key

緩存中的一個Key(比如一個促銷商品),在某個時間點過期的時候,恰好在這個時間點對這個Key有大量的併發請求過來,這些請求發現緩存過期一般都會從後端DB加載數據並回設到緩存,這個時候大併發的請求可能會瞬間把後端DB壓垮。

解決方案:

對緩存查詢加鎖,如果KEY不存在,就加鎖,然後查DB入緩存,然後解鎖;其他進程如果發現有鎖就等待,然後等解鎖後返回數據或者進入DB查詢

常用工具

55、Redis支持的Java客戶端都有哪些?官方推薦用哪個?

Redisson、Jedis、lettuce等等,官方推薦使用Redisson。

56、Redis和Redisson有什麼關係?

Redisson是一個高級的分佈式協調Redis客服端,能幫助用戶在分佈式環境中輕鬆實現一些Java的對象 (Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。

57、Jedis與Redisson對比有什麼優缺點?

Jedis是Redis的Java實現的客戶端,其API提供了比較全面的Redis命令的支持;Redisson實現了分佈式和可擴展的Java數據結構,和Jedis相比,功能較爲簡單,不支持字符串操作,不支持排序、事務、管道、分區等Redis特性。Redisson的宗旨是促進使用者對Redis的關注分離,從而讓使用者能夠將精力更集中地放在處理業務邏輯上

其他問題

58、Redis與Memcached的區別

兩者都是非關係型內存鍵值數據庫,現在公司一般都是用 Redis 來實現緩存,而且 Redis 自身也越來越強大了!Redis 與 Memcached 主要有以下不同:

5815b0bb110d4473ad97e74167bab82c


(1) memcached所有的值均是簡單的字符串,redis作爲其替代者,支持更爲豐富的數據類型

(2) redis的速度比memcached快很多

(3) redis可以持久化其數據

59、如何保證緩存與數據庫雙寫時的數據一致性?

你只要用緩存,就可能會涉及到緩存與數據庫雙存儲雙寫,你只要是雙寫,就一定會有數據一致性的問題,那麼你如何解決一致性問題?

一般來說,就是如果你的系統不是嚴格要求緩存+數據庫必須一致性的話,緩存可以稍微的跟數據庫偶爾有不一致的情況,最好不要做這個方案,讀請求和寫請求串行化,串到一個內存隊列裏去,這樣就可以保證一定不會出現不一致的情況

串行化之後,就會導致系統的吞吐量會大幅度的降低,用比正常情況下多幾倍的機器去支撐線上的一個請求。

還有一種方式就是可能會暫時產生不一致的情況,但是發生的機率特別小,就是先更新數據庫,然後再刪除緩存。

306e0b6ef0ed4092947e70813be1474e


60、Redis常見性能問題和解決方案?

Master最好不要做任何持久化工作,包括內存快照和AOF日誌文件,特別是不要啓用內存快照做持久化。

如果數據比較關鍵,某個Slave開啓AOF備份數據,策略爲每秒同步一次。

爲了主從複製的速度和連接的穩定性,Slave和Master最好在同一個局域網內。

儘量避免在壓力較大的主庫上增加從庫

Master調用BGREWRITEAOF重寫AOF文件,AOF在重寫的時候會佔大量的CPU和內存資源,導致服務load過高,出現短暫服務暫停現象。

爲了Master的穩定性,主從複製不要用圖狀結構,用單向鏈表結構更穩定,即主從關係爲:Master<–Slave1<–Slave2<–Slave3…,這樣的結構也方便解決單點故障問題,實現Slave對Master的替換,也即,如果Master掛了,可以立馬啓用Slave1做Master,其他不變。

61、Redis官方爲什麼不提供Windows版本?

因爲目前Linux版本已經相當穩定,而且用戶量很大,無需開發windows版本,反而會帶來兼容性等問題。

62、一個字符串類型的值能存儲最大容量是多少?

512M

63、Redis如何做大量數據插入?

Redis2.6開始redis-cli支持一種新的被稱之爲pipe mode的新模式用於執行大量數據插入工作。

64、假如Redis裏面有1億個key,其中有10w個key是以某個固定的已知的前綴開頭的,如果將它們全部找出來?

使用keys指令可以掃出指定模式的key列表。

對方接着追問:如果這個redis正在給線上的業務提供服務,那使用keys指令會有什麼問題?

這個時候你要回答redis關鍵的一個特性:redis的單線程的。keys指令會導致線程阻塞一段時間,線上服務會停頓,直到指令執行完畢,服務才能恢復。這個時候可以使用scan指令,scan指令可以無阻塞的提取出指定模式的key列表,但是會有一定的重複概率,在客戶端做一次去重就可以了,但是整體所花費的時間會比直接用keys指令長。

65、使用Redis做過異步隊列嗎,是如何實現的?

使用list類型保存數據信息,rpush生產消息,lpop消費消息,當lpop沒有消息時,可以sleep一段時間,然後再檢查有沒有信息,如果不想sleep的話,可以使用blpop, 在沒有信息的時候,會一直阻塞,直到信息的到來。redis可以通過pub/sub主題訂閱模式實現一個生產者,多個消費者,當然也存在一定的缺點,當消費者下線時,生產的消息會丟失。

66、Redis如何實現延時隊列?

使用sortedset,使用時間戳做score, 消息內容作爲key,調用zadd來生產消息,消費者使用zrangbyscore獲取n秒之前的數據做輪詢處理。

67、Redis回收進程如何工作的?

  • 一個客戶端運行了新的命令,添加了新的數據。

  • Redis檢查內存使用情況,如果大於maxmemory的限制, 則根據設定好的策略進行回收。

  • 一個新的命令被執行,等等。

  • 所以我們不斷地穿越內存限制的邊界,通過不斷達到邊界然後不斷地回收回到邊界以下。

如果一個命令的結果導致大量內存被使用(例如很大的集合的交集保存到一個新的鍵),不用多久內存限制就會被這個內存使用量超越。

68、Redis回收使用的是什麼算法?

LRU算法。

好了,Redis 的面試題就分享到這裏,如果對你有幫助的話,請“點個贊”鼓勵一下哦~

需要更多其他Java知識點的面試題及答案的老鐵請轉發並關注,然後加我VX【tkzl6666】獲得免費領取方式!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章