LRU算法及JAVA實現






引子:

我們平時總會有一個電話本記錄所有朋友的電話,但是,如果有朋友經常聯繫,那些朋友的電話號碼不用翻電話本我們也能記住,但是,如果長時間沒有聯繫了,要再次聯繫那位朋友的時候,我們又不得不求助電話本,但是,通過電話本查找還是很費時間的。但是,我們大腦能夠記住的東西是一定的,我們只能記住自己最熟悉的,而長時間不熟悉的自然就忘記了。

其實,計算機也用到了同樣的一個概念,我們用緩存來存放以前讀取的數據,而不是直接丟掉,這樣,再次讀取的時候,可以直接在緩存裏面取,而不用再重新查找一遍,這樣系統的反應能力會有很大提高。但是,當我們讀取的個數特別大的時候,我們不可能把所有已經讀取的數據都放在緩存裏,畢竟內存大小是一定的,我們一般把最近常讀取的放在緩存裏(相當於我們把最近聯繫的朋友的姓名和電話放在大腦裏一樣)。現在,我們就來研究這樣一種緩存機制。

LRU緩存:

LRU緩存利用了這樣的一種思想。LRU是Least Recently Used 的縮寫,翻譯過來就是“最近最少使用”,也就是說,LRU緩存把最近最少使用的數據移除,讓給最新讀取的數據。而往往最常讀取的,也是讀取次數最多的,所以,利用LRU緩存,我們能夠提高系統的performance.

實現:

要實現LRU緩存,我們首先要用到一個類 LinkedHashMap。 用這個類有兩大好處:一是它本身已經實現了按照訪問順序的存儲,也就是說,最近讀取的會放在最前面,最最不常讀取的會放在最後(當然,它也可以實現按照插入順序存儲)。第二,LinkedHashMap本身有一個方法用於判斷是否需要移除最不常讀取的數,但是,原始方法默認不需要移除(這是,LinkedHashMap相當於一個linkedlist),所以,我們需要override這樣一個方法,使得當緩存裏存放的數據個數超過規定個數後,就把最不常用的移除掉。LinkedHashMap的API寫得很清楚,推薦大家可以先讀一下。

要基於LinkedHashMap來實現LRU緩存,我們可以選擇inheritance, 也可以選擇 delegation, 我更喜歡delegation。基於delegation的實現已經有人寫出來了,而且寫得很漂亮,我就不班門弄斧了。代碼如下:

[java] view plaincopy
  1. import java.util.LinkedHashMap;  
  2. import java.util.Collection;  
  3. import java.util.Map;  
  4. import java.util.ArrayList;  
  5.   
  6. /** 
  7. * An LRU cache, based on <code>LinkedHashMap</code>. 
  8. * 
  9. * <p> 
  10. * This cache has a fixed maximum number of elements (<code>cacheSize</code>). 
  11. * If the cache is full and another entry is added, the LRU (least recently used) entry is dropped. 
  12. * 
  13. * <p> 
  14. * This class is thread-safe. All methods of this class are synchronized. 
  15. * 
  16. * <p> 
  17. * Author: Christian d'Heureuse, Inventec Informatik AG, Zurich, Switzerland<br> 
  18. * Multi-licensed: EPL / LGPL / GPL / AL / BSD. 
  19. */  
  20. public class LRUCache<K,V> {  
  21.   
  22. private static final float   hashTableLoadFactor = 0.75f;  
  23.   
  24. private LinkedHashMap<K,V>   map;  
  25. private int                  cacheSize;  
  26.   
  27. /** 
  28. * Creates a new LRU cache. 
  29. * @param cacheSize the maximum number of entries that will be kept in this cache. 
  30. */  
  31. public LRUCache (int cacheSize) {  
  32.    this.cacheSize = cacheSize;  
  33.    int hashTableCapacity = (int)Math.ceil(cacheSize / hashTableLoadFactor) + 1;  
  34.    map = new LinkedHashMap<K,V>(hashTableCapacity, hashTableLoadFactor, true) {  
  35.       // (an anonymous inner class)  
  36.       private static final long serialVersionUID = 1;  
  37.       @Override protected boolean removeEldestEntry (Map.Entry<K,V> eldest) {  
  38.          return size() > LRUCache.this.cacheSize; }}; }  
  39.   
  40. /** 
  41. * Retrieves an entry from the cache.<br> 
  42. * The retrieved entry becomes the MRU (most recently used) entry. 
  43. * @param key the key whose associated value is to be returned. 
  44. * @return    the value associated to this key, or null if no value with this key exists in the cache. 
  45. */  
  46. public synchronized V get (K key) {  
  47.    return map.get(key); }  
  48.   
  49. /** 
  50. * Adds an entry to this cache. 
  51. * The new entry becomes the MRU (most recently used) entry. 
  52. * If an entry with the specified key already exists in the cache, it is replaced by the new entry. 
  53. * If the cache is full, the LRU (least recently used) entry is removed from the cache. 
  54. * @param key    the key with which the specified value is to be associated. 
  55. * @param value  a value to be associated with the specified key. 
  56. */  
  57. public synchronized void put (K key, V value) {  
  58.    map.put (key, value); }  
  59.   
  60. /** 
  61. * Clears the cache. 
  62. */  
  63. public synchronized void clear() {  
  64.    map.clear(); }  
  65.   
  66. /** 
  67. * Returns the number of used entries in the cache. 
  68. * @return the number of entries currently in the cache. 
  69. */  
  70. public synchronized int usedEntries() {  
  71.    return map.size(); }  
  72.   
  73. /** 
  74. * Returns a <code>Collection</code> that contains a copy of all cache entries. 
  75. * @return a <code>Collection</code> with a copy of the cache content. 
  76. */  
  77. public synchronized Collection<Map.Entry<K,V>> getAll() {  
  78.    return new ArrayList<Map.Entry<K,V>>(map.entrySet()); }  
  79.   
  80. // end class LRUCache  
  81. ------------------------------------------------------------------------------------------  
  82. // Test routine for the LRUCache class.  
  83. public static void main (String[] args) {  
  84.    LRUCache<String,String> c = new LRUCache<String, String>(3);  
  85.    c.put ("1""one");                           // 1  
  86.    c.put ("2""two");                           // 2 1  
  87.    c.put ("3""three");                         // 3 2 1  
  88.    c.put ("4""four");                          // 4 3 2  
  89.    if (c.get("2") == nullthrow new Error();    // 2 4 3  
  90.    c.put ("5""five");                          // 5 2 4  
  91.    c.put ("4""second four");                   // 4 5 2  
  92.    // Verify cache content.  
  93.    if (c.usedEntries() != 3)              throw new Error();  
  94.    if (!c.get("4").equals("second four")) throw new Error();  
  95.    if (!c.get("5").equals("five"))        throw new Error();  
  96.    if (!c.get("2").equals("two"))         throw new Error();  
  97.    // List cache content.  
  98.    for (Map.Entry<String, String> e : c.getAll())  
  99.       System.out.println (e.getKey() + " : " + e.getValue()); }  

代碼出自:http://www.source-code.biz/snippets/java/6.htm


在博客 http://gogole.iteye.com/blog/692103 裏,作者使用的是雙鏈表 + hashtable 的方式實現的。如果在面試題裏考到如何實現LRU,考官一般會要求使用雙鏈表 + hashtable 的方式。 所以,我把原文的部分內容摘抄如下:


雙鏈表 + hashtable實現原理:

將Cache的所有位置都用雙連表連接起來,當一個位置被命中之後,就將通過調整鏈表的指向,將該位置調整到鏈表頭的位置,新加入的Cache直接加到鏈表頭中。這樣,在多次進行Cache操作後,最近被命中的,就會被向鏈表頭方向移動,而沒有命中的,而想鏈表後面移動,鏈表尾則表示最近最少使用的Cache。當需要替換內容時候,鏈表的最後位置就是最少被命中的位置,我們只需要淘汰鏈表最後的部分即可。

[java] view plaincopy
  1. public class LRUCache {  
  2.       
  3.     private int cacheSize;  
  4.     private Hashtable<Object, Entry> nodes;//緩存容器  
  5.     private int currentSize;  
  6.     private Entry first;//鏈表頭  
  7.     private Entry last;//鏈表尾  
  8.       
  9.     public LRUCache(int i) {  
  10.         currentSize = 0;  
  11.         cacheSize = i;  
  12.         nodes = new Hashtable<Object, Entry>(i);//緩存容器  
  13.     }  
  14.       
  15.     /** 
  16.      * 獲取緩存中對象,並把它放在最前面 
  17.      */  
  18.     public Entry get(Object key) {  
  19.         Entry node = nodes.get(key);  
  20.         if (node != null) {  
  21.             moveToHead(node);  
  22.             return node;  
  23.         } else {  
  24.             return null;  
  25.         }  
  26.     }  
  27.       
  28.     /** 
  29.      * 添加 entry到hashtable, 並把entry  
  30.      */  
  31.     public void put(Object key, Object value) {  
  32.         //先查看hashtable是否存在該entry, 如果存在,則只更新其value  
  33.         Entry node = nodes.get(key);  
  34.           
  35.         if (node == null) {  
  36.             //緩存容器是否已經超過大小.  
  37.             if (currentSize >= cacheSize) {  
  38.                 nodes.remove(last.key);  
  39.                 removeLast();  
  40.             } else {  
  41.                 currentSize++;  
  42.             }             
  43.             node = new Entry();  
  44.         }  
  45.         node.value = value;  
  46.         //將最新使用的節點放到鏈表頭,表示最新使用的.  
  47.         moveToHead(node);  
  48.         nodes.put(key, node);  
  49.     }  
  50.   
  51.     /** 
  52.      * 將entry刪除, 注意:刪除操作只有在cache滿了纔會被執行 
  53.      */  
  54.     public void remove(Object key) {  
  55.         Entry node = nodes.get(key);  
  56.         //在鏈表中刪除  
  57.         if (node != null) {  
  58.             if (node.prev != null) {  
  59.                 node.prev.next = node.next;  
  60.             }  
  61.             if (node.next != null) {  
  62.                 node.next.prev = node.prev;  
  63.             }  
  64.             if (last == node)  
  65.                 last = node.prev;  
  66.             if (first == node)  
  67.                 first = node.next;  
  68.         }  
  69.         //在hashtable中刪除  
  70.         nodes.remove(key);  
  71.     }  
  72.   
  73.     /** 
  74.      * 刪除鏈表尾部節點,即使用最後 使用的entry 
  75.      */  
  76.     private void removeLast() {  
  77.         //鏈表尾不爲空,則將鏈表尾指向null. 刪除連表尾(刪除最少使用的緩存對象)  
  78.         if (last != null) {  
  79.             if (last.prev != null)  
  80.                 last.prev.next = null;  
  81.             else  
  82.                 first = null;  
  83.             last = last.prev;  
  84.         }  
  85.     }  
  86.       
  87.     /** 
  88.      * 移動到鏈表頭,表示這個節點是最新使用過的 
  89.      */  
  90.     private void moveToHead(Entry node) {  
  91.         if (node == first)  
  92.             return;  
  93.         if (node.prev != null)  
  94.             node.prev.next = node.next;  
  95.         if (node.next != null)  
  96.             node.next.prev = node.prev;  
  97.         if (last == node)  
  98.             last = node.prev;  
  99.         if (first != null) {  
  100.             node.next = first;  
  101.             first.prev = node;  
  102.         }  
  103.         first = node;  
  104.         node.prev = null;  
  105.         if (last == null)  
  106.             last = first;  
  107.     }  
  108.     /* 
  109.      * 清空緩存 
  110.      */  
  111.     public void clear() {  
  112.         first = null;  
  113.         last = null;  
  114.         currentSize = 0;  
  115.     }  
  116.   
  117. }  
  118.   
  119. class Entry {  
  120.     Entry prev;//前一節點  
  121.     Entry next;//後一節點  
  122.     Object value;//值  
  123.     Object key;//鍵  
  124. }  
轉自http://blog.csdn.net/beiyeqingteng/article/details/7010411
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章