计算机中的缓存大小是有限的,如果对所有数据都缓存,肯定是不现实的,所以需要有一种淘汰机制,用于将一些暂时没有用的数据给淘汰掉,以换入新鲜的数据进来,这样可以提高缓存的命中率,减少磁盘访问的次数。
LRU(Least Recently Used 最近最少使用)算法有两种策略(均以队列的方式实现),一种是不调整的,另外一种是随时进行调整的,即缓存命中后,将这个数据缓存项移到LRU队列的最前端。
例如,缓存容量为4,顺序访问数据项1 5 1 3 5 2 4 1 2
第一种策略:首先读取1,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将1读到内存(队列)
(1)
再读取5,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将5读到内存
(5,1)
再读取1,发现缓存已经存在,则不会访问磁盘,而是直接从缓存中读取
(5,1)
再读取3,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将3读到内存
(3,5,1)
再读取5,发现缓存已经存在,则不会访问磁盘,而是直接从缓存中读取
(3,5,1)
再读取2,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将2读到内存
(2,3,5,1)
再读取4,发现缓存中没有,则访问磁盘,并将其放入缓存,但是缓存已经满了, 需要淘汰掉队列尾端的元素1,将4放入缓存,同时将4读到内存中
(4,2,3,5)
再读取1,发现缓存中没有,则访问磁盘,并将其放入缓存,但是缓存已经满了, 需要淘汰掉队列尾端的元素5,将1放入缓存,同时将1读到内存中
(1,4,2,3)
再读取2,发现缓存已经存在,则不会访问磁盘,而是直接从缓存中读取
(1,4,2,3)
第二种策略:首先读取1,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将1读到内存
(1)
再读取5,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将5读到内存
(5,1)
再读取1,发现缓存已经存在,则不会访问磁盘,而是直接从缓存中读取,由于缓存命中,则需要把刚才命中的元素移动到队列最前端
(1,5)
再读取3,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将3读到内存
(3,1,5)
再读取5,发现缓存已经存在,则不会访问磁盘,而是直接从缓存中读取
(5,3,1)
再读取2,发现缓存中没有,则访问磁盘,并将其放入缓存,同时将2读到内存
(2,5,3,1)
再读取4,发现缓存中没有,则访问磁盘,并将其放入缓存,但是缓存已经满了, 需要淘汰掉队列尾端的元素1,将4放入缓存,同时将4读到内存中
(4,2,5,3)
再读取1,发现缓存中没有,则访问磁盘,并将其放入缓存,但是缓存已经满了, 需要淘汰掉队列尾端的元素3,将1放入缓存,同时将1读到内存中
(1,4,2,5)
再读取2,发现缓存已经存在,则不会访问磁盘,而是直接从缓存中读取,由于缓存命中,则需要把刚才命中的元素移动到队列最前端
(2,1,4,5)
java中利用LinkedHashMap来实现LRU算法,需要覆写其中的removeEldestEntry(Map.Entry)方法即可。如果去看LinkedHashMap的源码可知,LRU算法是通过双向链表来实现,当某个位置被命中,通过调整链表的指向将该位置调整到头位置,新加入的内容直接放在链表头,如此一来,最近被命中的内容就向链表头移动,需要替换时,链表最后的位置就是最近最少使用的位置。
LinkedHashMap自身已经实现了顺序存储,默认情况下是按照元素的添加顺序存储,也可以启用按照访问顺序存储,即最近读取的数据放在最前面,最早读取的数据放在最后面,然后它还有一个判断是否删除最老数据的方法,默认是返回false,即不删除数据,我们使用LinkedHashMap实现LRU缓存的方法就是对LinkedHashMap实现简单的扩展
//LinkedHashMap的一个构造函数,当参数accessOrder为true时,即会按照访问顺序排序,最近访问的放在最前,最早访问的放在后面 public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) { super(initialCapacity, loadFactor); this.accessOrder = accessOrder; } //LinkedHashMap自带的判断是否删除最老的元素方法,默认返回false,即不删除老数据 //我们要做的就是重写这个方法,当满足一定条件时删除老数据 protected boolean removeEldestEntry(Map.Entry<K,V> eldest) { return false;
//return size() > MAX_CACHE_SIZE; (改为这个)
}