缓存淘汰算法系列(二)

缓存淘汰算法系列(二)

一、前言

　　接着上篇文章，这次继续介绍缓存算法。

二、Clock

　　1、算法思想

　　　　尽管上文介绍的Second-chance算法是一个合理的算法，但是它并不是很高效，因为它频繁需要把对象插入到队列尾部，要知道位移也是很耗时的。而更高效的算法Clock，采用的是一个循环链表，有一个指针指向最早的对象，且每个缓存中的对象都维护一个标记位。

　　2、工作原理

　　* 当待缓存对象在缓存中时，无论该对象标记位为0还是1，都设置为1(被使用)。同时，指针指向该对象的下一个对象。

　　*若不在缓存中时，检查指针指向对象的标记位。如果是0，则用待缓存对象替换该对象；如果是1，则置为0，指针指向下一个对象。如此直到淘汰一个对象为止。

三、Gclock(Generalized clock page replacement algorithm)

　　1、算法思想

　　　　该算法是Clock的变种。相对于Clock标志位采用的是二进制0和1表示，Gclock的标志位采用的是一个整数，意味着理论上可以一直增加到无穷大。

　　2、工作原理

　　* 当待缓存对象在缓存中时，把其标记位的值加1。同时，指针指向该对象的下一个对象。

　　*若不在缓存中时，检查指针指向对象的标记位。如果是0，则用待缓存对象替换该对象；否则，把标记位的值减1，指针指向下一个对象。如此直到淘汰一个对象为止。由于标记位的值允许大于1，所以指针可能循环多遍才淘汰一个对象。

　　

四、WSclock(Working set clock page replacement algorithm)

　　1、算法思想

　　　　该算法同样是clock的变种，可能是实际运用最广泛的算法。它采用clock的原理，是ws算法(不懂的朋友可以阅读ws算法)的增强版。算法数据结构为循环链表，每个缓存对象保存了"最近使用的时间"rt和"是否引用"的R标志位,使用一个周期计时器t。age表示为当前时间和rt的差值

　　2、工作原理

　　*当待缓存对象存在缓存中时，更新rt为当前时间。同时，指针指向该对象的下一个对象。

　　*若不存在于缓存中时，如果缓存没满，则更新指针指向位置的rt为当前时间,R为1。同时，指针指向下一个对象。如果满了，则需要淘汰一个对象。检查指针指向的对象，

　　(1)R为1，说明对象在working set中，则重置R为0，指针指向下一个对象。

　　(2)R为0。如果age大于t，说明对象不在working set中，则替换该对象，并置R为1，rt为当前时间。如果age不大于t，则继续寻找淘汰对象。如果回到指针开始的位置，还未寻找到淘汰对象，则淘汰遇到的第一个R为0的对象。

五、LRU-K算法

　　1、算法思想

　　LRU-K中的K代表最近使用的次数，因此LRU可以认为是LRU-1。LRU-K的主要目的是为了解决LRU算法“缓存污染”的问题，其核心思想是将“最近使用过1次”的判断标准扩展为“最近使用过K次”。

　　2、工作原理

　　相比LRU，LRU-K需要多维护一个队列，用于记录所有缓存数据被访问的历史。只有当数据的访问次数达到K次的时候，才将数据放入缓存。当需要淘汰数据时，LRU-K会淘汰第K次访问时间距当前时间最大的数据。详细实现如下

　　

　　(1). 数据第一次被访问，加入到访问历史列表；

　　(2). 如果数据在访问历史列表里后没有达到K次访问，则按照一定规则（FIFO，LRU）淘汰；

　　(3). 当访问历史队列中的数据访问次数达到K次后，将数据索引从历史队列删除，将数据移到缓存队列中，并缓存此数据，缓存队列重新按照时间排序；

　　(4). 缓存数据队列中被再次访问后，重新排序；

　　(5). 需要淘汰数据时，淘汰缓存队列中排在末尾的数据，即：淘汰“倒数第K次访问离现在最久”的数据。

　　LRU-K具有LRU的优点，同时能够避免LRU的缺点，实际应用中LRU-2是综合各种因素后最优的选择，LRU-3或者更大的K值命中率会高，但适应性差，需要大量的数据访问才能将历史访问记录清除掉。

六、Two queues（2Q）

　　1、算法思想

　　该算法类似于LRU-2，不同点在于2Q将LRU-2算法中的访问历史队列（注意这不是缓存数据的）改为一个FIFO缓存队列，即：2Q算法有两个缓存队列，一个是FIFO队列，一个是LRU队列。

　　2、工作原理

　　当数据第一次访问时，2Q算法将数据缓存在FIFO队列里面，当数据第二次被访问时，则将数据从FIFO队列移到LRU队列里面，两个队列各自按照自己的方法淘汰数据。详细实现如下：

　　

　　

　　(1). 新访问的数据插入到FIFO队列；

　　(2). 如果数据在FIFO队列中一直没有被再次访问，则最终按照FIFO规则淘汰；

　　(3). 如果数据在FIFO队列中被再次访问，则将数据移到LRU队列头部；

　　(4). 如果数据在LRU队列再次被访问，则将数据移到LRU队列头部；

　　(5). LRU队列淘汰末尾的数据。

　　该算法还有完整版的，具体可参考最后一篇论文

七、参考文献

　　The Clock Page Replacement Algorithm

　　Clock page replacement algorithm - Already existing pages

　　Page replacement algorithm

　　Generalized clock page replacement algorithm

Analysis of the Generalized Clock Buffer Replacement Scheme for Database Transaction Processing

　　

　　GCLOCK and CLOCK presentation

　　　　

　　CLOCK & GCLOCK Recovered

　　

　　The Wokring Set Model for Page Replacement

　　

　　Working set, WSClock page replacement algorithm

　　The Working Set Page Replacement Algorithm
　　

　　The LRU-K Page Replacement Algorithm For Database Disk Buffering

　　

　　2Q: A Low Overhead High Performance Buffer Management Replacement Algorithm
相关阅读:
Python爬虫模拟登录的github项目
 pandas常用数据清洗方法
 5分钟了解swagger
OpenAuth.Net.landv分支之旅开始制作CRM系统
 捷信达会员管理系统SQL语句相关
 EXcel vba 获取批注信息
 西软报表处理语句相关
 中软酒店管理系统CSHIS操作手册_数据结构_数据字典
 金蝶k3密码批量修改
 K3 WISE 开发插件《SQL语句WHERE查询-范围查询/模糊查询》
原文地址：https://www.cnblogs.com/junyuhuang/p/5993612.html