数据库存取缓冲区的lru与mru算法
1.cache hit and cache miss
当使用者第一次向数据库发出查询数据的请求的时候,数据库会先在缓冲区中查找该数据,如果要访问的数据恰好已经在缓冲区中(我们称之为cache hit)那么就直接用缓冲区中读取该数据.
反之如果缓冲区中没有使用者要查询的数据那么这种情况称之为cache miss,在这种情况下数据库就会先从磁盘上读取使用者要的数据放入缓冲区,使用者再从缓冲区读取该数据.
很显然从感觉上来说cache hit会比cache miss时存取速度快.
2. lru(最近最少使用算法) and mru(最近最常使用算法)
所谓的lru(least recently used)算法的基本概念是:当内存的剩余的可用空间不够时,缓冲区尽可能的先保留使用者最常使用的数据,换句话说就是优先清除”较不常使用的数据”,并释放其空间.之所以”较不常使用的数据”要用引号是因为这里判断所谓的较不常使用的标准是人为的、不严格的.所谓的mru(most recently used)算法的意义正好和lru算法相反.
下面我们通过oracle 9i cache中对lru和mru的使用来看一下两者在缓冲区工作机制中的作用和区别:
在oracle 9i中有lru list的概念: 我们可以把lru list想象成是一连串的缓冲区集合,两端分别是lru端和mru端, 当数据库从磁盘上读取数据放入缓冲区时,系统必须先确定缓冲区中有free buffers,这个时候oracle 9i会扫描lru list,扫描的基本原则是:
1. 从lru端到mru端;
2. 当扫描到free buffer或已扫描的缓冲区数目超过临界值时,就会停止扫描动作;
如果在扫描过程顺利的在lru list中找到了free buffer,那么oracle 9i就把从磁盘读出的数据写到free buffer中然后把free buffer加到lru list的mru端.
那如果扫描过程没有在lru list中找到free buffer怎么办?当然是从lru list的lru端开始清除缓冲区,如此一来就可以腾出新的空间了.
下图就是一个例子:
使用者查询数据a,初始的时候lru list中没有数据a,于是oracle 9i到磁盘读取a,然后放到lru list的mru端,使用者再从lru list中读取数据a,同理对于b,c…当lru list满了以后,如果使用者查询n,此时n不在lru list中而且lru list中已经没有free buffer了,此时oracle 9i就开始从lru端淘汰a以腾出空间存放n.
图 1
我们再来看另外一种情况:
在state 3之后,恰好使用者持续的查询a—这将会导致a一直被放置在靠近mru端的缓冲区,结果将如图state m’所示,你会发现图2的state m’与图1的state m缓冲区存放的数据完全一样但是存放位置不一样.此时lru list满了,如果再放n的时候lru list`淘汰的是b,因为a的查询率高于b,所以lru list让a在缓冲区中呆上较长的时间而先淘汰掉”较不常用的”的b.
图 2