因为region中的值都是以key来排序的,但是flush操作是生成一个新Store file(HFile),那么还怎么保持region中key的有序呢?
然后又延伸出一个问题:flush操作生成的Store file,为什么大小不一?见下图(与compaction有关)
原因是:
flush是对一个HRegion来定义的,所以flush时,是对其所有的Store里的MemStore进行flush.即有可能会flush出多个文件,对应在不同的Store里,这样就解释了为什么大小不一。
那么这么多storefile,怎么保持region中key有序呢,答案是:keyvalue是以storefile为排序的单位的。即每个storefile都是按照key来排序的,但同一系列的key可能在不同storefile,compaction过程中也保持了key的有序。查找的话是一个storefile,一个storefile这样查找的。
我们都知道region的split是将split一分为二,那么它在storefile层次是如何切分的呢?答案是它把所有的storefile也一分为二。