bitmap原理以及在java中的实现

转载：https://www.jianshu.com/p/e530baada558

说bitmap之前，我们要明白数字在内存中的表示，如果说byte用8个二进制位表示，即可以表示 $2^8 = 256$ 个数，每个byte占8位，即每个byte占8行，在内存中这样形象的表示：

而bitmap结构，充分利用了每一行所有的位数，它将每个位置作为一个数，那么一行就可以模拟表示出8个数。

Bitmap介绍

bitmap是很有用的结构。所谓的bitmap就是用一个bit位来标记某个元素，而数组下标是该元素。

bitmap优势

bitmap经常用在大数据的题中，比如10亿个int类型的数，如果用int数组存储的话，那么需要大约4G内存，浪费内存。如果用bitmap解决，就比较方便。bitmap可以用int来模拟，也可以用byte来模拟，它只是逻辑上的概念，在java语言中写不出来，我们采用byte。一个byte占8个bit，如果每一个bit的值是有或者没有，即1或0，则如下图所示：

比如，当我们用 int 类型来模拟 Bitmap 时，一个 int 4个字节共 4*8 = 32位，可以表示32个数。原来10亿个 int 类型的数用 int 数组需要 4G 的内存，但是我用 bitmap 只需要 4GB / 32 = 128 MB 的内存，是不是少多了。

bitmap代码实现

第一步：构建特定长度的byte数组（new byte[capacity/8 + 1]），其中capacity为整数数组长度（如：10亿个数字等）

byte[] bits = new byte[getIndex(n) + 1];

第二步：计算数字num在byte[]中的位置（num/8和num >> 3一样），也就是说num在byte[k]，算这个k是几

    /**
     * num/8得到byte[]的index
     * @param num
     * @return
     */
    public int getIndex(int num){
        return num >> 3;
    }

第三步：计算数字num在byte[index]中的位置，就是在byte[index]的第几位，每个byte有8位（num % 8）

    /**
     * num%8得到在byte[index]的位置
     * @param num
     * @return
     */
    public int getPosition(int num){
        return num & 0x07;
    }

第四步：将所在位置从0变成1，其它位置不变

    /**
     * 标记指定数字（num）在bitmap中的值，标记其已经出现过
     * 将1左移position后，那个位置自然就是1，然后和以前的数据做|，这样，那个位置就替换成1了
     * @param bits
     * @param num
     */
    public void add(byte[] bits, int num){
        bits[getIndex(num)] |= 1 << getPosition(num);
    }

解释如下图：

第五步：判断指定数字num是否存在

    /**
     * 判断指定数字num是否存在<br/>
     * 将1左移position后，那个位置自然就是1，然后和以前的数据做&，判断是否为0即可
     * @param bits
     * @param num
     * @return
     */
    public boolean contains(byte[] bits, int num){
        return (bits[getIndex(num)] & 1 << getPosition(num)) != 0;
    }

第六步：重置某一数字对应在bitmap中的值

    /**
     * 重置某一数字对应在bitmap中的值<br/>
     * 对1进行左移，然后取反，最后与byte[index]作与操作。
     * @param bits
     * @param num
     */
    public void clear(byte[] bits, int num){
        bits[getIndex(num)] &= ~(1 << getPosition(num));
    }

全部代码如下：

public class Test {

    /**
     * 创建bitmap数组
     */
    public byte[] create(int n){
        byte[] bits = new byte[getIndex(n) + 1];
        
        for(int i = 0; i < n; i++){
            add(bits, i);
        }
        
        System.out.println(contains(bits, 11));
        
        int index = 1;
        for(byte bit : bits){
            System.out.println("-------" + index++ + "-------");
            showByte(bit);

        }
        
        return bits;
    }
    
    /**
     * 标记指定数字（num）在bitmap中的值，标记其已经出现过<br/>
     * 将1左移position后，那个位置自然就是1，然后和以前的数据做|，这样，那个位置就替换成1了
     * @param bits
     * @param num
     */
    public void add(byte[] bits, int num){
        bits[getIndex(num)] |= 1 << getPosition(num);
    }
    
    /**
     * 判断指定数字num是否存在<br/>
     * 将1左移position后，那个位置自然就是1，然后和以前的数据做&，判断是否为0即可
     * @param bits
     * @param num
     * @return
     */
    public boolean contains(byte[] bits, int num){
        return (bits[getIndex(num)] & 1 << getPosition(num)) != 0;
    }
    
    /**
     * num/8得到byte[]的index
     * @param num
     * @return
     */
    public int getIndex(int num){
        return num >> 3;
    }
    
    /**
     * num%8得到在byte[index]的位置
     * @param num
     * @return
     */
    public int getPosition(int num){
        return num & 0x07;
    }
    
    /**
     * 重置某一数字对应在bitmap中的值<br/>
     * 对1进行左移，然后取反，最后与byte[index]作与操作。
     * @param bits
     * @param num
     */
    public void clear(byte[] bits, int num){
        bits[getIndex(num)] &= ~(1 << getPosition(num));
    }
    
    /**
     * 打印byte类型的变量<br/>
     * 将byte转换为一个长度为8的byte数组，数组每个值代表bit
     */
    
    public void showByte(byte b){
        byte[] array = new byte[8];
        for(int i = 7; i >= 0; i--){
            array[i] = (byte)(b & 1);
            b = (byte)(b >> 1);
        }
        
        for (byte b1 : array) {
            System.out.print(b1);
            System.out.print(" ");
        }
        
        System.out.println();
    }
    
    public static void main(String[] args) {
        int n = 100;
        new Test().create(n);
    }
}

结果如图，一共100个数：

杂谈

下面是我搜集的一些关于bitmap的，有时间再看。。。
https://blog.csdn.net/a3192048/article/details/80261699

这是关于java中原生的bitmap的实现，BitSet
https://blog.csdn.net/lushuaiyin/article/details/7546144

https://blog.csdn.net/y999666/article/details/51220833

https://blog.csdn.net/xia744510124/article/details/51509285/

相关阅读:
python之函数名,闭包、迭代器
 python-函数进阶-动态传参,名称空间,作用域的问题
 python之初识函数
 python之文件处理
 重新执笔，已是大三！Jekyll自定义主题开发
 HDU -2674 N！Again(小技巧)
HDU -2546饭卡(01背包+贪心)
NYOJ 1091 超大01背包(折半枚举)
HDU 5144 NPY and shot(三分法)
printf用法之打印2进制，八进制，十进制，十六进制
原文地址：https://www.cnblogs.com/kexianting/p/13171555.html