Huffman压缩编码问题,编码问题解决后,剩下的就是如何能够按位操作文件,以真正实现文件压缩。如果只是把编码按char甚至int输入文件,那么得到的压缩文件会更大。但是C语言的文件操作也有其特点,就是无论写入还是读取都是以byte为单位,而不能按位操作。这样一来,就需要我们采取一些特殊手段。比较容易想到的是把要输送的位串以8个bits,即一个byte为单位打包,然后按字节写入。读取时先按照byte读取,然后在根据写入方法的逆,转变成原代码。由于C语言类型的灵活性,对于char类型可以使用移位运算,这就使事情简单多了。假设欲传送的位串,每个位都以char表示,存放于一个char *string里。那么就可以这么做:在具体实现中,我们可以设置一个缓冲区。这个缓冲区不能按照常规理解是一个数组之类,而就是一个byte.比如,我们可以如下定义缓冲区:
1 char buffer; 2 3 for( int i=0; i < 8; i) 4 { 5 if(string[i] == 1) 6 buffer=(buffer<<1);//左移,补0; 7 buffer = (buffer<<1)|1;//左移,补1; 8 }