一、LBP特征
LBP指局部二值模式,英文全称:Local Binary Pattern,是一种用来描述图像局部特征的算子,LBP特征具有灰度不变性和旋转不变性等显著优点。
原始的LBP算子定义在像素3*3的邻域内,以邻域中心像素为阈值,相邻的8个像素的灰度值与邻域中心的像素值进行比较,若周围像素大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经过比较可产生8位二进制数,将这8位二进制数依次排列形成一个二进制数字,这个二进制数字就是中心像素的LBP值,LBP值共有2^8种可能,因此LBP值有256种。中心像素的LBP值反映了该像素周围区域的纹理信息。
备注:计算LBP特征的图像必须是灰度图,如果是彩色图,需要先转换成灰度图。
上述过程用图像表示为:
原始LBP特征的具体的代码如下:
1 //原始LBP特征计算 2 template <typename _tp> 3 void getOriginLBPFeature(InputArray _src,OutputArray _dst) 4 { 5 Mat src = _src.getMat(); 6 _dst.create(src.rows-2,src.cols-2,CV_8UC1); 7 Mat dst = _dst.getMat(); 8 dst.setTo(0); 9 for(int i=1;i<src.rows-1;i++) 10 { 11 for(int j=1;j<src.cols-1;j++) 12 { 13 _tp center = src.at<_tp>(i,j); 14 unsigned char lbpCode = 0; 15 lbpCode |= (src.at<_tp>(i-1,j-1) > center) << 7; 16 lbpCode |= (src.at<_tp>(i-1,j ) > center) << 6; 17 lbpCode |= (src.at<_tp>(i-1,j+1) > center) << 5; 18 lbpCode |= (src.at<_tp>(i ,j+1) > center) << 4; 19 lbpCode |= (src.at<_tp>(i+1,j+1) > center) << 3; 20 lbpCode |= (src.at<_tp>(i+1,j ) > center) << 2; 21 lbpCode |= (src.at<_tp>(i+1,j-1) > center) << 1; 22 lbpCode |= (src.at<_tp>(i ,j-1) > center) << 0; 23 dst.at<uchar>(i-1,j-1) = lbpCode; 24 } 25 } 26 }
在原始的LBP特征提出以后,研究人员对LBP特征进行了很多的改进,因此产生了许多LBP的改进版本。
圆形LBP特征(Circular LBP or Extended LBP)
由于原始LBP特征使用的是固定邻域内的灰度值,因此当图像的尺度发生变化时,LBP特征的编码将会发生错误,LBP特征将不能正确的反映像素点周围的纹理信息,因此研究人员对其进行了改进。基本的 LBP 算子的最大缺陷在于它只覆盖了一个固定半径范围内的小区域,这显然不能满足不同尺寸和频率纹理的需要。为了适应不同尺度的纹理特征,并达到灰度和旋转不变性的要求, 对 LBP 算子进行改进,将 3×3 邻域扩展到任意邻域,并用圆形邻域代替了正方形邻域,改进后的 LBP 算子允许在半径为 R 的圆形邻域内有任意多个像素点。从而得到了诸如半径为R的圆形区域内含有P个采样点的LBP算子:
旋转不变LBP特征
从上面可以看出,上面的LBP特征具有灰度不变性,但还不具备旋转不变性,因此研究人员又在上面的基础上进行了扩展,提出了具有旋转不变性的LBP特征。首先不断的旋转圆形邻域内的LBP特征,根据选择得到一系列的LBP特征值,从这些LBP特征值选择LBP特征值最小的作为中心像素点的LBP特征。具体做法如下图所示:
如图,通过对得到的LBP特征进行旋转,得到一系列的LBP特征值,最终将特征值最小的一个特征模式作为中心像素点的LBP特征。
1 //旋转不变圆形LBP特征计算,声明时默认neighbors=8 2 template <typename _tp> 3 void getRotationInvariantLBPFeature(InputArray _src,OutputArray _dst,int radius,int neighbors) 4 { 5 Mat src = _src.getMat(); 6 //LBP特征图像的行数和列数的计算要准确 7 _dst.create(src.rows-2*radius,src.cols-2*radius,CV_8UC1); 8 Mat dst = _dst.getMat(); 9 dst.setTo(0); 10 for(int k=0;k<neighbors;k++) 11 { 12 //计算采样点对于中心点坐标的偏移量rx,ry 13 float rx = static_cast<float>(radius * cos(2.0 * CV_PI * k / neighbors)); 14 float ry = -static_cast<float>(radius * sin(2.0 * CV_PI * k / neighbors)); 15 //为双线性插值做准备 16 //对采样点偏移量分别进行上下取整 17 int x1 = static_cast<int>(floor(rx)); 18 int x2 = static_cast<int>(ceil(rx)); 19 int y1 = static_cast<int>(floor(ry)); 20 int y2 = static_cast<int>(ceil(ry)); 21 //将坐标偏移量映射到0-1之间 22 float tx = rx - x1; 23 float ty = ry - y1; 24 //根据0-1之间的x,y的权重计算公式计算权重,权重与坐标具体位置无关,与坐标间的差值有关 25 float w1 = (1-tx) * (1-ty); 26 float w2 = tx * (1-ty); 27 float w3 = (1-tx) * ty; 28 float w4 = tx * ty; 29 //循环处理每个像素 30 for(int i=radius;i<src.rows-radius;i++) 31 { 32 for(int j=radius;j<src.cols-radius;j++) 33 { 34 //获得中心像素点的灰度值 35 _tp center = src.at<_tp>(i,j); 36 //根据双线性插值公式计算第k个采样点的灰度值 37 float neighbor = src.at<_tp>(i+x1,j+y1) * w1 + src.at<_tp>(i+x1,j+y2) *w2 38 + src.at<_tp>(i+x2,j+y1) * w3 +src.at<_tp>(i+x2,j+y2) *w4; 39 //LBP特征图像的每个邻居的LBP值累加,累加通过与操作完成,对应的LBP值通过移位取得 40 dst.at<uchar>(i-radius,j-radius) |= (neighbor>center) <<(neighbors-k-1); 41 } 42 } 43 } 44 //进行旋转不变处理 45 for(int i=0;i<dst.rows;i++) 46 { 47 for(int j=0;j<dst.cols;j++) 48 { 49 unsigned char currentValue = dst.at<uchar>(i,j); 50 unsigned char minValue = currentValue; 51 for(int k=1;k<neighbors;k++) 52 { 53 //循环左移 54 unsigned char temp = (currentValue>>(neighbors-k)) | (currentValue<<k); 55 if(temp < minValue) 56 { 57 minValue = temp; 58 } 59 } 60 dst.at<uchar>(i,j) = minValue; 61 } 62 } 63 }
Uniform Pattern LBP特征
为了解决二进制模式过多的问题,提高统计性,Ojala提出了采用一种“等价模式”(Uniform Pattern)来对LBP算子的模式种类进行降维。Ojala等认为,在实际图像中,绝大多数LBP模式最多只包含两次从1到0或从0到1的跳变。因此,Ojala将“等价模式”定义为:当某个LBP所对应的循环二进制数从0到1或从1到0最多有两次跳变时,该LBP所对应的二进制就称为一个等价模式类。如00000000(0次跳变),00000111(只含一次从0到1的跳变),10001111(先由1跳到0,再由0跳到1,共两次跳变)都是等价模式类。除等价模式类以外的模式都归为另一类,称为混合模式类,例如10010111(共四次跳变)。通过这样的改进,二进制模式的种类大大减少,而不会丢失任何信息。模式数量由原来的2^P减少为 P ( P-1)+2种,其中P表示邻域集内的采样点数。对于3×3邻域内8个采样点来说,二进制模式由原始的256种减少为58种,即它把值分为59类,58个uniform pattern为一类,其它的所有值为第59类。这样直方图从原来的256维变成59维。这使得特征向量的维数更少,并且可以减少高频噪声带来的影响。
1 //等价模式LBP特征计算 2 template <typename _tp> 3 void getUniformPatternLBPFeature(InputArray _src,OutputArray _dst,int radius,int neighbors) 4 { 5 Mat src = _src.getMat(); 6 //LBP特征图像的行数和列数的计算要准确 7 _dst.create(src.rows-2*radius,src.cols-2*radius,CV_8UC1); 8 Mat dst = _dst.getMat(); 9 dst.setTo(0); 10 //LBP特征值对应图像灰度编码表,直接默认采样点为8位 11 uchar temp = 1; 12 uchar table[256] = {0}; 13 for(int i=0;i<256;i++) 14 { 15 if(getHopTimes(i)<3) 16 { 17 table[i] = temp; 18 temp++; 19 } 20 } 21 //是否进行UniformPattern编码的标志 22 bool flag = false; 23 //计算LBP特征图 24 for(int k=0;k<neighbors;k++) 25 { 26 if(k==neighbors-1) 27 { 28 flag = true; 29 } 30 //计算采样点对于中心点坐标的偏移量rx,ry 31 float rx = static_cast<float>(radius * cos(2.0 * CV_PI * k / neighbors)); 32 float ry = -static_cast<float>(radius * sin(2.0 * CV_PI * k / neighbors)); 33 //为双线性插值做准备 34 //对采样点偏移量分别进行上下取整 35 int x1 = static_cast<int>(floor(rx)); 36 int x2 = static_cast<int>(ceil(rx)); 37 int y1 = static_cast<int>(floor(ry)); 38 int y2 = static_cast<int>(ceil(ry)); 39 //将坐标偏移量映射到0-1之间 40 float tx = rx - x1; 41 float ty = ry - y1; 42 //根据0-1之间的x,y的权重计算公式计算权重,权重与坐标具体位置无关,与坐标间的差值有关 43 float w1 = (1-tx) * (1-ty); 44 float w2 = tx * (1-ty); 45 float w3 = (1-tx) * ty; 46 float w4 = tx * ty; 47 //循环处理每个像素 48 for(int i=radius;i<src.rows-radius;i++) 49 { 50 for(int j=radius;j<src.cols-radius;j++) 51 { 52 //获得中心像素点的灰度值 53 _tp center = src.at<_tp>(i,j); 54 //根据双线性插值公式计算第k个采样点的灰度值 55 float neighbor = src.at<_tp>(i+x1,j+y1) * w1 + src.at<_tp>(i+x1,j+y2) *w2 56 + src.at<_tp>(i+x2,j+y1) * w3 +src.at<_tp>(i+x2,j+y2) *w4; 57 //LBP特征图像的每个邻居的LBP值累加,累加通过与操作完成,对应的LBP值通过移位取得 58 dst.at<uchar>(i-radius,j-radius) |= (neighbor>center) <<(neighbors-k-1); 59 //进行LBP特征的UniformPattern编码 60 if(flag) 61 { 62 dst.at<uchar>(i-radius,j-radius) = table[dst.at<uchar>(i-radius,j-radius)]; 63 } 64 } 65 } 66 } 67 } 68 //计算跳变次数 69 int getHopTimes(int n) 70 { 71 int count = 0; 72 bitset<8> binaryCode = n; 73 for(int i=0;i<8;i++) 74 { 75 if(binaryCode[i] != binaryCode[(i+1)%8]) 76 { 77 count++; 78 } 79 } 80 return count; 81 }
二、LBPH——图像的LBP特征向量
LBPH,Local Binary Patterns Histograms,即LBP特征的统计直方图,LBPH将LBP特征与图像的空间信息结合在一起。这种表示方法由Ahonen等人在论文[3]中提出,他们将LBP特征图像分成m个局部块,并提取每个局部块的直方图,然后将这些直方图依次连接在一起形成LBP特征的统计直方图,即LBPH。
一幅图像具体的计算LBPH的过程(以Opencv中的人脸识别为例):
1. 计算图像的LBP特征图像;
2. 将LBP特征图像进行分块,Opencv中默认将LBP特征图像分成8行8列64块区域;
3. 计算每块区域特征图像的直方图cell_LBPH,将直方图进行归一化,直方图大小为1*numPatterns;
4. 将上面计算的每块区域特征图像的直方图按分块的空间顺序依次排列成一行,形成LBP特征向量,大小为1*(numPatterns*64);
5. 用机器学习的方法对LBP特征向量进行训练,用来检测和识别目标。
举例说明LBPH的维度:
采样点为8个,如果用的是原始的LBP或Extended LBP特征,其LBP特征值的模式为256种,则一幅图像的LBP特征向量维度为:64*256=16384维,
而如果使用的UniformPatternLBP特征,其LBP值的模式为59种,其特征向量维度为:64*59=3776维,可以看出,使用等价模式特征,其特征向量的维度大大减少,
这意味着使用机器学习方法进行学习的时间将大大减少,而性能上没有受到很大影响。
1 //计算LBP特征图像的直方图LBPH 2 Mat getLBPH(InputArray _src,int numPatterns,int grid_x,int grid_y,bool normed) 3 { 4 Mat src = _src.getMat(); 5 int width = src.cols / grid_x; 6 int height = src.rows / grid_y; 7 //定义LBPH的行和列,grid_x*grid_y表示将图像分割成这么些块,numPatterns表示LBP值的模式种类 8 Mat result = Mat::zeros(grid_x * grid_y,numPatterns,CV_32FC1); 9 if(src.empty()) 10 { 11 return result.reshape(1,1); 12 } 13 int resultRowIndex = 0; 14 //对图像进行分割,分割成grid_x*grid_y块,grid_x,grid_y默认为8 15 for(int i=0;i<grid_x;i++) 16 { 17 for(int j=0;j<grid_y;j++) 18 { 19 //图像分块 20 Mat src_cell = Mat(src,Range(i*height,(i+1)*height),Range(j*width,(j+1)*width)); 21 //计算直方图 22 Mat hist_cell = getLocalRegionLBPH(src_cell,0,(numPattern-1),true); 23 //将直方图放到result中 24 Mat rowResult = result.row(resultRowIndex); 25 hist_cell.reshape(1,1).convertTo(rowResult,CV_32FC1); 26 resultRowIndex++; 27 } 28 } 29 return result.reshape(1,1); 30 } 31 //计算一个LBP特征图像块的直方图 32 Mat getLocalRegionLBPH(const Mat& src,int minValue,int maxValue,bool normed) 33 { 34 //定义存储直方图的矩阵 35 Mat result; 36 //计算得到直方图bin的数目,直方图数组的大小 37 int histSize = maxValue - minValue + 1; 38 //定义直方图每一维的bin的变化范围 39 float range[] = { static_cast<float>(minValue),static_cast<float>(maxValue + 1) }; 40 //定义直方图所有bin的变化范围 41 const float* ranges = { range }; 42 //计算直方图,src是要计算直方图的图像,1是要计算直方图的图像数目,0是计算直方图所用的图像的通道序号,从0索引 43 //Mat()是要用的掩模,result为输出的直方图,1为输出的直方图的维度,histSize直方图在每一维的变化范围 44 //ranges,所有直方图的变化范围(起点和终点) 45 calcHist(&src,1,0,Mat(),result,1,&histSize,&ranges,true,false); 46 //归一化 47 if(normed) 48 { 49 result /= (int)src.total(); 50 } 51 //结果表示成只有1行的矩阵 52 return result.reshape(1,1); 53 }
上面的LBP特征都是较经典的LBP特征,除此之外,LBP特征还有大量的变种,如TLBP,DLBP,MLBP,MB-LBP,RGB-LBP等。