tornadomeet
前景检测算法_4(opencv自带GMM)
http://www.cnblogs.com/tornadomeet/archive/2012/06/02/2531705.html
前面已经有3篇博文介绍了背景减图方面相关知识(见下面的链接),在第3篇博文中自己也实现了gmm简单算法,但效果不是很好,下面来体验下opencv自带2个gmm算法。
opencv实现背景减图法1(codebook和平均背景法)
http://www.cnblogs.com/tornadomeet/archive/2012/04/08/2438158.html
opencv实现背景减图法2(帧差法)
http://www.cnblogs.com/tornadomeet/archive/2012/05/01/2477629.html
opencv实现背景减图法3(GMM)
http://www.cnblogs.com/tornadomeet/archive/2012/06/02/2531565.html
工程环境opencv2.3.1+vs2010
实现功能:与上面第三篇博文一样,完成动态背景的训练,来检测前景。
数据来源和前面的一样: http://research.microsoft.com/en-us/um/people/jckrumm/WallFlower/TestImages.htm 由于该数据是286张bmp格式的图片,所以用的前200张图片来作为GMM参数训练,后186张作为测试。训练的过程中树枝被很大幅度的摆动,测试过程中有行人走动,该行人是需要迁就检测的部分。
Opencv自带的gmm算法1的实验结果如下:
其工程代码如下:
1 // gmm_wavetrees.cpp : 定义控制台应用程序的入口点。 2 // 3 4 #include "stdafx.h" 5 6 #include "opencv2/core/core.hpp" 7 #include "opencv2/video/background_segm.hpp" 8 #include "opencv2/highgui/highgui.hpp" 9 #include "opencv2/imgproc/imgproc.hpp" 10 #include <stdio.h> 11 12 using namespace std; 13 using namespace cv; 14 15 //this is a sample for foreground detection functions 16 string src_img_name="WavingTrees/b00"; 17 const char *src_img_name1; 18 Mat img, fgmask, fgimg; 19 int i=-1; 20 char chari[500]; 21 bool update_bg_model = true; 22 bool pause=false; 23 24 //第一种gmm,用的是KaewTraKulPong, P. and R. Bowden (2001). 25 //An improved adaptive background mixture model for real-time tracking with shadow detection. 26 BackgroundSubtractorMOG bg_model; 27 28 void refineSegments(const Mat& img, Mat& mask, Mat& dst) 29 { 30 int niters = 3; 31 32 vector<vector<Point> > contours; 33 vector<Vec4i> hierarchy; 34 35 Mat temp; 36 37 dilate(mask, temp, Mat(), Point(-1,-1), niters);//膨胀,3*3的element,迭代次数为niters 38 erode(temp, temp, Mat(), Point(-1,-1), niters*2);//腐蚀 39 dilate(temp, temp, Mat(), Point(-1,-1), niters); 40 41 findContours( temp, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE );//找轮廓 42 43 dst = Mat::zeros(img.size(), CV_8UC3); 44 45 if( contours.size() == 0 ) 46 return; 47 48 // iterate through all the top-level contours, 49 // draw each connected component with its own random color 50 int idx = 0, largestComp = 0; 51 double maxArea = 0; 52 53 for( ; idx >= 0; idx = hierarchy[idx][0] )//这句没怎么看懂 54 { 55 const vector<Point>& c = contours[idx]; 56 double area = fabs(contourArea(Mat(c))); 57 if( area > maxArea ) 58 { 59 maxArea = area; 60 largestComp = idx;//找出包含面积最大的轮廓 61 } 62 } 63 Scalar color( 0, 255, 0 ); 64 drawContours( dst, contours, largestComp, color, CV_FILLED, 8, hierarchy ); 65 } 66 67 int main(int argc, const char** argv) 68 { 69 bg_model.noiseSigma = 10; 70 img=imread("WavingTrees/b00000.bmp"); 71 if(img.empty()) 72 { 73 namedWindow("image",1);//不能更改窗口 74 namedWindow("foreground image",1); 75 namedWindow("mean background image", 1); 76 } 77 for(;;) 78 { 79 if(!pause) 80 { 81 i++; 82 itoa(i,chari,10); 83 if(i<10) 84 { 85 src_img_name+="00"; 86 } 87 else if(i<100) 88 { 89 src_img_name+="0"; 90 } 91 else if(i>285) 92 { 93 i=-1; 94 } 95 if(i>=230) 96 update_bg_model=false; 97 else update_bg_model=true; 98 99 src_img_name+=chari; 100 src_img_name+=".bmp"; 101 102 img=imread(src_img_name); 103 if( img.empty() ) 104 break; 105 106 //update the model 107 bg_model(img, fgmask, update_bg_model ? 0.005 : 0);//计算前景mask图像,其中输出fgmask为8-bit二进制图像,第3个参数为学习速率 108 refineSegments(img, fgmask, fgimg); 109 110 imshow("image", img); 111 imshow("foreground image", fgimg); 112 113 src_img_name="WavingTrees/b00"; 114 115 } 116 char k = (char)waitKey(80); 117 if( k == 27 ) break; 118 119 if( k == ' ' ) 120 { 121 pause=!pause; 122 } 123 } 124 125 return 0; 126 }
Opencv自带的gmm算法2的实验结果如下:
其工程代码如下:
1 // gmm2_wavetrees.cpp : 定义控制台应用程序的入口点。 2 // 3 4 #include "stdafx.h" 5 6 #include "opencv2/core/core.hpp" 7 #include "opencv2/video/background_segm.hpp" 8 #include "opencv2/highgui/highgui.hpp" 9 #include "opencv2/imgproc/imgproc.hpp" 10 #include <stdio.h> 11 12 using namespace std; 13 using namespace cv; 14 15 //this is a sample for foreground detection functions 16 string src_img_name="WavingTrees/b00"; 17 const char *src_img_name1; 18 Mat img, fgmask, fgimg; 19 int i=-1; 20 char chari[500]; 21 bool update_bg_model = true; 22 bool pause=false; 23 24 //第一种gmm,用的是KaewTraKulPong, P. and R. Bowden (2001). 25 //An improved adaptive background mixture model for real-time tracking with shadow detection. 26 BackgroundSubtractorMOG2 bg_model; 27 28 void refineSegments(const Mat& img, Mat& mask, Mat& dst) 29 { 30 int niters = 3; 31 32 vector<vector<Point> > contours; 33 vector<Vec4i> hierarchy; 34 35 Mat temp; 36 37 dilate(mask, temp, Mat(), Point(-1,-1), niters); 38 erode(temp, temp, Mat(), Point(-1,-1), niters*2); 39 dilate(temp, temp, Mat(), Point(-1,-1), niters); 40 41 findContours( temp, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE ); 42 43 dst = Mat::zeros(img.size(), CV_8UC3); 44 45 if( contours.size() == 0 ) 46 return; 47 48 // iterate through all the top-level contours, 49 // draw each connected component with its own random color 50 int idx = 0, largestComp = 0; 51 double maxArea = 0; 52 53 for( ; idx >= 0; idx = hierarchy[idx][0] ) 54 { 55 const vector<Point>& c = contours[idx]; 56 double area = fabs(contourArea(Mat(c))); 57 if( area > maxArea ) 58 { 59 maxArea = area; 60 largestComp = idx; 61 } 62 } 63 Scalar color( 255, 0, 0 ); 64 drawContours( dst, contours, largestComp, color, CV_FILLED, 8, hierarchy ); 65 } 66 67 int main(int argc, const char** argv) 68 { 69 img=imread("WvingTrees/b00000.bmp"); 70 if(img.empty()) 71 { 72 namedWindow("image",1);//不能更改窗口 73 //cvNamedWindow("image",0); 74 namedWindow("foreground image",1); 75 // namedWindow("mean background image", 1); 76 } 77 for(;;) 78 { 79 if(!pause) 80 { 81 i++; 82 itoa(i,chari,10); 83 if(i<10) 84 { 85 src_img_name+="00"; 86 } 87 else if(i<100) 88 { 89 src_img_name+="0"; 90 } 91 else if(i>285) 92 { 93 i=-1; 94 } 95 // if(i>=230) 96 // update_bg_model=false; 97 // else update_bg_model=true; 98 99 src_img_name+=chari; 100 src_img_name+=".bmp"; 101 102 img=imread(src_img_name); 103 if( img.empty() ) 104 break; 105 106 //update the model 107 bg_model(img, fgmask, update_bg_model ? 0.005 : 0);//计算前景mask图像,其中输出fgmask为8-bit二进制图像,第3个参数为学习速率 108 refineSegments(img, fgmask, fgimg); 109 110 imshow("foreground image", fgimg); 111 imshow("image", img); 112 113 src_img_name="WavingTrees/b00"; 114 115 } 116 char k = (char)waitKey(100); 117 if( k == 27 ) break; 118 119 if( k == ' ' ) 120 { 121 pause=!pause; 122 } 123 } 124 125 return 0; 126 }
可以看出gmm1效果比gmm2的好,但是研究发现,gmm2是在gmm1上改进的,不会越该越差吧,除非2个函数的使用方法不同(虽然函数形式一样),也就是说相同的参数值对函数功能的影响不同。以后有时间在研究了。
前景检测算法_3(GMM)
http://www.cnblogs.com/tornadomeet/archive/2012/06/02/2531565.html
摘要
本文通过opencv来实现一种前景检测算法——GMM,算法采用的思想来自论文[1][2][4]。在进行前景检测前,先对背景进行训练,对图像中每个背景采用一个混合高斯模型进行模拟,每个背景的混合高斯的个数可以自适应。然后在测试阶段,对新来的像素进行GMM匹配,如果该像素值能够匹配其中一个高斯,则认为是背景,否则认为是前景。由于整个过程GMM模型在不断更新学习中,所以对动态背景有一定的鲁棒性。最后通过对一个有树枝摇摆的动态背景进行前景检测,取得了较好的效果。
关键字:GMM,opencv,前景检测
前言
前景检测主要分为帧差法,平均背景法,光流法,前景建模法,背景非参数估计,背景建模法等。而本文要实现的方法属于背景建模法中的一种——GMM,也称混合高斯模型。
混合高斯模型最早在计算机视觉中的应用是Stauffer et al.[1],作者将其用来做前景检测,主要是用于视频监控领域,这个系统和稳定且有自学能力,能在户外环境跑16个多月。KaewTraKulPong et al.[2]将GMM的训练过程做了改进,将训练过程分为2步进行,前L帧采用EM算法进行权值,均值,方差更新,后面的过程就采用[1]中的方法进行更新,取得了更好的检测效果。Zivkovic et al.在[3]中对GMM理论做了全面的论述,使得GMM理论的使用不仅金限于计算机视觉领域。并且该作者在[4]将该理论进一步具体到背景减图的前景检测中来,即加入了参数估计的先验知识,取得了很好的效果和稳定性。
最近几年陆续有学者对GMM的背景见图中的应用做了更深一步的研究,其代表性贡献见论文[5][6]。
实现过程
本文中主要是根据[2][4]中提出的算法,采用其中的更新方差来根性模型中的3个参数,最后结合用opencv基本底层函数实现该算法。其主要过程如下:
- 首先将每个高斯的均值,方差,权值都设置为0,即初始化个模型矩阵参数。
- 采用视频中的T帧用来训练GMM模型。对每一个像素而言,建立其模型个数最大GMM_MAX_COMPONT个高斯的GMM模型。当第一个像素来,单独为其在程序中设置好其固定的初始均值,方差,并且权值设置为1。
- 非第一帧训练过程中,当后面来的像素值时,与前面已有的高斯的均值比较,如果该像素点的值与其模型均值差在3倍的方差内,则任务属于该高斯。此时用如下方程进行更新:
4. 当到达训练的帧数T后,进行不同像素点GMM个数自适应的选择。首先用权值除以方差对各个高斯进行从大到小排序,然后选取最前面B个高斯,使
这样就可以很好的消除训练过程中的噪声点。
5. 在测试阶段,对新来像素点的值与B个高斯中的每一个均值进行比较,如果其差值在2倍的方差之间的话,则认为是背景,否则认为是前景。并且只要其中有一个高斯分量满足该条件就认为是前景。前景赋值为255,背景赋值为0。这样就形成了一副前景二值图。
6. 由于前景二值图中含有很多噪声,所以采用了形态学的开操作将噪声缩减到0,紧接着用闭操作重建由于开操作丢失的边缘部分的信息。消除了不连通的小噪声点。
上面是该算法实现的大概流程,但是当我们在具体编程时,还是有很多细节的地方需要注意,比如有些参数值的选择。在这里,经过试验将一些常用的参数值声明如下:
- 3个参数的值的更新方差中,取其中的学习率为0.005。也就是说T等于200。
- 定义每个像素的最大混合高斯个数取7。
- 取视频的前200帧进行训练。
- 取Cf为0.3。即满足权值大于0.7的个数为自适应高斯的个数B。
- 训练过程中,需要新建立一个高斯时,其权值取值设为与学习率大小值相等,即0.005。
- 训练过程中,需要新建立一个高斯时,取该高斯的均值为该输入像素值大小本身。方差为15。
- 训练过程中,需要新建立一个高斯时,取该高斯的方差15。
程序流程框图
该工程的流程框图如下图所示:
试验结果
本次试验的数据为摇摆的树枝作为背景,Waving Trees,其来源网址为:http://research.microsoft.com/en-us/um/people/jckrumm/WallFlower/TestImages.htm 由于该数据是286张bmp格式的图片,所以用的前200张图片来作为GMM参数训练,后186张作为测试。训练的过程中树枝被很大幅度的摆动,测试过程中有行人走动,该行人是需要迁就检测的部分。
下图为训练过程中动态背景截图
由上图可以看出,树枝在不断摇摆,可见其背景是动态的。
没有形态学处理的结果如下:
下图是有简单形态学的试验结果:
(上面2幅图的左边为测试原始图片,右图为检测效果图)
总结
通过本次试验,不仅学习到了GMM的相关理论知识,以及背景减图法在前景检测中的应用。更重要的时,对opencv在计算机视觉中的使用更进一步的熟悉了。另外对于目标检测的难点有了更深一层的理解。
参考文献
- Stauffer, C. and W. E. L. Grimson (1999). Adaptive background mixture models for real-time tracking, IEEE.
- KaewTraKulPong, P. and R. Bowden (2001). An improved adaptive background mixture model for real-time tracking with shadow detection.
- Zivkovic, Z. and F. van der Heijden (2004). "Recursive unsupervised learning of finite mixture models." Pattern Analysis and Machine Intelligence, IEEE Transactions on 26(5): 651-656.
- Zivkovic, Z. and F. van der Heijden (2006). "Efficient adaptive density estimation per image pixel for the task of background subtraction." Pattern recognition letters 27(7): 773-780.
- Bouzerdoum, A., A. Beghdadi, et al. (2010). "On the analysis of background subtraction techniques using Gaussian mixture models."
- Lin, H. H., J. H. Chuang, et al. (2011). "Regularized background adaptation: a novel learning rate control scheme for Gaussian mixture modeling." Image Processing, IEEE Transactions on 20(3): 822-836.
后续改进
需要改进的地方:
1. 程序运行的速度太慢,很多参数都是浮点数,每个像素都要建立一个gmm,gmm个数本身比较多,所以训练过程中速度比较慢,代码需要优化。
2. 最后生成的前景图需要用连通域处理算法进行修整,即需要形态学操作,然后找出连通域大小满足要求的轮廓,用多边形拟合来进行处理。这种算法在《learning opencv》一书中有提到。后续有时间加入该算法,效果会好很多的。
附录:工程代码
1 //gmm.cpp : 定义控制台应用程序的入口点。 2 #include "stdafx.h" 3 #include "cv.h" 4 #include "highgui.h" 5 #include <opencv2/imgproc/imgproc.hpp> 6 #include <opencv2/core/core.hpp> 7 #include <opencv2/highgui/highgui.hpp> 8 #include <stdio.h> 9 #include <iostream> 10 11 using namespace cv; 12 using namespace std; 13 14 //定义gmm模型用到的变量 15 #define GMM_MAX_COMPONT 6 16 #define GMM_LEARN_ALPHA 0.005 //该学习率越大的话,学习速度太快,效果不好 17 #define GMM_THRESHOD_SUMW 0.7 //如果取值太大了的话,则更多树的部分都被检测出来了 18 #define END_FRAME 200 19 20 bool pause=false; 21 22 Mat w[GMM_MAX_COMPONT]; 23 Mat u[GMM_MAX_COMPONT]; 24 Mat sigma[GMM_MAX_COMPONT]; 25 Mat fit_num,gmask,foreground; 26 vector<Mat> output_m; 27 Mat output_img; 28 29 float temp_w,temp_sigma; 30 unsigned char temp_u; 31 int i=-1; 32 33 34 //For connected components: 35 int CVCONTOUR_APPROX_LEVEL = 2; // Approx.threshold - the bigger it is, the simpler is the boundary 36 int CVCLOSE_ITR = 1; 37 38 //Just some convienience macros 39 #define CV_CVX_WHITE CV_RGB(0xff,0xff,0xff) 40 #define CV_CVX_BLACK CV_RGB(0x00,0x00,0x00) 41 42 //gmm整体初始化函数声明 43 void gmm_init(Mat img); 44 45 //gmm第一帧初始化函数声明 46 void gmm_first_frame(Mat img); 47 48 //gmm训练过程函数声明 49 void gmm_train(Mat img); 50 51 //对输入图像每个像素gmm选择合适的个数函数声明 52 void gmm_fit_num(Mat img); 53 54 //gmm测试函数的实现 55 void gmm_test(Mat img); 56 57 //连通域去噪函数声明 58 void find_connected_components(Mat img); 59 //void cvconnectedComponents(IplImage *mask, int poly1_hull0, float perimScale, int *num, CvRect *bbs, CvPoint *centers); 60 61 int main(int argc, const char* argv[]) 62 { 63 Mat img,img_gray; 64 char str_num[5]; 65 66 67 // char *str_num;//why does this definition not work? 68 String str="WavingTrees/b00";//string,the 's' can be a captial or lower-caseletters 69 70 /****read the first image,and reset the array w,u,sigma****/ 71 img=imread("WavingTrees/b00000.bmp"); 72 if(img.empty()) 73 return -1; 74 75 output_img=Mat::zeros(img.size(),img.type()); 76 cvtColor(img,img_gray,CV_BGR2GRAY);//covert the colorful image to the corresponding gray-level image 77 78 /****initialization the three parameters ****/ 79 gmm_init(img_gray); 80 fit_num=Mat(img.size(),CV_8UC1,-1);//初始化为1 81 gmask=Mat(img.size(),CV_8UC1,-1); 82 foreground=img.clone(); 83 split(img,output_m); 84 85 output_m[0]=Mat::zeros(img.size(),output_m[0].type()); 86 output_m[1]=Mat::zeros(img.size(),output_m[0].type()); 87 output_m[2]=Mat::zeros(img.size(),output_m[0].type()); 88 89 namedWindow("src",WINDOW_AUTOSIZE); 90 namedWindow("gmask",WINDOW_AUTOSIZE); 91 92 //在定义视频输出对象时,文件名一定后面要加后缀,比如这里的.avi,否则是输出不了视频的!并且这里只能是avi格式的,当参数为('P','I','M','1')时 93 VideoWriter output_src("src.avi",CV_FOURCC('P','I','M','1'),20,Size(160,120),1);//c++版本的opencv用Size函数即可,c版本的用cvSize()函数 94 //VideoWriter output_src("src.avi",CV_FOURCC('M','J','P','G'),5,Size(160,120),1);//c++版本的opencv用Size函数即可,c版本的用cvSize()函数 95 VideoWriter output_dst("dst.avi",CV_FOURCC('P','I','M','1'),20,Size(160,120),1);//这样输出的是3个通道的数据 96 while(1) 97 98 { 99 if(!pause) 100 { 101 /****read image from WavingTrees****/ 102 i++; 103 _itoa_s(i,str_num,10);//the latest name is _itoa_s or _itoa,not the itoa,although iota can be used,deprecated 104 if(i<10) 105 str+="00"; 106 else if(i<100) 107 str+="0"; 108 else if(i>285)//we used the first 285 frames to learn the gmm model 109 i=-1; 110 str+=str_num; 111 str+=".bmp"; 112 113 img=imread(str); 114 if(img.empty()) 115 break; 116 str="WavingTrees/b00";//after read,str must be reseted ; 117 118 cvtColor(img,img_gray,CV_BGR2GRAY);//covert the colorful image to the corresponding gray-level image 119 120 /****when it is the first frame,set the default parameter****/ 121 if(1==i) 122 { 123 gmm_first_frame(img_gray); 124 } 125 126 //the train of gmm phase 127 //if(1<i&&i<5&&i!=3)//由此可知当i大于等于3以后,就会一直出现错误,且错误在内部排序的部分 128 if(1<i<END_FRAME) 129 { 130 gmm_train(img_gray); 131 }//end the train phase 132 133 cout<<i<<endl; 134 /****chose the fitting number of component in gmm****/ 135 if(END_FRAME==i) 136 { 137 gmm_fit_num(img_gray); 138 // cout<<fit_num<<endl;//其输出值有4个高斯的,但也有0个高斯的,why?照理说不可能的啊! 139 } 140 141 /****start the test phase****/ 142 if(i>=END_FRAME) 143 { 144 output_src<<img; 145 gmm_test(img_gray); 146 find_connected_components(img_gray); 147 148 output_m[0]=gmask.clone(); 149 output_m[1]=gmask.clone(); 150 output_m[2]=gmask.clone(); 151 152 merge(output_m,output_img); 153 output_dst<<output_img; 154 } 155 if(285==i) 156 { 157 return 0; 158 } 159 imshow("src",img); 160 imshow("gmask",gmask); 161 } 162 163 char c=(char)waitKey(1); 164 if(c==27)//if press the ESC key,the exit the proggram 165 break; 166 if(c==' ') 167 // pause=~pause;//if use '~',then the pause key cannot work,why? 168 pause=!pause; 169 } 170 return 0; 171 } 172 173 174 //gmm初始化函数实现 175 void gmm_init(Mat img) 176 { 177 /****initialization the three parameters ****/ 178 for(int j=0;j<GMM_MAX_COMPONT;j++) 179 { 180 w[j]=Mat(img.size(),CV_32FC1,0.0);//CV_32FC1本身体现了正负符号 181 u[j]=Mat(img.size(),CV_8UC1,-1);//为什么这里赋值为0时,后面的就一直出错?暂时还不知道原因,先赋值-1,其实内部存储的也是0 182 sigma[j]=Mat(img.size(),CV_32FC1,0.0);//float类型 183 } 184 185 //为什么一下语句不能放在这个函数里面呢 186 // output_m[0]=Mat(img.size(),CV_8UC1,0); 187 // output_m[1]=Mat(img.size(),CV_8UC1,0); 188 // output_m[2]=Mat(img.size(),CV_8UC1,0); 189 } 190 191 192 //gmm第一帧初始化函数实现 193 void gmm_first_frame(Mat img) 194 { 195 for(int m=0;m<img.rows;m++) 196 for(int n=0;n<img.cols;n++) 197 { 198 w[0].at<float>(m,n)=1.0; 199 200 //if the pixvel is gray-clever,then we should use unsigned char,not the unsigned int 201 u[0].at<unsigned char>(m,n)=img.at<unsigned char>(m,n);// 一定要注意其类型转换,否则会得不得预期的结果 202 sigma[0].at<float>(m,n)=15.0;//opencv 自带的gmm代码中用的是15.0 203 204 for(int k=1;k<GMM_MAX_COMPONT;k++) 205 { 206 /****when assigment this,we must be very carefully****/ 207 w[k].at<float>(m,n)=0.0; 208 u[k].at<unsigned char>(m,n)=-1; 209 sigma[k].at<float>(m,n)=15.0;//防止后面排序时有分母为0的情况 210 } 211 } 212 } 213 214 215 //gmm训练过程函数实现 216 void gmm_train(Mat img) 217 { 218 for(int m=0;m<img.rows;m++) 219 for(int n=0;n<img.cols;n++) 220 { 221 int k=0; 222 int nfit=0; 223 for(;k<GMM_MAX_COMPONT;k++) 224 { 225 // if(w[k].at<float>(m,n)!=0)//只有在权值不为0的情况下才进行比较 226 // { 227 int delam=abs(img.at<unsigned char>(m,n)-u[k].at<unsigned char>(m,n));//防止溢出 228 long dis=delam*delam; 229 if(dis<3.0*sigma[k].at<float>(m,n))//the present pixpel is fit the component 230 { 231 /****update the weight****/ 232 w[k].at<float>(m,n)=w[k].at<float>(m,n)+GMM_LEARN_ALPHA*(1-w[k].at<float>(m,n)); 233 234 /****update the average****/ 235 u[k].at<unsigned char>(m,n)=u[k].at<unsigned char>(m,n)+(GMM_LEARN_ALPHA/w[k].at<float>(m,n))*delam; 236 237 /****update the variance****/ 238 sigma[k].at<float>(m,n)=sigma[k].at<float>(m,n)+(GMM_LEARN_ALPHA/w[k].at<float>(m,n))*(dis-sigma[k].at<float>(m,n)); 239 240 // break; 241 } 242 else{ 243 w[k].at<float>(m,n)=w[k].at<float>(m,n)+GMM_LEARN_ALPHA*(0-w[k].at<float>(m,n)); 244 nfit++; 245 } 246 // } 247 } 248 249 ////训练过程加速算法 250 //for(int bb=k+1;bb<GMM_MAX_COMPONT;bb++) 251 //{ 252 // w[bb].at<float>(m,n)=w[bb].at<float>(m,n)+GMM_LEARN_ALPHA*(0-w[bb].at<float>(m,n)); 253 // nfit++; 254 //} 255 256 //对gmm各个高斯进行排序,从大到小排序,排序依据为w/sigma 257 for(int kk=0;kk<GMM_MAX_COMPONT;kk++) 258 { 259 for(int rr=kk;rr<GMM_MAX_COMPONT;rr++) 260 { 261 //怎样才能做到gmm结构体整体排序呢? 262 if(w[rr].at<float>(m,n)/sigma[rr].at<float>(m,n)>w[kk].at<float>(m,n)/sigma[kk].at<float>(m,n)) 263 { 264 //权值交换 265 temp_w=w[rr].at<float>(m,n); 266 w[rr].at<float>(m,n)=w[kk].at<float>(m,n); 267 w[kk].at<float>(m,n)=temp_w; 268 269 //均值交换 270 temp_u=u[rr].at<unsigned char>(m,n); 271 u[rr].at<unsigned char>(m,n)=u[kk].at<unsigned char>(m,n); 272 u[kk].at<unsigned char>(m,n)=temp_u; 273 274 //方差交换 275 temp_sigma=sigma[rr].at<float>(m,n); 276 sigma[rr].at<float>(m,n)=sigma[kk].at<float>(m,n); 277 sigma[kk].at<float>(m,n)=temp_sigma; 278 } 279 } 280 } 281 282 //****如果没有满足条件的高斯,则重新开始算一个高斯分布****/ 283 if(nfit==GMM_MAX_COMPONT&&0==w[GMM_MAX_COMPONT-1].at<float>(m,n))//if there is no exit component fit,then start a new componen 284 { 285 //不能写为for(int h=0;h<MAX_GMM_COMPONT&&((0==w[h].at<float>(m,n)));h++),因为这样明显h不会每次都加1 286 for(int h=0;h<GMM_MAX_COMPONT;h++) 287 { 288 if((0==w[h].at<float>(m,n))) 289 { 290 w[h].at<float>(m,n)=GMM_LEARN_ALPHA;//按照论文的参数来的 291 u[h].at<unsigned char>(m,n)=(unsigned char)img.at<unsigned char>(m,n); 292 sigma[h].at<float>(m,n)=15.0;//the opencv library code is 15.0 293 for(int q=0;q<GMM_MAX_COMPONT&&q!=h;q++) 294 { 295 /****update the other unfit's weight,u and sigma remain unchanged****/ 296 w[q].at<float>(m,n)*=1-GMM_LEARN_ALPHA;//normalization the weight,let they sum to 1 297 } 298 break;//找到第一个权值不为0的即可 299 } 300 } 301 } 302 //如果GMM_MAX_COMPONT都曾经赋值过,则用新来的高斯代替权值最弱的高斯,权值不变,只更新均值和方差 303 else if(nfit==GMM_MAX_COMPONT&&w[GMM_MAX_COMPONT-1].at<float>(m,n)!=0) 304 { 305 u[GMM_MAX_COMPONT-1].at<unsigned char>(m,n)=(unsigned char)img.at<unsigned char>(m,n); 306 sigma[GMM_MAX_COMPONT-1].at<float>(m,n)=15.0;//the opencv library code is 15.0 307 } 308 309 310 } 311 }//end the train phase 312 313 314 //对输入图像每个像素gmm选择合适的个数 315 void gmm_fit_num(Mat img) 316 { 317 //float sum_w=0.0;//重新赋值为0,给下一个像素做累积 318 for(int m=0;m<img.rows;m++) 319 for(int n=0;n<img.cols;n++) 320 { 321 float sum_w=0.0;//重新赋值为0,给下一个像素做累积 322 //chose the fittest number fit_num 323 for(unsigned char a=0;a<GMM_MAX_COMPONT;a++) 324 { 325 //cout<<w[a].at<float>(m,n)<<endl; 326 sum_w+=w[a].at<float>(m,n); 327 if(sum_w>=GMM_THRESHOD_SUMW)//如果这里THRESHOD_SUMW=0.6的话,那么得到的高斯数目都为1,因为每个像素都有一个权值接近1 328 { 329 fit_num.at<unsigned char>(m,n)=a+1; 330 break; 331 } 332 } 333 } 334 } 335 336 337 //gmm测试函数的实现 338 void gmm_test(Mat img) 339 { 340 for(int m=0;m<img.rows;m++) 341 for(int n=0;n<img.cols;n++) 342 { 343 unsigned char a=0; 344 for(;a<fit_num.at<unsigned char>(m,n);a++) 345 { 346 //如果对sigma取根号的话,树枝当做前景的概率会更大,不过人被检测出来的效果也更好些;用2相乘,不用开根号效果还不错 347 // if(abs(img.at<unsigned char>(m,n)-u[a].at<unsigned char>(m,n))<(unsigned char)(2*(sigma[a].at<float>(m,n)))) 348 if(abs(img.at<unsigned char>(m,n)-u[a].at<unsigned char>(m,n))<(unsigned char)(2.5*(sigma[a].at<float>(m,n)))) 349 { 350 gmask.at<unsigned char>(m,n)=1;//背景 351 break; 352 } 353 } 354 if(a==fit_num.at<unsigned char>(m,n)) 355 gmask.at<unsigned char>(m,n)=255;//前景 356 } 357 } 358 359 //连通域去噪函数实现 360 void find_connected_components(Mat img) 361 { 362 morphologyEx(gmask,gmask,MORPH_OPEN,Mat()); 363 // morphologyEx(gmask,gmask,MORPH_CLOSE,Mat()); 364 } 365 366 ////连通域去噪函数实现 367 //void find_connected_components(Mat img) 368 //{ 369 // morphologyEx(gmask,gmask,MORPH_OPEN,Mat()); 370 // morphologyEx(gmask,gmask,MORPH_CLOSE,Mat()); 371 //// erode(gmask,gmask,Mat());//只腐蚀是不行的,人来了也被腐蚀掉了 372 // 373 // vector<vector<Point>> contours;//由点向量组成的向量,所以有2个层次结构 374 // vector<Vec4i> hierarchy;//typedef Vec<int,4>Vec4i;即由4个整数组成的向量 375 // 376 // //找到gmask的轮廓,存储在contours中,其拓扑结构存储在hierarchy中,且仅仅找出最外面的轮廓,用压缩算法只存储水平,垂直,斜对角线的端点 377 // //其中暗含了hierarchy[i][2]=hierarchy[3]=-1,即其父轮廓和嵌套轮廓不用考虑 378 // findContours(gmask,contours,hierarchy,CV_RETR_EXTERNAL,CV_CHAIN_APPROX_SIMPLE); 379 // if(contours.size()==0) 380 // return; 381 // 382 // int idex=0; 383 // for(idex=0;idex<contours.size();idex++) 384 // { 385 // const vector<Point>& c=contours[idex]; 386 //// const vector<Point>& cnull::zeros(); 387 // double len=arcLength(c,false);//求出轮廓的周长,并不一定要求其是封闭的 388 // double q=(img.rows+img.cols)/4; 389 // if(q>=len) 390 // { 391 // const vector<Point> &cnew=contours[idex]; 392 // // Mat mcnew=Mat(cnew); 393 // // Mat mcnew; 394 // // approxPolyDP(Mat(c),mcnew,CVCONTOUR_APPROX_LEVEL,false);//多边形曲线拟合,并不一定要求其轮廓闭合 395 // // approxPolyDP(Mat(c),Mat(cnew),CVCONTOUR_APPROX_LEVEL,false);//多边形曲线拟合,并不一定要求其轮廓闭合 396 // approxPolyDP(Mat(c),cnew,CVCONTOUR_APPROX_LEVEL,false);//多边形曲线拟合,并不一定要求其轮廓闭合 397 // // cnew=vector<Point>(mcnew); 398 // // contours[idex]=cnew; 399 // } 400 //// else contours[idex]=vector<Point(0,0,0)>; 401 // } 402 // 403 //} 404 405 /////////////////////////////////////////////////////////////////////////////////////////// 406 //void cvconnectedComponents(IplImage *mask, int poly1_hull0, float perimScale, int *num, CvRect *bbs, CvPoint *centers) 407 // This cleans up the forground segmentation mask derived from calls to cvbackgroundDiff 408 // 409 // mask Is a grayscale (8 bit depth) "raw" mask image which will be cleaned up 410 // 411 // OPTIONAL PARAMETERS: 412 // poly1_hull0 If set, approximate connected component by (DEFAULT) polygon, or else convex hull (0) 413 // perimScale Len = image (width+height)/perimScale. If contour len < this, delete that contour (DEFAULT: 4) 414 // num Maximum number of rectangles and/or centers to return, on return, will contain number filled (DEFAULT: NULL) 415 // bbs Pointer to bounding box rectangle vector of length num. (DEFAULT SETTING: NULL) 416 // centers Pointer to contour centers vectore of length num (DEFULT: NULL) 417 // 418 //void cvconnectedComponents(IplImage *mask, int poly1_hull0, float perimScale, int *num, CvRect *bbs, CvPoint *centers) 419 //{ 420 // static CvMemStorage* mem_storage = NULL; 421 // static CvSeq* contours = NULL; 422 //// static CvSeq** firstContour; 423 // 424 // //CLEAN UP RAW MASK 425 // //开运算作用:平滑轮廓,去掉细节,断开缺口 426 // cvMorphologyEx( mask, mask, NULL, NULL, CV_MOP_OPEN, CVCLOSE_ITR );//对输入mask进行开操作,CVCLOSE_ITR为开操作的次数,输出为mask图像 427 // //闭运算作用:平滑轮廓,连接缺口 428 // cvMorphologyEx( mask, mask, NULL, NULL, CV_MOP_CLOSE, CVCLOSE_ITR );//对输入mask进行闭操作,CVCLOSE_ITR为闭操作的次数,输出为mask图像 429 // 430 // //FIND CONTOURS AROUND ONLY BIGGER REGIONS 431 // if( mem_storage==NULL ) mem_storage = cvCreateMemStorage(0); 432 // else cvClearMemStorage(mem_storage); 433 // 434 // //CV_RETR_EXTERNAL=0是在types_c.h中定义的,CV_CHAIN_APPROX_SIMPLE=2也是在该文件中定义的 435 // CvContourScanner scanner = cvStartFindContours(mask,mem_storage,sizeof(CvContour),CV_RETR_EXTERNAL,CV_CHAIN_APPROX_SIMPLE); 436 //// CvContourScanner scanner = cvFindContours(mask,mem_storage,firstContour,sizeof(CvContour),CV_RETR_EXTERNAL,CV_CHAIN_APPROX_SIMPLE); 437 // CvSeq* c; 438 // int numCont = 0; 439 // while( (c = cvFindNextContour( scanner )) != NULL ) 440 // { 441 // double len = cvContourPerimeter( c ); 442 // double q = (mask->height + mask->width) /perimScale; //calculate perimeter len threshold 443 // if( len < q ) //Get rid of blob if it's perimeter is too small 444 // { 445 // cvSubstituteContour( scanner, NULL ); 446 // } 447 // else //Smooth it's edges if it's large enough 448 // { 449 // CvSeq* c_new; 450 // if(poly1_hull0) //Polygonal approximation of the segmentation 451 // c_new = cvApproxPoly(c,sizeof(CvContour),mem_storage,CV_POLY_APPROX_DP, CVCONTOUR_APPROX_LEVEL,0); 452 // else //Convex Hull of the segmentation 453 // c_new = cvConvexHull2(c,mem_storage,CV_CLOCKWISE,1); 454 // cvSubstituteContour( scanner, c_new ); 455 // numCont++; 456 // } 457 // } 458 // contours = cvEndFindContours( &scanner ); 459 // 460 // // PAINT THE FOUND REGIONS BACK INTO THE IMAGE 461 // cvZero( mask ); 462 // IplImage *maskTemp; 463 // //CALC CENTER OF MASS AND OR BOUNDING RECTANGLES 464 // if(num != NULL) 465 // { 466 // int N = *num, numFilled = 0, i=0; 467 // CvMoments moments; 468 // double M00, M01, M10; 469 // maskTemp = cvCloneImage(mask); 470 // for(i=0, c=contours; c != NULL; c = c->h_next,i++ ) 471 // { 472 // if(i < N) //Only process up to *num of them 473 // { 474 // cvDrawContours(maskTemp,c,CV_CVX_WHITE, CV_CVX_WHITE,-1,CV_FILLED,8); 475 // //Find the center of each contour 476 // if(centers != NULL) 477 // { 478 // cvMoments(maskTemp,&moments,1); 479 // M00 = cvGetSpatialMoment(&moments,0,0); 480 // M10 = cvGetSpatialMoment(&moments,1,0); 481 // M01 = cvGetSpatialMoment(&moments,0,1); 482 // centers[i].x = (int)(M10/M00); 483 // centers[i].y = (int)(M01/M00); 484 // } 485 // //Bounding rectangles around blobs 486 // if(bbs != NULL) 487 // { 488 // bbs[i] = cvBoundingRect(c); 489 // } 490 // cvZero(maskTemp); 491 // numFilled++; 492 // } 493 // //Draw filled contours into mask 494 // cvDrawContours(mask,c,CV_CVX_WHITE,CV_CVX_WHITE,-1,CV_FILLED,8); //draw to central mask 495 // } //end looping over contours 496 // *num = numFilled; 497 // cvReleaseImage( &maskTemp); 498 // } 499 // //ELSE JUST DRAW PROCESSED CONTOURS INTO THE MASK 500 // else 501 // { 502 // for( c=contours; c != NULL; c = c->h_next ) 503 // { 504 // cvDrawContours(mask,c,CV_CVX_WHITE, CV_CVX_BLACK,-1,CV_FILLED,8); 505 // } 506 // } 507 //}
计算机视觉小菜鸟的专栏
http://www.cnblogs.com/tornadomeet/archive/2012/06/02/2531565.html
运动目标检测可以分为摄像机固定和摄像机运动两类;对于摄像机运动情况下的运动目标检测,光流法是比较常用的解决方法,通过求解偏微分方程求得图像序列的光流场,从而预测摄像机的运动状态。对于摄像机固定的情形,可以采用光流法也可以采用高斯背景模型,考虑到光流法计算量巨大,故而,高斯背景模型相对更常用一些。需要提醒的是,这里所谓的“背景”是指用户不需要的目标,而“前景”自然指代用户需要的特定目标了。背景模型有很多种,其中很多方法对光照的的突变和其它因素的适应能力不够,而高斯混合模型是最为成功的一种背景建模方法。
高斯背景模型是由Stauffer等人提出的经典的自适应混合高斯背景提取方法,是一种基于背景建模的方法,它是根据视频中的每个像素在时域上的分布情况来构建各个像素的颜色分布模型,依次来达到背景建模的目的。混合高斯背景模型是有限个高斯函数的加权和,它能描述像素的多峰状态,适用于对光照渐变、树木摇摆等复杂背景进行准确建模。此后经过很多研究人员的不断改进,该方法目前已经成为比较常用的背景提取方法。