opencv中的 HOGDescriptor 类

opencv中的 HOGDescriptor 类
其定义在 object.hpp中找到的：
[cpp] view plain copy
1. struct CV_EXPORTS_W HOGDescriptor
2. {
3. public:
4. enum { L2Hys=0 };
5. enum { DEFAULT_NLEVELS=64 };
7. CV_WRAP HOGDescriptor() : winSize(64,128), blockSize(16,16), blockStride(8,8),
8. cellSize(8,8), nbins(9), derivAperture(1), winSigma(-1),
9. histogramNormType(HOGDescriptor::L2Hys), L2HysThreshold(0.2), gammaCorrection(true),
10. nlevels(HOGDescriptor::DEFAULT_NLEVELS)
11. {}
13. CV_WRAP HOGDescriptor(Size _winSize, Size _blockSize, Size _blockStride,
14. Size _cellSize, int _nbins, int _derivAperture=1, double _winSigma=-1,
15. int _histogramNormType=HOGDescriptor::L2Hys,
16. double _L2HysThreshold=0.2, bool _gammaCorrection=false,
17. int _nlevels=HOGDescriptor::DEFAULT_NLEVELS)
18. : winSize(_winSize), blockSize(_blockSize), blockStride(_blockStride), cellSize(_cellSize),
19. nbins(_nbins), derivAperture(_derivAperture), winSigma(_winSigma),
20. histogramNormType(_histogramNormType), L2HysThreshold(_L2HysThreshold),
21. gammaCorrection(_gammaCorrection), nlevels(_nlevels)
22. {}
24. CV_WRAP HOGDescriptor(const String& filename)
25. {
26. load(filename);
27. }
29. HOGDescriptor(const HOGDescriptor& d)
30. {
31. d.copyTo(*this);
32. }
34. virtual ~HOGDescriptor() {}
36. CV_WRAP size_t getDescriptorSize() const;
37. CV_WRAP bool checkDetectorSize() const;
38. CV_WRAP double getWinSigma() const;
40. CV_WRAP virtual void setSVMDetector(InputArray _svmdetector);
42. virtual bool read(FileNode& fn);
43. virtual void write(FileStorage& fs, const String& objname) const;
45. CV_WRAP virtual bool load(const String& filename, const String& objname=String());
46. CV_WRAP virtual void save(const String& filename, const String& objname=String()) const;
47. virtual void copyTo(HOGDescriptor& c) const;
49. CV_WRAP virtual void compute(const Mat& img,
50. CV_OUT vector<float>& descriptors,
51. Size winStride=Size(), Size padding=Size(),
52. const vector<Point>& locations=vector<Point>()) const;
53. //with found weights output
54. CV_WRAP virtual void detect(const Mat& img, CV_OUT vector<Point>& foundLocations,
55. CV_OUT vector<double>& weights,
56. double hitThreshold=0, Size winStride=Size(),
57. Size padding=Size(),
58. const vector<Point>& searchLocations=vector<Point>()) const;
59. //without found weights output
60. virtual void detect(const Mat& img, CV_OUT vector<Point>& foundLocations,
61. double hitThreshold=0, Size winStride=Size(),
62. Size padding=Size(),
63. const vector<Point>& searchLocations=vector<Point>()) const;
64. //with result weights output
65. CV_WRAP virtual void detectMultiScale(const Mat& img, CV_OUT vector<Rect>& foundLocations,
66. CV_OUT vector<double>& foundWeights, double hitThreshold=0,
67. Size winStride=Size(), Size padding=Size(), double scale=1.05,
68. double finalThreshold=2.0,bool useMeanshiftGrouping = false) const;
69. //without found weights output
70. virtual void detectMultiScale(const Mat& img, CV_OUT vector<Rect>& foundLocations,
71. double hitThreshold=0, Size winStride=Size(),
72. Size padding=Size(), double scale=1.05,
73. double finalThreshold=2.0, bool useMeanshiftGrouping = false) const;
75. CV_WRAP virtual void computeGradient(const Mat& img, CV_OUT Mat& grad, CV_OUT Mat& angleOfs,
76. Size paddingTL=Size(), Size paddingBR=Size()) const;
78. CV_WRAP static vector<float> getDefaultPeopleDetector();
79. CV_WRAP static vector<float> getDaimlerPeopleDetector();
81. CV_PROP Size winSize;
82. CV_PROP Size blockSize;
83. CV_PROP Size blockStride;
84. CV_PROP Size cellSize;
85. CV_PROP int nbins;
86. CV_PROP int derivAperture;
87. CV_PROP double winSigma;
88. CV_PROP int histogramNormType;
89. CV_PROP double L2HysThreshold;
90. CV_PROP bool gammaCorrection;
91. CV_PROP vector<float> svmDetector;
92. CV_PROP int nlevels;
95. // evaluate specified ROI and return confidence value for each location
96. void detectROI(const cv::Mat& img, const vector<cv::Point> &locations,
97. CV_OUT std::vector<cv::Point>& foundLocations, CV_OUT std::vector<double>& confidences,
98. double hitThreshold = 0, cv::Size winStride = Size(),
99. cv::Size padding = Size()) const;
101. // evaluate specified ROI and return confidence value for each location in multiple scales
102. void detectMultiScaleROI(const cv::Mat& img,
103. CV_OUT std::vector<cv::Rect>& foundLocations,
104. std::vector<DetectionROI>& locations,
105. double hitThreshold = 0,
106. int groupThreshold = 0) const;
108. // read/parse Dalal's alt model file
109. void readALTModel(std::string modelfile);
110. };
默认构造函数的几个参数：
[cpp] view plain copy
1. winSize(64,128), blockSize(16,16), blockStride(8,8),
2. cellSize(8,8), nbins(9), derivAperture(1), winSigma(-1),
3. histogramNormType(HOGDescriptor::L2Hys), L2HysThreshold(0.2), gammaCorrection(true),
4. nlevels(HOGDescriptor::DEFAULT_NLEVELS)
winSize ：窗口的大小

blockSize ：块的大小

cellSize：胞元的大小

nbins：方向bin的个数 nBins表示在一个胞元（cell）中统计梯度的方向数目，例如nBins=9时，在一个胞元内统计9个方向的梯度直方图，每个方向为360/9=40度。

更详细请移步： http://blog.csdn.NET/raocong2010/article/details/6239431

=++++++++++++++++++++++提取 HOG 特征+++++++++++++++++++++++++=

//样本矩阵，nImgNum：横坐标是样本数量。列数是该样本对应的特征维数。ex: 样本是学生，其样本特征可以由身高，体重，年龄组成，那么第二个参数就是 3 啦。

CvMat *data_mat = cvCreateMat( nImgNum, 1764, CV_32FC1 );

//类型矩阵,存储每个样本的类型标志 , 一维，只需要存储该样本属于哪一类即可(只有两类)
CvMat * res_mat = cvCreateMat( nImgNum, 1, CV_32FC1 );

HOGDescriptor *hog=new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9);

// 计算hog特征

// trainImg是读入的需要计算特征的图像，IplImage* trainImg=cvCreateImage(cvSize(64,64),8,3);

//descriptors 是结果数组   vector<float> descriptors; HOG特征的维数就是 = descriptors.size 啦，上例中，就是那个3 啦。

hog->compute(trainImg, descriptors,Size(1,1), Size(0,0));

//计算完成后，把hog特征存储到上面声明的那个样本矩阵中

// i 是当前处理的第 i 张图片， n 从 0 开始 ++ ，从第 0 列开始存储。 *iter 是 (vector<float>::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)

cvmSet(data_mat, i, n,*iter);

// 训练读入的图片是有标签的( 知道已知属于哪一类), 将标签存入标签矩阵。i 是当前处理的图片的编号。 img_catg[i] 是读入的已知的数据。

cvmSet( res_mat, i, 0, img_catg[i] );

++++++++++++++++++++++++++++++++++开始训练+++++++++++++++++++++++++++

首先要/新建一个SVM

CvSVM svm = CvSVM();

// 开始训练~

svm.train( data_mat, res_mat, NULL, NULL, param ); //data_mat 是上面提取到的 HOG特征，存储 m 个样本的 n 个特征， res_mat 是标签矩阵，m个样本属于哪一类，已 // 知的。   param 的定义如下：

CvSVMParams param = CvSVMParams( CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );

CvTermCriteria   criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );

// 将训练结果保存在 xml文件中

svm.save( "SVM_DATA.xml" );

此阶段生成文件：

SVM_DATA.xml

训练完成之后，就开始对你所需要的数据进行预测。这里预测当前图片属于那一类别。

++++++++++++++++++++++++++++++++++检测样本+++++++++++++++++++++++++++

读入当前要预测的图片 testImg

将testImg 缩放至与训练图片一样大小，直接存放到 trainImg中

计算读入的图片的Hog特征，

hog->compute(trainImg, descriptors,Size(1,1), Size(0,0)); //调用计算函数开始计算

仍用 vector<float> descriptors; 存放结果

创建一个一行 n 列的向量。 n 是特征的个数。就是上面的 3 啊， descriptors.size() 啊。用来存放当前要预测的图片的特征

CvMat* SVMtrainMat=cvCreateMat(1,descriptors.size(),CV_32FC1);

// 开始预测

int ret = svm.predict(SVMtrainMat);

ret 返回的是当前预测的图片的类别。就是一开始读到标签矩阵中的数据。一般用 0 or 1 来标示两大类别。

可将结果文件保存在：

SVM_PREDICT.txt

+++++++++++++++++=OpenCV HOG特征向量个数计算方法+++++++++++++++++++++++

下面参照网上方法说下怎么计算的每个向量的特征维数，就是一开始就声明的

样本矩阵 CvMat *data_mat = cvCreateMat( nImgNum, 1764, CV_32FC1 );

中这个 1764 是如何计算出来的。

1. 先确定你要训练以及检测的图片的大小 IplImage* trainImg=cvCreateImage(cvSize(64,64),8,3);

ok 这里是 64 x 64

2. 确定 HOGDescriptor *hog=new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(8,8),cvSize(8,8),9);

第一个窗口大小设置为上面的图片大小 64 x 64 。

第二个块大小是 16 x 16 的话 [ 额这个肿么确定？与前面的窗口大小有关系么？这是opencv中默认的大小]

第三个块block的步进 stride 8 x 8

第四个是胞元cell大小 8 x 8

第五个是 cell的直方图的 bin = 9 [ 不懂 +_+]

每个 cell 有 9 个向量

每个block 有 (16 / 8 ) * (16 / 8) = 2 * 2 = 4 个 cell，那么现在就有 4 * 9 = 36 个向量啦

每个窗口有多少个 block 呢？

利用公式   (window_size - block_size)/block_stride + 1 对两个方向进行计算：

( 64 - 16) / 8 + 1 = 7

两个方向 7 * 7 = 49

so 共有 49* 36 = 1764
相关阅读:
快速傅里叶变换（FFT）
【BZOJ】1005: [HNOI2008]明明的烦恼（prufer编码+特殊的技巧）
【BZOJ】1030: [JSOI2007]文本生成器（递推+ac自动机）
cf490 C. Hacking Cypher（无语）
高精度模板2（带符号压位加减乘除开方封包）
【BZOJ】1004: [HNOI2008]Cards（置换群+polya+burnside）
【BZOJ】1500: [NOI2005]维修数列（splay+变态题）
【BZOJ】1064: [Noi2008]假面舞会（判环+gcd+特殊的技巧）
【BZOJ】1052: [HAOI2007]覆盖问题（贪心）
【BZOJ】1028: [JSOI2007]麻将（贪心+暴力）
原文地址：https://www.cnblogs.com/lyx2018/p/7123794.html