转载请注明出处:danscarlett的博客园
OpenCV是计算机视觉领域应用最广泛的开源工具包,基于C/C++,支持Linux/Windows/MacOS/Android/iOS,并提供了Python,Matlab和Java等语言的接口。2010年OpenCV发布了2.0版本,添加了非常完备的C++接口,从2.0开始的版本非常用户非常庞大,至今仍在维护和更新。2015年OpenCV 3正式发布,除了架构的调整,还加入了更多算法,更多性能的优化和更加简洁的API,另外也加强了对GPU的支持,现在已经在许多研究机构和商业公司中应用开来。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性,以及上手安装的难度,这部分先以2为主进行介绍。
根据功能和需求的不同,OpenCV中的函数接口大体可以分为如下部分:
- core:核心模块,主要包含了OpenCV中最基本的结构(矩阵,点线和形状等),以及相关的基础运算/操作。
- imgproc:图像处理模块,包含和图像相关的基础功能(滤波,梯度,改变大小等),以及一些衍生的高级功能(图像分割,直方图,形态分析和边缘/直线提取等)。
- highgui:提供了用户界面和文件读取的基本函数,比如图像显示窗口的生成和控制,图像/视频文件的IO等。
针对视频和一些特别的视觉应用,OpenCV也提供了强劲的支持:
- - video:用于视频分析的常用功能,比如光流法(Optical Flow)和目标跟踪等。
- - calib3d:三维重建,立体视觉和相机标定等的相关功能。
- - features2d:二维特征相关的功能,主要是一些不受专利保护的,商业友好的特征点检测和匹配等功能,比如ORB特征。
- - object:目标检测模块,包含级联分类和Latent SVM
- - ml:机器学习算法模块,包含一些视觉中最常用的传统机器学习算法。
- - flann:最近邻算法库,Fast Library for Approximate Nearest Neighbors,用于在多维空间进行聚类和检索,经常和关键点匹配搭配使用。
- - gpu:包含了一些gpu加速的接口,底层的加速是CUDA实现。
- - photo:计算摄像学(Computational Photography)相关的接口,当然这只是个名字,其实只有图像修复和降噪而已。
- - stitching:图像拼接模块,有了它可以自己生成全景照片。
- - nonfree:受到专利保护的一些算法,其实就是SIFT和SURF。
- - contrib:一些实验性质的算法,考虑在未来版本中加入的。
- - legacy:字面是遗产,意思就是废弃的一些接口,保留是考虑到向下兼容。
- - ocl:利用OpenCL并行加速的一些接口。
- - superres:超分辨率模块,其实就是BTV-L1(Biliteral Total Variation – L1 regularization)算法
- - viz:基础的3D渲染模块,其实底层就是著名的3D工具包VTK(Visualization Toolkit)。