最近看了些立体视觉方面的资料,感觉立体视觉涉及到的东西太多,且数学理论比较强,特别是几何方面的东西,下面是对这一周看关于立体视觉方面的资料的初步总结,很多知识也是懂了个概念而已,深入的话要在以后的实践过程中不断体会,其中主要是一些名词,写下来算是对自己有个小的总结:
一. 射影几何知识。
包括平面射影几何和空间射影几何。射影几何只是在欧式几何中引入了无穷远元素而已,比如说无穷远点,无穷远直线,无穷远曲线和曲面。因此在射影几何中2条平行线是可以相交的,交点在无穷远处,2个平行平面也交于无穷远处的一条直线。
所以在二维射影几何中,引入了二维射影平面,即由欧式平面和无穷远直线构成。其中涉及到的相关知识点有其次坐标和非其次坐标,叉积,交比,射影参数,对偶,无穷远直线的表达,二次曲线,对偶二次曲线,退化二次曲线,圆环点,单应,自由度,等距变换,相似变换,仿射变换,射影变换之间的区别,几何失真,变换群与不变量等。
三维射影几何中和二维的很类似,但是在三维射影空间中直线是最难表达的,且直线有4个自由度,而点和面只有3个自由度,点和面对偶,直线自对偶。涉及到的相关知识点有二次曲面,对偶二次曲面,扭三次曲线,绝对二次曲线。所有的球面交无穷远平面于绝对二次曲线,所有的圆交绝对二次曲线于2点,即圆环点。绝对对偶二次曲面,不变量,消隐点和消隐线的计算等。
为什么在立体视觉中要引入射影几何呢?因为图片的成像并不保持欧式不变性,摄像机的成像过程是一个射影变换过程。
二. 摄像机模型。
主要是小孔成像模型,中心透视投影模型。引入的概念有景深,视角,透视失真,物理坐标系,相机坐标系,物体图片坐标系,像素坐标系,主点偏移,相机内参数(5个,主点坐标2个,2个方向上的焦距,1个尺度因子),相机外参数(2个,旋转和平移),径向畸变,离心畸变,薄透镜畸变,仿射相机,摄像机矩阵等。
其中一般的立体视觉中分析的原理都是小孔成像模型,但是用的却是中心透视投影模型。
三. 多视几何。
因为从单幅图像中恢复场景中的结构和深度会引起歧义,所以引入了多视几何,主要包括二视几何和三视几何。
二视几何是指同时获得2幅照片,比如说有2个摄像机或者一个摄像机移动拍摄2次。其概念有外极几何,外极点,基线,外极平面,外极线,外极线约束,本质矩阵,基本矩阵,8点算法估计基本矩阵,单应矩阵,不动点和不动线等。
三视几何的产生是由于二视几何不能产生对直线的约束,2幅图像之间的约束由基本矩阵决定,3幅图像之间的约束由3焦张量决定,3幅及3幅以上的图像之间不存在独立的约束。
多视几何的知识对后面的摄像机标定和三维重建有很大的帮助。
四. 摄像机标定理论。
摄像机标定是指求出摄像机的内参数和外参数。涉及到的知识点有直接线性变换,退化配置,几何误差,黄金标准算法,矩阵分解,圆环点和摄像机内参数的约束,平行线与摄像机内参数的约束,Kruppa方程与摄像机内参数的约束,绝对二次曲线于摄像机内参数的约束,绝对二次曲面与摄像机内参数的约束,主动视觉系统,主动视觉标定等。
五. 三维重建理论。
目前的计算机理论框架是基于marr理论的,marr理论认为三维重建是人类视觉的主要问题,也是计算机视觉最主要的研究方向。因此三维重建理论在计算机视觉中占有很重要的地位。三维重建的一般步骤时在多幅图中分别找出相应的对应特征点,然后匹配对应的特征点,然后根据对应的特征点的几何约束,颜色值约束,运动模型约束等其他约束来估算出空间中对应点的深度。其中最难的部分在与怎样将每幅图像中的点对应起来,即多目融合问题。
目前三维重建理论涉及到的概念有重建过程,人体视觉理论,双目融合,灰度相关,交叉相关,相似性约束,窗口搜索,多尺度边缘匹配,动态规划,多视立体重建,多基线立体重建,视差,深度,立体元素,空间切割,剪影重构,相交体,基于切割的视觉壳,分层重建理论,射影重建,仿射重建,无穷远单应,相似重建,基于结构光的重建,基于纹理的重建,基于颜色值的重建,基于运动模型的重建,大规模场景重建等。
六. 参考文献:
- 吴福朝 (2008). 计算机视觉中的数学方法, 科学出版社.
- 中科院自动化所计算机视觉ppt,《立体视觉》.
- Szeliski, R. (2010). Computer vision: algorithms and applications, Springer-Verlag New York Inc.
- Shapiro, L. G. and G. C. Stockman ( 2001). Computer Vision, Prentice Hall.
- Hartley, R., A. Zisserman, et al. (2003). Multiple view geometry in computer vision, Cambridge Univ Press.
- Forsyth, D. A. and J. Ponce (2002). Computer vision: a modern approach, Prentice Hall Professional Technical Reference.
- Bradski, G. and A. Kaehler (2008). Learning OpenCV: Computer vision with the OpenCV library, O'Reilly Media.
立体视觉中的水很深,路漫漫其修远兮,吾将上下而求索!