双目立体视觉是计算机视觉的一个重要分支。它以模拟人类视觉处理景物的方式,利用两台位置相对固定的摄像机同时对同一景物从不同角度成像,通过计算其中对应点的视差来获取空间场景的三维信息。从双目视觉的应用来说,主要分为四大部分:
一 双目视觉导航、定位;
二 三维重构;
三 双目立体测量;
四 空间三维立体跟踪。
基于双目立体视觉的三维测量是一种被动式非接触测量方法,它除了可以获得目标的宽、高信息外,还可以获得目标的距离信息,已被广泛应用于三维重建、自主车(移动机器人)导航、工业检测、基于图像的建模和绘制等领域。基于双目立体视觉的三维测量技术在国外已经得到了比较深入的研究和广泛的应用,在国内也受到了越来越多的重视。
本文以双目立体视觉理论为基础,简单讲述下基于双目立体视觉的三维测量技术,重点在于双目立体视觉的几个关键技术,包括:相机标定、双目标定、图像处理、特征检测、立体匹配、双目三维测量以及姿态测量等。
双目立体视觉(Binocular Stereo Vision)是计算机视觉的一个重要分支,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。
双目立体视觉融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差(Disparity)图像。
双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。
双目立体视觉的开创性工作始于上世纪的60年代中期。美国MIT的Roberts通过从数字图像中提取立方体、楔形体和棱柱体等简单规则多面体的三维结构,并对物体的形状和空间关系进行描述,把过去的简单二维图像分析推广到了复杂的三维场景,标志着立体视觉技术的诞生。随着研究的深入,研究的范围从边缘、角点等特征的提取,线条、平面、曲面等几何要素的分析,直到对图像明暗、纹理、运动和成像几何等进行分析,并建立起各种数据结构和推理规则。特别是上世纪80年代初,Marr首次将图像处理、心理物理学、神经生理学和临床精神病学的研究成果从信息处理的角度进行概括,创立了视觉计算理论框架。这一基本理论对立体视觉技术的发展产生了极大的推动作用,在这一领域已形成了从图像的获取到最终的三维场景可视表面重构的完整体系,使得立体视觉已成为计算机视觉中一个非常重要的分支。
经过几十年来的发展,立体视觉在机器人视觉、航空测绘、反求工程、军事运用、医学成像和工业检测等领域中的运用越来越广。