消失点(Vanishing Point)是通过图形的透视图将三维空间中的平行线收敛到二维平面的点。在物理空间中,平行的直线只能在无穷远处相交,因此消失点是无穷远处。但在透视图,两条平行线会很容易相交于一点,这一点即是消失点。在大多数驾驶情况下,车道和道路标记会收敛到一个点,而不管道路是弯还是直。通常消失点被定义为地平线上最接近的点,在该点上,车道收敛并在可见车道的最远点附近消失。消失点可用于提供场景的全局几何背景,因此对于推断车道和道路标记的位置有重要作用。[1]中指出,消失点预测任务可指导类似于人类视觉的稳健车道和道路标记检测,采用消失点预测后结果得到了极大的提高,
消失点预测问题自提出以来一直没有很好的解决方法,传统方法认为,要检测消失点,必须找到图像中所有线的交点,然后将其合并为簇,从某个角度看,属于同一簇的所有线代表一堆平行线。因此传统算法中最主要的方法就是基于线的消失点检测算法,该算法通常分为几个阶段。首先,使用边缘/线检测器提取到一组线[2],然后使用线聚类算法[3]基于几何线索提出目标消失点位置的若干猜测。这类方法不依赖于直线定位精度和摄像机参数, 但无穷远消失点较难估计。另一种方法运用空间变换的技术进行消失点检测,[4]中展示了一种用于消失点检测的经典方法。他使用以坐标原点为中心的高斯球面,将图像平面放置在距图像平面一定距离处–焦距(图像平面的z坐标)。可以将图像上的每个点映射到球体上的一个点,然后将其视为半径矢量。利用这一技巧,可以将无穷远的点映射到有限空间并使用常规方法进行处理,但要求摄像机内参已知,算法复杂度高,效率较低,不利于实时处理的需求。还有一种方法是应用几个连续的Hough变换[5],一个Hough变换的输出作为下一个Hough变换的输入,并来回切换,在每个单一Hough变换后的空间中,通过某种滤波器检测落在同一条正弦曲线上的局部峰来检测消失点[6],并在不同层级进行遍历。这种方法无需已知摄像机参数,但目前尚未设计出有效的滤波器,效率较低。这些算法具有特定于任务的参数,大部分仅适用于简单道路状况图像的消失点检测,对于复杂道路状况图像效果较差,因此缺乏通用性鲁棒性[7]。近年来在卷积神经网络的帮助下,很多人正尝试用数据驱动和监督学习方法来解决这个问题。[8]将消失点检测公式化为块分类问题,但是他们只能检测图像内部的消失点。[9]通过首先估计水平消失线候选者来检测消失点,并根据他们经历的消失点对其进行评分。他们使用ImageNet预先训练的神经网络,该网络在Google街道图像上进行了微调。[10]使用逆投影图像,使消失点的球面图像表示回归。但是,这样的神经网络通常只提供消失点或水平线的粗略估计,输出通常是多级系统的组成部分,并用作初始化以消除线聚类的异常值。可以说,神经网络在消失点检测中精度较差的主要原因(与基于线聚类的方法相比)可能是因为现有的神经网络体系结构并未设计成表示或学习消失点的特殊几何特性及其与结构线的关系。
NeurVPS[11]提出了一种结构化卷积算子——圆锥卷积算子,对该圆锥空间中的每个像素应用规则卷积。圆锥算子是对图像中的空间和几何特性进行建模,近来这种非常规卷积核形状的算子有较多的应用。[12]中提出,由于构造卷积神经网络 (CNN) 所用的模块中几何结构是固定的,其几何变换建模的能力本质上是有限的,因此引入两种新的模块来提高卷积神经网络(CNN)对变换的建模能力,即可变形卷积 (deformable convolution)和可变形兴趣区域池化 (deformable ROI pooling),它们都是基于在模块中对空间采样的位置信息作进一步位移调整的想法,该位移可在目标任务中学习得到,并不需要额外的监督信号。这是一种对传统方块卷积的改进核,本质是一种抽样改进。标准卷积中的规则格点采样是导致网络难以适应几何形变的“罪魁祸首”。为了削弱这个限制,对卷积核中每个采样点的位置都增加了一个偏移的变量,通过这些变量,卷积核就可以在当前位置附近随意的采样,而不再局限于之前的规则格点。测地线CNN[13]采用具有球坐标的网格卷积,而TextureNet[14]在由全局平滑主方向定义的规范空间中进行操作,[15]将全局可变形变换的参数化修改为局部卷积算子,以提高图像分类、对象检测和语义分割的性能。与[15]不同,圆锥卷积的卷积核形状不是学习的,而是根据所需的几何特性进行设计的。圆锥卷积从第一原理中明确定义了空间并利用了其几何信息,使得卷积核的转型适应了本地化。用圆锥卷积算子对该圆锥空间中的每个像素应用规则卷积类似于在校正的图像上应用规则卷积,其中相关的结构线被转换为水平线,因此,网络可以基于本地定向来确定如何使用信号。从直观上来看,圆锥卷积使边缘检测更容易,更准确。普通的卷积可能需要数百个滤波器来识别具有不同方向的边缘,而圆锥卷积则需要更少的滤波器来识别与候选消失点对齐的边缘,因为滤波器首先会朝着消失点旋转。然后,强/弱响应(取决于候选对象是正/负)将由后续的全连接层聚合。另外,由于该校正图像中的水平聚集与沿结构线的特征聚集相同,因此该校正图像中的特征聚集也具有几何意义。
参考文献
[1] Seokju Lee, Junsik Kim, Jae Shin Yoon, Seunghak Shin, Oleksandr Bailo, Namil Kim, Tae-Hee Lee, Hyun Seok Hong, Seung-Hoon Han, In So Kweon, VPGNet: Vanishing Point Guided Network for Lane and Road Marking Detection and Recognition.In ICCV, 2017.
[2] Rafael Grompone Von Gioi, Jeremie Jakubowicz, Jean-Michel Morel, and Gregory Randall.LSD: A fast line segment detector with a false detection control.In PAMI, 2008.
[3] GF McLean, D Kotturi: Vanishing point detection by line clustering.In PAMI, 1995.
[4] S. T. Barnard: Interpreting perspective images. Artificialintelligence, vol. 21, no. 4, pp. 435–462, 1983.
[5] Alexander Sheshkus, Anastasia Ingacheva, Vladimir Arlazarov, Dmitry Nikolaev, HoughNet: neural network architecture for vanishing points detection, 15th International Conference on Document Analysis and Recognition.In ICDAR, 2019.
[6] J Tuytelaars, L Dangool, M Proesmans, et al: The cascaded Hough transform as aid in aerial image interpretation,[C]6th International Conference On Computer Vision, 1998.67-72
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。