文献综述(或调研报告):
计算机视觉技术起源于20世纪50年代,经过半个世纪的发展,目前已经广泛地应用于工业、医疗保险、航空航天、军事等各个领域,也划分出不同的方向,如图像分割、图像识别与目标跟踪等。随着人们对各个领域更加深入的研究,处理计算机视觉问题的技术也在不断更新。
1.发展
图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。传统的图像基于图像像素值间的不连续性以及相似性,基于图像的不连续性的常见方法是边缘检测,通过计算图像像素点间的梯度值来检测像素的边缘突变,从而将目标从背景中分割出来,人们提出了边缘检测算子如Roberts算子、Prewitt算子[1]。而基于像素的相似性的算法的发展较为广泛,出现了许多分支如基于阈值的图像分割技术、基于区域生长的图像分割技术等。但是此类非监督的分割算法只能进行特征的提取,无法进行语义标注,而且只能基于图像特征的数据驱动,难以同时具备准确性和通用性。
为了解决这些问题,研究者们不断对算法进行改进,Lei Yang等提出改进的基于噪声图像的Prewitt边缘检测算法[2],但难以从根本上解决通用性的问题。Carsten Rother等将图论引入了图像分割领域,提出了grab cut技术[3], 这种技术通过人工的干预,可以大大提高图像分割的结果。通过人工对想要分割的区域画一个红框,通过对略小于框的内容进行处理,算法会默认红框中部是用户期望得到的结果,所以将中部作为主体参考,然后剔除和主体差异较大的部分,留下结果。此方法大大提高了图像分割的准确性和速度,但是此方法需要人工的干预,无法满足大量的图片处理。
人们也在尝试将其他工具应用到图像分割上来。深度学习是机器学习的一个分支,是近些年来机器学习领域取得的重大突破和研究热点之一。2006 Geoffery Hinton 首次提出了深度学习的思想,提出神经网络对处理图像分割与分类问题会有良好的效果,2012年,在 ImageNet大赛中取得优异成绩的AlexNet使卷积神经网络(Conventional Neural Networks, CNNs)进入了人们的视线。含多个隐层的神经网络具有十分强大的特征学习能力,通过训练模型所提取的特征对原始输入数据具有更抽象和更本质的表述,从而有利于解决特征可视化或分类问题,通过使用无监督学习算法实现一种称作“逐层初始化”的方法,实现对输入数据信息进行分级表达,从而可以有效地降低深度神经网络的训练难度[4]。
卷积神经网络促进了图像分割领域的发展,使图像分割正式进入图像语义分割阶段。传统的图像分割的目的是将前景与背景的像素分隔开,而无法对像素所代表的目标进行分析,无法区分不同的目标,而通过卷积神经网络,不仅可以将图像前景与背景分开,还可识别出图像中的物体[5],2017年,Evan Shelhamer等人对传统的卷积神经网络模型进行了修改提出了全卷积网络(Fully Convolutional Networks, FCNs)[6],传统的CNN 网络中的后三层,是由一维的向量组成的全连接层,计算方式不再采用卷积,丢失了二维信息,而在FCN网络中,将这三层全部转化为1x1的卷积核所对应等同向量长度的多通道卷积层。CNN的识别是图像级的识别,即从图像到结果,而FCN的识别是像素级的识别,即对输入图像的每一个像素在输出上都有对应的判断标注。2018年Liang-Chieh Chen等人将FCNs与全连接CRF和atrous卷积相结合,设计了DeepLab语义分割系统,极大的提高了语义分割的效果[7]。
2.应用
图像分割技术取得了极大的发展,也应用于各个行业中,其中,将计算机视觉技术应用于畜牧业,实现养殖信息化是一个研究的重要方向。目前牧场的管理模式常见的是人工监控方式,但由于人工监控存在不稳定主观因素,人力耗费较大且行为中的细微变化需要人工长时间观察,这在大型商业养殖模式中是不切实际的。计算机视觉技术作为信息处理的有效辅助技术,提供了一种自动化、非接触式、低成本、高收益且对动物无伤无压力的行为识别方式,可用于考量家畜健康状况并及时预防和发现疾病[8]。2005年,河北农业大学的钱东平[9]教授采用虚拟仪器技术和图像处理相结合的方法进行奶牛体型线性评定。该研究通过图像处理,利用模板匹配方法定位特征点,使奶牛体型线性的测量转化为对两点之间的距离或三点之间夹角的测量,从而简化了奶牛体型线性评定过程。2006年,付为森 [10] 等人将猪体的头部和躯干分别近似为圆锥体和圆柱体,建立种猪体重的三维预估模型,结果表明,体重与体积的回归关系较为显著,预估准确性较好。2015年,李卓 [11] 利用机器视觉技术测得猪的背部面积,建立猪体质量估测模型。结果表明,建立的体长、体宽、体高、臀宽和臀高的拟合模型估测精度较好,其相关系数达到了0.996。而主成分的幂回归模型具有更高的相关系数,相关系数达到了0.997,估测平均相对误差为2.02%。
国内的研究为通过图像信息确定家畜的体重提供了可行性。但是,研究者们普遍使用的是经典图像分割算法,应用现代基于深度学习的算法较少。2018年,zheng等人[12]首次提出利用深度学习模型提取猪只目标,对2D深度图预处理后手动标记得到12000张有效标记图,标记姿态的同时手动划定有效区域。应用Faster R-CNN网络反复训练,最终测试显示该网络能输出母猪边框有效坐标,完成生猪提取。这为家畜识别的研究提供了另一个思路,将现代图像识别技术应用于家畜养殖将会是一个重要的发展方向。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。