文献综述
人机交互技术是指由计算机的输入,输出给用户提供信息,而人通过某种输入同样给计算机提供信息,最终达到人与计算机的交互过程。而随着时代发展,现今的人们对人机交互技术更高的要求是利用更简洁而形象的方式实现人与机器的信息传递。体感识别就是其中很典型的一种方法。本次课题就是基于体感识别技术,利用肢体的关键节点信息完成肢体控制动作的识别,将其运用到实际应用当中。并在此过程中优化识别算法,尽力改善体感识别其识别精度低、延迟长等缺点。
3.1基于Kinect的人体动作识别算法
3.1.1动作识别算法简介
体感识别技术就是使用体感控制器,对人所作出的的手势或动作指令进行接受,处理,识别,之后经过程序实现对人体的指令。相对于其他识别技术而言,体感识别更易于被大众所接受,其反应迅速,对简单指令的准确性很高。在未来的应用范围十分广泛。
而基于输入的数据类型动作识别方法可分为三类:基于颜色、基于深度、基于骨架。在多样的识别算法中选取了十种动作识别算法进行比较,分别为:HON4D,HDG,HOPC,LARP-SO,SCK DCK,HPM TM,P-LSTM,Clips CNN MTLN,IndRNN和ST-GCN。十种算法包含了不同的输入数据类型,且是自2013年之后发表的较新的识别算法,因此也比较的结果也很有说服力。
Kinect 识别算法考虑的因素很多,诸多因素均能对不同算法的识别精度产生影响,例如基础数据集的类型、单一视角还是交叉视角、基于深度特征还是基于骨骼特征、相机的视角。在Wang的论述中对上述的因素进行了分类,并逐一进行比较,对于单视图动作识别和交叉视图动作识别的每种算法的性能,一些算法如HON4D、LARP-SO-FTP、Clips CNN MTLN、P-LSTM和SCK DCK在单视角动作识别中表现较好,而在交叉视图动作识别中表现稍差。在跨主体动作识别中,基于骨架的特征在手工特征和深度学习的特征类别上都优于基于深度特征。而将基于深度的特征加入到基于骨架的特征中实际上会导致动作识别精度的轻微下降。而对于跨视角动作识别上,使用手工特征的方法比使用深度学习特征的方法对基于骨架的特征执行得更好。对于基于深度的特征,手工特征和深度学习的特征没有可明确得出的结论。对于较小的数据集,手工特征比深度学习特征表现得更好。然而,如果在大数据集上进行训练,深度学习方法会取得很好的效果。从不同的横向对比中可以看出,不同算法各自具有各自独特的特点,对基于Kinect的动作识别算法而言,其关键是要使用适合项目本身的算法,利用其长处达到项目目标。但对动作识别而言,仍需要新的、更具鲁棒性的动作识别算法以实现对各种情况的识别准确度均能达到很高的水平。
如上述文中别算法进行了比较,由于本次课题使用的Kinect相机为一台,因此参考文献中对于单视角的识别,在不同的识别数据集中的识别准确度也做出了详细的评测,其中识别准确度较高的几种算法如下表:
表1 不同算法在不同数据集中的识别准确度
数据集 剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。 |