自然场景下的文本检测和识别文献综述

 2023-05-23 03:05

文献综述

一、选题背景文字是用来记录、交流或传承文化的符号系统。

作为人类最有影响力的发明之一,文字在人类生活中发挥了重要作用。

具体来说,文本携带的丰富而精确的语义信息在广泛的基于视觉的应用场景中非常重要。

现在,传统光学字符识别主要面向高质量的文档图像,此类技术假设输入图像背景干净、字体简单且文字排布整齐,在符合要求的情况下能够达到很高的识别水平。

与文档文字识别不同,对于自然场景中的文字识别,由于图像背景复杂、分辨率低、字体多样、分布随意、文本存在多个方向、多种语言混合等,传统光学字符识别在此类情况下无法应用。

因此自然场景下的文本检测和识别是当今研究的重点和难点。

二、研究现状对于自然场景下的文本检测和识别目前存在两种方案,一种将场景文本阅读分为文本检测和文本识别两个独立任务的两步法。

基于深度学习的方法在这两个领域都取得了不错的效果,但是两步法在操作上很不方便且速度较慢,另一方面,文本识别的结果可以为文本检测模型提供额外信息,纠正检测的错误。

第二种方案就是端到端的模型,能够降低场景文字识别流程的复杂度,提高运行的效率和性能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。