论文检索系统设计与实现文献综述

 2022-11-22 09:11

文献检索研究主要涉及到信息检索理论、检索系统的模型和算法、检索系统在相关领域的实现。本文将一有关文献为基础从这三方面进行文献综述并结合本课题提出文献系统的设计思路。

  1. 相关检索理论

文献信息检索是以文献为检索对象的信息检索。即利用相应的方式与手段,在存储文献的检索工具或文献数据库中,查询用户在特定的时间和条件下所需文献的过程。衡量文献检索的两个指标是查全率和查准率,查全率等于检出相关文献数比全相关文献数,查准率等于检出相关文献数比全检出文献数。根据英国克勒弗登的研究,查全率和查准率之间存在着相反的相关关系[16]。

在文献[7]指出了文献检索的系统理论和系统方法,它结合了一般系统论的普遍性和文献检索系统的特殊性,主要有系统观点,层次观点,功能观点,动态观点,交叉观点。系统观点是从系统论出发的,它将世界视为系统与系统的集合。即文献检索系统是由相互联系、相互制约和作用的诸要素组成的、具有文献检索这一特定功能的整体。层次观点认为系统内部各要素的组成是按照一定的联系方式和作用方式分层次组成的,系统是一个有机整体。功能观点认为系统功能是指系统在一定环境中所发挥作用的功能。系统功能与系统结构密切相关。动态观点认为任何系统都自始至终处于运动状态中,而这种运动状态是按一定规律进行的,其中的各要素又是相互作用、制约的。

在设计文献检索系统时为提高用户易用性,需要遵循一些原则,文献[12]提出了六项原则:用户界面可视化原则、检索功能与检索完备性原则、主题检索智能化原则、文献条目输入款项选择性原则、检索结果输出的灵活性原则、用户辅助性提示原则。

文献资源数据库具有分布式、异构性、访问方法和检索界面多样化等特点,文献[6]提出的统一文献检索系统能够提供统一的检索界面和统一的检索语言,实现跨库跨平台的统一检索。在此基础上,文献[6]介绍了几种较为成熟的协议如C/S体系结构的Z39.50协议、基于HTTP的OpenURL协议、基于WebService标准的协议等。

  1. 检索模型和算法

建模是对建模对象的有关知识进行发现和明确描述,通过信息抽取,从中发现该对象的隐形知识,然后将这些知识映射到计算机内部,由系统对这些知识进行维护。包括用户建模、文档建模、领域建模。检索算法主要来自于数学理论和方法,有布尔逻辑检索、截词检索、全文检索等。目前许多检索系统一般采用SQL查询原理,对固定字段如出版日期、标题、关键词、作者、出版者等进行机械式的匹配检索,但存在当一些查询对象不十分清楚或对检索语言不甚了解的用户带来不便。

在文献[15]中提出了一个五元组智能检索形式化框架和概念模型,包括用户模型、领域模型、框架、算法。它针对智能信息检索特点进行了改进,将形式化框架的核心构成定义为用户模型、文档模型和领域模型,以及带推理机制的检索算法,主动发现用户兴趣和指导用户检索行为,使用包含了相似性计算函数和推理运算的检索算法替代了单纯的相关性排序函数,强调推理机制在智能检索中的作用等。

在文献[13]中提出了智能专家模糊检索系统是将专家系统技术和模糊知识相结合的智能系统,运用人类的经验知识进行模糊逻辑推理,进而得到适当的检索策略。文献[10]研究了基于用户偏好的智能检索算法。首先根据用户特征主要是用户的岗位职能信息以及岗位文献预先定义一些用户的主题偏好。从用户操作日志中挖掘用户主题偏好。通过个性化检索排序模型对文献进行加分评价。同时用相关反馈作为检索请求的补充,可以有效提高检索的准确性。

文献[9]提出了基于领域本体的文献智能检索模型,参考领域主题词表,并在相关领域研究人员的帮助下,建立合理的领域本体。对用户输入的检索词按照概念间的相似度大小进行扩展,排除相似度较小的概念,获得检索词集合从而为用户提供较高相关性和重要性的检索结果。

文献[8]结合农作物的的学术检索研究了上位自动登录功能对文献标引的影响,通过主题词表的使用可以有效提升检索质量。文献[7]价绍了在设计微机中文文献检索系统中涉及到的集中算法包括快速分类法、无冲突散列算法等。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。