充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

基于元数据的企业搜索引擎研究



0 引 言

    随着企业信息化建设的推进,信息量正以几何量级的速度在增长。要在浩瀚的信息海洋里准确高效地寻找信息,搜索引擎是必不可少的。企业内部数据的快速增长促进了企业搜索引擎的发展。企业搜索引擎不同于Web搜索引擎,企业数据专业性更强,企业搜索引擎对数据须有更强的针对性。

    企业搜索引擎的核心价值体现在对企业数据库进行搜索,但是不同企业的数据库模型差距非常大,而且技术信息的专业性也很强,这就给企业数据搜索带来了很大的难度。而元数据的引入,可以定义和描述异构数据源中的有关信息,更有效地将异构数据源集成,从而使通过企业搜索引擎对企业信息的检索“平民化”成为可能。本文根据企业数据的特点,将企业搜索引擎与元数据结合起来,以期解决搜索引擎不能对异构数据进行检索的问题,使搜索引擎能更有针对性地对企业信息进行检索。

1 元数据与搜索引擎结合的意义

    随着计算机技术的发展及其在企业信息管理方面的应用,各个行业、单位和部门会根据自己的业务流程引入不同的企业信息系统。这些企业信息系统都是自包含的独立系统,有各自独立的应用、流程以及数据,扩展性和交互性较差,形成了一个个信息孤岛,从而在某种程度上造成企业信息资源分散、共享困难、应用水平低下。另一方面,新技术不断出现,除了传统的数据库数据以外,又出现了word文档、XML文档、HTML文档等数据。如何合理地处理这些数据,实现异构数据源信息的有效共享,成为亟待解决的问题。

   元数据可以描述信息资源或数据对象,其目的在于使用户能够发现资源、识别资源、评价资源,对相关的信息资源进行选择、定 wei位和调用,追zhui 踪资源在使用过程中的变化,实现信息资源的整合、管理和保存。描述数据源的元数据分为3类,即模式信息、定 wei信息和其他相关信息。将元数据与搜索引擎结合起来,通过元数据对异构数据源进行描述,可以将数据源有效地管理起来,从而有效地解决搜索引擎不能够对异构数据进行检索的问题。

2 元数据搜索引擎的总体构架

    元数据搜索引擎结构如图1所示。

图1 元数据搜索引擎结构图
图1 元数据搜索引擎结构图


    目前已开发的企业搜索引擎在发现资源、集成资源,以及对信息资源的选择、定 wei位等方面没有进行更深入的开发。本文的主要功能是企业数据搜索,因为企业对信息资源的发现及集成是企业数据使用的基础

    本文的主要工作不集中在搜索引擎的核心部分,而是搜索结果的后期处理。系统分为搜索模块、数据映射模块、关系演算模块、安全控制模块。搜索模块完成对信息的搜索,并返回搜索结果,这可以直接利用现有的企业搜索引擎实现。数据映射模块完成企业数据库元数据到系统知识库的映射。关系演算模块对搜索结果进行处理,形成最终的显示结果。安全控制模块对企业数据进行安全保护,控制使用的数据。


21/212>


 

评分:0

我来说两句