充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

数据整合的利器——数据仓库



1 背 景

    随着以计算机技术为代表的信息技术的迅速发展,图书馆数字信息资源的建设成绩斐然,作为一个专门搜集整理保存并传播信息的机构,图书馆拥有非常丰富的数字化信息资源,这些数字资源既包括图书、期刊、报纸、标准、专利产品等全文数据库;又包括如文摘、题录和书目数据的数据库和相关系统。

    从计算机应用系统的角度来看,这些数字资源系统的硬件平台、数据库管理软件、数据库元数据、用户端应用程序都不尽相同,因而具有分布异构性。从用户的角度来看,各个数字资源系统中数字资源内容交叉重复,影响用户对信息的选择与获取;数字资源间的知识关联程度低,知识结构体系遭破坏等。

    然而用户希望在统一的检索环境和检索界面下,以最小的时间和精力实现“一站式”的文献检索、浏览和使用。图书馆也希望其用户的信息需求得到充分满足,并更好地体现其“以人为本”的服务理念,提高数字资源的利用率。因此,元论是用户方面还是图书馆方面都迫切地需要解决由于。信息爆炸”和“信息污染”给信息利用带来的不便。数字资源整合在这种情况下应运而生。

2 数字资源整合的层次模型

    从计算机信息系统集成的角度来看,根据数字资源的分布异构性,数字资源整合从低级到高级可以分为四个层次:网络整合、系统软件整合、数据整合和应用整合,如图1所示。

图1 数字资源整合层次图
图1 数字资源整合层次图


    网络和系统软件的整合是基础,目前各数字资源系统基本上都运行在集成的网络和系统软件基础上,而数据整合和应用整合是数字资源系统能否有效整合的关键。数据整合就是采用合适的技术手段将数字资源系统中的异构数据按一定的规则组织在一起,方便用户的有效访问。除数据库技术和较常见的中间件技术外,数据仓库技术是解决数据整合问题的重要技术。利用中间件整合异构数据库并不需要改变原始数据的存储和管理方式,中间件位于异构数据库系统(数据层)和应用程序(应用层)之间,向下协调各数据库系统,向上位访问整合数据的应用提供统一的数据模式和数据访问的通用接口。各数据库仍完成各自的任务,中间件主要为异构数据源的高层次的检索来服务。这种数据整合的思路是,通过模式翻译器将局部数据库模式以某种公共数据模型为基础映射成局部集成模式,然后通过模式集成器将各个局部集成模式按需要采用全局数据模型来定义,最终成为全局概念模式。

3 利用数据仓库进行数字资源整合的可行性

    数据仓库创始人W.H.Inmon于1991年在《Building the Data Warehouse》将“数据仓库”(Data Warehouse,DW)定义为一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、非易失的且随时间变化的数据集合”。元数据是数据仓库的核心。多个数据源的异构数据向数据仓库集成时,多个数据源的局部数据模式映射到数据仓库的全局数据模式,并对各个数据源数据进行抽取、转换和清洗、装载等处理来为数据仓库应用程序使用。

    虽然最早数据仓库的提出是用于企业的联机分析系统和决策支持系统,但分析数据仓库的基本特征,如集成性、稳定性和随时间不断变化的特点,对于数字资源系统数据层的整合来说,数据仓库可以将各个异构数字资源系统数据库中的数据集成到数据仓库中,将各数字资源系统中的变化按一定的周期更新到数据仓库中,并保持数据仓库巾集成数据的相对稳定。因此数据仓库是实现图书馆数字资源数据层整合的有利工具。

21/212>


 

评分:0

我来说两句