充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

基于统一视图的数据仓库体系结构及其构建方法



    企业在实施信息化技术的过程中积累了大量的设计、生产、库存、销售、采购和财务等业务数据,如何将企业海量业务数据转换为决策信息已成为目前企业信息化的难点和热点问题,数据仓库被认为是最好的解决方案。数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员决策。常见的数据仓库模型体系结构如图1所示,数据从操作型数据源和外部数据源流出,经过数据抽取-转换-装载(ETL)到全局数据仓库中。

图1 数据仓库模型体系结构
图1 数据仓库模型体系结构


    数据仓库系统ETL的复杂性和可用性是构建数据仓库系统的主要问题,为此,提出一种新的基于统一视图模型的数据仓库体系结构以及一种新的基于统一视图模型的数据映射-抽取-装载数据仓库ETL建模过程。这种体系结构不仅保证实施的可行性和扩展性,还可以降低数据仓库构建的复杂性。

1 基于统一视图的数据仓库体系结构

    定义1  统一视图(UView)。它是在一个全局数据环境应用中,具有统一属性、统一度量、统一分类的查询模式,可用四元组描述,即UView::=。其中:D是构成该视图的所有统一维关键属性的集合,D={d1,d2,…,dm},di是抽取的第i个统一维中的关键属性;肼是构成该视图的所有统一度量属性的集合,M={m1,m2,…,mk},mi是抽取的第i个统一度量属性;A是构成该视图的相关统一属性的集合,A={a1,a2,…,an},ai是抽取的第i个相关统一属性;class是该统一视图在统一视图模型中的分类。

    基于统一视图模型的数据仓库体系结构如图2所示,它由三个层次和二级映射构成,它是通过采用分层策略来降低数据抽取及转换的复杂性。

    基于统一视图模型的企业数据仓库体系结构的三个层次分别为资源数据层、统一标准层、数据仓库层。其核心是统一标准层,它是建立在统一视图模型的基础上,即统一标准层由面向整个企业、在企业范围内具有统一解释的统一属性库、统一维库和对问题域进行抽象所形成的统一视图分类树组成。这里的统一包括度量统一、名称统一、类型统一、值域统一、语义统一。统一视图分类树下的统一视图不同于企业数据全局模式,它是面向业务分析的自定义的标准数据模式。

图2 基于统一视图的数据仓库体系结构
图2 基于统一视图的数据仓库体系结构


    资源数据层由两部分数据组成:a)面向企业事务性操作的业务数据,如销售数据、采购数据、财务数据、生产数据、库存数据等;b)支持企业业务活动的基础数据,如标准数据、设备数据、客户数据、产品类别数据等。

    数据仓库层由多个面向应用主题的数据仓库组成,数据仓库中的数据按主题进行抽取和综合,采用星型模型或雪花模型进行组织存储,每个主题下可对应多个事实表。

    a)统一视图一资源数据映射,主要完成属性名称、属性类型、属性语义等方面的转换和统一。目的是使建模过程能够标准化或者模板化,并充分体现视图重用的概念和方法,缩短建模周期、提高建模质量。

    b)数据仓库一统一视图映射,主要是在统一视图模型的框架下,完成属性集成和数据抽取等工作。基于统一视图模型的企业数据仓库体系结构,通过定义统一视图和维表统一了业务概念标准,增强了业务数据与决策仓库数据的独立性,真正实现了统一视图和标准属性数据的共享,便于多数据仓库的开发,可以减少数据仓库开发与维护成本。采用分层及二级映射策略,一方面数据仓库设计人员不用关心错综复杂的业务系统中的数据模式及数据含义,可以更多关注数据仓库设计,进而提高数据仓库设计的质量,增强数据仓库建设的可操作性。另一方面,各业务系统设计人员负责定义和维护统一分类视图到业务数据的映射,完成对映射规则进行的动态维护,保证统一视图数据模式一致性,增强数据仓库系统可维护性。另外,基于统一视图模型的企业数据仓库体系结构具有很好的可扩展性,通过提供的统一接口便于增加新的标准属性和统一维,定义新的统一视图和事实表。

31/3123>


 

评分:0

我来说两句