充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

一个开放的OLAP体系结构



1 引 言

    联机分析处理(On-Line Analytical Processing,OLAP)技术支持决策者围绕决策主题对数据进行多角度、多层次的分析。OLAP通常建立在数据仓库之上,数据仓库的目的是为了支持经营H管理中的决策过程,存储在其中的数据既有企业内部的,也有企业外部的;既有当前的,更有历史的。来自不同数据源的数据经过提炼、加工后再加载到数据仓库,不管这些数据在物理上是怎么组织的,从逻辑上看它们是围绕一个个决策主题的多维数据的集合。这种数据结构为OLAP实施多维数据分析提供了理想的环境;而OLAP作为一种多维查询和分析工具,是数据仓库功能的自然扩展,也是数据仓库中大量数据资源得以有效利用的重要保障。

    一种OLAP产品的成功与否,也不仅仅限于OLAP技术的本身,更取决于它与各种大型数据仓库系统的集成度,取决于它的开放度即大多数第三方软件厂商对它的接受和利用程度。本文将着重分析OLAP服务器的体系结构(见图2)以及服务器对客户端的支持,最后还讨论客户端的一些常见形式。

图1 开放的OLAP外部体系结构
图1 开放的OLAP外部体系结构


2 OLAP在数据仓库系统中的地位

    OLAP技术的著名站点“OLAP Report”曾经统计过,OLAP的相关产品数量正以每年40%的速度增长,从产品的发展趋势来看,OLAP产品的体系结构必须必须具有足够的开放性:首先OLAP服务器要能够方便的与现有的大型数据仓库很好的集成,并且OLAP服务器在向客户端提供的支持上应该积极寻求与第三方软件特别是决策支持软件的开发商的良好合作关系。这里实际上对OLAP服务器的体系结构提出了一个“承上启下”的要求,在数据仓库的4层架构中,OLAP层是OLAP服务器的理想位置,下层有数据仓库层的强大支持,上层又可以有灵活的个体层实现,OLAP服务器的各种功能集中在OLAP层实现,这样的OLAP服务器能够灵活的与现有的数据仓库系统结合,并且能够为各决策支持软件开发商提供方便、透明的接口,这也是OLAP的开放性的体现。

3 OLAP服务器的体系结构

    在这一节中阐述OLAP服务器的组成结构,每一部分的功能及相互间的关系。

    3.1 现有的OLAP技术类型

    ·Relational OLAP(ROLAP)

    基于关系数据库的OLAP实现——ROLAP以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP建立在技术已经相当成熟的关系数据库管理系统上,灵活性和处理大规模数据的能力比较突出,但数据库中存放了大量的细节数据和相对较少的综合数据,OLAP的效率较低。

    ·Multidimensional OLAP(MOLAP)

    MOLAP以多维数据库为核心,存储预处理的多维立方体数据!对多维概念表达清楚,占用的存储空间较小,而且数据的综合速度高,但多维数据库管理系统缺乏标准,管理大规模数据库的能力不够强大。

    ·Hybrid OLAP(HOLAP)

    HOLAP集成了ROLAP和MOLAP的优点,使ROLAP和MOLAP在一个集成的环境中相互辅助共同工作。HOLAP、既有处理大规模数据的能力,又可以提供的响应速度,并且还可以配合以多种优化策略,调节ROLAP和MOLAP的比重等一系列参数,实现OLAP应用的最优化。

图2 OLAP服务器的体系结构
图2 OLAP服务器的体系结构


    3.2 数据的建模

    开放的OLAP体系结构一定要有包容性、灵活性以适应迅速建立新的数据集市或重定义原有集市的需要、OLAP的建模是一个持续的、交互的、循环的过程,在建模的开始就知道所有可能需要的分析模式是不可能的,所以必须提供快速调整分析模式以适应多变的商务需要的能力。

    OLAP将数据的多维结构划分为两类表:一类是实体表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息,维中的层次又称作量度。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩展称为“雪花模式”。

    不论是ROLAP和MOLAP的物理模式有多大的差别,它们的逻辑模式都可以用星形图或雪花图来描述,并且现有的雪花图和ER图的相互转换的技术、工具都比较成熟,加上许多多维数据库模型的逻辑模式的设计也都是用雪花图来描述的,所以在OLAP Server的体系结构中采用了基于雪花图的OLAP建模(见图2)。管理员使用OLAP建模模块来定义雪花图模型,生成一系列维表、实体表的定义集。用户可以通过选择维表和实体表中的所有维和量度的不同组合来实现不同的分析模式。不过在数据建模模块中,并不把雪花图模型转换成ER图(ROLAP)进而生成关系表,或者直接转换生成多维数据库中的数据立方体(MOLAP),而只是停留在逻辑模式。物理模式的生成要等到经过HOLAP优化器(见图2)的优化和智能代理(见图2)的加载之后才根据相应的OLAP模式分别以关系表或多维立方体的形式实现。

21/212>


 

评分:0

我来说两句