充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

数据仓库中联机分析处理技术的研究与开发



一、引 言

    数据仓库是近几年来信息领域中的技术热点,人们普遍认为它将是数据库技术的重要发展方向。由于传统的数据库应用系统是面向事务设计的,在查找业务的具体数据上非常有效,但在为决策者提供总结性数据时则显得力不从心。这就需要联机分析处理(OLAP)技术。OLAP是一项给数据分析人员以灵活、可用和及时的方式构造、处理和表示综合数据的技术。

二、联机分析处理(OLAP)

    (一)基本概念

    数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合。建立数据仓库的目的是为了满足企业信息分析与决策需求,更好的支持决策的制定。

    联机分析处理(OLAP)与数据仓库有着密切的联系,它是数据仓库的验证型分析工具。它将分析决策所需的大量数据从传统的操作环境中分离出来,清理、转换成集成的、统一的信息,帮助决策者进行及时有效的分析、判断和预测,获取更多效益。

    OLAP是建立在多维视图的基础之上,强调执行效率和对用户命令的及时响应,而且其直接数据源一般是数据仓库。它是一种软件技术,使分析人员、管理人员通过对信息的多角度、多侧面、多层次的观察,支持决策的制定。

    (二)技术特点

    1. Fast(快速性)  以相当固定的速度向用户提交信息。大多数查询可在5秒或更短时间内提交给用户。

    2. Analysis(可分析性)  OLAP系统能够处理与应用有关的任何逻辑分析和统计分析。用户无需过多编程就可以定义新的专门计算,将其作为分析的一部分,并以用户理想的方式给出报告。

    3. Shared(共享性)  在大量用户之间实现潜在地共享秘密数据所必需的安全性需求。

    4. Multidimensional(多维性)  多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。

    5. Information(信息性)  不论数据量有多大,也不管数据存储在那里,OLAP系统均能及时获得信息,并且管理大容量信息。

    (三)功能结构

    OLAP的功能结构由数据存储服务、OLAP应用服务、用户描述服务组成的三层客户/服务器结构(如图1所示),复杂的应用逻辑集中存放在应用服务器上,由服务器提供高效的数据存储,安排后台处理及报表的预处理。OLAP服务器能加强和规范决策支持的服务工作,集中和简化原客户端和DW 服务器的部分工作,降低系统数据传输量,因此工作效率更高。OLAP服务器设计的重点在于如何组织数据仓库中的综合数据,如何满足前端用户的多维分析。


图1 OLAP的三层客户/服务器结构图


三、OLAP的多维数据结构

    多维数据结构是数据仓库的一种存储结构类型。它是为了提高数据库的查询能力而设计的,其内部包含了等待分析的数据,并使用了数据维来分类数据。这种结构也可以称为立方体数据结构。多维结构里的数据资源既可以按星型结构分布,也可以按雪花型结构排列。

    (一)维

    一个立方体数据结构(Cube)是由很多数据维(Dimension,简称“维”)组成,每一维都表示某一类的数据。维就是相同类数据的集合。数据维里的数据都限制在某一问题所界定的领域之内。在Microsoft OLAP Service里的立方体数据结构可以包含1-64个数据维。在立方体结构(Cube)里至少要包含一个数据维,在一个数据维(Dimension)里又至少包含一个层次(Hierarchy),而一个层次又至少要包含一个级别(Level)。在每一个级别里,可以拥有多个成员(Member)。在事实表关键字与数据维成员交叉的地方,每一个成员至少有一个数据值出现在该位置上。

    (二)度量

    事实表成员的值被称为“度量”(Measure),它是进行数值分析时所要寻找的数量信息。度量应是具有数值性和可加性的。

    从数据库的数据维表里直接获取的成员被称为输入成员(Inputm ember);从包含其他成员的表达式里得到的成员被称为导出成员(Calculated member)。后者是在运行中计算得到的,并且只有那些计算成员的表达式被存储在多维数据库里。一个导出成员既可以作为数据维成员(Dimension member),也可以作为度量成员(Measure member)。在系统中根据用户需求设计导出成员,能够有效提高系统的分析能力,完善系统功能。

    (三)虚拟维

    虚拟数据维不需要存储在计算机的硬件设备中。虚拟维在立方体中可以提供更多的维分析,因此,虚拟维的设计会减少立方体存储空间,但也会增加查询时间。虚拟维的设计使用户可以灵活地使用实际维的多重属性来减少维的多重显示。

    多个立方体结构可以组合在一起,形成一个虚拟立方体结构供用户查询信息。在数据仓库里使用虚拟立方体结构,可以允许用户在多个结构里交叉访问信息,而用户无须建立数据仓库并把这些立方体结构存储到该数据仓库里。使用虚拟立方体数据结构既可以为用户提供所需信息,也可以节省磁盘空间。另外,虚拟立方体数据结构也可以用来提供一定级别的保密能力。

21/212>


 

评分:0

我来说两句