充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

基于数据仓库的OLAP技术的研究



    在过去的20多年中,由于数据库技术的迅猛发展,特别是关系数据库技术的成功应用,数据处理技术迅速成为计算机技术三大应用(数据处理、科学计算和过程控制)的主要方面,占据了75%以上的份额。进入90年代后,随着数据处理技术在企业的成功应用,企业积累了大量的生产、科研和业务数据,企业各级人员都希望能快速、交互、方便和有效地从杂乱无章的数据中提取有意义的信息决策者希望能够利用这此信息分析企业运行状况,指导企业决策。信息技术已取代数据处理技术成为信息产业研究的热门话题,业界所而临的问题不再是简单地处理数据,而是如何使用数据,信息的策略性价值越来越受到重视。为了解决企业决策人员而对浩瀚如烟的数据却很难及时获得支持决策的信息的矛盾,数据仓库(Data Warehouse)的概念应运而生利用OLAP通过快速、一致、交互地访问各种可能的信息视图,可帮助数据分析人员、管理人员、决策人员洞察数据的奥秘,掌握隐于其中的规律。

1 数据仓库概论

    1.1 数据仓库的定义

    什么是数据仓库呢?数据仓库就是一个用以更好地支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。

    1.2 数据仓库体系结构

    美国斯坦福大学计算机科学系的一个专门小组通过对数据仓库技术的研究,提出了数据仓库技术的一个比较完善的体系结构。该结构在整体上对数据仓库进行了描述,从各个数据源收集所需要的数据,并与其他数据源的数据集成,然后将集成的数据存入数据仓库,终端用户可以直接从数据仓库中访问所关心的数据。

    1)数据查询和分析组件:它用来实现指定终端用户的信息需要。

    2)数据集成组件(Data Integration Component) :负责将源数据装入DW,维护DW的视图,合并、过滤和综合从不同数据源来的数据。

    3)监视器(monitor) :其主要任务是翻译和监测数据源的数据变化。

    4)数据源(information source) :它是通常的数据库系统,但也可以是非传统的数据,如文件,HTML和SGML文件、知识库等,每个数据源和一个监视器相连。

    随着数据仓库技术的应用于实际,及其的日渐成熟,在此基础上形成了另种较为典型、具体的数据仓库系统结构图,如图1所示。

图1.2 数据仓库系统结构图

图1.2 数据仓库系统结构图


    该数据仓库系统是以数据仓库为中心,通过数据提取工具、数据转换工具、查询工具、报表工具、分析工具、数据发掘工其等,满足用户对信息的各种需求。

2 基于数据仓库的OLAP技术概述

    2.1 OLAP的提出

    联机分析处理的概念最早是由关系数据库之父E.F.CODD于1993年提出的。当时,CODD认为联机事务处理OLTP(on-line transaction processing)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简中查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,CODD提出了多维数据库和多维分析的概念,即OLAP。

    2.2 OLAP(联机分析处理)的概念

    OLAP是种分析处理技术,是针对特定问题的联机数据访问和分析,通过对大量信息的多种可能的观察形式进行快速、稳定致和交互的存取,使决策人员对数据进行深入观察。

    2.3 OLAP的特点

    OLAP的特点可以总的概括为:

    快速性(Fast) :指系统快速相应用户的分析请求用户对OLAP的快速反应能力有很高的要求,系统应能在5秒内对用户的人部分分析要求做出反应,这也是OLAP的个显著的特点。

    可分析性(Analysis) :OLAP系统应能处理与应用有关的任何逻辑分析和统计分析,用户无需编程就可以定义新的专门计算,将其科为分析的部分,并以用户理想的方式给出报告。用户可以在OLAP平台上进行数据分析,也可以连接到其他外部分析工具上,如时间序列分析工具、成本分配工具、意外报警、数据开采等。

    共享性(Share) :系统在保证安全的基础上,提供多用户共享数据与信息机制。

    多维性(Multi-Dimensional) :多维性是OLAP的关键属性,系统必须提供对数据分析的多维视图和分析,包括对层次维和多重层次维的完个支持。事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。

    信息性(Info):不论数据量有多大,也不肯数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。这里有许多因素需要考虑,如数据的可复制性、可利用的磁盘空间、OLAP产品的性能及与数据仓库的结合度等。

    2.4 OLAP与OLTP的比较

    OLAP主要通过多维的方式来对数据进行分析、查询和报表,它不同于传统的OLTP的应用。下面给出OLAP与OLTP的比较表,通过该表可以更好的理解联机分析处理(OLAP)的深层本质。


表2.4  OLAP与OLTP的比较
表2.4  OLAP与OLTP的比较


21/212>


 

评分:0

我来说两句