充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

浅谈数据仓库及其在SQL中的构建分析



一、引言

    数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。数据仓库提供用户用于决策支持的当前和历史数据。这些数据在传统的操作型数据库中很难或不能得到。

    面向主题是指数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。集成的是指数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的。必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。数据仓库的组成包括以下几个部分:数据仓库数据库、数据抽取工具、元数据、访问工具、数据集市(DataMarts)、数据仓库管理及信息发布系统。其中数据仓库数据库是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。

二、数据仓库的数据模型

    传统的OLTP系统是按照应用来建立模型,即OLTP系统是面向应用的。丽数据仓库是蘧向主题的,一般按照主题来建模。主题是一个在较高层次将数据进行归类的标准.每个主题基本对应一个宏观的分析领域。满足该领域决策的需要。

    l、两种主流模型分析

    目前两类主流的数据仓库模型分别是由Inmon提出的企业级数据仓库模型和由Kimball提出的多维模型。Inmon提出的企业级数据仓库模型采用第三范式(3Nn,先建立企业级数据仓库,再在其上开发具体的应用。它的优点是信息全面、系统灵活,数据存储冗余度低、反映的业务主题能力强以及具有较好的业务扩展性等。但这种模型设计的系统建设过程长,周期长,难度大,风险大,容易失败。Kimball提出的多维模型降低了范式化。以分析主题为基本框架来组织数据。以维模型开发分析主题.这样能够快速实施.迅速获得投资回报。在取得实际效果的基础上,再逐渐增加应用主题,循序渐进,积累经验,逐步建成企业级数据仓库。这种模型的优点是查询速度快,做报表也快;缺点是由于存在大量的预处理,其建模过程相对来说就比较慢。

    2、多维建模技术

    多维数据建模以直观的方式组织数据。并支持高性能的数据访问。每一个多维数据模型由多个多维数据模式表示。每一个多维数据模式都是由一个事实表和一组维表组成的。常见的有星形模式和雪花模式。星形模式:位于星形中心的实体是指标实体。是用户最关心的基本实体和查询活动的中心,为数据仓库的查询活动提供定量数据。每个指标实体代表一系列相关事实。成一项指定的功能。位于星形图星角上的实体是维度实体。其作用是限制用户的查询结果,将数据过滤从而缩小访问范围。每个维表有自己的属性。维表和事实表通过关键字相关联。

    星形模式优点:提高查询的效率,比较直观,通过分析星形模式,很容易组合出各种查询。

    雪花模式:雪花模式是对星形模式维表的进一步层次化,将某些维表扩展成事实表。这样既可以应付不冠级别用户的查询.又可以将源数据通过层次闻的联系向上综合.最大限度地减少数据存储量。因而提高了查询功能。雪花模式的维度表是基于范式理论的,因此是界于第三范式和星形模式之间的一种设计模式。通常是部分数据组织采用第三范式的规范结构.部分数据组织采用星形模式的事实表和维表结构。雪花模式的优点:在一定程度上减少了存储空间;规范化的结构更容易更新和维护。

21/212>


 

评分:0

我来说两句