充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

商业智能系统研究与设计(上)



    国内发展现状

    随着我国经济改革的不断深化,WTO后中国市场的迸一步开发,中国信息化建设步伐也进入加速阶段。2005年开始,中国商业智能技术的应用与发展进入了新的高速增长起点。2005年,金融、电信、零售业等已有大量操作型数据积累的企业都发出了迫切的应用需求。如何从海量的用户、市场数据中挖掘出高附加值的决策支持的信息,如何为企业经营决策者精确提供对企业经营战略、产品销售、客户偏好、客户构成及客户忠诚度的分析,成为企业十分关心的问题。因此,数据仓库、联机分析处理、数据挖掘等技术的应用已成为继数据大集中之后,众多企业新的关注焦点。

    随着全球经济步入信息分析的时代,每个企业都希望通过商业智能产品和服务处理其最重要的资产——信息,在中国的企业应用中,BI(商业智能)正在迅速成为最热门的话题之一,因为越来越多的人坚信,BI将成为信息时代的又一个新浪潮,成为企业盈利的关键因素之一。

    本章首先介绍了商业智能系统的概念,然后对国内外商业智能的发展现状进行了比较分析,通过国内外商业智能发展现状的分析可以看出我国与国外在商业智能应用领域还存在较大的差距。再次介绍了课题的来源和研究目的,最后提出了本文研究的内容和组织结构。

3 商业智能的相关技术

    数据仓库的概念

    有些文献把数据仓库当作商业智能的代替词。实际上,数据仓库系统是对数据的处理技术的集成,而商业智能系统的核心是解决商业问题,它把数据处理技术与商务规则相结合以提高商业利润减少市场运营风险,是数据仓库技术、决策处理技术和商业运营规则的结合。

    简而言之,数据仓库是一个面向主题的,集成的,时变的,非易失的数据集合。根据数据仓库概念的含义,数据仓库拥有以下四个特点:

    ①面向主题的

    ②集成的

    ③时变的

    ④非易失的

    主题、粒度和维度

    对于数据仓库的理解,还需要把握主题、粒度和维度的含义。主题是一个在较高层次上对数据进行归类的标准,每一个主题基本对应着一个宏观的分析领域。基于主题组织的数据被划分为各自独立的领域,每个领域有自己的逻辑内涵互不交叉。主题的制定决定了后续的数据组织。面向主题的数据组织方式,就是在较高层次上对分析对象的数据进行一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业各项数据,以及数据之间的联系。因此数据仓库的数据是模型化的数据,其模型化过程是以分析主题为线索。

    所谓粒度是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度越小级别就越低;数据综合度越高,粒度越大级别就越高。粒度越小,细节程度越高程度越低,回答查询的种类就越多。一个内在矛盾是:粒度越低,细节程度越高,回答查询的种类就越多。但这必然造成数据仓库中数据的大量堆积。当回答综合问题时,要从大量细节数据中综合并计算答案,效率将十分低下。另一方面,粒度的提高将会提高查询效率,但同时也造成了回答细节问题能力的下降。所以根据分析需要,选择适当的粒度,将会使决策分析简单易行。在数据仓库中,多重粒度是必不可少的,可以按照决策主题的分析要求在效率与效果之间平衡选择。维是指人们观察事物的特定角度,概念上非常相似于关系表的属性。例如:分析商品销量时常对某类客户时间跨度范围进行比较,所以时间就是一个维(时间维)。对不同不同地区的销售特性分析时需要在地理范围内选择,所以地理分布也是一个维(地理维)。数据仓库利用多维分类机制组织大量的数据,并可以按某一维来集成数据。在销售分析中常用的维有:时间维、客户维、地区维等。综合起来,数据仓库是按照决策分析的要求,对各自独立的主题将数据进行重组,表达成具有多个属性、多重层次关系的存储,以支持用户对数据进行灵活复杂的分析。数据最终表现为多维的结构,实际中,因为关系模型在数学上能够证明完全可以表达多维信息,同时关系数据库管理系统产品的成熟应用,常用关系表之间的连接表达多维的结构。


22/2<12


 

评分:0

我来说两句