充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

基于数据仓库和OLAP的商务决策系统



1 引 言

    随着市场竞争的加剧,各企业为了能够在竞争中发展必须及时做出正确的决策,大多数企业都在建立自己的决策支持系统DSS(Decision Support System),决策支持系统需要大量历史数据并且需要将来自异种源的数据统一,产生高质量的、纯净的和集成的数据,而传统的数据库一般不维护历史数据并且只维护详细的原始数据。因此,引入了数据仓库,它能够维护5~10年的历史数据,并能够把所需的信息从原始数据中分离出来,把分散的、难以访问的原始操作数据转化为集中统一、随时可用的信息。

    在商务决策系统中,需要对大量的客户数据进行多维分析处理,并把分析结果以多维视图方式展现给决策者,决策者再做出相应的决策。因要求该系统具有大量的多维客户信息进行快速决策的特点,所以采用数据仓库和OLAP作为商务决策系统的核心。

2 数据仓库和OLAP

    (1)数据仓库。
数据仓库就是面向主题的、集成的、稳定的、随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。

    为了使数据仓库中的数据是面向对象的,必须对数据按要求的主题进行收集、归纳后重新存放;由于要求能进行多视角的观察、分析,因此对应各主题的数据必须按一定的属性进行组织;另外,针对数据的综合程度不同,应对数据按不同的汇总程度存放。

    对应以上数据组织的要求,数据仓库定义了对应的结构元素来实现数据的结构模型:事实、维、粒度。事实:所分析的目标数据,如销售量、销售额、库存量、库存额等;维:事实信息的属性,如销售发生的时间、客户、地区,销售产品的品种、规格等;粒度:是划分维的单位,就好比数轴的单位,如时间维可按日计,也可按旬、月、年计等。

    (2)联机分别析处理(OLAP)。联机分析处理是针对特定问题的联机数据访问和分析。可以应分析人员要求快速、灵活地进行大数据量的复杂查询处理,并且以直观易懂的形式允许决策者对数据进行深入观察。

    OLAP采用一种多用户的三层客户机/服务器结构,如图1所示。第一层为客户机,实现最终用户功能,能够方便地浏览数据仓库中的数据,能够生成立方体,为决策者实施决策提供决策支持。第二层为OLAP服务器,集中存放应用逻辑和综合数据,提供高效的数据存取。第三层是企业服务器,存储数据仓库中的细节数据。


图1 OLAP体系结构


3 基于数据仓库的商务决策系统模型的建立

    3.1 多维数据模型结构


    数据仓库和OLAP工具是基于多维数据模型的,该模型将数据看成数据立方体(Data Cube)的形式。商务决策系统后台数据仓库主要由产品、客户、商店、销售时间4个多维数据集与销售事实表构成。所有多维数据集均采用星型模式,最终构成一个事实星座如图2所示。


图2 商务决策系统的星型模型


    以Customer维为例,此多维数据集维度有单Customer-ID、Customer-name、Location、Age、Sex。此星型模式多维数据集用DMQL定义如下:

    define cube sales[Item,Customer,Stoer,Time]:

    Sold_dollars=sum(sales_in_dollars),sold_Proit=sum(sales_in_dollars)-sum(buy_in_dollars)
    define dimension Item as(Item_ID*,Item_name,Brand,Type,Pirce)
    define dimension Customer as(Customer_ID*,Customer_name,Location,Age,Sex)
    define dimension Store as(Stoer ID*,Store_name,Location,Scale)
    define dimension Time as(Time_ID,Day,Day_of_week,Month,Quarter,Year)

    星型结构的核心是事实表,它是多维查询的焦点,那里存储了真正的数据。事实是数量属性,能被统计、求和、求平均值、求最大值和最小值,能根据各种统计操作来聚类。事实属性包含了被事实表管理的主体的可量度的数量值。维度属性提供了在事实表中的每一行的描述信息,这些属性用来提供事实表和相关的维表之间的联系。一般来说,时间维是一个有特殊意义的维,它对决策中的趋势很重要。

    在上面的星型结构中,商店维允许我们根据商店,包括商店的位置和规模来对事物进行分类。产品维允许我们根据产品以及它的牌子、类型和价格来分析购买形式。消费者维允许我们根据消费者来分析商业活动,比如购买频率(包括多大比例的消费者以什么样的频率进行购买),以及消费者的位置来分析商业活动(指多少消费者愿意旅行一段距离到某一特定的商店进行购买)。

    现在我们就可以根据上面的结构进行这样的分析:产品的牌子和商店的规模对利润有什么影响。

    假若有下面的一组数据,如表1~表3所示。


表1 商店维


表2 产品维


表3 事实表


    为了分析商品牌子对利润的影响,我们先在商品牌子上进行聚类,得到表4和表5。


表4 产品牌子聚类表


表5 商店规模聚类表


    这样,综合这些聚类结果,就能得出下面结论:商店规模越大,盈利越多;而牌子为T1的商品的盈利也比较多。决策者可以根据这些来决定在什么季节,在哪个商店销售什么牌子的哪种商品,才能获利最大;根据顾客的年龄、性别和所在的地方在商店中怎样来配置产品,才能导致不会积压过量的产品,从而获利最大。

21/212>


 

评分:0

我来说两句