充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

效能大幅提升,ROLAP将成BI未来主流



    在商业智慧的世界中,OLAP工具是具体展现数据仓储内容的一扇窗,其功能是否够强大、丰富,直接影响企业用户的使用观感。OLAP工具的目的是让非IT用户也能自己设计及操作报表,因此用户最在意的问题,不外乎是接口的使用操作是否够方便,或是报表产生的效能问题。
   
    操作接口是否方便好用,通常和使用者过去的经验及个人审美有直接的关系,并无一定的评断标准,多半可以透过完善的教育训练、详尽的接口设计以及上线计划来改善,所以较易解决,但是效能问题兹事体大,往往涉及项目能否成功进行。近来由于企业资料量的巨幅成长,伴随着分析维度的复杂化、分析需求的实时化及使用者的普遍化,早期以MOLAP Cube为主的中小型BI分析产品面临巨量的后端数据库、跨部门的分析维度、实时且巨量的在线分析需求及数以千计的上线人数等多项困境;而ROLAP工具则是以能处理大量数据、具有弹性及能做进阶分析著称,最能符合现代企业的需求。
   
    ROLAP是透过中介数据(Metadata)的设计,针对每一份报表或图表,「实时」产生出数据库指令,以获取最新的数据,这样的架构拥有绝佳的弹性,但也使得ROLAP工具等待数据回传的效能问题,成为使用者最关注的焦点。捷冠信息科技产品技术经理陈运昌表示,ROLAP拥有诸多优点,只要以下列方式解决效能上的疑虑,企业即可享受其所带来的好处:
   
    一、 数据库架构(Schema)的改善:
   
    (1)数据库的设计:星状模型(Star schema)仍有其效能之局限,故针对特定目的所形成的汇总表格,就成为解决效能的利器,此时OLAP工具必须要支持让单一商业术语(如销售金额)可以拥有多个技术定义的能力,并能自动判断何时应使用原始详细表格或汇总表格,以加快查询效率。(2)数据库的设定:在数据库参数设定方面,包含了数据库空间的设定、数据表格初始设定、成长率、Index的建立,这些设定,直接牵涉到数据库表格存取及成长的效率,设定方式依数据库品牌而有所不同。在数据表格的归类问题方面,牵涉到将不同用途的数据表格放置在不同参数设定的数据库空间中,以求取最大效能,透过这样的归类,能让整个数据库的运行更有效率。
   
    二、 程序代码(Program)的改善:
   
    (1)对象的定义方式:商业对象本身的技术定义(也就是程序代码)必须包含前述的汇总表格的定义,让设计人员可以不用刻意注意数据库中的复杂性,可以专心于商业对象本身的定义,以符合用户的需求。而产生报表时要采用哪个技术定义,就由OLAP工具来决定,不但省却IT人员的时间,更可以大幅改进效能。(2)对象的阶层:商业对象本身的阶层定义方式,也是改善执行效率的要点,尤其是很多对象的阶层定义,并非是单线式的,OLAP工具必须能支持一父多子或一子多父的定义,这样才能充分表达出商业术语的真正定义,也才能有效的节省重复的设计,增进整体系统的效率。(3)小型数据方块的应用:ROLAP的基本设计逻辑在于实时产生数据库撷取指令,每次产生报表时必须重新执行,因此先进的ROLAP工具已有兼采MOLAP工具特性的趋势,亦即将已执行过的报表,暂存于服务器中,形成小型数据方块(Internal cube),下次如有用户存取此报表,则由ROLAP工具来侦测数据库是否有更新或是筛选条件是否有变更,来决定是否要重新撷取资料;且进一步透过ROLAP工具,让多份报表可以分享同一个数据方块,以加快报表存取速度。如MicroStrategy即为其中的佼佼者,MicroStrategy以ROLAP作为主要的分析架构,再辅以特有的Intelligent Cube,提供MOLAP分析功能,如此可兼具ROLAP的分析弹性、处理大量数据的能力,以及MOLAP优秀的分析效能。
  
    三、 硬件(Hardware)的改善:
   
    如果前述两个方法,已经没有改善空间,导致执行瓶颈产生在ROLAP服务器上的时候,那就意味着必须要改善或升级硬件。在单机的环境下,仅能对个别资源做增加,如增加升级CPU、增加内存、或是加大升级硬盘。或者可以采用ROLAP产品中的Cluster架构,连结多部服务器来分担工作,同时达成负载平衡(Load balancing)及容错(Fail over)的效果,不但改善效能,更能增加系统的可用性(Availability)。


 

评分:0

我来说两句