充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

创建一个有效的数据仓库策略



每个公司都有大量的数据, 太多太多的数据。如果你没有大量的时间和精力, 你甚至不能访问它。这些数据就可能不是那么的有用。这就需要一个有效的数据仓库策略。

与一些公司所认为的可能相反,有效的数据仓库解决方案不必一定是要昂贵。他们也不需要太复杂或局限于单一的规模和范围。

什么不再管用

在所谓的过去,在高科技领域,也可能就近在去年,数据仓库曾尝试使用两种相当常见的方法。

一种是依靠外部资源来拼凑一个公司认同的系统。这样的系统可以包含任意种类和数量的服务器、存储阵列和软件。用在一起, 公司希望这样的集合会是有效的数据仓库解决方案,尽管这已经变得越来越不可能。不同的单位凑在一起可以创建日益复杂的系统,难以监控、跟踪和有效管理。

“自己动手”的方法在只有有限的内部IT资源来创建和管理有效的仓库系统的公司会有麻烦。IT的资源可能不足够大或可以腾出手来关注一个庞大的仓库系统的实施和管理。

另一个老派数据仓库方法则基于专有技术的系统。虽然这类的系统可能提供, 满足许多企业的功能和技术,但成本通常很高。按这种合约要求,确保系统不断的优化和维护的费用是昂贵的。使用专有系统对于中小企业来说也可能经常导致过度供应。规模较小的企业也不一定需要这样广泛的系统,但被迫要支付它,认为这是唯一可行的选择。

以上的数据仓库方法的缺点包括高成本、低效率,对存储的数据无能为力。

对一个更有效的系统你能做什么

与其拥有大量无组织和无法访问的数据,一个有效的数据仓库策略能让你易于访问数据,并快速进行一系列的使用。评估各种类型的数据可以让你跟踪过去和当前的趋势,同时预测未来趋势和问题,带来有意义的商业智能

低效率存储的大量数据会导致系统性能大大降低。随着数据量的增加, 即使最简单的日常操作的数据加所用的时间也会增加。试图找到一个特定项目的几个查询,会让系统在试图筛选或处理现有的数据时更加滞后。这样的滞后不仅影响到员工的工作效率, 而且也因为故障或瓶颈流量的结果而影响公司整体。

全面的不断扩大的数据集合对于今天的企业是一个重大的挑战。内部和外部数据源不断增加更多的数据组合在各种不同的格式和复杂的层次里。重复和冗余数据随处可见,毫无用途。

在线分析处理, 或OLAP, 对于从不同数据源里挖掘数据会是一个非常方便的应用,,但它要求系统的工作量和压力极大,不太适于任何复杂或大的事情。

有效的数据仓库可以消除陈旧的数据存储系统, 让任何有用的目的更长久或解放其他过度堆放数据执行额外的功能的设备。

如何找一个有效的数据仓库系统

在选择数据仓库的策略时要考虑的两大因素是容量和性能。它的框架应该能够支持和平衡硬件和软件组成的系统,包含对当下企业重要的特性。包括:

能够处理广泛的顺序扫描

兼容OLAP系统的能力

实施下一代服务器和存储阵列的配置

对日常运营和操作系统影响最小的快速安装

不需要过度更新就可满足业务需求的可扩展性

未来低成本增加业务的扩充规模能力

适应多种价格和预算的成本效益

可以升级并随着技术的进步而升级

规模问题

要保持高速处理和低成本,规模适用性的选择是必须的。小型, 中型和大型数据仓库选项应该可以满足业务的特定需要。例如中小型企业, 可以用一个5 TB的平台, 由单个服务器与内部存储就行。略大的企业可以用有更大服务器和网络存储阵列的10 TB的平台创建有效的策略。相比之下,最大的企业可能要用大于20 TB的平台,基于大型服务器和光纤通道存储阵列来处理大规模的负载。




 

评分:0

我来说两句