充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

一个联机分析处理应用系统的选择



极少有一个术语可以点燃整个市场,但在IT世界里,大数据就是这样。但大数据有一千种定义, 要想有效的描绘这个术语是无意义的, 所以请允许我讲一些实际的。

简单的说,大数据适用于任何数据集,它打破了IT传统的界限和能力。大数据的可扩展性定义特征是最容易引人注目的。大量的内容会超出数据中心现有的能力。它可以是你需要完成的交易量。

大数据只是一个起因。解决它的一种新的方法是效果, 这才是重要的。效果将会改变一切。

历史和混乱

大数据经常等同于分析,而分析只是一种用例,它决不是唯一的一个。然而, 可以从它开始了大数据。简而言之, 我们从“我的数据”概念开始,比如,从一个人的数据开始。

我在企业战略集团的同事创造了一种结构化数据参考模型,用以追踪我的数据的生命周期,它让人更容易理解小事情如何变得很大。在该模型中, 数据在交易处理系统中创建生命周期。而该模型可能与企业到企业和应用程序到应用程序会有所不同,一般来说, 数据创建时要创设四个数据生命周期: 交易处理、报表和分析、备份和灾难恢复、应用测试和开发。

一旦创建,数据就在复制这四个功能,只不过是在交易处理系统域内。第一级的分析存在于交易处理系统本身(成功的交易、失败的等)。这些数据随后在交易处理系统之外会被准备、处理、转换、复制,再将其放置在一个数据仓库的系统, 在那里可以在一组我的数据记录上进行分析, 如基于地域寻找销售。数据仓库也需要数据保护和灾难恢复功能, 其他副本则需要测试/开发。

然后,所有我的数据对象都经过转换、处理和复制到一个“大分析”系统, 在那里可以关注购物车的退出率和其他原因/效果的情况。复制的副本再次被用于测试/发展、备份、和DR。

哇。它不需要很长时间就能看到一次小的交易记录能增长100-倍。或早或晚, 这种增长将突破传统IT的能力。

借用一句话:“不仅仅数据的量,聪明的大数据策略也要考虑信息的速度、种类、和复杂性。”数据源并不仅仅是简单的交易处理系统。他们来自社交媒体, 包括许多类型的内容(视频、音频等),而且他们来自这个星球上每个已知的设备中。

怪不得行业对大数据如此激动。抢先一步创造新机遇让你的企业可以销售更多的东西,而且也让企业对你销售更多。这也意味着可把事情搞砸的新机会。

那么,在你穿越大数据的临界点时,什么会被中断? 你第一次发现所有基本面中断了。例如, 你不再能处理所有数据, 所以你仅仅开始处理子工作, 然后你希望你选择的小组正好能代表整个数据池 (而他们不是)。你正在使用传统的结构化数据库系统,而它不再管用,因为你的数据比曾经能够支持的DBMS要大1000倍。你不能在分析(或其它)系统中足够快地输入你的数据。你不能很快地增加你的储存基础设施。你不能快速备份数据,所以恢复的概念也完全不能实现。

那么你做什么呢? 你别想用去年的解决方案来解决明年的问题。

大量的技术正在被开发用以解决所有领域的这些问题。最简单是Band-Aids。 其他像Hadoop这样的,更为激进, 将从根本上改变你做事的方式 (存储,在这种情况下)。大多数要更多的时间来发展成为合法的企业选择, 但他们还在进行中。

与此同时,下一次有人问:“你有什么大数据的计划? ”回答他“哪一个?”你会需要多个大数据规划。




 

评分:0

我来说两句