充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

Forrester研究公司预测数据仓库供应商将整合Hadoop大数据平台



据Forrester研究公司称,企业数据仓库供应商将整合开源大数据平台Hadoop。

社交客户关系管理(CRM)所面临的挑战之一是对大数据集的分析行业使用“大数据(big data)”这样的术语来形容这些数据集,但针对大数据的工具尚未成熟。冉冉升起的新星之一是开源Hadoop平台,它能提供对诸如Facebook这样的网站所产生数据的分析。

Forrester研究公司预测Hadoop将成为主导企业数据仓库供应商的产品策略里的一个关键组件。EMC Greenplum和 IBM已经提供了Hadoop产品,其他的供应商在他们的产品系列中提供了一定程度的Hadoop整合,或有些供应商已宣布有这样做的意图。

Forrester研究公司预计到2012年第三季度,像Teradata、甲骨文(Oracle)、 SAP/Sybase、微软和惠普/Vertica这样的公司会收购像Cloudera、 MapR Technologies、DataStax、 HStreaming 和Outerthought这样的Hadoop创业公司。

但Forrester研究公司还说,Hadoop对许多企业数据分析和IT专业人士来说是一个陌生的技术。在一份在企业中使用Hadoop的报告中,Forrester研究公司的高级分析师James Kobielus警告说,甚至一流的高级分析和企业数据仓库高手将会发现,要真正弄清Hadoop的技术规范、工具和方法是一场艰难的跋涉。

在“企业Hadoop最佳实践:来自在线服务中早期采用者的具体指南”报告中,他解释道, 针对Hadoop的培训和职业认证服务的供应短缺,使得项目不仅很困难,还具有挑战性甚至更加危险。更有甚者,得到行业一致认可的最佳实践更是空白。

该报告强调了对Hadoop核心规范这样的关键领域的关注,这些领域仍然由Apache Hadoop的社区在开发。在此报告中,Kobielus警告说在联合、元数据、高可用性和机器学习方面都缺少规范。

这意味着业务仍受困于供应商放入开源软件销售Hadoop的专有功能。

也没有一种单一整合的Hadoop软件分布。许多Hadoop的安装都包含一些自定义码。针对Hadoop部署的复杂性,Kobielus警告说,自定义的Hadoop开发和数据建模的混乱复杂性会呈现出一种可怕的学习难度,以致会延迟完全的部署。



 

评分:0

我来说两句