无论是企业用户还是业界分析人士,对Hadoop都不乏关注,技术媒体更是对Hadoop赞赏有加。不过,所有的关注都要落实到一个问题上,那就是采用率。去年美国企业管理协会和9sight咨询公司联合开展了一项调查,结果显示259名受访者中,只有16%表示正在使用Hadoop,在其他的调查中,Hadoop的采用率也是很低的。在Hadoop诞生之初,这个开源的分布式处理架构拥有一些先锋用户,尤其在互联网企业中。但知道Hadoop 2.0发布,它的用户群还停留在先锋用户的阶段。
Hadoop未得到普及,原因之一在于企业不知道如何让这项技术贡献价值。今年2月,Gartner做了一次问卷调查,其中一个问题是“您认为企业部署Hadoop面临的最大障碍是什么?”,在213名受访者中,50%都表示“不清楚Hadoop能贡献什么价值”。
当然,大数据应用对很多企业来说还是一个全新的领域。不过另一个影响Hadoop普及的因素是它自身的设计。它只支持MapReduce应用程序,要调节扩展性一定要通过一个单一的命名空间服务器,放置以前跨集群存储的数据文件。Gartner分析师Merv Adrian在一篇博客中写道,很多企业认为Hadoop只是宣传者口中的理想工具,也就是说,要企业真正采用Hadoop,还有很长的路要走。
2013年10月,Hadoop发布了2.0版本。它不在以来MapReduce的批处理,集群的扩展性和容错性也更高。TechTarget商务智能网站近期发表了很多文章,从技术、案例和专家观点等多方面介绍新的Hadoop,希望能给IT管理者、业务执行者和其他技术人员以帮助。
Hadoop 2做了很多改进。比如加入了新的组件——YARN资源管理器,能够运行非MapReduce应用程序;加入了实时分析程序,在这一点上YARN也功不可没。现在,是时候重新考虑Hadoop了。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Cask框架:加速构建Azure HDInsight数据管道
Microsoft Azure之类的云正努力将部署简化,但这和端对端大数据分析应用程序的实现以及将其在云上运行一样困难。
-
Spark架构在大数据环境的核心位置找到用武之地
Spark的最开始的名片是它能比MapReduce更快地运行批处理应用程序,而其编程环境和执行引擎是嵌入在Hadoop原始版本中的。
-
功能上的“硬伤”并非Spark应用解不开的死结
虽然Spark自身还有待完善,但由于在批处理应用性能方面的优势,Spark正在逐渐将MapReduce边缘化,该数据处理引擎的使用正在快速增长。
-
MapReduce地位难保?Spark开源上位
开源Apache Spark架构已经提供了快速的内存处理和高性能的机器学习库,还集成了数据流处理能力。它还在继续吸引更多来自Web新贵和传统企业环境的追随者。