电子书:你需要知道的Hadoop 2
全球市场调研公司Allied Market Research预测,在2013年到2020年这八年里,全球Hadoop市场价值将以年复合增长率58.2%的速率增长,到2020年达到502亿美元。Apache软件基金会在2013年10月正式宣布了Hadoop 2的GA。除了可下载的社区版,Hadoop商业发行版提供商随后也为客户提供了新版本软件。在本次的TechTarget商业智能电子书当中,我们关注了Hadoop 2的新特性、对YARN的技术解析、Hadoop应用实践、常见问题及市场需求。
目录:
-
>新版发布,是时候重新认识Hadoop了
2013年10月,Hadoop发布了2.0版本。它不再依赖MapReduce的批处理,集群的扩展性和容错性也更高。Hadoop 2做了很多改进。比如加入了新的组件——YARN资源管理器,能够运行非MapReduce应用程序;加入了实时分析程序,在这一点上YARN也功不可没。现在,是时候重新考虑Hadoop了。
-
>Hadoop不会单独存在,需与EDW集成
组织大数据战略的重点将落在IT团队上,看他们如何部署可扩展的大数据系统,如何将系统与现存数据仓库、分析和运营环境集成。IT团队需要正确的技术,科学的管理流程,才能应对大数据时代的挑战。
-
>Hadoop最佳实践案例分享
Hadoop还处在初级阶段。Gualtieri表示最近的一项Forrester调查显示,只有16%的受访者正在使用Hadoop,很多人还只是在观望。总体来讲,Hadoop还只是一个“很潮的工具”,只有一部分先行者在使用。
-
>Hadoop 2常见问题汇总
和大多数软件的2.0版本一样,Apache Hadoop 2可能是这个开源分布式处理框架的一个重要飞跃。第一个版本的Hadoop的应用在不断地增长,这主要体现在两个方面:处理大量非结构化数据和作为信息的暂存区。但是,用户也发现了它的一些严重局限性。
-
>Hadoop 2:YARN能否改变游戏规则?
YARN的引入对Hadoop来说是具有革命性的,是可以改变游戏规则的。而且它已经从理论走向实践,而并不是未来的某种概念。事实上,Hadoop 2已经正式GA了,用户已经可以直接对YARN进行测试。
-
>Hadoop 2带来的大数据技术需求
Apache软件基金会最近发布了Hadoop 2,这个最新版本的开源平台具有高扩展性和分布式计算等特点。Hadoop 2包含了一些新功能,比如重新设计的资源管理器YARN。但Hadoop 2也让一直困扰大数据公司的一个问题重新引起关注:大数据人才的供不应求。