Hadoop中文指南
Apache Hadoop是一款免费的,基于Java的编程框架,专为分布式计算环境下的超大数据量并行处理而设计。Hadoop支持以容错方式扩展,可以从一台计算机扩展到数千台。这种扩展性意味着处理集群中的个体计算机可以是比较廉价的,而集群本身也很有弹性。有了Hadoop,应用程序可以在成千上万个处理节点上处理PB级的数据量。
目录:
-
>Hadoop发展现状
专家认为,Hadoop未来会出现更多的商业工具。与传统的IT开发维护人员相反,大多数工具将直接面向专门的Hadoop开发人员。
-
>理解Hadoop
虽然Hadoop伴随大数据一同火爆起来,但相信还是有许多用户对于它不甚了解。人们在谈论Hadoop的时候,常常把它当做单一产品来看待,但事实上它由多个不同的产品共同组成。
-
>Hadoop技巧
在了解Hadoop概念以及整个生态系统之后,我们需要着手去搭建一个Hadoop集群或者维护已有的Hadoop系统。本部分将告诉你作为一名Hadoop管理员,你需要了解什么。