英特尔的Hadoop愿景

日期: 2012-12-03 作者:孙瑞 来源:TechTarget中国

在今年的七月份,英特尔公司对外发布了自己的Hadoop商业发行版(Apache Hadoop Distribution)。对于以硬件芯片为主要业务的英特尔来说,这一举动的确有一些让人摸不着头脑的感觉。首先,Apache Hadoop是一套开源软件技术,与英特尔的传统硬件技术基本属于平行,这的确并不是英特尔所擅长的领域;其次,Hadoop发行版提供商Cloudera、Hortonworks以及MapR等公司同英特尔相比, 在技术团队储备、支持与实施经验以及合作伙伴等各个方面都存在一定优势。在社交媒体平台中,也不乏用户对于英特尔Hadoop的一些质疑之声。英特尔公司的Hadoop之路是否是一个正确的选择?他们的机会又在哪?英特尔亚太研发集团总经理何京翔在“HBTC 2012”大会上一一解答了这些疑问。

英特尔的Hadoop愿景

英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理 何京翔博士(右)英特尔亚太研发有限公司数据中心软件部 英特尔Hadoop发行版研发团经经理 孙元浩(左)

  为何选择Hadoop这条路?

  虽然Hadoop并不是大数据代名词,但当提到大数据生态系统的时候,人们还是会首先想到Apache Hadoop。同大数据类似,Hadoop是一整套技术与产品的组合,来源于Apache软件基金会的开源项目,可以为企业提供一个可靠的、可扩展的分布式计算环境。它包括了MapReduce计算框架、HDFS存储系统、HBase数据库以及Hive等工具,能够对非结构化数据进行有效的操作与处理。这也是Hadoop在大数据时代独领风骚的重要原因,因此许多厂商都希望通过Hadoop来抓住大数据所带来的机遇。

  然而,Hadoop因其技术的复杂程度使得无论是厂商还是终端用户都不敢轻易触碰,特别是厂商方面,许多传统的企业级IT厂商,如IBM、Oracle、微软都选择与合作伙伴共同推出Hadoop服务,既有平台形式(PaaS)、也有工具形式(Connector)。对于这种现状,英特尔有着不同的理解。何京翔表示:“现在的英特尔已经不再是一个仅仅生成芯片的硬件制造商,而是希望通过计算技术来改善人们的生活,这种技术包括硬件,也包括软件。”

  毫无疑问,何京翔所说的软件技术中,Hadoop就是非常重要的一环。英特尔已经看到企业用户对于大数据的需求在不断增长,特别是在中国。目前国内的Hadoop应用大多数集中在互联网这一以技术驱动的行业当中,而其他一些大型行业中,没有专门的技术团队可以担负起维护开源Hadoop集群的重任。除Oracle、IBM这样的厂商会提供一些异常昂贵的Hadoop服务之外,像Cloudera、Hortonworks这样的顶级Hadoop提供商在国内的投入力度却非常小。这虽然让人有些意外,但国内用户的确是需要一个“靠谱的”Hadoop解决方案,来切实解决大数据问题。

  何京翔表示,英特尔的Hadoop平台将重点关注三个方面,即易用性、即时性以及高效性。英特尔公司的愿景就是要把Hadoop做成下一代做数据分析的平台,何京翔也介绍了一些电信、智慧城市建设当中的Hadoop应用案例,如基于终端设备的用户行为分析、智能交通控制等。

  英特尔的Hadoop发行版

  何京翔介绍,英特尔的Hadoop发行版最先在国内发布并投入使用,同时也与一些客户进行了深入的合作。英特尔Hadoop发行版包含了所有的分析、集成以及开发组件,并对不同组合之间进行了更加深入的优化。此外,还添加了英特尔Hadoop管理器(Hadoop Manager),从安装、部署到配置与监控,可以提供对平台的全方位管理。

英特尔Hadoop发行版

英特尔Hadoop发行版

  针对具体的优化,何京翔介绍,主要集中在HDFS、Hive以及Hbase等组件。还添加了针对数据分析、挖掘的R语言支持,为统计人员提供更好的易用性。另外目前还在研发中的“Project Panthera”是一项开源技术,能够在Hadoop基础之上提供更高级的分析功能。何京翔介绍,这个项目将是以英特尔与开源社区合作作为主导的。

  未来的英特尔Hadoop发行版将能够提供与现有基础架构更好的集成,包括针对SQL的优化功能,还会进一步对HBase的文档存储与查询性能进行优化。真正实现易用性、即时性以及高效性的三大目标。

  据了解,目前的英特尔Hadoop发行版为用户提供了“软件许可+15%服务费”以及“订阅”两种收费方式,后者主要在美国等地区使用,而根据国内用户的购买习惯,大多数国内用户偏向于使用第一种模式。对于具体的价格信息,英特尔方面并未透露,不过有一个好的消息是,英特尔近期发布了其Hadoop平台的免费版,其中对部分功能进行了简化,并对存储数据量和节点规模进行了限制。何京翔介绍,免费版的Hadoop平台包括了主要的功能,用户可以免费进行下载试用,还可以通过社区的方式将问题反馈给英特尔,以便未来对该产品进行功能改进。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

孙瑞
孙瑞

相关推荐