Hadoop发行版供应商Cloudera公布了最新业绩标准,意在表明其Impala MPP查询引擎已经成熟。此举显然指向竞争对手SQL引擎。
Impala是Cloudera在Hadoop平台实现SQL分析的首选,像其他Apache Hadoop数据管理工具一样,近几年发展很快。不过人们关心的还是Impala什么时候才能真正与已有的SQL分析产品相抗衡。
作为回应,Cloudera测试了Impala的性能。它在同样的硬件上安装Impala和来自匿名运营商的某个分析型数据库,在二者上同时运行20个查询,这些查询都是基于行业标准基准测试TPC-DS的。
结果是,这20个查询中,有17个都是Impala优于该分析型数据库的,而且平均来算,要比分析型数据库快两倍。
Cloudera Impala基础架构工程师Marcel Kornacker表示:“这次测试显示了Impala卓越的可扩展性和支持真正的交互与多用户工作负载的能力。”
Impala能有这么快的处理速度,要归功于它的基础架构。其基础架构减少了数据转换和数据移动。
Kornacker表示:“Impala是运行在Hadoop上的,处理数据时,不用把数据从Hadoop迁移到存储引擎上去。”
Impala的目标是覆盖包括惠普Vertica和IBM Netezza在内的分析型数据库使用的所有SQL功能。虽然上述测试中Impala处理速度的胜出并不足以改变用户的选择,但它显示了Impala的发展潜力,也许有一天,用户会转向Hadoop系统。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
SQL-on-Hadoop:Hadoop上第一个纯粹的通用型数据库
Bloor评价该产品为“Hadoop上第一个纯粹的通用型数据库”,同时它也高度评价了Splice Machine为优化Berby数据库做出的贡献。
-
用户:我为什么依然选择SQL数据库
就算NoSQL数据库扩展性真的优于RDBMS,然而现实世界的事实是,99%的应用程序都不会变更数据模型。
-
数据库市场冷观察:从SQL到NoSQL
随着技术的发展和客户需求的改变,一种新的DBMS走进人们的视野,它成本更低、而且有更好的扩展性。
-
Hadoop峰会群雄逐鹿 SQL和安全是发展的重心
今年的Hadoop峰会已于6月3日到5日在美国加州的圣何塞举行,共有3200多名开发者、数据科学家、数据架构师和解决方案供应商参会。主办方为Hortonworks和Yahoo!