SQL-on-Hadoop:Hadoop上第一个纯粹的通用型数据库

日期: 2014-12-01 作者:Jack Vaughan翻译:陈洪钰 来源:TechTarget中国 英文

数据库领域初创公司Splice Machine上周宣布,发布SQL-on-Hadoop数据库,官方宣称它可以在HDFS(Hadoop分布式文件系统)中运行SQL查询和ACID事务。

Splice Machine公司总部位于旧金山,去年五月推出该产品的公测版,此次推出1.0版本。作为产品的一部分,Splice Machine部署了修改版的开源Apache Derby,它是轻量级的基于Java的关系型数据库,安装在HDFS或HBase NoSQL数据库上。Derby支持SQL能力,HBase支持Hadoop集群中跨服务器的数据库表的扩展。

Splice Machine联合创始人兼CEO Monte Zweben表示,公司致力于提供通用平台,处理多种事务和分析程序,而不是像其他初创数据库供应商一样专注于某个数据处理领域。在Hadoop上运行软件,可以以低成本进行扩展,对SQL和ACID ——原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)——的支持符合大多数企业使用关系型数据库的习惯。

Hadoop+RDBMS

市场服务咨询公司Harte Hanks产品创新管理总监Rob Fuller认为,通用数据库即意味着混合数据库,既能满足交易性需求,又能满足分析性需求。Fuller使用过Splice Machine软件的公测版,他很看好这种将Hadoop和关系型数据库结合起来的形式。

Fuller表示:“在Hadoop上实现实时事务处理是现在的技术热点。Harte Hanks此前部署了Oracle RAC集群,但还是在寻找更好的分析性能和扩展性能。在测试阶段,Splice Machine软件在处理超过8亿行数据的表查询中表现良好,其查询速度是Oracle RAC数据库的三到七倍。并且,用scale-out的形式在Hadoop集群中增加更多的服务器,会收货更好的性能。

Hadoop上第一个纯粹的通用型数据库

IDC分析师Carl Olofson认为,Splice Machine想要展示给人们的是支持交易型查询的数据仓库平台。他认为Hadoop数据库架构的扩展性为它增色不少。开源软件的采用和对商业集群的支持让它在成本上颇具优势。

咨询集团Bloor首席分析师Robin Bloor认为,Splice Machine的方法可能最接近于在Hadoop上运行Oracle数据库。Bloor评价该产品为“Hadoop上第一个纯粹的通用型数据库”,同时它也高度评价了Splice Machine为优化Berby数据库做出的贡献。

从某种程度上来讲,Splice Machine数据库代表这Derby系统的回归。Derby在上世纪九十年代产生于Cloudscape公司,之后该公司被Informix收购,Informix又在2001年被IBM收购。IBM将Derby技术开源,将它贡献给Apache软件基金会。

Splice Machine目前提供两个版本:免费初创公司版本和企业版。初创公司版本针对成立不满五年,年收入在1千万美元一下的公司。企业版包括免费开发和测试节点许可证和付费许可证。许可证价格每年每节点5千美元起,包含所有支持服务。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Jack Vaughan
Jack Vaughan

TechTarget新闻记者和网站编辑,主要关注数据管理领域的技术趋势和动态。

相关推荐