是时候讨论一下数据架构了!也许并行架构、NoSQL、NewSQL、Hadoop、SQL on Hadoop、列式关系型数据库管理系统扩展等等层出不穷的新架构已经让你眼花缭乱了。今天我们共同关注一下企业如何选择适合自己的数据架构,
TechTarget记者就此问题采访了分析公司Monash Research总裁、资深数据库管理系统行业观察者Curt Monash。本文是系列文章的第二篇,第一篇为《专访:并行计算是新兴数据架构的核心》。
TechTarget:所谓“以史为鉴、可以知兴替”,那么关系型数据库的发展历程能够为我们提供哪些启示?
Monash:回想上个世纪八十年代,那时有很多种数据库管理系统(下文简称DBMS),每种产品都有自己的数据操纵语言。后来,SQL胜出了,关系型DBMS被大家广泛认可。那之后,所有的DBMS都使用类似的语言和编程模型。
大浪淘沙,这期间存活下来的大概有五到十个主要的厂商:Oracle、DB2、微软SQL Server 、Progress OpenEdge、Teradata和Sybase IQ。这种几大厂商分而治之的局面持续了一段时间。
随着技术的发展和客户需求的改变,一种新的DBMS走进人们的视野,它成本更低、而且有更好的扩展性。
在某种程度上来说,今天的Oracle DBMS相当于几十年前的IBM大型机操作系统。Oracle DBMS在大企业中有着广泛的应用,它性能稳定,但比较老旧,而且价格昂贵,安装和维护都比较麻烦。在数据库市场,Oracle有着很高的市场份额,所以它高昂的价格也就为其他厂商提供了保护伞。
事实上,企业在DBMS上投入了很多人力物力,因为利益关系,很多人反对去掉这些数据库,甚至支持这种高昂的投入。我们看到,之前投入在IBM大型机系统上的东西今天又都投入到Oracle上。
不过,NoSQL、Hadoop和NewSQL等新秀不断向DBMS市场发起冲击,它们在特定的工作负载方面有着卓越的表现。这种最佳产品的组合,发展迅猛的公司会在一段时间内迎来繁荣。
TechTarget:既然有这么多新技术,那么企业该如何选择呢?CIO可能面临这样的问题,就是有人想要用Spark,有人中意Impala,有人认为使用PostgreSQL会比较好……这种情况下该如何权衡呢?
Monash:如果不了解自己的工作负载,很难在做出正确的选择。就像如果一个人不知道自己要干什么,那他怎么选择该使用大卡车还是小汽车还是自行车呢?
技术的选择取决于很多因素。有些工作负载需要SQL和NoSQL技术高度集成,这样比单纯扩展SQL关系型数据库要好的多。而对于一些工作负载来说,SQL-on-Hadoop更合适。也有不少企业就喜欢用开源的产品,而那些开源、scale out的技术本身就适合Hadoop。
在选择技术类型之前,首先要考虑数据库的大小,其次要考虑对工作负载的吞吐量,然后是并发性——即你可能同时在数据库运行多少查询,多少人可能同时使用一个系统。同时还要考虑除了SQL查询之外,还要做什么,是不是有复杂的SQL查询等等。说起来要考虑的因素很多,要结合自己的情况处理。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
图形数据库的优点:更简单的数据建模和分析
作为咨询公司Booz Allen Hamilton首席数据科学家,Kirk Borne是从数据连接角度来看这个 […]
-
数据库性能软件究竟是企业刚需还是鸡肋?
确保数据库系统高效运行是现代IT管理的核心需求。有一些专用工具可以帮助数据库管理员和IT专业人士监控、管理数据库并优化数据库及其访问应用的性能。
-
Oracle NoSQL:一个神秘莫测的矛盾体?
Oracle自己的销售团队可能也不会提及Oracle的NoSQL产品。由于这样或那样的原因,Oracle NoSQL看起来似乎是一个矛盾体。
-
NoSQL+商务智能将是一种怎样的体验?
在过去几年里,有各种关于“NoSQL商务智能”的短评和出版物。然而,我一直没搞清楚它吸引人关注的到底是什么,我的疑问可以归结为“你想从中得到什么东西?”