大数据在改变数据环境的同时,也带来深刻的技术变革。大数据时代催生了NoSQL数据库、Hadoop分布式存储等新兴技术。新技术发展迅猛,业内对它的看法也各有不同、莫衷一是。有人认为RDBMS(关系型数据库管理系统)将死,NoSQL为王;有人讥讽Hadoop只是简单的存储系统;当然更多人还是持折衷的观点,即新老技术会共同发展、优势互补。但传统技术和新兴技术如何落地部署,还是一个难题。
在刚刚结束的IBM 2014 技术峰会上,TechTarget中国记者就这一问题采访了IBM数据库专家。
IBM中国开发中心信息管理总经理朱辉认为:“Hadoop和NoSQL是我们这个时代里重要的技术演变,是技术上的创新,我们需要这种创新。”朱辉在软件行业有近二十年的工作经验,长期致力于DB2和Informix数据库的软件研发工作。早在2008年,他就带领一个团队关注Hadoop的开源代码,那时离Hadoop项目确立还不到两年。
IBM中国开发中心信息管理总经理朱辉
朱辉讲到,从应用角度来讲,我们并不一定依赖于传统的数据,数据存储也不需要存储在硬盘上,我们有新的数据类型出现,很多非结构化数据、半结构化数据本身在它们的形态上发生着变化。随着数据量的增加以及运算量的增加,我们也不可能用Scale-up的架构来交付这么大量的计算。
大数据本质:企业主业务系统向外延伸
但同时朱辉也强调:“我们也不认为大数据仅仅等于Hadoop,大数据的时代只能有NoSQL。”他认为大数据最后其实是以前的或者将来的主业务系统以及主业务系统当中数据的一个往外延伸,这个延伸纳入了更多以前没有的非结构化、半结构化数据。企业关心的并不是数据,而是如何从数据中获取更大的价值。
有意思的是,企业领导者并不像我们想象的那样关心技术本身。CEO不会执着于关系型数据库、也不会执着于非关系型数据库,他只要业务价值。企业未来一定需要更多的数据源进行分析,未来的大数据平台一定会融合更多的技术类型。
“兼容并包”的混搭平台
IBM数据库和数据仓库业务副总裁Sean Poulley介绍到,企业正在利用新技术构建自己的数据架构,希望把所有的数据都放入其中,将数据分为以下五个区域:
- 数据摄取区域:把信息进行存储为了进行日后其他的交易。
- 准备和探索区域:存储你不知道如何处理和运用的数据。
- 传统的企业仓库和数据市场:用于数据分析。
- 流数据区域:这个数据量非常大,需要利用内存技术根据数据做出实时决策。
- 深度分析区域:用来承载深度的数据挖掘、预测分析、语义分析等应用。
IBM数据库和数据仓库业务副总裁Sean Poulley
在谈到未来大数据平台发展的时候,朱辉特别强调“混搭平台”,混搭(mix)也是此次IBM 技术峰会的关键词。朱辉认为:“大数据平台的将来会是一个关系型数据库,非关系型数据库混搭在一起,中间又有非常强大数据整合、数据清洗、数据生命周期管理的工具,包括ETL工具,混合在一块儿形成的混搭的群组。”
无疑,混搭平台彰显了IBM的技术优势。IBM既利用了开源Hadoop技术,提供大数据分析工具BigInsights,又有老牌关系型数据库DB2,还有中间数据的转换、移动、整合、清洗这一系列的工具。所以朱辉声称:“我们拥有最完整的平台,使得我们最适合去搭一个混搭的大数据平台。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
图形数据库的优点:更简单的数据建模和分析
作为咨询公司Booz Allen Hamilton首席数据科学家,Kirk Borne是从数据连接角度来看这个 […]
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
61% 的受访 CMO 和销售主管认为认知计算将颠覆市场营销 但他们准备好应对颠覆了吗?
市场营销和销售专家发现他们正在被日益庞大的数据淹没。尽管一项新的 IBM 调研发现,近64%的受访 CMO 和销售主管认为其行业在未来 3 年内将采用认知技术,但只有 24% 的人认为他们目前已经拥有实施这些技术的战略。
-
数据太多Hold不住?Hadoop数据治理来“救场”
当LinkedIn还是一家规模较小的公司时,它从社交网站上获取的数据是如何被格式化和结构化的,似乎并没有人关注。