IBM在dashDB软件上增加了大规模并行处理和R语言支持——这是数据仓库数据库支持分布式云计算应用的重要举措。
IBM继续更新dashDB关系型数据仓库系统,努力进一步扩大IBM云数据库服务产品线。上周在波士顿举行的自助风格“新兵训练营”活动中,IBM展示了dashDB及其最新的技术改进——支持跨越集群系统的大规模并行处理(MPP)。
dashDB于去年秋季发布,它基于IBM旗舰产品DB2关系型数据库的BLU Acceleration内存计算技术,但同时也将IBM的Netezza柱状风格处理运用到云实施中。,该软件旨在与Amazon Redshift直接竞争,而后者是Amazon Web Services (AWS)在2012年底推向市场的云数据仓库服务。
与其他关系型数据库供应商类似,IBM也一直面临如何应对新型云产品的压力——特别来自云计算巨头AWS的产品。上个月,IBM发布了一个旨在加快查询处理速度和提高可伸缩性的MPP版dashDB。支持越来越流行的R分析编程语言也是IBM对dashDB的另一个最新改进。
在上周的活动中,一名来自大数据主战场、数字广告与营销行业的dashDB用户发言表示,R语言与云数据库的集成水平是一个很好的特性。
RSG Media是纽约一家专门为电视网络、出版商及其其他媒体开发软件的公司,它的解决方案架构师Shiv Sehgal说:“在我们看来,dashDB是一个柱状数据库,具有DB2特性,并支持R语言。”在访谈中,Sehgal指出,让精通R语言的内部用户和客户能够轻松使用这种语言,这是让业务用户在不需要IT帮助下就能够提出并解决分析问题的重要一步。
大数据、大魔法
dashDB的推出一直是循序渐进,但是IBM可能在管理云数据方面寄予该技术厚望。现在,有了MPP支持,dashDB可能成为DB2和Netezza数据仓库设备的用户通向云的道路。
IBM的dashDB产品经理John J. Park说:“MPP确实是我们的大魔法——有了它,你就可以根据数据仓库的需要增加节点。从策略而言,这是给我们的Netezza客户和DB2客户提供的云产品。”
Park指出,对某些用户来说,可能会存在这样一个潜在问题,即dashDB与Netezza的SQL编程语言实现的兼容性仍然在改进中。他估计dashDB目前优化的Netezza SQL功能比例为84%,IBM将在今年末将这个兼容性比例增加到90%以上。
在dashDB不断改进的同时,IBM上个月收购了位于加州的Compose。该公司前身是MongoHQ,专注于数据库即服务软件,自动化云中数据库的创建、管理和扩展。它已经支持大量的数据库,首先是MongoDB,后来继续增加了Elasticsearch、PostgreSQL、Redis等。
IBM收购Compose的目的之一是使开发者能够在云中快速创建数据库实例。Compose的技术与dashDB将通过IBM云平台即服务(PaaS)产品交付给开发者。而且,它们只是IBM不断扩大的云数据库服务产品线的一部分。IBM的云数据管理活动证明在去年初收购Cloudant公司之后成为最赚钱的业务,而后者是一家基于Apache CouchDB项目的软件开发商。Cloudant的NoSQL数据库专门解决关系型数据库在云环境中的可伸缩性和部署问题。
用户很多、数据很多
根据Sehgal的介绍,除了使用dashDB,RSG Media还使用Cloudant软件作为存储分析数据的数据池。他说:“它最重要的特性是可伸缩性。它可以应付大规模的用户。”
Sehgal及其支持的用户有许多不同类型的数据要处理。RSG的各种系统都会抓取Web日志和社交媒体数据,以及评分、访问信息及来自于信息服务和广告平台提供商(如Nielsen, Rentrak和Operative Media)的广告数据。
这些数据的其中一个应用是使有线电视网络能够预测节点决策的收益——例如,点播Billy Madison或Breaking Bad 的回报。这种节目决策以前一直由直观猜测得出,但是Sehgal指出,现在情况已经改变,因为决策者知道可以合适分析工具来测量投放一个节目的成本和通过有线电视费用或广告收益可能获得的回报。
Sehgal指出,混合使用NoSQL数据库和SQL数据仓库的IBM云服务产品将所有东西整合在一起。他说:“在我们的一些应用中,我们会使用线性广告销售数据、社交媒体数据及其各种来源的数据。而最终要将它们关联到一个特定节点的播放上,我们确实需要一种SQL方法,我们现在可以用一个产品来处理所有数据。”
根据预测公司Research and Markets在一月份发布的报告,全球基于云的数据管理服务市场预计年增长率将达到30.5%——从2014年35.1亿美元增长到2019年的132.8亿美元。
目前,大多数对大数据云的热捧都聚焦在非关系型模型的创业公司。但是,像IBM及其他成熟的数据库厂商,也并非坐以待毙。Oracle投入了大量的资源去开发自己的云数据库服务平台,其中包括云版本的NoSQL数据库软件;此外,最新版的Oracle Database 12c支持文档存储和基于SQL的JSON查询,这是一种广泛应用于移动、Web和云应用的格式。同时,在开发与Amazon Redshift竞争的柱状产品时,微软还开始推广DocumentDB,这是在其Azure云上运行的支持JSON的NoSQL软件。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。
相关推荐
-
Teradata推出数据仓库新架构IntelliFlex 提升海量并行处理性能
大数据分析服务供应商Teradata天睿公司日前宣布,将于 2016 年第三季度向大中华区市场推出下一代海量并行处理(MPP)架构:Teradata IntelliFlex。
-
作为云数据仓库 IBM dashDB到底好在哪儿?
IBM Bluemix平台提供了IBM dashDB, 这是一个数据仓库服务,它实现了IBM BLU Acceleration技术和嵌入式Netezza数据库内部分析技术。
-
【大数据分析产品探秘 】Oracle Advanced Analytics
Oracle Advanced Analytics是Oracle企业级数据库12c版本的一个数据分析产品可选项,为业务分析人员或其他没有专业分析技能的用户提供了一种易用的、可伸缩的方式来操作Oracle数据库中的大量数据。
-
数据可视化工具是否可容开源一席之位?
数据可视化工具是否也有开源的一席之地?有人认为,使用开源工具门槛太高,必须懂代码。但开源技术不断深入,越来越多的开源数据可视化工具越来越得心应手……