Infochimps近日推出1.1版本,号称Hadoop的Heroku(一种支持多语言的云应用开发平台)。新版本在很多地方有所突破,包括在不启用Hadoop的情况下很容易地创建流式工作流。
Infochimps是一家位于德克萨斯州奥斯丁的创业公司,今年二月从数据市场转型为大数据平台提供商。新版本Infochimps Platform的推出标志着Infochimps具备了处理流式数据Streaming Data的能力。
虽然Infochimps将其大数据平台称为“Hadoop的Heroku”,但实际上Hadoop并非Infochimps的重点。“人们遇到大数据问题时往往会想到Hadoop,”Infochimps的首席执行官Joe Kelly说道:“实际上,他们解决大数据问题的过程中也许根本用不到Hadoop。”
根据Infochimps的首席战略官Dhruv Bansal介绍:更常见的情况是,客户用Infochimps的平台开发程序处理分析数据,只有在需要批量分析海量数据时才会用到Hadoop。基于这种经验,我们的新版本关注的重点是对数据的实时处理功能(而不是Hadoop)。
新的流式分析引擎Data Delivery Service基于Apache Flume,Infochimps的用户可以用它来处理进入系统的数据。通过Wukong——一个基于Ruby的命令行界面,开发者可以编写大数据应用调用Data Delivery Service或Hadoop,使用的语法也非常简单,开发者无需学习MapReduce或者Flume。
尽管如此,Infochimps平台还是支持高级Hadoop语言如Hive和Pig。Wukong是一种互动方式,但不是唯一的。
Infochimps的新平台还向开发者提供Deploy Pack功能,开发者可以在本地编写和测试代码,只需一条命令就可以推送到云端环境。这要归功于Ironfan——Infocimps的基础设施自动化工具、数据库以及Hadoop集群等应用环境,这些都最大限度减轻了开发者的工作负荷。
Infochimps可以在客户自己的选择的云基础设施中运行,同时还与Rackspace合作,支持其OpenStack云计算平台。
不过,给Infochimps打上“Hadoop的Heroku”还有些为时过早,因为Infochimps还是需要高度人工干预的平台,虽然开发和部署相对简单,但用户还不能刷完信用卡后什么也不管;他们还需要与Infochimps紧密沟通设置程序。这部分是因为客户的水平层次不齐——数据科学家们需要磨练编程技巧,而开发者则需要学习如何写出更好的数据流。
“我们正处在一个过渡阶段(从完全DIY的平台到完全托管的服务)”Kelly表示,当这个过渡阶段完成后,用户将能够付费后马上使用服务。核心将会是用户常用的服务,90%的代码已经写好了,用户可以根据自己的需要调试其余10%的代码。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
数据分析是关于文化,而非技术
在新加坡,Tableau公司新数据准备工具发布会上,发言人表示,数据分析日益盛行的原因在于数据量呈指数级增长以 […]
-
攻关克难:大数据系统中的预测技术
大数据分析近年来逐渐成为预测分析技术的代名词。这使得越来越多的人以为,任何用于预测分析的系统都必定涉及大数据; […]
-
让工业无忧 天泽智云发布工业智能应用孵化器GenPro
工业世界看似离我们遥远,却与我们的福祉紧密相连。数据和智能分析赋予我们更加广阔的视野,能够以预测的方式管理和避免还未发生的问题。