Hadoop在过去几年引起很多关注,因为它具有处理海量各种数据的能力。但Hadoop的批处理存在问题,用户对此的吐槽也越来越多,说这一流程拖慢迭代分析的数据提取。不过,最近新面世的两个Hadoop分析工具则有望超越同行分析工具,加速处理速度。
Skytree将机器学习植入Hadoop集群
位于美国加州的Skytree公司上个月发布了最新版本的机器学习软件,它承诺可以改善对非结构化数据的提取、转换和加载(ETL)功能并且对安全工具进行了增强,旨在加强治理,并将这款软件更多地定位为企业级系统。
Skytree的机器学习软件可以操作各种来源的数据,但是Skytree却把这款产品作为Hadoop的自然搭配加以推出。Robert Dutcher 是Skytree的营销副总裁,他说公司采用这一策略是因为数据在Hadoop中是并行处理的。Hadoop使用批处理,跨许多节点分配任务,比起在一个单一节点上运行一项任务,这样的确可以提供不错的速度。这就让程序员可以对机器学习任务进行迭代。
新版软件主要关注的是在非结构化数据上做机器学习。这对于Skytree来说通常都是可行的,但是公司宣称此次更新通过把分配属性给数据点这一过程进一步自动化简化了分析之用的非结构化数据的准备。
本次更新包括了一个全新的管理控制台,它可以让管理员分配权限来定义什么样的数据源是可访问的,以及用户要如何对它们进行合并。
Arcadia将BI植入Hadoop
Arcadia Data公司算是BI领域的新人,一直低调运营,直至今年夏天,公司宣布推出新款Hadoop BI工具,旨在用来消除Hadoop和业务用户之间的中间系统。
该公司总部位于美国加州,通过使用一个系统实现上述目标,此系统可以随着时间的推移,学习用户的查询并且能够在Hadoop中为常用查询数据创建预定义形式。
该工具提供了一个可视化界面,它可以让业务用户浏览数据并将数据可视化。它的预置函数可以执行客户细分,购买路径分析等任务。
虽然Hadoop历来就是一个批处理引擎,但它的速度也是有限制的,Arcadia的高管说他们工具的速度要优于竞争对手(如Tableau Software和MicroStrategy Inc.)的BI工具,这是因为任务是在Hadoop本地运行的,而不经过中间系统。
BI-on-Hadoop根据该软件安装的每个节点、每年进行收费。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国