近日,美国大数据初创公司GraphLab宣称,公司引进了一种能够帮助扩展企业级机器学习技术的新的分析平台。
公司创始人兼CEO Carlos Guestrin表示,公司希望能够把多种类型的数据存储在一个分析平台上,简化大数据处理流程。
软件供应商Paradigm4本月的调研结果也显示,在100名接受调研的数据科学家中,71%的人都认为大数据的主要挑战来自于数据类型,而非数据规模。
新发布的GraphLab Create可应用于多数主流的数据存储,包括Hadoop集群、亚马逊Redshift数据库、NoSQL数据库和基于桌面的数据库。它提供API(应用程序编程接口),包括一些预置的算法,比如推荐引擎等。用户可以用Python写任务。具体的价格信息公司会在今年年底发布。
类似的产品其实已经在市场上出现,比如Apache Spark就是其中之一,它为多种类型的数据存储提供统一界面。大数据机器学习供应商Skytree也提供类似的产品。不过,Guestrin回应道,比之于开源Spark,Create更成熟也更稳定。和Skytree相比,Create能提供更多个性化的功能。
Guestrin表示,平台使用的Python语言,之所以没有选择R语言或其他编程语言,是因为Python能够实现机器学习技术的纵向扩展,更好地满足企业的需求。
从市场角度来看,用户确实有使用统一大数据平台的需求,而Create恰能满足这种需求。但最终能否占领这一细分市场,还要看Create在与Spark等同类产品的竞争中能否胜出。现在竞争的焦点在于争夺客户。
Create已经经过了Cloudera Hadoop发行版的认证,并且打包到了Pivotal Hadoop发行版中。Spark也打包到了上述两家厂商的Hadoop发行版中,另外还有Hortonworks、IBM和MapR。目前,GraphLab有100多个测试用户,包括美国房产网站Zillow,美国流媒体音乐服务商潘多拉(Pandora)和石油天然气厂商埃克森美孚。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
开源大数据平台实施的难点
开源大数据技术是一种新一代技术和构架,它以成本较低、以快速的采集、处理和分析技术,从各种超大规模的数据中提取价值。
-
开源领跑大数据?淡定!这不是快跑,而是征途
大数据的开源技术一直都受到市场的青睐,很多公司采用Hadoop、HBase、MongoDB、Storm等开源技术,期望能够更快速实现大数据的商业价值,提升业务利润。
-
【大数据分析工具采购指南】你弄明白要分析什么数据了吗?
估计大家听大数据听得太多,耳朵都快起茧了吧?谁要IT界几年才憋出一个流行词,自然大家只要提到数据,都说“大”。但你弄明白要分析什么数据了吗?
-
青云QingCloud Spark服务正式上线
企业级基础云服务商青云QingCloud日前宣布,Spark服务作为QingCloud大数据基础平台的重要组件现已正式上线。