听说早期采用者在Spark集群部署很容易？

日期： 2017-02-15 作者：Craig Stedman翻译：乔俊婧来源：TechTarget中国英文

Spark 大数据开源

软件公司Intuit和Novantas采用了特定的方法来部署他们的第一个Spark集群，限制了初始用户访问，并寻找更加坚实的业务用途。 Intuit公司已经建立了一对Spark集群，最初用于分析其网站的点击流记录以及其财务和会计软件的用户在线表单中输入的数据。但是Intuit的数据工程和分析团队副总裁Bill Loconzolo不打算使用开源数据处理引擎来处理事务。 Loconzolo说，Spark集群设置是实验性的，可供数据科学家在他的团队和一个单独的高级技术组使用。

直到2016年年底，他不打算开放系统实现更广泛的使用。这与他在构建以Hadoop为中心的大数据分析架构时所采取的方法保持一致……

我们一直都在努力坚持原创.......请不要一声不吭，就悄悄拿走。

我原创，你原创，我们的内容世界才会更加精彩！

【所有原创内容版权均属TechTarget，欢迎大家转发分享。但未经授权，严禁任何媒体（平面媒体、网络媒体、自媒体等）以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

取消回复

要发表评论，您必须先登录。

软件公司Intuit和Novantas采用了特定的方法来部署他们的第一个Spark集群，限制了初始用户访问，并寻找更加坚实的业务用途。

Intuit公司已经建立了一对Spark集群，最初用于分析其网站的点击流记录以及其财务和会计软件的用户在线表单中输入的数据。但是Intuit的数据工程和分析团队副总裁Bill Loconzolo不打算使用开源数据处理引擎来处理事务。

Loconzolo说，Spark集群设置是实验性的，可供数据科学家在他的团队和一个单独的高级技术组使用。直到2016年年底，他不打算开放系统实现更广泛的使用。

这与他在构建以Hadoop为中心的大数据分析架构时所采取的方法保持一致。 Loconzolo说，他试图在试用模式下运行Spark等新技术至少六个月，以确保他们准备好了。

他解释说：“这是我们从过去几年经历过的教训与其他大数据技术的结合。有时，早期暴露给用户是最糟糕的事情。”

纽约Novantas公司的技术部门首席技术官和工程总监Kaushik Deka说，他们的团队在2015年中期开始使用Hadoop和Spark时，采用了循序渐进的策略。

“我们一年前从来没有使用大数据平台，”Deka说，“我们完全拥有这样的技术，但它是一个组织内真正的文化变革。”Novantas还不得不建立Spark等工具的内部专业知识培训体系，主要是通过对现有工人进行再培训。

为了避免出现问题，该公司为大数据技术找到可靠的初始业务。使用其分析服务和软件的银行之一要求帮助组合不同的数据集，以支持预测建模如何个别客户如何响应市场营销。Spark是一个很好的选择，实现提取，转换和加载数据集成。

Gartner分析师Nick Heudecker说，咨询公司正在从客户那里获得大量关于Spark的查询。但是技术还在逐渐成熟，很多企业正在密切关注是否实现技术的部署。

作者

: Craig Stedman

翻译

: 乔俊婧

关注商务智能及虚拟化领域技术发展，专注网站内容策划、组稿和编辑，负责《数据价值》电子杂志的策划和撰稿。喜欢桌游，热爱音乐，吃货一枚。

相关推荐

Cloudera-Hortonworks合并或将减少Hadoop用户的选择

近日大数据领域两家顶级供应商达成交易协议，这可能会影响Hadoop和其他开源数据处理框架，并使大数据用户的技术 […]
采矿设备制造商利用BI on Hadoop来挖掘数据

如果大数据要取得巨大成功，则需要提供给更多的最终用户群组。但广泛使用的商业智能工具尚不能轻松分析最大的大数据， […]
新Qlik Sense功能可用于云计算、AI和大数据

一年前，Qlik公司公布其长期计划，即将高级云计算、AI和大数据功能添加到其自助式BI和数据可视化软件中。现在 […]
Cambridge Analytica秘密收集Facebook数据表明对道德数据挖掘的需求

当有关Cambridge Analytica公司秘密收集Facebook数据的消息传出时，这暴露了一个薄弱环节 […]