CardinalCommerce如何满足用户日益增长的数据分析需求?

日期: 2017-12-12 作者:Ed Burns翻译:乔俊婧 来源:TechTarget中国 英文

通过使用Spark进行大数据分析,Visa全资附属公司CardinalCommerce在整个组织内加大了对数据的需求,并让更多的内部用户参与分析过程。 关于大数据分析,用户的需求似乎总是“永无止境”。 这是CardinalCommerce在增强大数据分析能力的过程中得到的教训之一。该公司位于俄亥俄州,在2017年被Visa收购。

现在为在线商户提供服务,以确定使用其他支付平台(如PayPal)的购买者的身份。毋庸置疑,在线金融交易产生大量的数据,要从这些资源中获得更多的见解,这既是一项首要任务,也是一项核心挑战。 CardinalCommerce数据系统经理Christopher Baird表示……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

通过使用Spark进行大数据分析,Visa全资附属公司CardinalCommerce在整个组织内加大了对数据的需求,并让更多的内部用户参与分析过程。 关于大数据分析,用户的需求似乎总是“永无止境”。 这是CardinalCommerce在增强大数据分析能力的过程中得到的教训之一。该公司位于俄亥俄州,在2017年被Visa收购。现在为在线商户提供服务,以确定使用其他支付平台(如PayPal)的购买者的身份。毋庸置疑,在线金融交易产生大量的数据,要从这些资源中获得更多的见解,这既是一项首要任务,也是一项核心挑战。 CardinalCommerce数据系统经理Christopher Baird表示:“我们每天都进行大量的交易。我们收集了指标数据,记录数据等等,我们必须把它带回到报告环境。” 几年前,随着Apache Spark变得越来越重要,Baird的团队成员在办公场所建立了一个小型集群,运行Spark进行基本数据处理任务,例如从CardinalCommerce的网络支付处理平台返回数据以完成报告。 他们主要使用Microsoft SQL Server Reporting Services软件来跟踪XML消息格式中的数据质量问题,平台使用该格式对在线购物者进行身份验证。他们得到了不错的结果,但问题是集群太小,无法扩展到更大的用例。 Baird说:“显而易见,我们掌握的数据都不够用。”

云中的Spark提高了可扩展性

因此,CardinalCommerce决定将Spark工作负载转移到云中的亚马逊弹性MapReduce(EMR)大数据服务。 这样做可以让团队更灵活地根据需要将Spark扩展到更大的工作负载。但是,这也造成了与公司大数据分析能力有关的其他问题。 定价很复杂,而且随着越来越多的团队成员加入Spark,让每个人都在同一页面上工作是一个挑战,Baird表示。由于每个新工作都有Spark集群,当工作完成后,Spark团队成员需要访问不断变化的Apache Zeppelin笔记本,该团队在EMR中使用EMR作为分析前端来分析Spark数据。 在此期间,Baird和他的团队希望在整个公司提供Spark的数据。这意味着向商家支持团队开放数据,以便向客户报告通过CardinalCommerce平台处理的交易。 Baird说:“我们的使命是让那些不在我们团队的人使用这个产品。” 这一努力使他的团队进入了Databricks的Spark平台。Baird说,他们做出了这一举动,部分原因是与EMR相比,Databricks提供了一个简化的用户界面,以及一个价格结构,使它更容易在需要时启动Spark集群,并提前知道成本。现在,任何有基本SQL技能的人都可以在Spark中查询数据。 Baird表示,Databricks比EMR更昂贵。但是,降低公司大数据分析能力的复杂性更加值得。

大数据的成功引发了更多的需求

大数据的成功会产生更多用例的需求。一旦平台启动并运行,并为结构化报告和临时SQL查询提供一致的结果,Baird团队决定在Databricks上运行Tableau的数据可视化软件。Baird说,结果最初是可变的。 问题是人们可以访问大量的数据,并想要分析一切。但是,Tableau可能会扼杀这么大的数据量。毕竟可视化渲染缓慢,性能也比较差。 从那以后,这个团队一直在和用户合作,对他们带入可视化的数据进行更多的选择,但是在一定程度上,这种情况反映了自助服务分析的本质:一旦人们对数据有兴趣,他们通常需要更多的东西。 Baird说:“人们希望在很长的时间内完成可视化,覆盖大量的数据。但这不会是一个非常有效的查询。”

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

翻译

乔俊婧
乔俊婧

关注商务智能及虚拟化领域技术发展,专注网站内容策划、组稿和编辑, 负责《数据价值》电子杂志的策划和撰稿。喜欢桌游,热爱音乐,吃货一枚。

相关推荐