通过使用Spark进行大数据分析,Visa全资附属公司CardinalCommerce在整个组织内加大了对数据的需求,并让更多的内部用户参与分析过程。 关于大数据分析,用户的需求似乎总是“永无止境”。 这是CardinalCommerce在增强大数据分析能力的过程中得到的教训之一。该公司位于俄亥俄州,在2017年被Visa收购。
现在为在线商户提供服务,以确定使用其他支付平台(如PayPal)的购买者的身份。毋庸置疑,在线金融交易产生大量的数据,要从这些资源中获得更多的见解,这既是一项首要任务,也是一项核心挑战。 CardinalCommerce数据系统经理Christopher Baird表示……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
云中的Spark提高了可扩展性
因此,CardinalCommerce决定将Spark工作负载转移到云中的亚马逊弹性MapReduce(EMR)大数据服务。 这样做可以让团队更灵活地根据需要将Spark扩展到更大的工作负载。但是,这也造成了与公司大数据分析能力有关的其他问题。 定价很复杂,而且随着越来越多的团队成员加入Spark,让每个人都在同一页面上工作是一个挑战,Baird表示。由于每个新工作都有Spark集群,当工作完成后,Spark团队成员需要访问不断变化的Apache Zeppelin笔记本,该团队在EMR中使用EMR作为分析前端来分析Spark数据。 在此期间,Baird和他的团队希望在整个公司提供Spark的数据。这意味着向商家支持团队开放数据,以便向客户报告通过CardinalCommerce平台处理的交易。 Baird说:“我们的使命是让那些不在我们团队的人使用这个产品。” 这一努力使他的团队进入了Databricks的Spark平台。Baird说,他们做出了这一举动,部分原因是与EMR相比,Databricks提供了一个简化的用户界面,以及一个价格结构,使它更容易在需要时启动Spark集群,并提前知道成本。现在,任何有基本SQL技能的人都可以在Spark中查询数据。 Baird表示,Databricks比EMR更昂贵。但是,降低公司大数据分析能力的复杂性更加值得。大数据的成功引发了更多的需求
大数据的成功会产生更多用例的需求。一旦平台启动并运行,并为结构化报告和临时SQL查询提供一致的结果,Baird团队决定在Databricks上运行Tableau的数据可视化软件。Baird说,结果最初是可变的。 问题是人们可以访问大量的数据,并想要分析一切。但是,Tableau可能会扼杀这么大的数据量。毕竟可视化渲染缓慢,性能也比较差。 从那以后,这个团队一直在和用户合作,对他们带入可视化的数据进行更多的选择,但是在一定程度上,这种情况反映了自助服务分析的本质:一旦人们对数据有兴趣,他们通常需要更多的东西。 Baird说:“人们希望在很长的时间内完成可视化,覆盖大量的数据。但这不会是一个非常有效的查询。”相关推荐
-
数据分析是关于文化,而非技术
在新加坡,Tableau公司新数据准备工具发布会上,发言人表示,数据分析日益盛行的原因在于数据量呈指数级增长以 […]
-
攻关克难:大数据系统中的预测技术
大数据分析近年来逐渐成为预测分析技术的代名词。这使得越来越多的人以为,任何用于预测分析的系统都必定涉及大数据; […]
-
让工业无忧 天泽智云发布工业智能应用孵化器GenPro
工业世界看似离我们遥远,却与我们的福祉紧密相连。数据和智能分析赋予我们更加广阔的视野,能够以预测的方式管理和避免还未发生的问题。
-
大数据定义业务新规则,企业准备好了吗?
很多企业正在使用Hadoop和其他大数据技术,打破现有的业务模式,寻求新的业务策略、研发新的产品。