企业的数据科学团队如何挖掘数据价值

日期: 2017-03-23 作者:Ed Burns翻译:乔俊婧 来源:TechTarget中国 英文

单纯地雇用数据科学家并不意味着企业能够充分利用数据科学带来的优势。来看看以下几家企业如何通过数据科学团队让数据价值最大化。

数据科学看上去是一项很“高大上”的工作,企业正在利用数据科学提取巨大的运营价值。

福特汽车公司全球分析总监Alan Jacobson在Gartner数据分析峰会上表示,数据科学的重点为公司带来了巨大的收益。

从2015年开始,该公司聘请了一位首席数据科学官,并从业务部门中抽取了大约200位数据分析师,形成了一个集中的数据科学团队。如今,该团队在每一个业务领域都发挥着咨询、协商的作用。这意味着分析师正在从汽车生产问题到支持使用福特汽车的NASCAR赛车队开展工作。

数据科学提升运营效率

数据科学的最大价值是提高制造效率。 Jacobson分享了负责制造的总监如何获得车辆生产信息清单。确定生产顺序是一个手动的过程,管理人员凭借经验整理生产计划。但没有人可以跟踪所有涉及的变量,例如某些车辆可能需要的专用工具,以及生产某些汽车所需的时间差异。这延迟了新车的交付时间,也给公司带来了损失。

Jacobson和他的团队了解到这些问题后,为加拿大的生产流程制定了一个算法。该算法不仅考虑了生产每个车辆的所有变量,该算法提供了一个进行了优化,保持车辆沿最小重组生产线移动的生产计划。Jacobson说,构建算法需要七天时间,另外还需要七天将算法部署到生产环境中进行测试。如今,生产设备每天都可以达到目标,节省了公司的资金。

数据科学助力产品开发

对于亚特兰大征信局Equifax来说,数据科学的价值来自于改进其主要产品之一:信用评分。

Equifax数据和分析高级副总裁Peter Maynard在接受采访时表示,信用评分在传统意义上是消费者信用状况的一个快照。使用更多的趋势和历史数据可以让分数更有说服力,让贷款人看到消费者随着时间的推移如何使用信贷。但Maynard认为,信用报告机构传统上并没有使用趋势数据,因为这样做会增加一些复杂度。

像神经网络这样的机器学习模型可以理解这种复杂性,但是由于监管的原因,报告机构需要能够为他们提供的分数提供简单的理由。通常征信局无法为机器学习模型给出的答案做出更好的解释,所以像Equifax这样的征信局一般不会选择机器学习模型。

Maynard要求团队成员不仅仅是开发一个评估历史信用数据的神经网络,而且还为决策提供了原因代码,这些事机器学习做不到的。Maynard表示,这一变化以数据科学为主导,大大改进了公司的主要产品。

“通过分析实现更好的决策,这是金融业十年来一直在等待的事情。”他说,“这也是快照和数字视频之间的区别。”

重视数据质量

当然,要想充分挖掘数据价值,并不是简单地要求数据科学家解决某些问题摆在面前,要求他解决这些问题。FICO首席分析官Scott Zoldi表示,实现数据科学的价值,数据质量也是非常关键的一环。

Zoldi说,软件供应商使用人工智能和机器学习来开发信用评分模型及其销售的软件。但他表示,这些模型中使用的数据往往与模型本身的成功有关。

例如,他指出机器学习模型可以很好地发现变量和发现趋势之间的相关性。但是,相关性并不等于因果关系。过时的数据或从不同来源组合的数据可以呈现任何数量的关系,这并不意味着可以带来任何商业价值。

Zoldi说,这不是所有新的数据科学家都能理解的,他们中的许多人将针对任何可用的数据进行复杂的分析,相信该模型将弥补数据中的任何缺陷。但Zoldi表示,公司应该花费更多的精力来获取高质量的数据,而不是扩大他们的数据科学团队才能做到这一点。

“在我的职业生涯中,我已经学会了尊重这一点,”他说,“如果你不能得出因果关系,至少要理解并确保模型的建议是可信的。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

翻译

乔俊婧
乔俊婧

关注商务智能及虚拟化领域技术发展,专注网站内容策划、组稿和编辑, 负责《数据价值》电子杂志的策划和撰稿。喜欢桌游,热爱音乐,吃货一枚。

相关推荐