如何让你的数据科学项目物尽其用

日期: 2015-11-11 作者:Ed Burns翻译:张亮亮 来源:TechTarget中国 英文

数据科学在运用得当的情况下能够给企业带来巨大的竞争优势。但在有效分析之路上存在着诸多陷阱。对于如何实施一项数据科学计划来确保它们交付的东西产生了预期的积极影响,企业是需要有策略的。 在线媒体公司Upworthy的分析主管Daniel Mintz说:“通常,最难测量的东西是最重要的。

” 人如其所测 Upworthy是一家坐落在纽约的媒体公司,它曾经想要测量人们对于内容的参与度并以此来查看哪些内容表现最好。例如页面浏览量和分享量都是衡量成功与否的典型Web标准,但它们并不能真正起到衡量的作用。这是因为虽然某人登上了某个页面并转发了此链接,但这并不意味着此人就真的有阅读过这篇文章。 因此,要获取参与……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

数据科学在运用得当的情况下能够给企业带来巨大的竞争优势。但在有效分析之路上存在着诸多陷阱。对于如何实施一项数据科学计划来确保它们交付的东西产生了预期的积极影响,企业是需要有策略的。

在线媒体公司Upworthy的分析主管Daniel Mintz说:“通常,最难测量的东西是最重要的。”

人如其所测

Upworthy是一家坐落在纽约的媒体公司,它曾经想要测量人们对于内容的参与度并以此来查看哪些内容表现最好。例如页面浏览量和分享量都是衡量成功与否的典型Web标准,但它们并不能真正起到衡量的作用。这是因为虽然某人登上了某个页面并转发了此链接,但这并不意味着此人就真的有阅读过这篇文章。

因此,要获取参与度的测量结果,Mintz和他的团队必须开发自己的指标。他说现在他们正着眼于通过一个由页面停留时间、鼠标滚动和点击时间组成的复杂混合指标来衡量读者对他们内容的参与度,并了解什么类型的内容表现最佳。

Mintz说这是一个具有挑战的过程,但是这也是数据科学的意义所在。如果最好的见解出自最容易回答的问题,那么数据科学家就没有用武之地了。他说尽管困难重重,企业也需要考虑对他们的操作和寻找测量方法而言,什么才是最重要的。“我们必须克服‘不(难)测量的东西’,”他说。

眼光放长远

通常,专业分析人士提倡以快制胜,尤其是在遇到新的数据科学项目的时候。这种方法有助于带来业务并说服企业数据驱动决策的价值。但是此处的陷阱在于以快制胜的方法会作为数据科学模型变得根深蒂固。

Silvanus Lee是拼车公司Uber的产品分析主管,他表示抵制以快制胜这种方法是重要。他和他的团队一直试图在短期收益的渴望和需要一段时间才能获得回报的长期项目需求之间进行平衡,但这最终可能会改变现状。

例如,他谈及目前Uber是如何开发一项服务来允许乘客进行拼车的。这可以让司机的出行效率最大化还能降低乘客的成本,而且同时还能增加Uber网络上总的出行数量。这家公司仍然致力于研究乘客拼车以及将乘客与司机进行匹配的算法。这项服务目前为止还没有提供任何有形的投资回报,但Uber认为它最终会成为一项受欢迎的服务,因此Lee和他的团队仍然继续为之努力。

“眼光要放长远一点,短视对业务无益,”Lee说。

最终,某样事物是否值得经年累月地去追求可能还有待评判。他谈了Facebook首次推出动态消息功能的曲折故事,目前这一功能已成为所有用户的标准视图,并且用户在这上面花费的时间也是最多的,它可谓是成功的典范。如果公司只衡量短期回报,那么Facebook可能就会取消动态消息的功能。但是公司明白这会开启巨大的广告空间,而且最终会被用户接受,因此才会如此坚定笃行。如今,很难想象如果没有动态消息公司将如何盈利。

“数据科学不只是统计数据,”Lee说,“它的统计数据包含了很多评判。数据科学将数据驱动的声音引上台面,但它并不能在一场对话中起到主导作用。”

针对具体的业务问题

对于Boston Red Sox来说,最大的业务问题之一就是定错票价。几年前当所有门票都有相同面值的时候,高关注度的比赛通常会在二级市场上有很高的溢价,而球迷普遍认为非主要比赛收费过高。Tim Zue是Red Sox的业务部门副总裁,他在一场展示中说:“我们知道这一点,但是我们并没有将其量化。”

在2011年,该团队开始着手建立一个动态定价模型,此模型可以将定价和需求进行匹配。StubHub.com是一家领先的二级票证销售商,Zue和它的同事从这里收集了六年的数据,而且他们找到了一种模式,这种模式可以预测特定赛事的未来需求。他们发现有赛事举办的日子和月份对于需求的预测非常靠谱。例如,可以看到高需求量发生在七月的周末,而四月工作日的需求则较低。该团队现在也是以这些信息作为定价的基础。

Zue说由于门票的定价低于需求水平而失去潜在的二级市场收入,这是一个主要的问题,但是当工作人员有了数据,至于如何通过动态定价来解决这一问题就十分明了。这所有的一切都起始于数据科学项目对业务的了解和存在改进的空间。

“挑战在于‘那该如何办’,”Zue说,“你要如何使用数据进行决策来助力你的业务?你必须用你的数据来做这些决策。”

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

翻译

张亮亮
张亮亮

TechTarget特邀编辑。毕业于北京邮电大学网络技术研究院。熟悉软件开发测试的各个环节和流程,对操作系统,数据库,计算机网络等有较为深入的理解。现就职于中国电子科技集团公司下属研究所,从事软件研发工作。热衷于英文的学习交流,平时喜欢户外运动,音乐,电影。

相关推荐