追求数据产品开发的速成方案 当心欲速则不达

日期: 2016-10-09 作者:Ed Burns翻译:杨宏玉 来源:TechTarget中国 英文

分析团队通常热衷于追求速成方案,以此来证明分析的价值。但是有关专家表示,这不应该成为数据产品开发的指导性策略。 在过去,尤其是一个新组建的,渴望证明其价值的分析团队,都倾向于快速的取得成果。通过快速交付数据产品或报告,分析团队可以将高管和业务合作伙伴召集到一起,互相交流意见,制定未来的支持计划,不过一般来说,首次交付的产品都不会太完美。

但是,并不是每个人都认同这个建议。 最近在波士顿举办的 Big Data Innovation Summit上,Facebook负责消息业务和平台分析的主管Ahmad Anvari说道:“速成方案并不是长久之计。在我的职业生涯中见过很多类似的案例。” 在出报表……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

分析团队通常热衷于追求速成方案,以此来证明分析的价值。但是有关专家表示,这不应该成为数据产品开发的指导性策略。

在过去,尤其是一个新组建的,渴望证明其价值的分析团队,都倾向于快速的取得成果。通过快速交付数据产品或报告,分析团队可以将高管和业务合作伙伴召集到一起,互相交流意见,制定未来的支持计划,不过一般来说,首次交付的产品都不会太完美。

但是,并不是每个人都认同这个建议。

最近在波士顿举办的 Big Data Innovation Summit上,Facebook负责消息业务和平台分析的主管Ahmad Anvari说道:“速成方案并不是长久之计。在我的职业生涯中见过很多类似的案例。”

在出报表之前请三思

Anvari认为,过度关注短期项目可能会导致团队脱离长远战略,错失更大的机会。这就好像一个进行股票交易的投资者只追求短期收益的最大化,而不考虑长期投资计划。

Anvari举了个例子,Instagram(属于Facebook)在两年前推出应用内置广告,当数据一开始呈现出来时,人们都对此感到十分兴奋。与其他应用程序的功能相比,用户点击广告的频率相对是最高的。但是广告商却并不高兴,因为用户在点击广告后,通常会立刻离开广告页面。

最终人们意识到,广告的点击量看起来不错,但这主要是因为广告是唯一可点击的内容,而图片本身内容却不可点击。所以,很多人不小心点击了广告。现在的应用程序增加了一个功能,要求点击广告后,主动询问用户,是否跳转至广告页面,这样能让数据更有意义。

最小化可行产品带来的价值也不会太高

最小化可行产品是分析团队追寻速成方案的另一种方式,但它自身也存在着一定的问题。游戏公司Zynga Inc负责数据科学的主管Dhruv Bhargava 在会议上表示,鼓励数据科学家和产品经理向用户交付有用的应用程序,并激发开发人员的创造性,这一点非常重要,仅仅交付一个最小可行化产品,还远远不够。

最小化可行产品的策略通常被视为是一件好事,因为它迫使开发人员和分析师尽早考虑用户如何与报表或应用程序进行交互。此外它还允许开发人员根据用户反馈来有针对性的优化产品。

但是,这样做是有潜在风险的。有时开发人员在产品发布后,并没有及时进行相应的产品更新,Bhargava说他见过类似的情况。产品管理团队急于得到一些最基本的东西,事实上,他们需要在接下来对应用进行完善。但有时候他们却忽略了这一点,用户最后没有得到最好的数据应用。

“如果你意识到自己忘了最初的意图,现在想对应用进行改进,那就赶快行动吧,”他说道。

不要使用错误的数据进行训练

使用错误的数据构建数据产品会将应用开发项目引入歧途。在线交友网站eHarmony Inc的首席科学家Steve Carter说道,数据科学家和分析团队的成员在开发初期,经常对所使用的数据不加任何审查。通常,这些数据中还有着历史数据的存在。但Carter表示,如果他们正在开发一个产品,这些数据就将被用于生产。在eHarmony的案例中,主要产品是预测引擎,基于用户特征进行匹配,该产品所用的训练数据,应该与生产环境的数据保持高度一致。

使用生产数据对于数据科学家来说相当具有挑战性。这可能需要处理数据治理或工程约束等方面的问题,这是数据科学家追求速成方案时经常遇到的问题。

但Carter表示,训练模型时使用历史数据,在投入生产时使用生产数据可能会遇到问题。为了避免这个问题,数据科学家应该与数据工程师协同工作,以确保他们构建程序的可靠性。这样做可能需要花费一定的时间,但最后结果也会更好。

“在你开始数据产品建模之前,请首先与工程师沟通,” Carter说。

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

翻译

杨宏玉
杨宏玉

TechTarget特邀编辑。北京邮电大学计算机科学与技术专业硕士。熟悉软件开发流程,对系统管理,网络配置,数据库应用等方面有深入的理解和实践经验。现就职于IBM(中国)投资有限公司,从事IBM服务器相关软件的开发工作。业余时间喜欢游泳登山,爱健身,喜欢结交朋友。

相关推荐