一旦代码完成,构建预测分析模型的工作就会一直持续下去。分析经理认为,要确保预测分析模型能够一直提供准确、有意义的分析结果,就要不断进行测试和调优,直到预测模型完全可以信赖,千万不能只让个别数据分析师单独调试模型。
益博睿(Experian)数据实验室执行副总裁Eric Haller表示:“我们不断调试我们的假设条件和分析结果。最后,我们希望得到最佳的答案。”
益博睿(Experian)是美国三大征信服务公司之一,数据实验室是益博睿的一个业务部门。Haller的团队为公司其他部门和外部客户开发和运行数据分析应用程序,团队中的数据科学家和预测建模人员通常要和信用风险模型、目标市场活动和网页数据分析等打交道。Haller表示,与他之前工作过的地方不同的是,他的团队在处理这些问题时采用了高度以团队为中心的方法。
比如,数据实验室没有尽量减少项目中的人员以节省费用或加快部署,而是尽可能多的聘请分析师。与其他业务场景不同,部署预测分析模型在很多方面都能产生积极的影响。某个模型可能是某位分析师开发的,但是可能其他分析师才能对其中为何包含或排除某个变量进行质疑,所以每一个分析师都要能够证明自己在开发流程中做出的决定是合理的。
Haller表示:“要想构建最好的模型,就要尽可能多地集中最优秀的人才。”
预测建模团队的规模限制
所谓知易行难,Haller也承认在招聘数据科学家方面,公司之间大打人才战。数据科学家既难寻得,薪酬要求还很高,因此所谓“尽可能多的集中最优秀的人才”是个不小的挑战。
但Haller也表示,有一些共同的因素有助于为构建模型培养良好的环境,也是在工作环境中备受数据科学家青睐的,比如协作、智力挑战和让分析师处理不同类型的项目。另外,为建模创建强有力的环境以开发预测分析模型也有利于招聘新人和留住人才。
美国网络媒体公司Upworthy的数据分析负责人Daniel Mintz也采用了相似的方法确保分析模型的质量和可靠性。在波士顿2015大数据创新论坛上,Mintz表示,在正式投入生产之前,他要求分析师向他口头描述一个真实的场景,来解释他们所做模型的分析结果。他认为这样能迫使分析师考虑媒体消费者的行为,而不是简单地埋头于算法。它还能帮助分析团队在公司采用不良信息之前规避潜在的错误。
预测分析模型受质疑
最近,Mintz的团队分析了一些数据,研究页面加载时间对用户参与的影响,Upworthy公司以用户在页面上滚动和其他因素上花费的时间量为标准进行了评估。他们提出了这样的假设:当页面需要加载很长时间时,人们会产生挫败感,因此在读到点击的内容之前就会离开该网站。然而,他们发现页面加载时长事实上和高参与度正相关。
团队已经准备放弃他们使用的预测分析模型了,因为他们认为模型本身或生成的数据出了问题。但当他们碰头讨论,试图解释这种情况时,他们意识到,如果页面需要加载很长时间,但用户仍然在等待,说明用户很关心这个话题,这也解释了为什么页面加载时间越长,用户参与度越高。最终,该模型成为预测用户参与度的重要工具。
Mintz表示:“如果你心里存在一个现实世界中事物运行的模型,那么一旦出现不符常理的问题时就能及时捕捉到。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
十大步骤帮你有效使用预测分析算法
一个成功的预测分析项目不仅仅涉及软件部署,使用软件分析数据。了解下面这些步骤可以帮助你为分析项目打下坚实基础。
-
人力资源分析 需要的不仅仅是数据
数据并不能直观显示员工的工作表现和员工留存率,更多的公司计划使用员工分析工具来帮助员工做出决策。
-
对于预测建模来说,数据集才是决定成败的关键
数据科学核心任务之一是利用数据挖掘和机器学习算法来开发预测模型。但是,如果在前期没有选择正确的数据挖掘数据集合,即使是最佳设计的模型也可能会误入歧途。
-
《数据价值》2017年3月刊·当预测模型失败了
随着大数据环境的不断发展,集成和准备分析数据的工作正在发生显著的变化。