没有好数据 再先进的预测分析工具也爱莫能助

日期: 2017-03-02 作者:Bridget Botelho翻译:张亮亮 来源:TechTarget中国 英文

人们常说,生活中唯一确定的就是不确定,但至少有一些事情,我们可以有把握进行预测。 但是对于客户的行为是很难预测的,这种不确定性可能决定新产品或服务的成败。预测分析工具可以对结果进行预测,验证业务领导的直觉,投资一个有前途的新产品或阻止他们推出一个可能会重蹈微软Zune覆辙的产品。 但是,决定对数据的信赖程度是一个棘手的问题。

Ian Swanson是数据科学公司的首席执行官兼联合创始人,他说,数据分析是一种论证的方法,可以提供数据予以支撑。“有时数据科学只是证明了这个假设,”Swanson指出,“然后有一种情况是,我们发现了一块金子,我们需要证明它值得进行更多的探索。在这两种情况下它都是有价值的……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

人们常说,生活中唯一确定的就是不确定,但至少有一些事情,我们可以有把握进行预测。

但是对于客户的行为是很难预测的,这种不确定性可能决定新产品或服务的成败。预测分析工具可以对结果进行预测,验证业务领导的直觉,投资一个有前途的新产品或阻止他们推出一个可能会重蹈微软Zune覆辙的产品。

但是,决定对数据的信赖程度是一个棘手的问题。Ian Swanson是数据科学公司的首席执行官兼联合创始人,他说,数据分析是一种论证的方法,可以提供数据予以支撑。“有时数据科学只是证明了这个假设,”Swanson指出,“然后有一种情况是,我们发现了一块金子,我们需要证明它值得进行更多的探索。在这两种情况下它都是有价值的”。

对不可预测性进行预测

虽然对预测分析工具的价值进行了宣扬,但对它们的过度依赖同样也是有害的,分析工具的洞察力是否足够好,与提供给它们的数据好坏息息相关。统计学家George Box著名的观点是:“很多模型都是错误的,但有些是有用的。”任何数据科学家都会告诉你使预测模型变得有用的方法就是和业务用户一起,在工程人员的帮助下把可预测的洞察力转化为新产品。

Dataiku的首席分析架构师以及波士顿学院的兼职教授Kenneth Sanford表示:“拥有某些单一软件解决所有问题是不可能的,在数据业务中对专业知识的需要将会是毫无疑问的。”

事实上,没有东西可以替代专业知识,即便是专业人员参与分析项目,预测也可能是错的,例如美国大选中预测模型的“马失前蹄”。据报道,前国务卿Hillary Clinton的竞选活动是与一个由数据科学家组成的团队联合开展的,而该团队由首席数据分析师Elan Kriegel领导,他是BlueLabs的联合创始人,参与了2012年奥巴马成功竞选的数据科学家团队的工作。Clinton的竞选活动依靠数据分析来进行战略决策,包括在哪里对潜在选民开展工作并进行广告投放。比起那些没有在预测技术上进行投入的总统候选人,这些洞察力应该会为竞选提供优势。但我们都知道最后大选的结果是怎样的。

Kriegel的评论请求没有得到回应,因此我们不知道预测模型是否有助于或损害了竞选活动。但可以肯定的是,在最后几个星期中还有其他原因导致了竞选活动的崩溃,对于这些因素,甚至最好的预测模型也爱莫能助。

数据完整性才是关键所在

这并不是说企业应该抛弃他们的预测分析项目,并回归到旧的经营方式。数据科学家认为Clinton策略的问题不在于数据驱动的方法或预测模型。相反,而是在于馈送算法数据的完整性,这一问题在预测建模中非常常见。Sanford说,“在选举中使用机器学习时有趣的地方在于,如果他们使用传统统计,则预测会更为准确,”他补充说。他解释出现这种情况的原因是统计学家花费了大量的时间来计算变量背后的意义,而预测机器学习对于数据是如何创建的却关注很少。如果分析师花更多的时间在审查是“谁在回答民意调查”上,我们看到的结果可能大有不同。

对于选举,专家的意见是,重点在于数据的完整性存在问题。

人们在接受采访或调查时可能会说他们赞成保护公园和环境,但他们可能不会这样投票。与其说这是预测模型问题的核心,倒不如说是样本的质量问题。Swanson解释说,这个问题涉及人工智能,预测分析和数据科学项目的一些常见缺陷:使用可靠的数据,选择正确的算法,真正了解需要解决的问题。

数据完整性是预测分析的软肋。有些公司正在进行正确的预测分析,他们会以获得新的客户,更多的收入,更高的效率和更强大的洞察力,帮助他们做出明智的决策。

作者

Bridget Botelho
Bridget Botelho

资深专家

翻译

张亮亮
张亮亮

TechTarget特邀编辑。毕业于北京邮电大学网络技术研究院。熟悉软件开发测试的各个环节和流程,对操作系统,数据库,计算机网络等有较为深入的理解。现就职于中国电子科技集团公司下属研究所,从事软件研发工作。热衷于英文的学习交流,平时喜欢户外运动,音乐,电影。

相关推荐