Forrester分析师谈预测分析对于数据科学家的重要性

日期: 2013-02-21 作者:Jack Vaughan翻译:茶一峰 来源:TechTarget中国 英文

数据科学家为时下流行话题,无论在电脑商店、大学校园还是企业董事会议上都受到了热议;对此,Forrester的分析师Mike Gualtieri有自己的看法。虽然不一定所有人都认同他的观点,但他认为,真正的数据科学家和其他门类的科学家无异,他们构建假说,将其验证。

  Gualtieri说:“关于数据科学家的定义有很多种说法。有人认为数据科学家是管理、收集和存储数据的人,也就是说他们更倾向于计算机科学,而不是分析师的领域。”他把重点放在了寻找懂得如何收集正确信息的人才上面,这使得他的定义显得比其他人的定义更加狭窄。

  “很多人都认为数据科学家是会使用Hadoop的人,但我更认同数据科学家就是一个科学家这样的定义。他们决定了处理的数据类型。如果有人没有做好分析工作,不去寻找演算法则并测试它们,那么他们就不是数据科学家。”

  理解数据科学家的角色十分重要,但数据管理员在规划一个预测分析项目的时候,还需要考虑在高涨的数据科学家需求背后的技术问题。Gualtieri在近期发布的一份名为《The Forrester Wave: Big Data Predictive Analytics Solutions, Q1 2013》的报告中指出,在海量多变的数据冲击下,现代预测分析帮助企业降低风险,创造独特的客户体验。

  虽然基于高级机器学习与其他演算法则的预测分析需要全新的工具技术,但是它提供的商务智能价值,是传统的数据挖掘所不能比的。

  Gualtieri说:“以往的商务智能都在于不断生成报表,用不同的方式进行交叉分析,以提供洞察力。但是预测分析大不相同,它运用多种不同类型的运算法则,回归算法、神经网络和各种各样的树算法等等,正是这些运算法则决定了数据的重要性和结果的可能性。”

  运算法则就是工作的根基。回想1980年代,人工智能就已经有了类似的运算法则,但是今天的预测分析得以蓬勃发展,还有赖于更加简单的可用性、更加强大的计算能力和更加宽泛的工具互用性。

  数据管理员需要信任他们的数据科学家,建立对于如预见性和可能性这些重要概念的理解,做出新兴软件的智慧决策。他们需要设定业务目标,通过预测分析项目将成功最大化,这些都需要对于预见性的充分理解。

  Gualtieri说:“企业如果不理解预测将会带来很大的困难。许多人都认为预测过于绝对,但其实预测分析不是二进制。一个预测模型的的结果都是通过概率得出的。”

  Gualtieri提到了一家出类拔萃的新兴网络公司Netflix,认为它是一个在概率方面很好的例子。Netflix的在线电影服务采用了预测模型,为用户推荐电影。据用户反映,该公司使用的推荐引擎在预测方面出乎意料地精准,错乱的几率相当小。

  对于用户而言,只需要接受或拒绝推荐即可,十分简单。但对于战略部署的业务领导人来讲,就十分困难了。Gualtieri表示,无论怎样,都必须人为决定处理信息的方式。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Jack Vaughan
Jack Vaughan

TechTarget新闻记者和网站编辑,主要关注数据管理领域的技术趋势和动态。

相关推荐