数据科学家为时下流行话题,无论在电脑商店、大学校园还是企业董事会议上都受到了热议;对此,Forrester的分析师Mike Gualtieri有自己的看法。虽然不一定所有人都认同他的观点,但他认为,真正的数据科学家和其他门类的科学家无异,他们构建假说,将其验证。
Gualtieri说:“关于数据科学家的定义有很多种说法。有人认为数据科学家是管理、收集和存储数据的人,也就是说他们更倾向于计算机科学,而不是分析师的领域。”他把重点放在了寻找懂得如何收集正确信息的人才上面,这使得他的定义显得比其他人的定义更加狭窄。
“很多人都认为数据科学家是会使用Hadoop的人,但我更认同数据科学家就是一个科学家这样的定义。他们决定了处理的数据类型。如果有人没有做好分析工作,不去寻找演算法则并测试它们,那么他们就不是数据科学家。”
理解数据科学家的角色十分重要,但数据管理员在规划一个预测分析项目的时候,还需要考虑在高涨的数据科学家需求背后的技术问题。Gualtieri在近期发布的一份名为《The Forrester Wave: Big Data Predictive Analytics Solutions, Q1 2013》的报告中指出,在海量多变的数据冲击下,现代预测分析帮助企业降低风险,创造独特的客户体验。
虽然基于高级机器学习与其他演算法则的预测分析需要全新的工具技术,但是它提供的商务智能价值,是传统的数据挖掘所不能比的。
Gualtieri说:“以往的商务智能都在于不断生成报表,用不同的方式进行交叉分析,以提供洞察力。但是预测分析大不相同,它运用多种不同类型的运算法则,回归算法、神经网络和各种各样的树算法等等,正是这些运算法则决定了数据的重要性和结果的可能性。”
运算法则就是工作的根基。回想1980年代,人工智能就已经有了类似的运算法则,但是今天的预测分析得以蓬勃发展,还有赖于更加简单的可用性、更加强大的计算能力和更加宽泛的工具互用性。
数据管理员需要信任他们的数据科学家,建立对于如预见性和可能性这些重要概念的理解,做出新兴软件的智慧决策。他们需要设定业务目标,通过预测分析项目将成功最大化,这些都需要对于预见性的充分理解。
Gualtieri说:“企业如果不理解预测将会带来很大的困难。许多人都认为预测过于绝对,但其实预测分析不是二进制。一个预测模型的的结果都是通过概率得出的。”
Gualtieri提到了一家出类拔萃的新兴网络公司Netflix,认为它是一个在概率方面很好的例子。Netflix的在线电影服务采用了预测模型,为用户推荐电影。据用户反映,该公司使用的推荐引擎在预测方面出乎意料地精准,错乱的几率相当小。
对于用户而言,只需要接受或拒绝推荐即可,十分简单。但对于战略部署的业务领导人来讲,就十分困难了。Gualtieri表示,无论怎样,都必须人为决定处理信息的方式。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
Qlik收购Attunity为用户扩展数据管理功能
近日BI和数据可视化供应商Qlik公司收购以色列数据集成和数据管理供应商Attunity公司,此举将进一步推动 […]
-
如何减少部署自助BI工具的痛苦
为什么部署自助BI如此困难?从理论上来讲,自助BI应该是你所有问题的答案。但很多企业最终都还是失望,数据让他们 […]
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
采矿设备制造商利用BI on Hadoop来挖掘数据
如果大数据要取得巨大成功,则需要提供给更多的最终用户群组。但广泛使用的商业智能工具尚不能轻松分析最大的大数据, […]