数据科学家需要具备哪些素质?

日期: 2013-03-26 作者:Brian McKenna翻译:曾少宁 来源:TechTarget中国 英文

科技已经给数据赋予了新的使命,即“数据科学”。IBM合伙人Matin Jouzdani将它们放在一起解释:过去几年里,“数据分析越来越难,所以从事数据分析的人也就成了科学家。”

  商业领袖最近对于数据科学有了很高的期望。为什么呢?Gartner分析师Debra Logan说:“他们正在应付天花乱坠的广告宣传。”

  然而,期望就在那里,即使仅仅由于经济衰退影响而需要从数据中挖掘出金矿。

最新一篇标题为《培育数据驱动的文化》的经济学人智库调查报告作者Jim Giles说:“仍然有一种看法,认为数据科学家应该‘空降’到组织之中,充当数据处理咨询师角色。这是错误的看法。数据关系到每一个的业务。”

  调查结果显示,最成功的公司能够通过提供必要的培训和促进各级别员工与部门的数据共享来优化数据使用。

  由数据可视化公司Tableau Software资助的报告认为,“民主化”的数据分析过度关注于数据科学家骨干的培养。

  Lastminute.com的数据分析

  Lastminute.com的首席创新官Bill Beckler力图在数据民主化和建立严格数据科学职能上实现平衡。

  他说:“我们坚定地认为基层人员应该使用数据工具,这样数据才能够驱动所有位置的决策。这样可以简化所有人的工作并提高满意度,因为它能够赋予人们更多的责任,而且这些工具也能够不断提升实现目标的作用。我们的数据科学家团队正关注于这个方法。”

  根据Beckler的介绍,Lastminute.com数据科学家团队建立了一个公开招聘流程,其中包括解答一些高难度的数学问题,只有对公司有全面了解的人员才能够解答这些问题。

  这个团队不涉及数据处理、预测建模、销售优化和回答战略业务问题。他说:“团队成员需要不断地开发工具,将他们解决问题的方法自动化。”

  公司热衷于聘用明星。Beckler说:“为了留住明星,您需要一群明星。所以,我们保持高标准,保证每一个人所接触的同事都是他们乐于共事的人。有了高昂的士气和人才相惜,才有利于培养人才和留住人才。”

  那么从他自己的公司出发,Beckler认为哪一类组织最适合建立数据分析专家团队呢?

  他说:“只要您需要根据数据来制定决策,那么您就需要一些了解如何编写程序和进行大数据计算的专家。Excel只能处理百万级数据。遇到再大的数据,您就需要一个数据团队。”

  虽然数据爆炸为公司提供了新的战略竞争机会,但是公司所使用的技术与所能够实现的目标之间仍然存在很大的差距。这个差距源于数据团队与决策制定者之间的分离。大数据只会扩大这个差距,而不是缩小。

  Beckler说:“通过组建数据团队,开发他们的倾听和拓展关系的技能,您才能够缩小这个差距。这些团队应该与决策制定者完全同步。理解造就信任,而信任造就行动。”

  McKinsey如何提升数据科学技能?

  麦肯锡总裁Michael Chui在2011年发表了颇具影响力的大数据报告,报告名为:“大数据:下一个创新、竞争和生产力前线”。

  这家公司为客户提供建议,包括如何组织大数据和分析,以及如何发现最重要的人才。他指出,数据科学家很稀少,但是在大数据概念提出之前他们就已经确实存在。“他们既有高级统计和机器学习知识,又有商业头脑。”

  他非常看重这个概念本身,它的范畴反映了将高效利用数据作为竞争基础的理念。

  在2011年的报告中,麦肯锡指出,同时懂大数据科学与业务的管理者很少。它曾经向许多教育机构反映过这个问题。

  这份报告指出:“在线公司、一些销售部门(例如,零售)和金融机构都是培养人才的地方。”

  IBM的数据科学骨干

  IBM的Matin Jouzdani指出,公司的业务分析实践已经存在了28年左右。在招聘时,他们看重数学能力,以及商业头脑和客户意识。他们让候选人解决一些业务问题,其中包含一些数字计算问题,然后他们会在分组环境中进一步评估他们解决问题的能力。

  在招聘应届毕业生时,这家公司看重其适应各种工具与技术的潜力。大约有2/3的招聘来自这种方式。

  但是他指出,同样重要的是咨询人员要适合面对客户,清晰阐述复杂的分析过程。

  Jouzdani看到的价值是,大数据社区正在主动重新关注于数据的商业价值,并且认为数据科学家这个定义“更加聪明”和“更加吸引人”。而且,因为一些大数据技术还没有成熟,所以他认为一些聪明的分析师仍然有机会进入这个市场。

  然而,他指出,对于一些大型组织而言,在他们原有人才基础上开始进一步增加新的数据科学家并不存在问题。

  Jouzdani指出,对于数据民主化,大数据将迫使一些组织在比以往更低的层面上展开跨职能协作。而且,他们一致认可数据的重要性。

  他说:“做好数据分析是很难的。这就是为什么那些能够很好地处理数据的人会被称为科学家的原因。我很喜欢这个挑战。既然理解您业务数据的人已经有了,那么就给他们工具吧!”

  数据科学大师

  Mark Whitehorn在邓迪大学主持了一个新的数据科学大师项目,另外有一个商业智能(BI)项目。

  这是第一年开设数据科学课程,有17位学生选课,其中大部分是在职学生。他们大多数都有正式的数学背景。他说:“如果您有足够的激情和理解力,那么统计学对你而言并不会太难学。与用户交流的能力也很重要。”

  根据Whitehorn观点,有一定的好奇心也非常重要。“有一个好的测试方法:您是否从早上7点就开始玩数据,然后突然意识到已经到凌晨2点了,而且对于寒冷的夜晚全然没有感觉?”

  他指出,并非所有数据科学家都要有出神入化的水准,但是他们都属于少数智力顶尖人群的范畴。

  他补充说:“女性在这个领域也具有一定的优势,因为她们似乎通常交流能力更强。而且她们在这个领域很少会跳槽。”

  对于正在考虑建立数据科学职能部门的组织,Whitehorn的建议是先从供应商购买技术。他说:“但是,如果您有长期的大数据需求,那么要自行开发这个功能。业务需要真正理解自己数据的人才。”

  Whitehorn还指出,现有BI人员也可以成为数据科学家。他说:“他们都是BI架构师,而不是一些人所谓的报表‘苦工’。”

  他总结说:“数据科学的趣味大于经济利益。如果数据总能吸引您,那么您应该感到高兴,因为世界最终会认识到数据的重要性。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐