数据科学家工作中最重要的软技能

日期: 2020-04-28 作者:Maria Korolov翻译:邹铮 来源:TechTarget中国 英文

Jeff Herman并不是机车专家,他拥有数学和工程学背景,还做过数据科学方面的研究。他曾是一家铁路公司的数据科学家,他的工作是查看有关机车的数据,以便做出相关预测。

由于他不是机车专家,因此他需要寻找公司中的专家。

他说:“与这些人保持良好的关系会使我的工作更加轻松。”他还指出,这种关系并不是自然形成,“团队合作的很大一部分在于互相提供价值。”

例如,他注意到有些分析师正在生成Excel报告,而这些报告需要大量的体力劳动。

他说:“我能够使用自动化的Python脚本使其中一些流程自动化,这有助于建立关系。团队合作是一条双向的道路。你提供价值,你获得价值。”

他指出:“建立关系和团队合作是数据科学家工作的关键软技能。还有其他必要的技能,例如沟通、道德规范和理解业务价值,这是人们在考虑数据科学时通常不会想到的技能。”

沟通

每个数据科学家应该具备的技能之一是与非技术人员进行沟通的能力。

纽约市Flatiron School的数据科学讲师Herman称:“我认为这是最重要的一项技能。最主要的是能够结识他们的受众。”

在以前的铁路工作中,在向公司其他部门解释其工作时,Herman将重点放在结果上,他侧重于介绍该模型重要的原因。

Herman指出:“如果你无法解释你的模型,那么你的模型就不会投入生产。如果我不能解释为什么这个模型比以前预测煤火车更准确,那么这只是我出于娱乐的目的而做的研究,并不重要。”

但是,不善交流的人能否掌握这项技能吗?当然能。

除了技术文章外,Herman的学生还需要为非技术观众制作幻灯片,作为他们演讲的一部分。

他说:“他们会将其呈现给指导老师,然后指导老师会假装自己是非技术人员,并提出与业务有关的问题。”

在教室外面,数据科学家可以尝试练习向朋友或家人解释他们的项目,例如参考Meetup小组或Toastmasters活动。

在疫情期间,很多Meetup活动、技术会议和其他小组活动已经转移到线上,但是人们仍然有机会进行演示。Herman说,例如,在公司内部,即使办公室里没有人,也仍然可以进行演示。

他说:“如果我制作了一个模型,我必须向人们展示,否则它不会投入生产,哪怕是通过Zoom会议的形式。”

批判性思考

在任何行业中,批判性思维技能都很重要,但由于它与数据科学有关,因此在数据源方面更需要使用批判性思维。

Herman称:“你应该花一些额外的时间来了解和理解你的数据集。你不能只是获取数据,如果你不确定特定的列或值,请进行研究-查看是否有其理由。”

他说,数据科学家经常在个人项目中练习技能,并从抓取网站或下载文件中获取数据集。

与其直接进行分析,不如借此机会查看数据集,并有助于在企业环境中创建或打破项目。

批判性思维不仅仅是对数据集的批判,这也关乎对算法的批判。并从最基本的算法问题开始:某个问题是否需要机器学习,还是可以通过传统统计或其他方法解决。

在线编码平台HackerEarth的联合创始人兼首席执行官Sachin Gupta表示:“我们可以将机器学习应用于一切,但是实际上,只有少数几个问题适用于机器学习解决方案。”

他说:“在面试候选人时,我经常问的一个问题是,列出他们早上醒来以来使用的移动应用程序的数量。然后,我会问他们的观点,哪些应用可以从机器学习中受益以提供更多价值以及原因。”

业务重点

数据科学家通常做的并不够。

他说:“这里的价值在于帮助客户获得更好的想法、做出更好的投资和做出更好的决策。”

Rountree承认,当他最早开始他的职业生涯时,他并没有业务思维。幸运的是,这是可以学习的技能。

他说:“与那些优先考虑业务的人共事,使我能够提升自己的职业生涯。”

数据科学家需要了解在其特定行业、在其公司甚至特定部门或职能部门中最重要的东西。他们还需要能够提出正确的问题,以准确找出客户或用户的需求。

他说:“有时他们不知道自己想要什么,或者他们改变了主意。你必须能够即时调整。”

Booz Allen Hamilton公司AI策略和培训主管Kathleen Featheringham说,数据科学家可能需要也是调查员。

她指出:“我们被问最多的问题是,‘我们想做人工智能。’然后我们问他们,‘做什么?’。仅仅因为你可以做,并不意味着你应该这样做。”

当数据科学家确定了需要解决的业务问题,另一方面的业务价值问题就是:是否使用该解决方案。在部署解决方案时,还会有文化或管理障碍或其他部署问题,导致数据科学项目无法进行,即使其他方面都没问题。

Featheringham说:“人们可能会反对。他们可能认为机器人会抢走他们的工作。因此,你需要研究心理方面,并确保同时解决技术和人为因素。最坏的情况是创建了没人会使用的东西。”

另一个常见的问题是,当用户或客户在解释问题的范围时,他们会忽略他们习惯于做的工作流的关键方面,甚至根本不会考虑它。

数据科学项目的业务价值的另一个经常被忽视的方面是在管理领域。Featheringham说,如果一家公司派人去接受Python培训,但是绩效评估没有改变,并且员工使用新技能也没有得到任何回报,那么培训将被浪费。

企业数据公司Alation的数据分析主管Andrea Levy说,数据科学家可以首先尝试将自己想象成自己的用户之一。

她建议,假设自己是用户,问问自己他们会在乎什么。

Levy说:“另一种更好地了解全局的方法是在非正式场合与其他团队合作。”她说,了解他们的工作、询问他们使用和生成的数据。

伦理

在构建预测模型时,数据科学家拥有强大的力量。他们在选择数据集、优先某些功能以及如何使用数据方面做出的选择会影响项目的成功,甚至影响公司的生存能力。

长期存在或加剧现有偏见或制造新偏见是潜在问题。侵犯隐私权可能会导致不良的公关,违反合规性或使公司倒闭。

仅仅因为可以收集数据并不意味着应该收集。有时,问题并非立即显而易见。

Herman说:“如果你在银行工作,你可能会对根据性别预测贷款会感到不舒服。但是一个不同的特征可能与性别高度相关。”

这里很重要的是能够解释你的行为。这不仅使你更轻松地与业务利益相关者沟通模型的价值,而且还可以帮助人们确定决策是否在道德准则范围内。

终身学习

没有数据科学家能够知道一切,即使他们知道,这个行业发展得非常快,他们很快又需要学习新知识和技能。

Herman说:“当遇到新问题时,你需要进行新研究和学习新知识。这就是我所说的终身学习者或黑客思维方式。”

AIOps技术公司Moogsoft首席科学官Rob Harper说,这里需要保持好奇心。

他说:“有时候,数据科学比科学更难。而且,与很多领域一样,突破是偶然发生的。重要的是要有毅力,以及知道何时在正确的地方继续钻研。”

数据科学软技能让一切不同

根据麻省理工学院和波士顿咨询集团去年年底发布的一项调查显示,在AI上进行大量投资的企业中,40%没有从AI获得业务收益。

AI技术并没有问题,只是这些企业没有人员识别该技术以对所有利益相关者都有效的方式可提供业务价值的领域。因此,关键在于数据科学家工作的软技能,而不仅仅是技术能力。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

翻译

邹铮
邹铮

相关推荐

  • 企业商业智能的10大好处

    商业智能(BI)软件的起源可以追溯到20世纪60年代基于大型机的决策支持系统,随后BI技术在不断发展,以应对数 […]

  • 生成式AI会取代数据分析师吗

    生成式AI不会取代数据分析师的工作。在很多领域,人工智能都无法取代人类,特别是那些需要人类同理心和洞察力的领域 […]

  • 改进数据可视化的7项技能

    数据可视化可以实现可操作的洞察力和卓越的业务成果。但构建有效的数据可视化可能很困难。如果你想创建数据可视化,你 […]

  • 了解BI生命周期以构建有效的架构

    成功的数据驱动运营遵循商业智能(BI)生命周期,定义BI能力,并部署良好理解的治理架构。 该过程的前提是,你必 […]