COVID-19数据资源供志愿数据科学家使用

日期: 2020-03-30 作者:George Lawton翻译:邹铮 来源:TechTarget中国 英文

随着COVID-19在全球大流行,各种组织机构都开始提供资源来帮助分析师、AI开发人员和数据工程师开展工作。这些举措可以为个人和团队提供机会,让他们做有意义的事情、与他人合作以及学习新技能。

全球战略和管理咨询公司Kearney的数字化转型合作伙伴Joshua Swartz说:“毫无疑问,我们需要构建统计和预测模型来帮助科学界,他们正在努力了解病毒、治疗效果并在开发疫苗。开发人员可以做的是帮助科学界执行这些分析,并产生有意义的结果。”

为抗击冠状病毒而努力

很多供应商也纷纷提供自己的资源。

SQL GPU数据仓库供应商SQream的首席营销官David Leichner表示,他们正在基于先前志愿者在癌症研究和DNA分析方面的努力,以发现各种指标的相关性,从而建立风险模型,考虑人口统计、城市密度、吸烟习惯等。

统一分析平台Knowi的营销主管Sean Knight说,他的公司已安排其大部分开发人员力量来构建仪表板,以帮助追踪冠状病毒的传播。其目标是提供一个值得信赖的免费场所,让人们可以跟踪COVID-19的传播。分析师也可以将这些数据整合到自己的应用程序中。

CORD-19

在众多COVID-19数据资源​​中,最大的协同项目可能是Kaggle COVID-19开放研究数据集挑战赛,也被称为CORD-19。美国白宫希望通过该挑战赛呼吁大家采取行动,并为希望提供帮助的数据分析师提供奖项、数据资源和合作机会。

CORD-19要求参与者为各种数据集以及数千份科学论文和报告开发文本和数据挖掘工具,以试图解决当前的问题。

DataRobot产品和客户支持高级副总裁Phil Gurbacki说:“该挑战赛是希望可以利用AI和其他工具来帮助解答有关COVID-19的一系列关键问题。”

原始数据集包括44,000多篇有关各种冠状病毒的学术文章和该病毒的完整RNA测序。该挑战赛鼓励研究人员解决各种高级任务和子任务。

高级任务包括“关于传播、潜伏期和环境稳定性,目前已知的信息是什么”等问题。子任务则包括“潜伏期的范围是多少?”“传播的季节性是什么?”和“无症状感染者传播的患病率是多少?”之类的问题。

EndCoronavirus

EndCoronavirus是由新英格兰复杂系统研究所(NECSI)及其合作机构建立并维护的项目,其目的是通过提供有用的数据和行动指南来最大程度地降低COVID-19的影响。目前该项目已迅速发展,其中包含超过2,100名志愿者,并且正在寻找更多志愿者。

参与者将提高其在分析网络、基于代理的建模、多尺度分析和复杂性方面的技能。

区块链初创公司Geeq的创始人兼CDO的Stephanie So表示,他们都通过Slack工作。该团队采用了一系列数学工具,这些工具主要针对具有很多交互的组件的系统,其中传统的统计假设都被打破。

COVID-19数据集

其他团体也在整理COVID-19数据资源​​,可能可帮助执行各种类型的分析和开发新应用程序。

ClosedLoop.ai是专注于医疗保健的数据科学平台,该平台首席执行官兼联合创始人Andrew Eye表示:“COVID-19危机让我们看到,具有独特技能的不同群体如何快速地以分布式方式合作。”

他说,负责收集和汇总数据集的主要团队包括Worldometer COVID-19 Statistics和Johns Hopkins,后者在GitHub上提供数据集和可视仪表板。该数据还可以在AWS免费访问。

免费访问超级计算机

多个政府实验室和私有云提供商(包括IBM和AWS)正在向数据分析师提供他们的高性能计算机,让他们可以通过COVID-19 HPC联盟来分析与COVID-19相关的数据。组织者正在为数据分析师提供超过330 千万亿次、775,000个CPU内核和34,000个GPU(这个数据在不断增加)。

该计划还在云服务提供技术支持和促销积分,以运行这些工作负载。例如,亚马逊让通过AWS进行时间紧迫的项目的研究人员可即时访问几乎无限的基础架构容量。

其他资源

其他组织也在为COVID-19项目免费提供其工具和资源。

DataRobot的Gurbacki说:“现在,开发人员、数据科学家和技术社区的其他人可以利用各种免费平台和工具来参与应对新型冠状病毒。”

DataRobot正在向研究人员免费提供其自动机器学习和Paxata数据准备产品。

开发商众包公司Topcoder发起了Topcoder抗冠状病毒黑客马拉松挑战赛。

Topcoder首席执行官Michael Morris说:“这里的目标是找到新的应用程序、算法或网站,以在疫情期间帮助人们。”

深度学习冠状病毒疗法正在使用深度学习来产生新型分子,作为治疗新型病毒的候选药物。OpenCovid19正在研究各种数据分析和实际工具,以使用通用工具安全地测试COVID-19。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

翻译

邹铮
邹铮

相关推荐

  • 企业商业智能的10大好处

    商业智能(BI)软件的起源可以追溯到20世纪60年代基于大型机的决策支持系统,随后BI技术在不断发展,以应对数 […]

  • 生成式AI会取代数据分析师吗

    生成式AI不会取代数据分析师的工作。在很多领域,人工智能都无法取代人类,特别是那些需要人类同理心和洞察力的领域 […]

  • 改进数据可视化的7项技能

    数据可视化可以实现可操作的洞察力和卓越的业务成果。但构建有效的数据可视化可能很困难。如果你想创建数据可视化,你 […]

  • 了解BI生命周期以构建有效的架构

    成功的数据驱动运营遵循商业智能(BI)生命周期,定义BI能力,并部署良好理解的治理架构。 该过程的前提是,你必 […]