无论国内还是国外,医疗保险都是关乎百姓民生的话题。在大数据时代,医疗保险行业是否也在随机而动,利用数据分析,创造业务价值?近日,在上海举办的“2017 Teradata大数据峰会”上,来自美国田纳西州蓝十字蓝盾组织的Brandon Cosley博士接受了我们的采访,分享大数据在美国医疗行业的应用。
Brandon Cosley博士,美国田纳西州蓝十字蓝盾组织生物统计学研究科学家
数据驱动预测性分析团队的发展
美国田纳西州蓝十字蓝盾组织(BlueCross BlueShield of Tennessee)成立于1945年,是田纳西州最大的、非营利目的管理的医疗保险提供商。目前,蓝十字蓝盾组织有5千8百名员工,350万用户,为超过1万1千家公司提供服务,每年处理的报销帐单达2.8亿美元。
Brandon Cosley博士是田纳西州蓝十字蓝盾组织预测性分析团队的一名数据科学家。谈及这个分析团队的成立过程,Cosley博士介绍,蓝十字蓝盾机构经历了两次大的增长。第一次是源于7年前处理帐单付款时发现的问题。在美国,用户就诊后,医疗保险组织会收到来自医生、诊所或医院等医疗服务提供商的账单,然后进行报销处理流程。Cosley博士说:“我们发现,我们有那么多报销数据(Claims Data),这些数据可以用来识别那些对某类疾病有高风险的人群。通过这类数据的收集,我们可以去接触这些人群,帮助他们更好地管理自己的生活方式,降低得这种特殊疾病的风险,从而减少某些医疗诊断费用。”为了从数据统计学建模,发现这些人群到底是谁,田纳西州蓝十字蓝盾组织成立了现在的预测性分析团队。“七年后到今天,我们现在仍然收集来自用户的账单,继续收集报销数据。我们认为,我们可以更多地应用这些数据,帮助这些数以百万计的患者。”
Cosley博士团队的第二次较大增长发生在三年前,即2014年美国奥巴马政府颁布了“平价医疗法案”(Patient Protection And Affordable Care Act),又称Obamacare。联邦政府颁布的这个新法案意味着像蓝十字蓝盾这样的医疗保险机构必须遵循法规,进行数据收集,并且每年向联邦政府上报。这也敦促医疗保险机构必须要利用大数据进行分析与应用,来帮助用户更好地管理医疗费用。
整合数据库平台支持复杂分析,提高运营效率
早在2012年,田纳西州蓝十字蓝盾组织在自己的临床数据库(Clinical Data Warehouse)就部署了Teradata的医疗数据模型,帮助分析更大量、更多样化的数据集,提高运营效率。
Cosley博士介绍,来自报销付款的数据被正常化和结构化之后录入Teradata数据仓库,这样,数据分析师可以非常便捷地访问,进行数据分析。当问及这款Teradata产品给田纳西州蓝十字蓝盾组织带来的最大价值是什么,Cosley博士表示,该产品是一个非常高效的平台,它的功能不仅仅只是建立数据库而已,而且提供了很多数据建模的功能;数据整合优化也做得非常好,可以在一个数据库的环境中,用很快的速度来计算非常复杂的数据。所以田纳西州蓝十字蓝盾组织也在不断扩大使用Teradata数据库的环境以及这些应用场景的规模。
预测性平台帮助解决美国意外死亡的第一起因
此外,田纳西州蓝十字蓝盾组织还部署了Teradata Warehouse Miner分析数据集生成器和Fuzzy Logix的DB Lytix,在数据库环境中进行更先进的统计建模。Cosley博士在采访中特意分享了如何利用大数据帮助解决美国意外死亡第一起因的案例。
阿片类药物(opioid abuse,注:阿片类药物是罂粟衍生的精神活性物质或人工合成的具有类似效果的物质,例如吗啡、海洛因、曲马多、羟考酮和美沙酮)过量对人的生命造成巨大伤害,而且在美国这个问题越来越严重。2016年初,奥巴马政府将阿片类药物过量确定为急需解决的关键性任务,并且拨款11亿美元用以研究和开发解决方案。田纳西州蓝十字蓝盾组织采用Fuzzy Logix的大数据分析架构、Teradata数据库和Teradata数据挖掘的工具,建立预测性平台,展开了一项数据驱动的项目,希望能够为解决阿片类药物过量提供解决方案。
该项目收集来自田纳西州蓝十字蓝盾组织以及第三方的多年药房资料和报销数据,通过数据建模和数据分析,使用742个预测变量,很快发现能够找到一个人是否可能存在阿片类药物滥用问题的风险因素。这样,在问题还没有真正发生之前,希望医生和专家可以尽早参与,提供预防性的治疗。数据分析师通过分析某些可追踪的行为数据来预测日后滥用或误用阿片类药物的几率大小,例如是否经常使用不同的医生开处方药,去不同的药房取药等。通过使用随机森林模型对数据集进行分析后,发现预测结果的准确度高达85%。
Cosley博士表示,这个大数据项目的计算非常复杂,强度大,Teradata平台提供了非常快速的分析和洞察。田纳西州蓝十字蓝盾组织计划将该项目所采用的数据和算法模型进一步推广和应用到日后的分析项目中。
预测性分析帮助更有效管理医疗花销,更高效使用医疗系统,更智能化互动
目前Cosley博士所在的团队在进行什么大数据项目?Cosley博士介绍,团队一共有七名分析师,每个人的责任和每个人的业务建模都不一样。例如,有一个正在进行的项目是希望建立一个更好的模型,来预测性分析医疗花销成本,在医疗保健上,一个人可能会花多少钱。但这个比较有难度,因为每个人在医疗保健上花费的方式很零星。因此,Cosley博士的团队建立了一系列的成本模型,每一种模型是基于某一种具体的疾病要花多少钱;等到每种疾病的成本模型都建好后,再统一成为一个大的模型,这样可以算出来一个人在医疗上要花多少钱。
另一个项目是帮助田纳西州蓝十字蓝盾组织的用户更高效地使用美国的医疗系统。Cosley博士介绍,由于美国的医疗系统复杂,用户对医疗系统的了解不全面,造成有些用户使用医疗系统很低效。通过建模,Cosley博士的团队希望能够找到这样的用户,进行教育宣传,更有效地使用医疗系统。
还有一个项目是在田纳西州蓝十字蓝盾组织内部建立了一个企业级项目,希望能够更加智能地与用户进行个性化的互动。Cosley博士说:“我们会对用户进行分层,对每个层进行分析,建立预测性模型,根据用户是谁来改变跟他们宣讲的资料内容,使这些内容更个性化。比如,我以前就收到过相关怀孕建议的宣传单,但这肯定是对我没有任何用处的。所以,我们希望跟用户互动的内容能够更加个性化和定制化,更加智能化地跟用户进行互动。”
大数据团队的多元化背景
Cosley博士所在的预测性分析团队致力于开发统计模型和高级分析解决方案,基于已有的数据,进行高级分析以及预测性建模。此外,该团队还负责创新,包括数据挖掘的创新,通过新产品来获得更多的数据源以及通过新的方式来对数据建模。
Cosley博士是生物统计学研究科学家,2011年获得了心理学研究的博士学位,主攻于定量分析、社会和医疗科学。那么其他团队成员又是什么背景?
“我们团队的技术、背景和技巧非常多元,有些是经济计量学专业,有些是量化行为分析专业,有些是药学专业,有些是搞临床实验的,还有政治科学家。但是,每个人都具有量化分析的背景,都擅长统计学数据建模,这是他们的通用特点。” Cosley博士这样介绍道。正因为大家的背景都非常多元化,所以大家看待数据的方式不尽相同,大家从同一组数据中得出来的洞察不一样,从而让这个团队具有很强的创新能力。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
相关推荐
-
如何选择正确的数据发现平台
企业的业务目标决定着最合适该企业的数据发现平台,对任何公司都是如此。在高层次上,数据发现工具可帮助企业从数据挖 […]
-
Teradata与GE航空集团达成战略合作 推动航空运营与业务齐头并进
Teradata天睿公司宣布与GE航空集团(GE Aviation)建立战略合作伙伴关系,携手为航空公司带来卓越的分析驱动型业务成果。
-
【对话Teradata高管】人工智能(AI)大势所趋 “黑盒” 制肘深度学习
Teradata天睿公司最近在2017 Teradata全球用户大会上分享了一项最新人工智能(AI)现状的调查结果。
-
业务引领 技术赋能 Teradata转型正当时
如何更好地帮助客户从海量的大数据信息中挖掘有用的、提供业务支撑的价值,是Teradata一直以来最关注的问题。如今,Teradata正在实现转型,以业务价值为驱动,让客户通过大数据分析获得最终的业务价值。