辉瑞(Pfizer)公司的Pat Saucier很仔细地区分信息和数据这两个词,并指出两者各有各的意思。数据包含了因数据处理需要而产生的无序虚构数据,信息则是具有实际用途的处理过的数据。例如,一名学生的考试分数只是个体的数据点,而全班平均分数则能为校长提供关于学生整体表现的信息。
他说:“数据人会考虑数据库和数据结构,而信息是制定精准的业务决策时用到的数据。”
不出人们所料,Saucier的确在思考信息与数据的差别。作为制药巨头产品研究与发展部门的解决方案战略和信息结构总监,Saucier在技术的支持下,花费了大量时间将各种来源的数据流转变成有用的信息,并使之最终为塑造企业未来服务。
Saucier尤其引以为豪的一个项目是使用数据虚拟化技术,使辉瑞研究人员能够更快地获取信息。他的团队就参加了这个项目。
Saucier介绍说,这项工程开始于2010年,研究人员提出,需要更快更便捷地获得用于制定精准决策的数据。而他的团队想要避免漫长的发展时间和附加服务、存储以及数据库带来的成本,直接完成该目标。
这就用到了数据虚拟化软件。它创造了一种抽象概念,或者叫中间件层。该层能够收集不同来源的数据,必要时将之与其他数据结合起来,最终运用到信息仪表盘或发表在BI报表中。辉瑞目前使用的是Composite Software的产品,该公司最近刚被网络巨头Cisco收购。其他主要的数据整合和数据虚拟化软件供应商包括Informatica、Denodo Technologies和红帽等。
在其他方面,Saucier的团队运用Composite创造了混合数据仓储并支持辉瑞公司的“跨功能数据标准”项目。该项目致力于确保数据以预设的、标准化的方式传输,并能在公司研究部门和医疗机构持续使用。
例如,公司会用产品数据标准来确保产品信息的一致性。但Saucier认为,统一的产品数据只是制定精准决策要求的一部分。要想获得全面的认识,数据就必须和组织中的其他数据结合起来。所以我们才需要数据虚拟化。
他表示:“纵向来看,我们不得不建造巨大的数据仓库或主数据管理解决方案,并竭力限定数据的使用,才能提供全面的认识。借助混合模型,我们可以通过Composite传输数据,并把它和其他企业数据结合起来。”
数据虚拟化软件给辉瑞公司带来的另一个好处是缩短了数据交易中心发展的时间,并降低了硬件成本。但是Saucier提醒道,因为数据虚拟化是从各种来源搜集数据的,所以如何确保快速数据检索和信息传输就成了一个难题。要想提升数据虚拟化平台的性能,最好采用可靠的方式聚合数据并使用内存技术。而弄清楚哪些数据以及多少数据要存储到内存中也很重要。
Saucier说:“如果我们是从每日更新的数据仓库,或者数据集市,或者应用中获取数据,那么即时访问就没有什么意义了。所以一定要先弄清楚进入虚拟平台的数据‘热度’,再做决策。我们是该缓存,还是快照,还是做其他的事。”
给起步者的建议
Saucier给考虑信息管理的人提供了一些建议。
他说:“要接触数据,以此来了解数据的运动。不止在系统中,更要用现实生活经验来确定数据和信息流动的方式。”
这种亲身实践的方法也帮助起步者理解单个数据点或数据元素是如何与其他的数据点或数据元素产生联系的,以及这种联系是如何在现实世界中实现的。
Saucier说:“要亲力亲为。要接触数据。要运行查询。在做这些的时候,要敢于假设,之后整个的图景才会越来越清晰。然后对于从哪里得到数据和数据如何组织,你就能做出精准的决策。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
处理大数据 现有的数据集成框架还远远不够
对于初学者来说,大型数据架构通常包括内部系统和外部数据源的组合。除结构化交易数据之外,它们还添加了各种类型的非结构化和半结构化数据。
-
珠宝销售的“后实体时代” 拼的是预测分析模型
预测模型竟然可以帮助美国电视台Jewelry Television的主持人销售商品?这得益于将数据集成到分析应用程序中的数据集成和准备流程。
-
选择合适的ETL工具 关键看什么?
传统ETL工具仍然在数据集成市场占最大比例,Gartner公司在2016年数据集成工具魔法象限调研报告中发现,使用批处理任务处理大量数据集成的组织超过80%。
-
云计算固然好 但挑战依然存在
云计算的出现,让企业在投资IT和商业应用时,多了一种部署选择,不再仅限于本地部署。但云环境也经常会增加企业使用的系统的数量。