拥有大量的数据并不是一个成功数据仓库的衡量标准。使用数据的人必须理解数据。每一个源系统会给不同的数据元素设置不同的名称。例如,订单创建日期在一个系统中可能被称为销售日期,在另一个系统中可能是ED,第三个系统可能就被简单命名为日期。
使用这些源系统的人将根据自己最常使用的系统来命名这些数据元素。通用的报表系统必须在各个部门和系统之间建立起联系,使整个企业范围的用户都能理解。 总的来说,最适合作为这种用途的工具就是数据仓库。它们可将企业中所有的数据泛化为一个规范模式。
这个模式由不同系统的不同输入构成。只要这个模式设计合理,并且符合整个企业的数据,那么它就可以作为一个中央知识库,帮助人们创建报表。……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
拥有大量的数据并不是一个成功数据仓库的衡量标准。使用数据的人必须理解数据。每一个源系统会给不同的数据元素设置不同的名称。例如,订单创建日期在一个系统中可能被称为销售日期,在另一个系统中可能是ED,第三个系统可能就被简单命名为日期。使用这些源系统的人将根据自己最常使用的系统来命名这些数据元素。通用的报表系统必须在各个部门和系统之间建立起联系,使整个企业范围的用户都能理解。
总的来说,最适合作为这种用途的工具就是数据仓库。它们可将企业中所有的数据泛化为一个规范模式。这个模式由不同系统的不同输入构成。只要这个模式设计合理,并且符合整个企业的数据,那么它就可以作为一个中央知识库,帮助人们创建报表。
虽然这些信息需要保持一致,但是也需要具备一定的灵活性。业务一旦发生变化,它们所监控和运行的信息也会发生改变。如果一个模式可以扩展到包括新的业务流程、发展和并购,那么它就能够帮助企业维护自身地位。这就需要系统具有一定的适应性,可以随着业务的扩大而扩展。IT企业总是需要有足够的空间来增加新的数据源;也需要有足够的处理能力,在不超载的前提下完成内部信息模式的更新。
注:我知道有一些分析师,他们尝试通过挖掘数据来创建报表。因为数据定义不佳,而且分析师本身并没有完全理解保存数据的源系统,所以生成的报表错漏百出。这样一来,就容易导致错误的决策,浪费大量的成本。如果分析师拥有并掌握一个归档分类的单一数据源,那么这些错误就可以避免。
将数据保存在同一个位置将帮助分析师更好地利用这些信息。在清晰定义了可靠的信息之后,分析师就可以分析整个企业,从而查找出内部操作的重要关系。这些系统可以进一步扩展并加入外部数据源。因此,分析师就能更好地查找到主要的指标和趋势,帮助企业作出更准确的决策。
整个企业的规范模式数据可以确定组织中所有系统数据的关系和关联。建立一个可扩展平台来保存这个模式,可以使企业能够根据市场变化和内部运营变化进行自我调节。
作者
翻译
TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。
相关推荐
-
数据分析是关于文化,而非技术
在新加坡,Tableau公司新数据准备工具发布会上,发言人表示,数据分析日益盛行的原因在于数据量呈指数级增长以 […]
-
BI和AI是两个独立的概念?是时候改变这种想法了
尽管BI和AI是两个独立的概念,但AI和BI相结合这种想法应该得到更多关注。
-
年度数据仓库市场格局新鲜出炉 论技术论实力谁更受青睐?
国际数据管理分析机构The Information Difference在最新年度数据仓库市场格局(Big Data Warehouse Landscape)报告中,对全球前25家数据仓库厂商进行了评估。
-
体育机构合理选择数据仓库 上演“球迷也疯狂”
体育运动机构如何能更准确地熟悉球迷群体呢?NBA的夏洛特黄蜂队提出了这个问题,并在Phizzle FanTracker平台中获得了答案。