通用数据字典和信息模式

日期: 2012-05-24 作者:Mark Scott翻译:曾少宁 来源:TechTarget中国 英文

拥有大量的数据并不是一个成功数据仓库的衡量标准。使用数据的人必须理解数据。每一个源系统会给不同的数据元素设置不同的名称。例如,订单创建日期在一个系统中可能被称为销售日期,在另一个系统中可能是ED,第三个系统可能就被简单命名为日期。

使用这些源系统的人将根据自己最常使用的系统来命名这些数据元素。通用的报表系统必须在各个部门和系统之间建立起联系,使整个企业范围的用户都能理解。   总的来说,最适合作为这种用途的工具就是数据仓库。它们可将企业中所有的数据泛化为一个规范模式。

这个模式由不同系统的不同输入构成。只要这个模式设计合理,并且符合整个企业的数据,那么它就可以作为一个中央知识库,帮助人们创建报表。……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

拥有大量的数据并不是一个成功数据仓库的衡量标准。使用数据的人必须理解数据。每一个源系统会给不同的数据元素设置不同的名称。例如,订单创建日期在一个系统中可能被称为销售日期,在另一个系统中可能是ED,第三个系统可能就被简单命名为日期。使用这些源系统的人将根据自己最常使用的系统来命名这些数据元素。通用的报表系统必须在各个部门和系统之间建立起联系,使整个企业范围的用户都能理解。

  总的来说,最适合作为这种用途的工具就是数据仓库。它们可将企业中所有的数据泛化为一个规范模式。这个模式由不同系统的不同输入构成。只要这个模式设计合理,并且符合整个企业的数据,那么它就可以作为一个中央知识库,帮助人们创建报表。

  虽然这些信息需要保持一致,但是也需要具备一定的灵活性。业务一旦发生变化,它们所监控和运行的信息也会发生改变。如果一个模式可以扩展到包括新的业务流程、发展和并购,那么它就能够帮助企业维护自身地位。这就需要系统具有一定的适应性,可以随着业务的扩大而扩展。IT企业总是需要有足够的空间来增加新的数据源;也需要有足够的处理能力,在不超载的前提下完成内部信息模式的更新。

  注:我知道有一些分析师,他们尝试通过挖掘数据来创建报表。因为数据定义不佳,而且分析师本身并没有完全理解保存数据的源系统,所以生成的报表错漏百出。这样一来,就容易导致错误的决策,浪费大量的成本。如果分析师拥有并掌握一个归档分类的单一数据源,那么这些错误就可以避免。

  将数据保存在同一个位置将帮助分析师更好地利用这些信息。在清晰定义了可靠的信息之后,分析师就可以分析整个企业,从而查找出内部操作的重要关系。这些系统可以进一步扩展并加入外部数据源。因此,分析师就能更好地查找到主要的指标和趋势,帮助企业作出更准确的决策。

  整个企业的规范模式数据可以确定组织中所有系统数据的关系和关联。建立一个可扩展平台来保存这个模式,可以使企业能够根据市场变化和内部运营变化进行自我调节。

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐