保证数据仓库唯一真实的数据源

日期: 2012-05-30 作者:Mark Scott翻译:曾少宁 来源:TechTarget中国 英文

在商业领域,人们最关注的问题之一,就是两个报表系统为相同的数据产生完全不同的结果。源系统通常会相互交换数据,然后修改或传输这些数据。在许多报表系统中,最难完成的任务之一就是保持非规范化数据的一致性和同步性。   我们通常使用一个中央数据仓库确定特定数据元素的唯一可靠数据源。

如果多个源系统拥有相同的数据副本,数据仓库中存储的单个数据表现可以作为真实性的判断。另一个相关问题是过载问题。例如,如果有三个系统,每个系统都保存订单信息,一个作为订单处理系统,第二个负责连接合作伙伴供应商,第三个是支付帐号系统。每一个系统都拥有日期输入域,但是每一个域都不相同,而且每一个数据点都非常重要。

用户必须确定他们需……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

在商业领域,人们最关注的问题之一,就是两个报表系统为相同的数据产生完全不同的结果。源系统通常会相互交换数据,然后修改或传输这些数据。在许多报表系统中,最难完成的任务之一就是保持非规范化数据的一致性和同步性。

  我们通常使用一个中央数据仓库确定特定数据元素的唯一可靠数据源。如果多个源系统拥有相同的数据副本,数据仓库中存储的单个数据表现可以作为真实性的判断。另一个相关问题是过载问题。例如,如果有三个系统,每个系统都保存订单信息,一个作为订单处理系统,第二个负责连接合作伙伴供应商,第三个是支付帐号系统。每一个系统都拥有日期输入域,但是每一个域都不相同,而且每一个数据点都非常重要。用户必须确定他们需要的各个数据点,使数据在各个报表中保持一致。大多数组织都会使用多个报表系统,它们拥有不同的数据处理方式。有一些需要详细的交易数据,其他系统则需要汇总数据。从一个数据源获得数据,有利于保证不同系统的数据一致性,以及减少数据混乱和报表错误问题。

  拥有一个中央信息源也有利于简化新报表的创建过程。由于数据位于一个位置,而且数据相关性已经完全确定,所以报表的创建会更简单一些。高效地确定目标知识库报表数据,有利于加快新报表项目的完成和降低其成本。

  当然,从这个数据源创建的报表越多,对服务的要求就越高。与只包含小规模数据的小型独立系统相比,这种系统需要缓存数据,快速响应查询,其要求是完全不一样的。实现唯一企业数据源的效率还需要对数据仓库进行优化,使之能够支持更大的数据量要求。

  注:虽然拥有唯一一个真实数据源有很多好处,但是其实现难度也很大。人们偏向于保存自己的本地数据。创建一个中央数据仓库,保存大规模的统一数据,会迫使人们交出“自己的”数据——以换取一个更大范围的整体组织数据视图,以及了解其他部门的交互。

  这些报表需求也迫使系统提到创建报表信息的速度。将源系统的数据移动到数据仓库,以及准备数据时进行的ETL和分析处理,都有利于确定数据仓库的容量和性能需求。

  中央企业数据能够高数据查找速度和简化数据查找过程。它有利于简化新报表的创建过程和降低其成本。它能够优化交流和减少错误。

  通过建立统一且简单的唯一数据源,公司可以获得许多的好处。随着业务的增长和发展,系统本身也会变大,成为一种大型数据仓库。虽然实现一个大型企业信息源能够给公司带来很多好处,但是IT是否应该考虑一些替代方案,以克服一些实现一个大型关键业务信息源的技术问题?将所有信息保存在一个系统中又是否可行?

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐