大型数据仓库的分析优势

日期: 2012-05-24 作者:Mark Scott翻译:曾少宁 来源:TechTarget中国 英文

分析数据(从汇总到数据挖掘)能够深入分析业务内涵。分析不仅可用于发现趋势,预报未来事件,还可用于填补信息缺失点,发现因果关系,为组织决策者提供决策所需要的最佳数据。   因此,数据仓库应该提供多个存储数据的位置,组织和建立数据结构,抽象和优化信息。大型数据仓库能够为这种分析数据的类型提供坚实的分析基础。

  全范围业务数据   在数据集合中查找重要趋势和信息需要整套数据。数据越全面和详细,分析就越精准。这意味着,需要保存更多的在线系统数据,为分析系统提供更丰富的数据源。此外,这也意味着保存更多来源的统一数据可以扩大分析范围。

  我曾经处理过许多保存详细数据的系统。在数据容量较大的情况中,这是……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

分析数据(从汇总到数据挖掘)能够深入分析业务内涵。分析不仅可用于发现趋势,预报未来事件,还可用于填补信息缺失点,发现因果关系,为组织决策者提供决策所需要的最佳数据。

  因此,数据仓库应该提供多个存储数据的位置,组织和建立数据结构,抽象和优化信息。大型数据仓库能够为这种分析数据的类型提供坚实的分析基础。

  全范围业务数据

  在数据集合中查找重要趋势和信息需要整套数据。数据越全面和详细,分析就越精准。这意味着,需要保存更多的在线系统数据,为分析系统提供更丰富的数据源。此外,这也意味着保存更多来源的统一数据可以扩大分析范围。

  我曾经处理过许多保存详细数据的系统。在数据容量较大的情况中,这是常用的做法。一旦对数据进行了汇总,就不需要再保存全部的详细数据。通常,因为系统本身无法处理很大的数据容量,所以详细数据会被删除,高级汇总数据会被保留。然而,如果需要进行数据挖掘,则需要保留这些详细数据,来创建和培训挖掘模型。我处理的系统都保留了一年或两年的详细数据,必须人工从存档中对它们进行恢复。否则,两年前的详细数据无法使用。系统处理大容量数据的能力反映了它所能执行的分析类型。

  说明:假设要为零售商设计一个系统,它需要预测季节性产品的市场趋势,并直接关系到具体的宣传推广活动。虽然有一些部门汇总的产品销售数据可用,但为了帮助零售商生成可用于指导销售计划的特殊报表,系统必须存储最近三年的详细信息。因为需要大量的空间,系统无法在线保存这些信息。即使这个系统存档了所有详细数据,其他系统无法存档,整个数据分析过程也无法进行。由于物理架构限制了他们的决策过程,这样的设计不能完全满足企业需求。

  企业数据通常受多种外部因素的影响。外部事件可能会对业务内部的数据产生重大影响,如股票市场趋势、天气情况和商品市场变动等。如果数据仓库有足够保存数据的容量(包括对数据的存储、处理、整合与优化),那么它就可以带来真正的商业价值。相反,如果系统的容量已经接近饱和,那么就不可能再增加这些数据了。

  存储大量数据的能力仅仅是一方面。支持数据分析的大型数据仓库系统还需要具备足够的处理能力,在回应用户请求的同时,汇总数据、建立挖掘模型。因此,这些系统执行并发操作的规模大小也值得认真考量,例如,在安全查询数据时加载数据。能够解决这些问题的系统也就能够实现更大的商业价值。

  许多组织需要混合使用大量的汇总数据、明细数据和事务数据。汇总数据通常可以确定一小部分验证预期行为的事务或反映组织问题的数据。如果系统能够深入分析明细数据,帮助分析师分辨正确与错误,那么这个系统将有助于企业作出更明智的决策。

  再次强调,这会有利于确定大型数据仓库的需求。它不仅需要处理大容量数据,还必须拥有快速加载数据和保持用户响应速度的能力。它必须提供足够详细的事务数据结构、汇总结构和数据挖掘结构,帮助分析师获得一些重要结果。

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐