开展数据仓库项目前应考虑的重要问题

日期: 2012-07-15 作者:Mark Whitehorn翻译:曾少宁 来源:TechTarget中国 英文

问:请问在创建数据仓库之前,我们需要考虑哪些相关的问题?

  答:这要看您是否有时间上的限制。

  一般要考虑的问题包括以下方面:

  • 业务用户希望执行哪些类型的分析?
  • 您当前是否收集了支持这种分析所需要的数据?
  • 数据存储在什么位置?
  • 数据质量如何?
  • 是否存在多个类似的数据来源?
  • 哪一种数据结构最适合核心数据仓库(例如,空间型还是关系型)?

  技术相关的问题包括:

  • 通过网络传输的数据有多少,是否有足够的处理能力?
  • 需要多大的磁盘空间?
  • 磁盘存储的速度应该有多快?
  • 您是否准备使用固态驱动器(SSD)存储“热”数据(例如,频繁访问的信息)?
  • 公司已经有哪些数据库和数据管理技术专业储备?

  企业文化问题包括:

  • 运营系统之间的数据定义是如何区别的?不同的部门和业务单元通常使用各自的术语定义,如“客户”、“销售”和“订单”。所以,必须将这些定义标准化,添加一些前缀信息,如“所有销售”、“最新销售”和“商品销售”等。但是,要注意:业务经理通常不需要改变已建立的表述方法。
  • 收集业务需求的过程是什么?有一些人不希望花费太多时间为您定义数据仓库需求。相反,他们希望您自行构思数据仓库和数据分析需求。

  这里特别说一下最后一项。过去,在描述任务时,我也做了完全相同的事情。例如,我可能会对建筑工说:“看,我只想要一个小房子而已,好吗?建个小房子有那么难吗?您以前已经建过很多小房子了。”然后,建筑工建好了一个小房子,而我又说:“您怎么能够在这柴房里装一个这么小的门呢!?”

  收集用户需求的经验使我越来越同情建筑工人。我现在尽力投入足够的时间准确描述我的要求。但是,我认为这种行为是非常正常的:人们一般都不希望太受约束,但希望事情发展完全符合自己的意愿。

  总的来说,上面所列只是涉及表面的问题——当然,给人的印象是创建一个数据仓库非常困难且非常痛苦。它很有挑战性,但是它也是很有吸引力的项目,因为如果数据仓库按要求运行,它们会非常有用且回报巨大。按照我的经验,技术问题总是很容易解决;而企业文化问题则通常是导致数据仓库项目失败的原因。

  我还要提醒您另一个问题:办公室政治问题。我的意思是,人们可能不会如实表明他们的举措或动机。

  例如,财务主管可能将数据仓库看作是一种威胁。如果没有数据仓库,他们就能够控制财务部门的信息流,而控制就是权力。数据仓库威胁到他们的权力。但是,这种人一般不可能在会议上公开站出来表明自己的真实态度。相反,他们可能会说:“这个仓库太贵了。”而且,更严重的是他们可能会说:“数据仓库?很不错;我完全支持!”——然后他们会在接下来的半年时间里偷偷不停地阻挠这个项目。

  一定要注意数据仓库项目的办公室政治问题。毕竟,数据仓库是一种可以让整个公司的所有人都共享信息的系统。如果处理方式不当,它肯定会影响到一些人的利益。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐