对于针对不同客户群设置多个业务单元的大型组织,BI数据集成是必要的,这样才能利用企业范围内的数据。与此同时,以这样的规模做BI数据集成也是很有挑战的。 应当通过分析你的业务需求开始,指定一个流程模式,理解BI用户的需求。 下面给出了一些最重要的BI数据集成挑战,并给出了解决这些问题的一些技巧。
大爆炸陷阱 一次性处理掉BI数据集成的所有工作(大爆炸式)是很有诱惑力的,但是这种方法可能并不是成本效益较高的。零敲碎打的方法会遇到更少问题。把要集成的BI数据规模最小化是很有意义的。我们可以独立地看待每个数据点,创建各自的计划,并一次整合它们。
假设你需要从以下应用合并数据:一套商……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
对于针对不同客户群设置多个业务单元的大型组织,BI数据集成是必要的,这样才能利用企业范围内的数据。与此同时,以这样的规模做BI数据集成也是很有挑战的。
应当通过分析你的业务需求开始,指定一个流程模式,理解BI用户的需求。
下面给出了一些最重要的BI数据集成挑战,并给出了解决这些问题的一些技巧。
大爆炸陷阱
一次性处理掉BI数据集成的所有工作(大爆炸式)是很有诱惑力的,但是这种方法可能并不是成本效益较高的。零敲碎打的方法会遇到更少问题。把要集成的BI数据规模最小化是很有意义的。我们可以独立地看待每个数据点,创建各自的计划,并一次整合它们。
假设你需要从以下应用合并数据:一套商品管理系统(MMS),一个客户数据库,还有一个产品数据库。我们可以把它划分成多个数据集,比如客户信息、销售数据、财务数据等等,然后依次进行整合。
忽略自动化
自动化BI数据集成遇到的挑战会少一些。人工干预越少,出错情况和数据集成问题就越少。举一个零售的例子来说,要把数据从MMS移动到销售点(POS)应用中,我们需要生成HTML文件。我们可以手动上传文件到FTP服务器,在服务器上POS系统可以逐个处理这些文件。或者,我们可以把信息放到存储文件夹,通过计划任务自动处理。数据的准确性可以通过系统检查点得到维护。
钻取报表的困难
数据集成通常是BI的第一步。要支持向下钻取报表,数据必须集成到最深级别。在零售业务场景中,销售数据分析要从许多层面分析:产品、分类、部门、存储、公司、城市、地区等等。集成数据的最佳方式是在产品层面,因为那样的话BI工具可以根据需要自动把它合并到更高级别。例如,在公司维度直接整合数据就会带来向产品维度钻取报表的困难。要记住,“从下向上”是更好的BI数据集成方法。
业务数据的差异
应积极监控数据,不只是在数据集成设计阶段,还包括用户阶段。用户可以指出技术团队可能忽略的数据差异和现场BI数据集成难点。质量检查点也应该提供给用户。如果在数据整合之后发现销售数据错误了,用户应该能在任何原有系统中发现数据差异。
供应商挑战
许多实施供应商缺乏足够的技能,不能独立设计和实施BI数据集成解决方案。我们要寻求理解技术并懂得如何架构解决方案的供应商。只有在解决方案成功实施以后才能最终付款。这就确保供应商能解决实施过程中出现的所有BI数据集成挑战。
要注意数据提取流程,比如提取转换加载(ETL)。要提高数据质量,要确保提取和加载流程在源方面操作,而不是在目标方面。加载和显示流程可以在目标方面完成。要根据业务需求定时检查数据量和实时更新程度。最后,要确定所有要集成的数据点,在启动流程之前对它们做好规划。
翻译
相关推荐
-
数据分析是关于文化,而非技术
在新加坡,Tableau公司新数据准备工具发布会上,发言人表示,数据分析日益盛行的原因在于数据量呈指数级增长以 […]
-
BI和AI是两个独立的概念?是时候改变这种想法了
尽管BI和AI是两个独立的概念,但AI和BI相结合这种想法应该得到更多关注。
-
处理大数据 现有的数据集成框架还远远不够
对于初学者来说,大型数据架构通常包括内部系统和外部数据源的组合。除结构化交易数据之外,它们还添加了各种类型的非结构化和半结构化数据。
-
珠宝销售的“后实体时代” 拼的是预测分析模型
预测模型竟然可以帮助美国电视台Jewelry Television的主持人销售商品?这得益于将数据集成到分析应用程序中的数据集成和准备流程。