数字媒体软件供应商Adobe公司运用SAP Data Service将Hadoop数据加载到SAP内存数据库HANA上。那么,你的企业应用Hadoop进行数据管理的业务用例是什么样的呢?为什么任何一个数据项目,尤其是Hadoop项目一定要有专门的业务用例呢?
Adobe公司高级数据仓库工程师Kevin Davis表示,我们之所以使用Hadoop,是因为我们的数据量巨大。Hadoop组件能够追踪所有Adobe Creative Cloud上发生的事件。我们有250万付费用户,和120到150万免费用户。这些用户在Adobe Creative Cloud上的所有操作都以数据流的形式存入到Hadoop系统中。我想,这就是人们所说的大数据了。
Davis表示,最初决定部署hadoop时,我并没有参与讨论。不过事实证明,在处理大规模数据集和海量事件上,Hadoop的确表现优异。
为Hadoop制定业务用例是很重要的,因为Hadoop是比较难的技术,将Hadoop与HANA这样的分析引擎集成也不容易。更多的人还是习惯使用传统的关系型数据库。应用Hadoop还需要对人员进行培训,相比之下,应用传统关系型数据库就要容易的多。另外,很多技术人员都有操作Oracle的经验和操作SQL Server的经验,如果组织需要补充的资源,可以很容易地聘请熟悉Oracle和SQL Server的人,但要寻找有丰富Hadoop经验,又熟悉Hadoop与HANA集成的人就困难多了
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
数据太多Hold不住?Hadoop数据治理来“救场”
当LinkedIn还是一家规模较小的公司时,它从社交网站上获取的数据是如何被格式化和结构化的,似乎并没有人关注。
-
将数据治理工具渗透到企业中有多难?
对于主流大数据用户来说,数据治理是一个大问题。最近,IT供应商已经宣称使用开源以及商业数据治理工具来管理基于Hadoop的数据湖中的数据。
-
遇到Hadoop性能问题很头疼?监控集群很重要
大数据系统中,数据并非唯一需要管理的内容。数据科学家和其他用户所运行的查询也必须进行监控,以确保他们不会在Hadoop和Spark集群中陷入困境。